Sự kiện Code with Claude Tokyo 2026 của Anthropic đã giới thiệu những cập nhật đột phá cho Claude Code và Managed Agents. Giờ đây, các agent có thể chạy tự động theo lịch trình, bảo mật thông tin nhạy cảm với vault, và xử lý các tác vụ phức tạp nhờ luồng công việc động. Những cải tiến này đang định hình lại tương lai của phát triển phần mềm, biến Claude thành một cộng tác viên AI mạnh mẽ hơn bao giờ hết.
Bài viết được biên tập + bổ sung research từ nhiều nguồn. Đọc bài gốc tại Twitter / X →

Anthropic đã tiên phong thực hiện một nghiên cứu an toàn quan trọng, thử nghiệm khả năng các mô hình ngôn ngữ lớn (LLM) tự phát triển mã khai thác lỗ hổng bảo mật. Công bố ngày 22/05/2026, báo cáo 'Nhóm Đỏ Tiên phong' không chỉ đo lường rủi ro hiện tại mà còn đề ra các biện pháp bảo vệ, định hình tương lai phát triển AI có trách nhiệm.
17/06/2026

Nhóm Frontier Red Team của Anthropic đã công bố LLM ATT&CK Navigator, một công cụ đột phá để lập bản đồ các mối đe dọa an ninh mạng do AI gây ra. Bằng cách điều chỉnh khuôn khổ MITRE ATT&CK nổi tiếng cho các mô hình ngôn ngữ lớn, nghiên cứu này cung cấp một cái nhìn sâu sắc về cách các tác nhân độc hại có thể khai thác AI và quan trọng hơn là cách chúng ta có thể xây dựng hệ thống phòng thủ chủ động để chống lại chúng.
17/06/2026

Nhóm Đỏ Frontier của Anthropic đang tiên phong nghiên cứu để đánh giá mức độ ảnh hưởng của các Mô hình Ngôn ngữ Lớn (LLM) như Claude đối với việc khai thác lỗ hổng N-day. Nghiên cứu này đo lường liệu AI có thực sự giúp tin tặc dễ dàng tấn công các hệ thống chưa được vá hay không, và kết quả ban đầu cho thấy chuyên môn của con người vẫn là yếu tố quyết định.
17/06/2026

Anthropic đã công bố các bản cập nhật quan trọng tại Code with Claude Tokyo. Các tính năng nổi bật bao gồm triển khai theo lịch và biến môi trường trong Claude Managed Agents (beta). Ngoài ra, luồng công việc động (dynamic workflows) trong Claude Code đã chính thức phát hành. Những cải tiến này giúp agent chạy tự động, bảo mật hơn và xử lý các tác vụ phức tạp hơn.
Sự kiện này là một bước tiến lớn, khẳng định cam kết của Anthropic trong việc cung cấp các công cụ AI mạnh mẽ cho lập trình viên. Các tính năng mới không chỉ cải thiện hiệu suất mà còn mở ra những phương pháp làm việc mới. Theo Blake Crosley (2026), Claude Opus 4.7 đã dẫn đầu ngành trên benchmark Vals AI Finance Agent với điểm số ấn tượng 64.37%, cho thấy năng lực xử lý vượt trội của mô hình. Mục tiêu cuối cùng là trao quyền cho các nhà phát triển để giải quyết những bài toán khó khăn nhất. Sự kiện này cũng nhấn mạnh tầm nhìn của Anthropic về một tương lai nơi AI và con người cộng tác chặt chẽ. Theo Chris Ebert (2026), mục tiêu là tạo ra "context windows that feel infinite," cho phép xử lý các dự án ngày càng lớn và phức tạp hơn.


Claude Managed Agents giờ đây có thể tự động hóa công việc thông qua các "routine" (lịch trình). Tính năng này cho phép bạn thiết lập các agent để chạy vào những thời điểm cụ thể, như hàng ngày hoặc hàng tuần. Chúng có thể thực hiện các tác vụ lặp đi lặp lại như tạo báo cáo, giám sát hệ thống hoặc phân tích dữ liệu mà không cần sự can thiệp của con người.
Tính năng này, hiện đang trong giai đoạn public beta, mở ra khả năng xây dựng các quy trình làm việc chủ động. Ví dụ, một agent có thể được lên lịch để kiểm tra các lỗ hổng bảo mật mới mỗi sáng và tạo báo cáo. Một agent khác có thể tự động tổng hợp dữ liệu bán hàng cuối mỗi tuần. Điều này giúp giải phóng thời gian cho các nhà phát triển để tập trung vào các công việc sáng tạo hơn. Theo Chris Ebert (2026), một công ty thể thao đã giảm 66% lượng token sử dụng chỉ bằng cách chuyển đổi đầu ra của công cụ từ JSON sang markdown. Điều này cho thấy tối ưu hóa quy trình có thể mang lại hiệu quả đáng kể. Theo Releasebot (2026), các tính năng này đang ở giai đoạn research preview, mở ra khả năng tự động hóa cho các nhóm xây dựng agent an toàn và hiệu quả.


Biến môi trường được lưu trữ trong "vaults" giúp tăng cường bảo mật bằng cách tách biệt các thông tin nhạy cảm. Thay vì nhúng trực tiếp API key hay mật khẩu vào code của agent, bạn lưu chúng an toàn trong vault. Agent sẽ truy xuất các biến này khi cần thiết, giảm thiểu rủi ro lộ thông tin bí mật trong mã nguồn hoặc trong quá trình thực thi.
Đây là một thực hành bảo mật tiêu chuẩn trong phát triển phần mềm, và việc Anthropic tích hợp nó vào Claude Managed Agents là một bước đi quan trọng. Nó cho thấy sự trưởng thành của nền tảng, hướng tới việc hỗ trợ các ứng dụng cấp doanh nghiệp. Theo Blake Crosley (2026), Moody's đã ra mắt một ứng dụng MCP cung cấp dữ liệu về hơn 600 triệu công ty, nhấn mạnh tầm quan trọng của việc xử lý dữ liệu quy mô lớn một cách an toàn. Để xây dựng các agent sẵn sàng cho môi trường production, Chris Ebert (2026) đề xuất "đặt mục tiêu tỷ lệ cache hit cho prompt ít nhất 80% trong các agent production". Điều này không chỉ tối ưu chi phí mà còn tăng tốc độ phản hồi, đồng thời đảm bảo tính ổn định và bảo mật.


Dynamic Workflows, nay đã phát hành chính thức, cho phép Claude tự động chia nhỏ các tác vụ lớn thành nhiều bước nhỏ hơn và thực thi chúng. Điều này có ý nghĩa to lớn với lập trình viên vì nó giúp giải quyết các vấn đề phức tạp mà trước đây không thể. Claude có thể tự lên kế hoạch, viết code, kiểm thử và sửa lỗi một cách linh hoạt và tự chủ.
Đây không còn là việc tạo ra các đoạn mã nhỏ lẻ. Thay vào đó, Claude có thể đảm nhận toàn bộ các dự án nhỏ. Một ví dụ ấn tượng được chia sẻ là việc port toàn bộ framework Bun từ ngôn ngữ Zig sang Rust. Theo Releasebot (2026), dự án này đã thành công với 99.8% bộ test hiện có đã vượt qua, liên quan đến khoảng 750.000 dòng code Rust. Điều này cho thấy khả năng lập luận và thực thi phức tạp của Claude. Chris Ebert (2026) cũng ghi nhận rằng với các công cụ AI mạnh mẽ, "nút thắt cổ chai đã chuyển từ việc viết code sang mọi thứ xung quanh việc viết code", như lên kế hoạch và đánh giá.

Tương lai phát triển với AI của Anthropic hướng tới việc tự động hóa toàn diện và cộng tác sâu hơn giữa người và máy. Các công cụ như Multi-agent Orchestration cho phép nhiều agent phối hợp giải quyết vấn đề. Mục tiêu là biến AI thành một đồng đội thực thụ, giúp các nhóm phát triển "riding the exponential curve" của năng suất và sự đổi mới trong công việc.
Các công cụ này không chỉ giúp viết code nhanh hơn mà còn thay đổi cách chúng ta thiết kế và quản lý dự án. Theo Chris Ebert (2026), một nhóm phát triển đã chứng kiến thông lượng pull request hàng tuần tăng 300% chỉ trong ba tháng sau khi áp dụng các công cụ AI. Năng suất tăng vọt này cho phép các nhóm thử nghiệm nhiều ý tưởng hơn và đưa sản phẩm ra thị trường nhanh hơn. Hơn nữa, các tính năng như Outcomes (beta) đang giúp AI tự đánh giá và cải thiện chất lượng công việc của chính nó. Theo Blake Crosley (2026), các cải tiến này đã cho thấy "tỷ lệ thành công tác vụ tăng +8.4% trên docx và +10.1% trên pptx" trong các benchmark nội bộ, mở đường cho các ứng dụng AI đáng tin cậy hơn.