Anthropic vừa ra mắt Claude Opus 4.8, mô hình AI mạnh nhất của họ cho lập trình. Với điểm SWE-bench Pro tăng lên 69.2, khả năng tự sửa lỗi và tính trung thực cao hơn, Opus 4.8 hứa hẹn thay đổi cách các nhà phát triển tương tác với AI, trong khi vẫn giữ nguyên mức giá cũ.
Bài viết được biên tập + bổ sung research từ nhiều nguồn. Đọc bài gốc tại Twitter / X →

Claude Opus 4.8 là bản cập nhật đáng kể từ Anthropic, tập trung vào việc nâng cao năng lực lập trình và "tính trung thực". Mô hình này không chỉ mạnh hơn trong các bài kiểm tra mã hóa mà còn có khả năng tự nhận biết khi không chắc chắn. Nó cũng có thể tự sửa lỗi thay vì đưa ra kết quả sai một cách tự tin.
Boris Cherny, đại diện Quan hệ Nhà phát triển của Anthropic, đã công bố phiên bản mới này. Ông nhấn mạnh đây là mô hình lập trình mạnh nhất của công ty từ trước đến nay. Cải tiến quan trọng nhất được thể hiện qua điểm số SWE-bench Pro. Đây là một bộ tiêu chuẩn đánh giá khả năng giải quyết các vấn đề thực tế trên GitHub. Theo thông báo năm 2026, điểm số đã tăng từ 64.3 lên 69.2. Boris Cherny đã chia sẻ: "Claude Opus 4.8 is out today. It's our strongest coding model yet: up on SWE-bench Pro (from 64.3 to 69.2) and noticeably more honest about its own work. It tells you when it's unsure and catches its own bugs instead of declaring victory early. Same price as 4.7." Sự cải tiến này không chỉ là về sức mạnh tính toán mà còn về độ tin cậy.

Hiệu năng lập trình của Opus 4.8 được cải thiện rõ rệt, đặc biệt là trong các tác vụ có định hướng (agentic coding). Mô hình này giải quyết các vấn đề kỹ thuật phần mềm phức tạp hiệu quả hơn. Khả năng tự phát hiện và sửa lỗi giúp giảm đáng kể thời gian giám sát và gỡ lỗi của lập trình viên, tăng năng suất làm việc.
Sự nhảy vọt về điểm số trên các benchmark chuyên ngành là minh chứng rõ ràng nhất. Theo The Next Web (2026), điểm số trên Terminal-Bench 2.1, một bài kiểm tra về lập trình có định hướng, đã tăng từ 64.3% lên 69.2%. Điều này có nghĩa là Opus 4.8 có thể tự chủ thực hiện các chuỗi lệnh phức tạp để hoàn thành một nhiệm vụ lập trình. Nó không chỉ viết code mà còn tương tác với môi trường terminal giống như một nhà phát triển thực thụ. Đây là một bước tiến quan trọng hướng tới các "AI agent" có khả năng làm việc độc lập lâu hơn và hiệu quả hơn. Thay vì chỉ là một công cụ gợi ý code, Claude đang trở thành một cộng sự ảo.

"Tính trung thực" trong AI có nghĩa là mô hình sẽ chủ động thừa nhận khi nó không chắc chắn hoặc phát hiện ra lỗi của chính mình. Thay vì quả quyết một câu trả lời sai, Opus 4.8 sẽ báo hiệu sự không chắc chắn. Điều này xây dựng lòng tin và làm cho sự hợp tác giữa người và máy trở nên hiệu quả và an toàn hơn.
Đây là một trong những triết lý cốt lõi của Anthropic: xây dựng AI an toàn và đáng tin cậy. Một mô hình "trung thực" sẽ không "ảo tưởng sức mạnh" và tuyên bố chiến thắng sớm. Nó sẽ nói "tôi không chắc về điều này" hoặc "đoạn code này có thể chứa lỗi". Điều này giúp các lập trình viên tránh được việc triển khai code lỗi và tiết kiệm hàng giờ gỡ lỗi. Theo Techzine Global (2026), các cải tiến trên nhiều lĩnh vực của Opus 4.8 so với 4.7 dao động từ dưới 1% đến gần 9%. Mặc dù không phải tất cả đều là bước nhảy vọt, chúng cho thấy sự tinh chỉnh toàn diện hướng tới một mô hình đáng tin cậy hơn. Việc Anthropic tập trung vào khía cạnh này cho thấy họ hiểu rõ nỗi đau của người dùng chuyên nghiệp.

Mặc dù nổi bật về lập trình, Claude Opus 4.8 cũng cho thấy sự cải thiện đáng kể trong các tác vụ khác. Khả năng suy luận đa ngành, sử dụng công cụ và xử lý công việc tri thức đều được nâng cấp. Điều này làm cho Opus 4.8 trở thành một trợ lý AI toàn diện, hữu ích cho nhiều chuyên gia ngoài ngành công nghệ.
Anthropic không chỉ xây dựng một công cụ cho lập trình viên. Họ đang tạo ra một nền tảng AI đa năng. Theo The Next Web (2026), điểm số về suy luận đa lĩnh vực có sử dụng công cụ đã tăng từ 54.7% lên 57.9%. Tương tự, khả năng tự chủ sử dụng máy tính (agentic computer use) cũng nhích nhẹ từ 82.8% lên 83.4%. Những con số này cho thấy Claude đang ngày càng thông minh hơn trong việc hiểu và thực thi các yêu cầu phức tạp, kết hợp nhiều kỹ năng. Theo Thurrott.com (2026), mục tiêu của Anthropic là "đưa Claude đến nhiều nơi làm việc hơn", và những cải tiến này chính là bước đi cụ thể để hiện thực hóa tầm nhìn đó. Từ phân tích tài chính đến soạn thảo văn bản pháp lý, Opus 4.8 đều cho thấy tiềm năng ứng dụng rộng rãi.

Một trong những thông tin đáng chú ý nhất là Claude Opus 4.8 được phát hành với mức giá không đổi so với phiên bản 4.7. Điều này thể hiện chiến lược của Anthropic nhằm gia tăng giá trị cho người dùng. Họ không tăng gánh nặng chi phí, giúp củng cố vị thế cạnh tranh trên thị trường AI đang phát triển nhanh chóng.
Việc giữ nguyên giá là một động thái thông minh. Nó khuyến khích người dùng hiện tại tiếp tục sử dụng và thu hút khách hàng mới. Đằng sau chiến lược này là sự hậu thuẫn tài chính vững chắc. Theo The Next Web (2026), Anthropic gần đây đã huy động thành công 65 tỷ đô la trong vòng gọi vốn Series H. Vòng vốn này nâng định giá công ty lên 965 tỷ đô la. Con số này cho thấy niềm tin mạnh mẽ của các nhà đầu tư. Theo Thurrott.com (2026), mức định giá này thậm chí đã vượt qua giá trị 852 tỷ đô la của OpenAI tại cùng thời điểm. Điều này cho phép Anthropic tiếp tục đầu tư mạnh mẽ vào nghiên cứu và phát triển mà không cần chuyển gánh nặng chi phí sang người dùng ngay lập tức.


Anthropic vừa ra mắt Claude Fable 5, một mô hình AI thuộc lớp Mythos được thiết kế an toàn cho công chúng. Với khả năng vượt trội so với các phiên bản trước như Opus, Fable 5 đặt ra tiêu chuẩn mới về hiệu suất trong lập trình, lý luận phức tạp và an toàn AI. Bài viết này phân tích sâu về sức mạnh và ý nghĩa của bước tiến đột phá này.
09/06/2026

Anthropic vừa ra mắt Claude Fable 5, một mô hình AI thuộc lớp Mythos với khả năng vượt trội và an toàn cho sử dụng rộng rãi. Được xác nhận bởi đánh giá FrontierCode, Fable 5 thể hiện một bước tiến lớn về hiệu năng, đặc biệt trong các tác vụ lập trình phức tạp, hứa hẹn thay đổi cuộc chơi cho các nhà phát triển và doanh nghiệp.
09/06/2026

Anthropic vừa nâng cấp Claude Code với khả năng hỗ trợ subagent lồng nhau, một bước tiến quan trọng trong lập trình agentic. Tính năng này cho phép các agent chính khởi tạo và quản lý các agent con chuyên biệt, giúp giải quyết các tác vụ phức tạp một cách hiệu quả hơn. Với giới hạn ban đầu là 5 lớp lồng nhau, cập nhật này hứa hẹn sẽ tối ưu hóa đáng kể việc quản lý ngữ cảnh và tài nguyên cho các nhà phát triển.
09/06/2026