Anthropic đang kêu gọi cộng đồng người dùng Claude chia sẻ kinh nghiệm về mức độ 'suy nghĩ' của AI. Nhà nghiên cứu Sholto Douglas muốn biết liệu Claude có đang cân bằng tốt giữa việc phân tích sâu và phản hồi nhanh hay không. Phản hồi của bạn sẽ giúp tối ưu hóa hiệu suất, chi phí và trí thông minh của các thế hệ Claude tiếp theo.
Bài viết được biên tập + bổ sung research từ nhiều nguồn. Đọc bài gốc tại Twitter / X →

Anthropic đang phát triển Claude để trở thành một công cụ mạnh mẽ cho ngành hóa học. Bằng cách tận dụng khả năng đa phương thức và suy luận tường minh, Claude có thể phân tích dữ liệu phức tạp như phổ NMR, vượt qua các phần mềm chuyên dụng và hứa hẹn đẩy nhanh tốc độ khám phá khoa học trong phòng thí nghiệm.
06/06/2026

Anthropic đang mở rộng đáng kể Dự án Glasswing, một nỗ lực hợp tác nhằm bảo vệ các phần mềm quan trọng nhất thế giới bằng AI. Với việc bổ sung 150 tổ chức từ hơn 15 quốc gia, dự án tập trung vào các lĩnh vực hạ tầng trọng yếu. Sáng kiến này sử dụng mô hình Claude Mythos Preview để chủ động phát hiện lỗ hổng, chuẩn bị cho một kỷ nguyên mới của an ninh mạng.
04/06/2026

Research powered by Tavily.
Dự án Glasswing của Anthropic, với sự tham gia của 50 đối tác, đã sử dụng AI Claude Mythos Preview để phát hiện hơn mười nghìn lỗ hổng bảo mật nghiêm trọng. Cập nhật ban đầu này cho thấy tiềm năng to lớn của AI trong việc bảo vệ phần mềm quan trọng, đồng thời đặt ra thách thức mới về việc xác minh và vá lỗi ở quy mô lớn.
22/05/2026

Anthropic đang tìm cách tối ưu hóa hiệu suất và hiệu quả của Claude. Việc "suy nghĩ quá nhiều" có thể gây lãng phí tài nguyên tính toán và làm chậm phản hồi cho các tác vụ đơn giản. Ngược lại, "suy nghĩ quá ít" sẽ không giải quyết được các vấn đề phức tạp. Tìm kiếm sự cân bằng hoàn hảo này giúp Claude vừa thông minh, vừa hiệu quả về chi phí và tốc độ cho người dùng.
Trong một bài đăng gần đây, nhà nghiên cứu Sholto Douglas của Anthropic đã chia sẻ lời kêu gọi từ đồng nghiệp, tìm kiếm các ví dụ từ cộng đồng người dùng. Họ muốn biết khi nào Claude dường như "suy nghĩ quá nhiều" hoặc "quá ít". Đây không chỉ là một câu hỏi về học thuật. Nó chạm đến cốt lõi của việc phát triển AI bền vững và có khả năng mở rộng. Mỗi yêu cầu gửi đến Claude đều tiêu tốn một lượng tài nguyên tính toán nhất định. Nếu mô hình dành quá nhiều năng lượng cho một nhiệm vụ đơn giản, chi phí sẽ tăng lên và thời gian phản hồi kéo dài. Ngược lại, nếu nó xử lý hời hợt một vấn đề phức tạp, giá trị mà nó mang lại sẽ giảm sút. Theo `dwarkesh.com` (2026), các phòng thí nghiệm AI luôn đối mặt với câu hỏi: "Tôi sẵn sàng đốt bao nhiêu tài nguyên tính toán, so với việc đốt bao nhiêu đô la vào thời gian của con người?" Việc tối ưu hóa này là câu trả lời cho bài toán kinh tế đó. Dự kiến đến năm 2028, sẽ có khoảng 100 triệu đơn vị tính toán tương đương H100 trên toàn thế giới, nhấn mạnh tầm quan trọng của việc sử dụng hiệu quả nguồn tài nguyên khổng lồ này.

"Suy nghĩ quá nhiều" là khi Claude đưa ra câu trả lời quá phức tạp cho một câu hỏi đơn giản. Ví dụ, bạn chỉ hỏi định nghĩa của một thuật ngữ, nhưng Claude lại trả về một bài luận chi tiết về lịch sử và các sắc thái triết học của nó. Ngược lại, "suy nghĩ quá ít" xảy ra khi mô hình đưa ra câu trả lời hời hợt, thiếu chi tiết hoặc sai cho một vấn đề đòi hỏi phân tích sâu.
Hãy tưởng tượng bạn yêu cầu Claude viết một hàm Python đơn giản để tính tổng hai số. Một Claude "suy nghĩ quá nhiều" có thể trả về hàm đó, kèm theo một phân tích về các loại số nguyên, cách xử lý lỗi tràn bộ nhớ, và so sánh hiệu suất với các ngôn ngữ khác. Điều này hữu ích trong một số trường hợp, nhưng thường là thừa thãi. Một Claude "suy nghĩ quá ít" có thể đưa ra một câu trả lời sai hoặc không đầy đủ cho một câu hỏi chiến lược kinh doanh, chỉ liệt kê các gạch đầu dòng chung chung thay vì phân tích sâu về bối cảnh bạn cung cấp. Theo `dwarkesh.com` (2026), nhiều người dùng thấy rằng mô hình đôi khi đã làm đúng đến 90% nhưng vẫn chưa hoàn hảo. Việc tìm ra điểm cân bằng lý tưởng là mục tiêu. Theo `Anthropic` (2026), việc theo dõi 'dòng suy nghĩ' của mô hình ngôn ngữ giúp các nhà nghiên cứu hiểu được cách nó đi đến một kết luận, từ đó có thể tinh chỉnh quá trình này.


Phản hồi của người dùng là dữ liệu vàng cho việc huấn luyện học tăng cường (RLHF - Reinforcement Learning from Human Feedback). Bằng cách cung cấp các ví dụ cụ thể về việc Claude hoạt động tốt hay không, người dùng giúp các nhà nghiên cứu tại Anthropic tinh chỉnh mô hình. Dữ liệu này giúp AI hiểu rõ hơn kỳ vọng của con người và điều chỉnh "mức độ suy nghĩ" cho phù hợp với từng loại nhiệm vụ.
Mỗi khi bạn đánh giá một câu trả lời của Claude là hữu ích hay không, bạn đang cung cấp một tín hiệu. Các tín hiệu này, khi được tổng hợp từ hàng triệu người dùng, sẽ tạo thành một bộ dữ liệu khổng lồ. Các nhà nghiên cứu sử dụng nó để "thưởng" hoặc "phạt" các hành vi nhất định của mô hình. Theo `Twitter / X` (2026), một nhà nghiên cứu của Anthropic đã hỏi cộng đồng: "bạn có thích mức độ Claude suy nghĩ về các tác vụ của bạn không? Rất mong nhận được ví dụ về việc nó suy nghĩ quá nhiều hoặc quá ít." Lời kêu gọi này cho thấy tầm quan trọng của các ví dụ thực tế. Thậm chí, theo `dwarkesh.com` (2026), ngay cả khi mô hình chỉ gán 1% xác suất cho một token đúng, phản hồi tích cực cũng giúp nó học hỏi và tăng cường lựa chọn đó trong tương lai. Sholto Douglas ví von điều này như nói với mô hình: "Ồ, tôi thấy bạn đã gán 1%. Làm tốt lắm. Hãy tiếp tục làm vậy."


Việc tối ưu hóa này sẽ tạo ra một Claude thông minh hơn, nhanh hơn và tiết kiệm chi phí hơn. Nó cho phép Anthropic phân bổ tài nguyên tính toán một cách hợp lý, dùng "suy nghĩ" sâu cho các vấn đề hóc búa và phản ứng nhanh cho các yêu cầu đơn giản. Điều này trực tiếp cải thiện trải nghiệm người dùng và mở đường cho các ứng dụng AI tiên tiến hơn, hiệu quả hơn trong tương lai.
Mục tiêu cuối cùng là tạo ra một trí tuệ nhân tạo có thể điều chỉnh linh hoạt nỗ lực của mình. Giống như con người không dùng 100% năng lượng não bộ để pha một tách cà phê, AI cũng không cần phải vận dụng toàn bộ khả năng cho mọi tác vụ. Bằng cách dạy Claude khi nào cần "suy nghĩ sâu" và khi nào cần "phản ứng nhanh", Anthropic có thể cung cấp một dịch vụ tốt hơn với chi phí thấp hơn. Sholto Douglas, trong một cuộc phỏng vấn với `The MAD Podcast with Matt Turck` (2026), đã thảo luận về việc vượt qua 'cao nguyên AI' (AI Plateau) thông qua những cải tiến như thế này. Ước tính đến năm 2028, thế giới sẽ có 100 triệu đơn vị tính toán tương đương não người, mở ra khả năng cho 100 triệu AGI hoạt động song song, theo `dwarkesh.com` (2028). Việc sử dụng hiệu quả sức mạnh này là chìa khóa.


Người dùng có thể tham gia trực tiếp vào các cuộc thảo luận trên các nền tảng như X (Twitter), nơi các nhà nghiên cứu của Anthropic thường xuyên tương tác. Cung cấp các ví dụ chi tiết, bao gồm câu lệnh (prompt), phản hồi của Claude, và phân tích tại sao nó "suy nghĩ quá nhiều" hoặc "quá ít" là cách đóng góp hiệu quả nhất để giúp cải thiện mô hình.
Ngoài việc theo dõi và trả lời các nhà nghiên cứu, bạn có thể sử dụng các tính năng phản hồi được tích hợp sẵn trong giao diện Claude. Nút thích/không thích (thumbs up/down) bên cạnh mỗi câu trả lời là một kênh trực tiếp. Khi bạn bấm không thích, Claude thường sẽ hỏi lý do. Hãy tận dụng cơ hội này để giải thích cụ thể. Thay vì chỉ nói "câu trả lời tệ", hãy nêu rõ: "Câu trả lời này quá dài dòng cho câu hỏi của tôi" hoặc "Câu trả lời này thiếu các chi tiết quan trọng về X và Y". Một nghiên cứu năm 2024 đã phân tách được 30 triệu 'tính năng' khái niệm bên trong một mô hình AI, cho thấy tầm quan trọng của phản hồi chi tiết để tinh chỉnh các tính năng cụ thể này (Theo `dwarkesh.com`, 2024). Như lời kêu gọi ban đầu trên `Twitter / X` (2026), việc chia sẻ các đoạn hội thoại cụ thể là cách tốt nhất để giúp các nhà nghiên cứu hiểu rõ bối cảnh và vấn đề. Đóng góp của bạn, dù nhỏ, cũng góp phần xây dựng một Claude thông minh và hữu ích hơn cho tất cả mọi người.