- Claude Sonnet 4 của Anthropic nay cung cấp ngữ cảnh tối đa 1 triệu token, cho phép xử lý các codebase lớn hoặc nhiều tài liệu cùng lúc
- Với khả năng hỗ trợ ngữ cảnh được nâng cấp, có thể áp dụng cho nhiều trường hợp như phân tích mã quy mô lớn, xử lý tập tài liệu đồ sộ và phát triển tác nhân duy trì ngữ cảnh
- Với các prompt vượt quá 200.000 token, phí API sẽ tăng, nhưng có thể giảm chi phí thông qua prompt caching và xử lý hàng loạt
- Các khách hàng thực tế như Bolt.new và iGent AI đã cải thiện đáng kể năng suất và năng lực AI nhờ tính năng này
- Hiện tại, hỗ trợ ngữ cảnh dài của Sonnet 4 đang được cung cấp bản beta trên Anthropic API và Amazon Bedrock, và sắp ra mắt trên Google Cloud
Hỗ trợ ngữ cảnh 1 triệu token
- Claude Sonnet 4 dùng qua Anthropic API nay hỗ trợ ngữ cảnh lên tới 1 triệu token
- Nhờ đó, trong một yêu cầu duy nhất có thể xử lý toàn bộ hơn 75.000 dòng mã hoặc nhiều bài nghiên cứu một cách tổng hợp
- Tính năng beta ngữ cảnh 1 triệu token hiện có trên Anthropic API và Amazon Bedrock, đồng thời Vertex AI của Google Cloud cũng sẽ sớm hỗ trợ
Ngữ cảnh dài hơn, mở rộng các trường hợp sử dụng
- Phân tích mã quy mô lớn: Có thể nạp toàn bộ codebase (bao gồm tệp nguồn, test và tài liệu) cùng lúc để hiểu cấu trúc dự án, nắm mối liên hệ giữa các tệp và đề xuất cải thiện mã dựa trên thiết kế hệ thống
- Tóm tắt hợp nhất tài liệu: Có thể phân tích hàng trăm hợp đồng pháp lý, bài nghiên cứu, tài liệu đặc tả kỹ thuật trong một lượt và rút ra insight tổng hợp trong khi vẫn giữ được mối quan hệ giữa các tài liệu
- Tác nhân duy trì ngữ cảnh: Ngay cả trong các quy trình làm việc nhiều bước với hàng trăm lần gọi công cụ, vẫn có thể phát triển tác nhân hội thoại duy trì trạng thái nhất quán bằng cách bao gồm toàn bộ tài liệu API, định nghĩa công cụ và lịch sử tương tác
Chính sách giá API
- Prompt từ 200.000 token trở xuống: đầu vào $3/triệu token, đầu ra $15/triệu token
- Prompt vượt quá 200.000 token: đầu vào $6/triệu token, đầu ra $22.5/triệu token
- Khi áp dụng prompt caching, có thể giảm độ trễ và chi phí
- Kết hợp ngữ cảnh 1 triệu token với xử lý hàng loạt có thể giúp giảm thêm tối đa 50% chi phí
Các trường hợp ứng dụng từ khách hàng
-
Bolt.new
- Bolt.new đang tạo ra đổi mới trong phát triển web bằng cách tích hợp Claude vào nền tảng phát triển dựa trên web
- "Nhờ cửa sổ ngữ cảnh 1 triệu token của Sonnet 4, các nhà phát triển có thể xử lý những dự án lớn hơn với độ chính xác cao"
-
iGent AI
- iGent AI có trụ sở tại London, Anh, chuyển nội dung hội thoại thành mã có thể thực thi thông qua đối tác AI mang tên Maestro
- "Khả năng kỹ thuật phần mềm tự chủ vốn trước đây là bất khả thi nay đã trở thành hiện thực với ngữ cảnh 1 triệu token của Sonnet 4, cho phép vận hành các phiên kéo dài nhiều ngày trên codebase thực tế"
Cách sử dụng và kế hoạch sắp tới
- Tính năng ngữ cảnh dài hiện đang được cung cấp dưới dạng beta cho khách hàng Tier 4 và gói giá tùy chỉnh của Anthropic API, và dự kiến sẽ mở rộng cho nhiều người dùng hơn trong vài tuần tới
- Tính năng này cũng đã được hỗ trợ trên Amazon Bedrock, và hỗ trợ cho Google Cloud Vertex AI cũng sẽ sớm được cung cấp
- Anthropic cũng có kế hoạch đưa ngữ cảnh dài vào các dòng sản phẩm Claude khác
- Có thể xem thêm thông tin chi tiết trên tài liệu chính thức và trang hướng dẫn giá
Chưa có bình luận nào.