9 điểm bởi wedding 5 ngày trước | 7 bình luận | Chia sẻ qua WhatsApp

Opus 4.7, một bản cải tiến từ dòng mô hình hiện có và khác với Mythos, đã được phát hành.

Tuần trước, chúng tôi đã công bố Project Glasswing, dự án nhấn mạnh cả rủi ro lẫn lợi ích của các mô hình AI trong lĩnh vực an ninh mạng. Chúng tôi cũng cho biết sẽ triển khai phát hành Claude Mythos Preview một cách hạn chế, đồng thời trước tiên thử nghiệm các tính năng an ninh mạng mới trên những mô hình có năng lực thấp hơn đôi chút. Opus 4.7 là mô hình đầu tiên trong các thử nghiệm đó. Các tính năng an ninh mạng của Opus 4.7 không tiên tiến bằng Mythos Preview (trên thực tế, chúng tôi đã tiến hành thử nghiệm giảm dần các khả năng này trong quá trình huấn luyện). Chúng tôi phát hành Opus 4.7 với các tính năng bảo mật có khả năng tự động phát hiện và chặn những yêu cầu thể hiện mục đích sử dụng an ninh mạng bị cấm hoặc có mức độ rủi ro cao. Những bài học thu được từ việc triển khai thực tế các tính năng bảo mật này cuối cùng sẽ giúp ích cho việc phát hành rộng rãi các mô hình cấp độ Mythos.

Các chuyên gia bảo mật muốn sử dụng Opus 4.7 cho các mục đích an ninh mạng hợp pháp (nghiên cứu lỗ hổng, kiểm thử xâm nhập, hoạt động red team, v.v.) có thể tham gia chương trình xác minh an ninh mạng mới của chúng tôi.

Từ hôm nay, Opus 4.7 có mặt trên tất cả các sản phẩm Claude và API, Amazon Bedrock, Vertex AI của Google Cloud và Microsoft Foundry. Mức giá giống Opus 4.6: 5 USD cho mỗi 1 triệu token đầu vào và 25 USD cho mỗi 1 triệu token đầu ra. Các nhà phát triển có thể sử dụng thông qua Claude API.

7 bình luận

 

Tôi đã cảm nhận hiệu năng của opus 4.6 bị giảm đi, chắc là vì sắp ra mắt model mới. Cú lừa khiến cảm giác tụt hạng một lần rồi lại làm mức độ hài lòng tăng lên đúng là ma thuật..

 

Giống như tộc chiến đấu Saiyan trong Dragon Ball...

 

Cùng với model opus 4.7, dường như cũng đã có thêm tùy chọn bật auto mode trong claude code.

> Auto mode cho phép Claude tự động xử lý các yêu cầu cấp quyền. Claude sẽ kiểm tra xem mỗi lần gọi công cụ có phải là thao tác nguy hiểm hay có dấu hiệu prompt injection hay không trước khi thực thi.
> Những tác vụ được đánh giá là an toàn sẽ được thực hiện, còn những tác vụ bị đánh giá là nguy hiểm sẽ bị chặn, và Claude có thể thử một cách tiếp cận khác.

> Chế độ này phù hợp với các tác vụ chạy trong thời gian dài. Tuy nhiên, chi phí phiên sẽ cao hơn một chút.
> Vì Claude cũng có thể vô tình thực thi các lệnh có hại, nên chỉ nên dùng trong môi trường cách ly.
> (Có thể chuyển chế độ bằng Shift+Tab)

 

Đây là nội dung đã có sẵn trước đó.

 
turastory 5 ngày trước

Tôi tưởng là nó sẽ tự động chọn mô hình như Cursor auto, nhưng hóa ra là về quyền hạn nhiều hơn.
https://claude.com/blog/auto-mode

 
shakespeares 5 ngày trước

Có vẻ hiệu năng khá đáng mong đợi.

 

Tôi định vào viết bài ngay khi thấy ra mắt, nhưng anh/chị đã đăng rồi nhỉ.
Tôi tò mò không biết hiệu năng sẽ đến mức nào.