Ra mắt Claude 3.5 Sonnet: hiệu năng vượt GPT4o

(anthropic.com)

15 điểm bởi brainer 2024-06-21 | 1 bình luận | Chia sẻ qua WhatsApp

Anthropic hôm nay đã ra mắt Claude 3.5 Sonnet. Đây là phiên bản đầu tiên trong dòng mô hình Claude 3.5 sắp được phát hành, với hiệu năng vượt trội hơn Claude 3 Opus hiện có và các mô hình cạnh tranh. Claude 3.5 Sonnet được cung cấp với cùng tốc độ và chi phí như Claude 3 Sonnet, mô hình tầm trung.

Cách cung cấp

Claude 3.5 Sonnet có thể được sử dụng miễn phí trên Claude.ai và ứng dụng Claude iOS, đồng thời người đăng ký gói Claude Pro và Team có thể truy cập với hạn mức yêu cầu cao hơn. Ngoài ra, mô hình này cũng có thể được sử dụng thông qua Anthropic API, Amazon Bedrock và Vertex AI của Google Cloud. Chi phí là $3 cho mỗi một triệu token đầu vào và $15 cho mỗi một triệu token đầu ra, đồng thời cung cấp cửa sổ ngữ cảnh 200K token.

Cải thiện hiệu năng

Claude 3.5 Sonnet đã thiết lập chuẩn mới trong suy luận ở cấp độ sau đại học (GPQA), kiến thức ở cấp độ đại học (MMLU) và năng lực lập trình (HumanEval). Khả năng hiểu sự hài hước và các chỉ dẫn phức tạp đã được cải thiện đáng kể, đồng thời có thể viết nội dung chất lượng cao với giọng điệu tự nhiên và giàu sự đồng cảm.

Kết quả đánh giá nội bộ

Trong đánh giá lập trình nội bộ, Claude 3.5 Sonnet đã giải quyết được 64% vấn đề, vượt qua mức 38% của Claude 3 Opus. Bài đánh giá này kiểm tra khả năng sửa lỗi hoặc bổ sung tính năng cho các codebase mã nguồn mở dựa trên mô tả bằng ngôn ngữ tự nhiên. Claude 3.5 Sonnet xử lý việc dịch mã dễ dàng, nên đặc biệt hiệu quả trong việc cập nhật ứng dụng legacy và migration codebase.

Năng lực thị giác

Claude 3.5 Sonnet vượt qua Claude 3 Opus trên các benchmark thị giác tiêu chuẩn và cho thấy hiệu năng nổi bật trong các tác vụ đòi hỏi suy luận thị giác. Khả năng chép lại chính xác văn bản từ các hình ảnh không hoàn chỉnh đặc biệt hữu ích trong các lĩnh vực bán lẻ, logistics và dịch vụ tài chính.

Giới thiệu tính năng Artifacts

Artifacts, được đưa vào Claude.ai hôm nay, cung cấp một không gian làm việc động nơi người dùng có thể chỉnh sửa theo thời gian thực và tích hợp vào dự án cũng như quy trình làm việc các nội dung như đoạn mã được tạo, tài liệu văn bản và thiết kế website.

An toàn và quyền riêng tư

Claude 3.5 Sonnet đã trải qua các thử nghiệm nghiêm ngặt ở cấp độ ASL-2 và hoàn tất đánh giá an toàn trước triển khai với sự hợp tác của Viện Nghiên cứu An toàn AI Vương quốc Anh (UK AISI). Dữ liệu người dùng sẽ không được dùng để huấn luyện nếu không có sự cho phép rõ ràng.

Kế hoạch sắp tới

Để hoàn thiện dòng mô hình Claude 3.5, Anthropic dự kiến phát hành Claude 3.5 Haiku và Claude 3.5 Opus vào cuối năm nay. Công ty cũng đang phát triển các tính năng và modality mới để hỗ trợ tích hợp ứng dụng doanh nghiệp, đồng thời khám phá tính năng "Memory" có khả năng ghi nhớ sở thích của người dùng và lịch sử tương tác.

Chúng tôi luôn nỗ lực cải thiện Claude và phản ánh phản hồi của người dùng để mang lại trải nghiệm tốt hơn. Bạn có thể gửi phản hồi về Claude 3.5 Sonnet trực tiếp trong sản phẩm để phản ánh vào lộ trình phát triển.

1 bình luận

wedding 2024-06-21

Tôi đã thử rồi, tốc độ cực kỳ nhanh.
Cũng rất tốt vì giống như gpt4o, có thể dùng miễn phí một số lượt nhất định.