- DeepSeek-V3.1 là bước đầu tiên cho kỷ nguyên tác tử thế hệ tiếp theo
- Được trang bị tính năng suy luận lai, cho phép chọn sử dụng linh hoạt hai chế độ Think (dựa trên suy luận) và Non-Think (không dựa trên suy luận) trong một mô hình duy nhất
- Ở chế độ DeepSeek-V3.1-Think, có thể đưa ra đáp án trong thời gian ngắn hơn so với mô hình trước đó DeepSeek-R1-0528, giúp hiệu suất được cải thiện đáng kể
- Thông qua huấn luyện hậu kỳ (Post-training), năng lực đảm nhiệm vai trò của mô hình trong việc sử dụng công cụ, thao tác hệ thống bên ngoài, và các tác vụ tác tử nhiều bước đã được cải thiện mạnh mẽ
- Người dùng có thể tự do chuyển đổi giữa chế độ Think/Non-Think thông qua nút “DeepThink” trong dịch vụ chatbot DeepSeek
- Cập nhật API
- Đạt được kết quả tốt hơn trong các đánh giá SWE (Software Engineering) và Terminal-Bench
- Khả năng suy luận nhiều bước và giải quyết vấn đề được tăng cường đáng kể trong các tác vụ tìm kiếm phức tạp hoặc nhiều bước
- Hiệu suất suy luận tổng thể được nâng lên rõ rệt
- Thay đổi gói giá (áp dụng từ 9/25)
- API đầu vào: $0.07 cho mỗi 1M token (cache hit) / $0.56 (cache miss)
- API đầu ra: $1.68 cho mỗi 1M token
Chưa có bình luận nào.