- Grok-1.5 có khả năng suy luận được cải thiện và độ dài ngữ cảnh 128.000 token
- Hiệu năng cải thiện rõ rệt trong các tác vụ liên quan đến lập trình và toán học
- Đạt 50,6% trên benchmark MATH, 90% trên benchmark GSM8K và 74,1% trên benchmark HumanEval
- Với ngữ cảnh dài tối đa 128K token, mô hình có thể tận dụng thông tin từ các tài liệu dài hơn trước tới 16 lần. Vẫn duy trì khả năng làm theo chỉ dẫn trong khi xử lý các prompt dài và phức tạp hơn
- Sắp được cung cấp trên nền tảng cho các tester ban đầu và người dùng Grok hiện tại
- Được xây dựng trên framework huấn luyện phân tán tùy chỉnh dựa trên JAX, Rust và Kubernetes
- Sẽ sớm được cung cấp cho các tester ban đầu, và kỳ vọng phản hồi từ người dùng sẽ giúp cải thiện Grok
- Đồng thời sẽ dần mở rộng cho nhiều người dùng hơn và giới thiệu nhiều tính năng mới trong vài ngày tới.
Chưa có bình luận nào.