8 điểm bởi xguru 2025-07-21 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Là các mô hình phái sinh từ Qwen2.5-32B-Instruct (mô hình suy luận), được tối ưu cho suy luận giải quyết bài toán toán học, code và khoa học
  • Có thể sử dụng cho mục đích nghiên cứu thương mại hoặc phi thương mại
  • Hỗ trợ độ dài ngữ cảnh 64.000 token và được cung cấp với các kích cỡ 1.5B, 7B, 14B, 32B
  • Ghi nhận hiệu năng suy luận hàng đầu cùng phân khúc trên nhiều benchmark như LiveCodeBench, GPQA, MMLU-PRO
  • Khi áp dụng suy luận kết hợp đa tác tử (GenSelect), đạt hiệu năng vượt trội hơn mô hình đơn lẻ hiện có trên các benchmark toán học, code và khoa học
    • GenSelect: chạy song song suy luận của nhiều mô hình, sau đó chọn ra lời giải tối ưu

Chưa có bình luận nào.

Chưa có bình luận nào.