1.5B

xguru · 2025-07-21T10:21:02+09:00

Là các mô hình phái sinh từ Qwen2.5-32B-Instruct (mô hình suy luận), được tối ưu cho suy luận giải quyết bài toán toán học, code và khoa học Có thể sử dụng cho mục đích nghiên cứu thương mại hoặc phi thương mại Hỗ trợ độ dài ngữ cảnh 64.000 token và được cung cấp với các kích cỡ 1.5B, 7B, 14B, 32B Ghi nhận hiệu năng suy luận hàng đầu cùng phân khúc trên nhiều benchmark như LiveCodeBench, GPQA, MMLU-PRO Khi áp dụng suy luận kết hợp đa tác tử (GenSelect), đạt hiệu năng vượt trội hơn mô hình đơn lẻ hiện có trên các benchmark toán học, code và khoa học GenSelect: chạy song song suy luận của nhiều mô hình, sau đó chọn ra lời giải tối ưu

(huggingface.co)

8 điểm bởi xguru 2025-07-21 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Là các mô hình phái sinh từ Qwen2.5-32B-Instruct (mô hình suy luận), được tối ưu cho suy luận giải quyết bài toán toán học, code và khoa học
Có thể sử dụng cho mục đích nghiên cứu thương mại hoặc phi thương mại
Hỗ trợ độ dài ngữ cảnh 64.000 token và được cung cấp với các kích cỡ 1.5B, 7B, 14B, 32B
Ghi nhận hiệu năng suy luận hàng đầu cùng phân khúc trên nhiều benchmark như LiveCodeBench, GPQA, MMLU-PRO
Khi áp dụng suy luận kết hợp đa tác tử (GenSelect), đạt hiệu năng vượt trội hơn mô hình đơn lẻ hiện có trên các benchmark toán học, code và khoa học
- GenSelect: chạy song song suy luận của nhiều mô hình, sau đó chọn ra lời giải tối ưu

NVIDIA công bố các mô hình OpenReasoning-Nemotron 32B/14B/7B/1.5B

Bài viết liên quan

Chưa có bình luận nào.