-
Sky-T1
-
Huấn luyện mô hình O1 Preview với 450 USD
- Các mô hình như O1 và Gemini 2.0 cho thấy năng lực suy luận vượt trội trong việc giải quyết các tác vụ phức tạp, và đạt được điều đó thông qua các chuỗi suy nghĩ nội bộ dài.
- Tuy nhiên, việc không thể tiếp cận các chi tiết kỹ thuật và trọng số mô hình đã tạo ra rào cản đối với sự tham gia của giới học thuật và cộng đồng mã nguồn mở.
- Để đáp lại, đã xuất hiện một số nỗ lực đáng chú ý nhằm huấn luyện các mô hình suy luận có trọng số mở trong lĩnh vực toán học như Still-2 và Journey.
- Nhóm NovaSky của UC Berkeley đang khám phá nhiều kỹ thuật khác nhau để nâng cao năng lực suy luận của các mô hình nền tảng và mô hình đã được tinh chỉnh theo chỉ dẫn.
- Trong nghiên cứu này, nhóm đạt được hiệu năng suy luận cạnh tranh không chỉ trong toán học mà cả trong lập trình trên cùng một mô hình.
-
Tác giả đóng góp
- Dacheng Li, Shiyi Cao, Shu Liu, Tyler Griggs, Simon Mo, Shishir G. Patil, Joseph E. Gonzalez, Ion Stoica
Chưa có bình luận nào.