Microsoft công bố Phi-4, tối ưu cho suy luận

xguru · 2025-05-02T11:36:01+09:00

Nhân dịp kỷ niệm 1 năm ra mắt dòng Phi, vốn đã chứng minh tiềm năng của mô hình ngôn ngữ nhỏ (SLM), Microsoft đã công bố một họ mô hình mới được tối ưu cho suy luận và chuyên về tư duy nhiều bước Dù có quy mô tham số nhỏ, các mô hình này vẫn cho thấy hiệu năng sánh ngang với các mô hình lớn Phi-4-reasoning: 14B tham số, được SFT (Supervised Fine-Tuning) bằng dữ liệu reasoning chất lượng cao Phi-4-reasoning-plus: bổ sung RL (Reinforcement Learning) trên nền mô hình trên, cải thiện độ chính xác với lượng token sử dụng nhiều hơn 1,5 lần Phi-4-mini-reasoning: dù chỉ có kích thước 3.8B, vẫn vượt qua các mô hình lớn hơn hơn 2 lần trong nhiều benchmark toán học, phù hợp cho thiết bị di động/edge Vượt nhiều mô hình khác nhau về mặt hiệu năng như OpenThinker-7B, Llama-3.2-3B, dòng DeepSeek-R1 Đạt kết quả tương đương hoặc vượt OpenAI o1-mini, đặc biệt mạnh trong các bài kiểm tra thiên về toán như Math-500, GPQA Diamond Các mô hình này cũng được cung cấp dưới dạng Phi Silica, phiên bản tối ưu cho NPU trên Copilot+ PC, cho phép chạy nhanh và hiệu quả trong môi trường Windows Được phát hành trên Azure AI Foundry và HuggingFace: Phi-4-reasoning Phi-4-reasoning-plus Phi-4-mini-reasoning API cho nhà phát triển và các công cụ tích hợp cục bộ cũng được cung cấp, giúp dễ dàng áp dụng trong nhiều môi trường khác nhau

(azure.microsoft.com)

3 điểm bởi xguru 2025-05-02 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Nhân dịp kỷ niệm 1 năm ra mắt dòng Phi, vốn đã chứng minh tiềm năng của mô hình ngôn ngữ nhỏ (SLM), Microsoft đã công bố một họ mô hình mới được tối ưu cho suy luận và chuyên về tư duy nhiều bước
Dù có quy mô tham số nhỏ, các mô hình này vẫn cho thấy hiệu năng sánh ngang với các mô hình lớn
Phi-4-reasoning: 14B tham số, được SFT (Supervised Fine-Tuning) bằng dữ liệu reasoning chất lượng cao
Phi-4-reasoning-plus: bổ sung RL (Reinforcement Learning) trên nền mô hình trên, cải thiện độ chính xác với lượng token sử dụng nhiều hơn 1,5 lần
Phi-4-mini-reasoning: dù chỉ có kích thước 3.8B, vẫn vượt qua các mô hình lớn hơn hơn 2 lần trong nhiều benchmark toán học, phù hợp cho thiết bị di động/edge
- Vượt nhiều mô hình khác nhau về mặt hiệu năng như OpenThinker-7B, Llama-3.2-3B, dòng DeepSeek-R1
- Đạt kết quả tương đương hoặc vượt OpenAI o1-mini, đặc biệt mạnh trong các bài kiểm tra thiên về toán như Math-500, GPQA Diamond
Các mô hình này cũng được cung cấp dưới dạng Phi Silica, phiên bản tối ưu cho NPU trên Copilot+ PC, cho phép chạy nhanh và hiệu quả trong môi trường Windows
Được phát hành trên Azure AI Foundry và HuggingFace:
API cho nhà phát triển và các công cụ tích hợp cục bộ cũng được cung cấp, giúp dễ dàng áp dụng trong nhiều môi trường khác nhau

Microsoft công bố Phi-4, tối ưu cho suy luận

Bài viết liên quan

Chưa có bình luận nào.