- Nhân dịp kỷ niệm 1 năm ra mắt dòng Phi, vốn đã chứng minh tiềm năng của mô hình ngôn ngữ nhỏ (SLM), Microsoft đã công bố một họ mô hình mới được tối ưu cho suy luận và chuyên về tư duy nhiều bước
- Dù có quy mô tham số nhỏ, các mô hình này vẫn cho thấy hiệu năng sánh ngang với các mô hình lớn
- Phi-4-reasoning: 14B tham số, được SFT (Supervised Fine-Tuning) bằng dữ liệu reasoning chất lượng cao
- Phi-4-reasoning-plus: bổ sung RL (Reinforcement Learning) trên nền mô hình trên, cải thiện độ chính xác với lượng token sử dụng nhiều hơn 1,5 lần
- Phi-4-mini-reasoning: dù chỉ có kích thước 3.8B, vẫn vượt qua các mô hình lớn hơn hơn 2 lần trong nhiều benchmark toán học, phù hợp cho thiết bị di động/edge
- Vượt nhiều mô hình khác nhau về mặt hiệu năng như OpenThinker-7B, Llama-3.2-3B, dòng DeepSeek-R1
- Đạt kết quả tương đương hoặc vượt OpenAI o1-mini, đặc biệt mạnh trong các bài kiểm tra thiên về toán như Math-500, GPQA Diamond
- Các mô hình này cũng được cung cấp dưới dạng Phi Silica, phiên bản tối ưu cho NPU trên Copilot+ PC, cho phép chạy nhanh và hiệu quả trong môi trường Windows
- Được phát hành trên Azure AI Foundry và HuggingFace:
- API cho nhà phát triển và các công cụ tích hợp cục bộ cũng được cung cấp, giúp dễ dàng áp dụng trong nhiều môi trường khác nhau
Chưa có bình luận nào.