1 điểm bởi recast7838 4 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp

Moonshot AI đã ra mắt 'Kimi K2.7-Code', một mô hình lập trình mã nguồn mở theo hướng agent với hiệu năng viết mã được cải thiện đáng kể so với mẫu trước đó và giảm 30% lượng token suy luận tiêu thụ.


Bản dịch đầy đủ

Trong tuần này, Moonshot AI đã ra mắt Kimi K2.7-Code. Đây là một mô hình theo hướng agent được tối ưu hóa cho việc lập trình. Trọng số mô hình được phân phối trên Hugging Face theo giấy phép MIT đã sửa đổi. Ngoài ra, mô hình cũng có thể được sử dụng thông qua Kimi API và Kimi Code. K2.7-Code không nhắm đến hội thoại thông thường mà hướng đến các tác vụ kỹ thuật phần mềm dài hạn. Mô hình này lập kế hoạch qua nhiều bước, chỉnh sửa mã, chạy công cụ và thực hiện gỡ lỗi. Moonshot AI cung cấp mô hình này cùng với một nền tảng lập trình dạng thuê bao.

Thông số Kimi K2.7-Code

K2.7-Code là một mô hình MoE (Mixture-of-Experts). Mô hình có tổng cộng 1 nghìn tỷ (1T) tham số, trong đó 32 tỷ (32B) tham số được kích hoạt cho mỗi token. Kiến trúc này sử dụng cách chọn 8 chuyên gia trên mỗi token trong tổng số 384 chuyên gia, cùng với 1 chuyên gia dùng chung. Mô hình gồm tổng cộng 61 lớp, bao gồm 1 lớp Dense.

Cơ chế attention sử dụng MLA, còn đường feedforward áp dụng SwiGLU. Bộ mã hóa thị giác MoonViT bổ sung 400 triệu (400M) tham số cho đầu vào hình ảnh và video. Mô hình được cung cấp với lượng tử hóa INT4 gốc. Cửa sổ ngữ cảnh là 256K token (262.144). Có hai hạn chế. Chế độ suy nghĩ (Thinking mode) là bắt buộc, và nếu vô hiệu hóa thì API sẽ trả về lỗi. Các tham số lấy mẫu được cố định ở temperature 1.0, top_p 0.95, n 1 và penalty 0.0. Mức đầu ra tối đa mặc định là 32.768 token. Có thể tự host bằng vLLM, SGLang và KTransformers. Kích thước repository trên Hugging Face rất lớn, khoảng 595GB trên đĩa. Đây là mục tiêu triển khai ở cấp máy chủ chứ không phải một mô hình dành cho laptop.

Điểm benchmark

Nhóm Moonshot đã công bố kết quả trên 6 benchmark. Họ so sánh K2.7-Code với K2.6, GPT-5.5 và Claude Opus 4.8. K2.7-Code vượt K2.6 ở mọi hạng mục. Mức tăng lớn nhất trong phần lập trình là ở Kimi Code Bench v2, tăng từ 50.9% lên 62.0%.

K2.7-Code đạt 81.1% trên benchmark MCP Mark Verified, vượt Opus 4.8 với 76.4%. Ngoài ra, trên MLS Bench Lite, mô hình ghi nhận kết quả tiệm cận GPT-5.5. K2.7-Code được chạy trong Kimi Code CLI, còn GPT-5.5 được thử nghiệm trong môi trường Codex xhigh và Opus 4.8 trong môi trường Claude Code xhigh.

1 bình luận

 

Thật sự quá đỉnh