- grok-code-fast-1 do xAI phát hành là một mô hình AI lập trình siêu nhanh dành cho nhà phát triển, có khả năng phản hồi cực nhanh và các tính năng thân thiện với IDE
- Mô hình này được tiền huấn luyện tập trung vào bộ dữ liệu lập trình và được thiết kế để thành thạo trong việc sử dụng các công cụ như grep, terminal, chỉnh sửa tệp thông qua đánh giá từ người dùng thực tế
- Hiệu năng đạt tốc độ sinh 190 token mỗi giây và điểm 70,8% trên SWE-Bench-Verified, đồng thời thể hiện thế mạnh ở nhiều ngôn ngữ như TypeScript, Python, Java, Rust, C++, Go
- Giá được ấn định ở mức $0.20 cho mỗi 1 triệu token đầu vào, $1.50 cho đầu ra, $0.02 cho đầu vào được cache, và trên một số nền tảng đối tác (GitHub Copilot, Cursor, v.v.) hiện đang được cung cấp miễn phí trong thời gian giới hạn
- Một biến thể hỗ trợ đầu vào đa phương thức, gọi công cụ song song, ngữ cảnh mở rộng cũng sẽ sớm được công bố
Tổng quan
- grok-code-fast-1 của xAI là một mô hình AI lập trình siêu nhanh được phát triển để giải quyết vấn đề suy giảm tốc độ trong môi trường phát triển thực tế, nơi việc suy luận lặp lại và sử dụng công cụ diễn ra thường xuyên
- Dựa trên phản hồi từ các kỹ sư đang làm việc thực tế, mô hình được xây dựng lại từ đầu với kiến trúc phù hợp cho công việc thực chiến, nhanh nhạy và linh hoạt
- Đội ngũ kỹ thuật suy luận và hạ tầng tính toán đã đưa nhiều phương pháp đổi mới vào công nghệ phục vụ mô hình với tốc độ áp đảo
- Người dùng có thể cảm nhận rằng nhiều lệnh gọi công cụ đã được thực hiện trước cả khi họ kịp đọc hết luồng suy nghĩ
- Nhờ tối ưu hóa prompt caching, mô hình đạt tỷ lệ cache hit trên 90% trong môi trường đối tác
Thiết kế và bộ dữ liệu
- Môi trường huấn luyện được xây dựng dựa trên dữ liệu pretraining khổng lồ tập trung vào lập trình
- Quá trình post-training chất lượng cao được thực hiện với dữ liệu pull request và dữ liệu viết mã thực tế
- xAI hợp tác chặt chẽ với nhiều đối tác ra mắt để liên tục cải thiện cách mô hình hoạt động trong các nền tảng agentic
Tính năng chính và môi trường hỗ trợ
grok-code-fast-1 sử dụng thành thạo các công cụ phát triển phổ biến như grep, terminal, chỉnh sửa tệp
- Người dùng có thể sử dụng ngay trong IDE và các môi trường phát triển chính
Hiệu năng lập trình
- Hỗ trợ toàn bộ software development stack
- Thể hiện khả năng vượt trội trong TypeScript, Python, Java, Rust, C++, Go
- Ngay cả khi có rất ít giám sát, mô hình vẫn có thể xử lý nhanh và chính xác nhiều tác vụ lập trình như tạo dự án từ zero đến one, hỏi đáp trên codebase, sửa lỗi chính xác
- Grok Code Fast 1 mang lại độ phản hồi nhanh nhất trong số các mô hình hiện có
- Khi chia công việc thành các đơn vị nhỏ để sử dụng, mô hình đặc biệt có lợi cho việc xây dựng workflow lặp lại và tốc độ cao
- Ví dụ thực tế: hoàn thành một prototype Battle Simulator chỉ trong một ngày trong môi trường Cursor
- Việc lập kế hoạch cho tính năng lớn, chia nhỏ theo từng bước rồi thực thi lặp lại sẽ hiệu quả hơn
Chính sách giá
- $0.20 cho mỗi 1 triệu token đầu vào
- $1.50 cho mỗi 1 triệu token đầu ra
- $0.02 cho mỗi 1 triệu token đầu vào được cache
- Nhờ hiệu năng cao và mức giá kinh tế, mô hình có thể xử lý nhanh và hiệu quả các tác vụ lập trình hằng ngày
Hiệu năng mô hình và đánh giá
- Tốc độ xử lý token (Tokens Per Second, TPS): 190, thuộc nhóm cao nhất ngành
- Khi so sánh với các mô hình khác như Gemini 2.5 Pro, GPT-5, Claude Sonnet 4, Qwen3-Coder, Grok 4, mô hình cho thấy năng lực cạnh tranh mạnh mẽ cả về giá lẫn tốc độ xử lý
- Kết hợp cả benchmark công khai đa dạng và các bài kiểm tra thực tế từ nhà phát triển
- Đạt 70,8% trên tập con SWE-Bench-Verified
- Kết hợp đánh giá định kỳ từ kỹ sư thực tế với kiểm thử tự động để tối đa hóa tính hữu dụng và mức độ hài lòng của mô hình
Kế hoạch sắp tới và hướng dẫn sử dụng
- Được cung cấp qua API chính thức và các đối tác lớn, đồng thời đang có chương trình dùng thử miễn phí trong thời gian giới hạn
- GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, opencode, Windsurf, v.v.
- Cam kết cập nhật liên tục và chu kỳ cải tiến nhanh
- Một biến thể mới đang được huấn luyện, bao gồm các tính năng như đầu vào đa phương thức, gọi công cụ song song, hỗ trợ ngữ cảnh mở rộng
- Cũng có cung cấp riêng hướng dẫn prompt engineering
- Có thể chia sẻ ý kiến qua model card và các kênh phản hồi (Discord, v.v.)
Chưa có bình luận nào.