Grok Code Fast 1
(x.ai)- grok-code-fast-1 do xAI phát hành là một mô hình AI lập trình siêu nhanh dành cho nhà phát triển, có khả năng phản hồi cực nhanh và các tính năng thân thiện với IDE
- Mô hình này được tiền huấn luyện tập trung vào bộ dữ liệu lập trình và được thiết kế để thành thạo trong việc sử dụng các công cụ như grep, terminal, chỉnh sửa tệp thông qua đánh giá từ người dùng thực tế
- Hiệu năng đạt tốc độ sinh 190 token mỗi giây và điểm 70,8% trên SWE-Bench-Verified, đồng thời thể hiện thế mạnh ở nhiều ngôn ngữ như TypeScript, Python, Java, Rust, C++, Go
- Giá được ấn định ở mức $0.20 cho mỗi 1 triệu token đầu vào, $1.50 cho đầu ra, $0.02 cho đầu vào được cache, và trên một số nền tảng đối tác (GitHub Copilot, Cursor, v.v.) hiện đang được cung cấp miễn phí trong thời gian giới hạn
- Một biến thể hỗ trợ đầu vào đa phương thức, gọi công cụ song song, ngữ cảnh mở rộng cũng sẽ sớm được công bố
Tổng quan
- grok-code-fast-1 của xAI là một mô hình AI lập trình siêu nhanh được phát triển để giải quyết vấn đề suy giảm tốc độ trong môi trường phát triển thực tế, nơi việc suy luận lặp lại và sử dụng công cụ diễn ra thường xuyên
- Dựa trên phản hồi từ các kỹ sư đang làm việc thực tế, mô hình được xây dựng lại từ đầu với kiến trúc phù hợp cho công việc thực chiến, nhanh nhạy và linh hoạt
- Đội ngũ kỹ thuật suy luận và hạ tầng tính toán đã đưa nhiều phương pháp đổi mới vào công nghệ phục vụ mô hình với tốc độ áp đảo
- Người dùng có thể cảm nhận rằng nhiều lệnh gọi công cụ đã được thực hiện trước cả khi họ kịp đọc hết luồng suy nghĩ
- Nhờ tối ưu hóa prompt caching, mô hình đạt tỷ lệ cache hit trên 90% trong môi trường đối tác
Thiết kế và bộ dữ liệu
- Môi trường huấn luyện được xây dựng dựa trên dữ liệu pretraining khổng lồ tập trung vào lập trình
- Quá trình post-training chất lượng cao được thực hiện với dữ liệu pull request và dữ liệu viết mã thực tế
- xAI hợp tác chặt chẽ với nhiều đối tác ra mắt để liên tục cải thiện cách mô hình hoạt động trong các nền tảng agentic
Tính năng chính và môi trường hỗ trợ
grok-code-fast-1sử dụng thành thạo các công cụ phát triển phổ biến như grep, terminal, chỉnh sửa tệp- Người dùng có thể sử dụng ngay trong IDE và các môi trường phát triển chính
Hiệu năng lập trình
- Hỗ trợ toàn bộ software development stack
- Thể hiện khả năng vượt trội trong TypeScript, Python, Java, Rust, C++, Go
- Ngay cả khi có rất ít giám sát, mô hình vẫn có thể xử lý nhanh và chính xác nhiều tác vụ lập trình như tạo dự án từ zero đến one, hỏi đáp trên codebase, sửa lỗi chính xác
- Grok Code Fast 1 mang lại độ phản hồi nhanh nhất trong số các mô hình hiện có
- Khi chia công việc thành các đơn vị nhỏ để sử dụng, mô hình đặc biệt có lợi cho việc xây dựng workflow lặp lại và tốc độ cao
- Ví dụ thực tế: hoàn thành một prototype Battle Simulator chỉ trong một ngày trong môi trường Cursor
- Việc lập kế hoạch cho tính năng lớn, chia nhỏ theo từng bước rồi thực thi lặp lại sẽ hiệu quả hơn
Chính sách giá
- $0.20 cho mỗi 1 triệu token đầu vào
- $1.50 cho mỗi 1 triệu token đầu ra
- $0.02 cho mỗi 1 triệu token đầu vào được cache
- Nhờ hiệu năng cao và mức giá kinh tế, mô hình có thể xử lý nhanh và hiệu quả các tác vụ lập trình hằng ngày
Hiệu năng mô hình và đánh giá
- Tốc độ xử lý token (Tokens Per Second, TPS): 190, thuộc nhóm cao nhất ngành
- Khi so sánh với các mô hình khác như Gemini 2.5 Pro, GPT-5, Claude Sonnet 4, Qwen3-Coder, Grok 4, mô hình cho thấy năng lực cạnh tranh mạnh mẽ cả về giá lẫn tốc độ xử lý
- Kết hợp cả benchmark công khai đa dạng và các bài kiểm tra thực tế từ nhà phát triển
- Đạt 70,8% trên tập con SWE-Bench-Verified
- Kết hợp đánh giá định kỳ từ kỹ sư thực tế với kiểm thử tự động để tối đa hóa tính hữu dụng và mức độ hài lòng của mô hình
Kế hoạch sắp tới và hướng dẫn sử dụng
- Được cung cấp qua API chính thức và các đối tác lớn, đồng thời đang có chương trình dùng thử miễn phí trong thời gian giới hạn
- GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, opencode, Windsurf, v.v.
- Cam kết cập nhật liên tục và chu kỳ cải tiến nhanh
- Một biến thể mới đang được huấn luyện, bao gồm các tính năng như đầu vào đa phương thức, gọi công cụ song song, hỗ trợ ngữ cảnh mở rộng
- Cũng có cung cấp riêng hướng dẫn prompt engineering
- Có thể chia sẻ ý kiến qua model card và các kênh phản hồi (Discord, v.v.)
1 bình luận
Ý kiến trên Hacker News
Hôm qua tôi đã thử bằng Cline, tốc độ nhanh, rất hợp với agentic flow và chất lượng code cũng khá ổn, không hiểu vì sao thread này lại tiêu cực như vậy (đang gõ còn bị dính flag). Tôi thấy model này ổn, cảm giác ngang hoặc hơn mức gpt5-mini. Tôi đã dùng gpt5-mini làm model chính vài ngày nay, vừa khớp ngân sách lại vẫn làm tốt việc cần làm
Những điểm tôi chú ý:
bs4) mà nó vẫn hoàn thành trơn tru, không gặp vấn đề gì trong bối cảnh context lớnNhìn chung khá ổn, đáng để dùng hằng ngày so với mức giá, cũng có thể hình dung việc dùng Opus+gpt5 high làm planner và để model này làm implementer. Vì tốc độ nhanh nên kiểu thiết lập pass@x chạy song song cũng có vẻ thú vị
Việc có nhiều lựa chọn ở mọi tầng là điều tốt, cần nhiều nhà cung cấp cạnh tranh để họ phải dè chừng nhau và kéo giá xuống. gpt5-mini là 2$/MTok, model này cỡ 1.5$/MTok nên gần như có cảm giác “miễn phí”, tôi không hiểu bầu không khí tiêu cực này
Qwen3-Coder-480B (được host trên Cerebras) có giá 2$/Mtok qua OpenRouter, tính cả input/output
Có nên coi là model tốt nếu dùng đến khoảng một nửa context length không? Với qwen3-coder tôi có cảm giác nó bắt đầu rối ở mức 65k/256k, và còn đắt hơn grok 50%
Đọc review rất hay, tôi tò mò nếu so với claude code thì thế nào
Tôi cũng nghĩ tương tự, gần đây đang dùng model này và thấy khá ổn, tốc độ cũng rất nhanh
Điều thú vị là benchmark mà model này nhấn mạnh lại là tốc độ xuất token, thậm chí còn gắn luôn chữ “fast” trong tên
Nói chung tôi nghĩ software engineer sẽ coi chất lượng token quan trọng hơn tốc độ
Vấn đề là nó nhanh đến mức nào
Đây cũng không phải metric tệ nhất mà xAI từng nghĩ ra
Tôi đã thử API miễn phí của Cerebras (có Qwen Coder 480b và gpt-oss-120b, không phải quảng cáo) và nó thực sự nhanh, cỡ 3000 token mỗi giây
Còn tùy mục đích
Tốc độ rất quan trọng
Tôi tò mò trên HN mọi người đang dùng gì cho AI coding assistant, ví dụ plugin VSCode nào, rất muốn nghe mẹo dùng thực tế
Tôi thắc mắc liệu “bản coding” từng xuất hiện khi Grok-4 bị chê hiệu năng code kém có phải chính là model này không
Có vẻ khi benchmark yếu thì họ mang ra hạng mục dễ thổi phồng hơn là tốc độ
Tìm thử thì chỉ thấy các bài ca ngợi model này từ những tài khoản spam rất lộ liễu trên Reddit
Link tài khoản đó
Tôi có cảm giác nó dựa trên Grok 3, vì Grok 3 từng rất nhanh và chuyên về lập trình
Theo toàn bộ "SWE-Bench-Verified", grok-code-fast-1 được nói là đạt 70.8% trong benchmark nội bộ, nhưng tôi muốn xem kỹ công cụ benchmark đó
Báo cáo bên thứ ba chỉ ra mức khoảng 57.6%
Link liên quan
Có thể hơi nitpick, nhưng tôi bị sốc vì vừa mở site lên là cách hiển thị ngày tháng đã rất lộn xộn (thứ tự ngày/tháng/năm bị đảo lung tung)
Không chỉ gây rối mà còn khiến sắp xếp không đúng
Tôi thử sort cột ngày thì ra kết quả hoàn toàn vô lý (nó sort theo mục ở giữa)
Những thứ cơ bản như vậy mà còn không để ý thì dễ khiến người ta nghi code cũng cẩu thả
[Một số quốc gia vẫn dùng kiểu hiển thị này, nhưng phần lớn đã chuyển sang chuẩn]
Dù vậy, so với các model khác thì thành tích của nó vẫn khá tốt
Tôi từng có kết quả khá ổn ngay cả với bản Grok 4 thường
Khi hỏi về các lựa chọn kiến trúc khác nhau, nó cho câu trả lời rất tốt và hướng dẫn từng bước trong quá trình giải quyết vấn đề, điều đó tôi rất thích
So với kiểu “one-shot” viết lại toàn bộ code trong một lần, tôi thích quá trình dần đi đúng hướng tôi muốn hơn
Tôi nghĩ cách đánh giá one-shot cho Opus 4.1 hay dòng Sonnet không thật sự chính xác, tiêu chí quan trọng là vai trò trợ lý thực thụ
gpt-5 cũng có lúc cố chấp đi theo hướng tôi không muốn, dù trao đổi thế nào nó vẫn lặp lại cùng một kiểu hành vi
Sonnet 4 có thể thua GPT-5 ở thiết kế kiến trúc hay phân tích sâu, nhưng khi kế hoạch chi tiết đã có sẵn và chỉ cần cày ra thật nhiều code thì Sonnet 4 làm tốt hơn
Sau vài ngày test Grok, tôi lại thấy như nó bị thụt lùi
Tôi đã gặp chuyện nó xóa ngẫu nhiên một phần code của mình, lâu rồi mới lại bị kiểu này
Các model coding hàng đầu dạo này đã khá đáng tin, nhưng Grok có cảm giác vẫn chưa tới mức đó
Dù có nhanh và miễn phí đến đâu, nếu không thể tin tưởng giao code cho nó thì cũng không dùng như một công cụ được
Tôi đã thử miễn phí Grok Code Fast 1 trong Kilo Code và kết quả rất tệ
Full Self Coding?
Tôi tò mò bạn đang dùng nền tảng/ngôn ngữ gì
Việc xóa một phần code có thực sự là vấn đề không? Chẳng phải đã có version control sao?
Nó làm những chuyện vô lý rất nhanh, và đó không phải điều tốt
Có lẽ hợp với các tác vụ đơn giản, cụ thể như CRUD endpoint, file i8n, còn ngoài ra thì tôi không chắc
Tôi đúng là dùng model này cho đúng kiểu việc đó
Tôi nhờ nó cải thiện Justfile, cuối cùng nó làm rối tung mọi thứ và rơi vào vòng lặp vô hạn
Ngay từ thời stealth của model ‘sonic’, tốc độ đã nhanh nhưng chất lượng thì không đủ chính xác như cần thiết
Nó có tạo test code và chạy lặp lại, nhưng lại chỉ kiểm tra các lời gọi mock chứ không xác minh hành vi đúng như ý định
Có giới hạn là chưa thật sự chú ý đến pattern sử dụng thực tế
Cá nhân tôi thấy khá ấn tượng