Kimi K2.7 Code chính thức có mặt trên GitHub Copilot
(github.blog)- Kimi K2.7 Code được thêm vào GitHub Copilot, trở thành mô hình trọng số mở đầu tiên có thể chọn trong bộ chọn mô hình
- GitHub lưu trữ mô hình trên Microsoft Azure, mang đến nhiều lựa chọn mô hình hơn và tùy chọn chi phí thấp hơn cho quy trình phát triển mã
- Việc tính phí áp dụng theo giá niêm yết của nhà cung cấp trong cơ chế tính phí dựa trên mức sử dụng; chi phí thực tế cần được kiểm tra trong tài liệu về giá mô hình và yêu cầu của Copilot
- Được triển khai theo từng giai đoạn trước tiên cho các gói Copilot Pro, Pro+, Max và có thể dùng trong bộ chọn mô hình của Visual Studio Code
- Với Copilot Business và Enterprise, mặc định là bị vô hiệu hóa, nên trước khi tổ chức sử dụng, quản trị viên cần bật chính sách và rà soát bảo mật, tuân thủ, quản trị dữ liệu
Mô hình trọng số mở đầu tiên được thêm vào Copilot
- Kimi K2.7 Code là mô hình trọng số mở được cung cấp chính thức trong GitHub Copilot
- Được thêm vào như mô hình trọng số mở đầu tiên có thể chọn trong bộ chọn mô hình của Copilot
- Cung cấp nhiều lựa chọn mô hình hơn và tùy chọn chi phí thấp hơn trong quy trình phát triển mã
- GitHub lưu trữ mô hình trên Microsoft Azure
Tính phí dựa trên mức sử dụng
- Kimi K2.7 Code được tính phí theo giá niêm yết của nhà cung cấp trong cơ chế tính phí dựa trên mức sử dụng
- Có thể xem tiêu chí tính phí chi tiết trong tài liệu GitHub Copilot’s pricing for models and requests
Phạm vi cung cấp trong Copilot
- Kimi K2.7 Code được triển khai dần trước tiên cho các gói Copilot Pro, Pro+, Max
- Người dùng có thể chọn mô hình này trong bộ chọn mô hình của Visual Studio Code
- Việc triển khai diễn ra theo từng giai đoạn, và GitHub tiếp tục giám sát chất lượng cũng như hiệu năng của mô hình
- Dự kiến sẽ mở rộng sang Copilot Business, Enterprise và các giao diện sử dụng bổ sung trong vài tuần tới
Client và giao diện được hỗ trợ
- Bộ chọn mô hình có thể dùng trong các môi trường sau
- Visual Studio Code 1.127.0 trở lên
- Visual Studio 17.14.6 trở lên
- Copilot CLI
- GitHub Copilot cloud agent
- GitHub Copilot App
- github.com
- GitHub Mobile iOS và Android
- JetBrains 1.9.1-251 trở lên
- Xcode
- Eclipse
Thiết lập quản trị cho Business và Enterprise
- Kimi K2.7 Code mặc định bị tắt trong Copilot Business và Copilot Enterprise
- Để thành viên trong tổ chức chọn được mô hình, quản trị viên gói phải bật chính sách Kimi K2.7 Code trong phần cài đặt Copilot
- Nếu chính sách vẫn ở trạng thái tắt, tổ chức đó sẽ không thể sử dụng mô hình
- Quản trị viên được khuyến nghị rà soát trước khi bật để đảm bảo mô hình trọng số mở phù hợp với các yêu cầu nội bộ về bảo mật, tuân thủ và quản trị dữ liệu
Tài liệu và kênh phản hồi
- Toàn bộ các mô hình có thể dùng trong GitHub Copilot có trong tài liệu supported models
- Cách chọn mô hình phù hợp với tác vụ có trong tài liệu choosing the right AI model for your task
- Có thể chia sẻ phản hồi trong thảo luận trên GitHub Community
1 bình luận
Ý kiến trên Hacker News
Tôi gần như đã mất hứng thú với các sản phẩm AI dựa trên đám mây
Đã có quá nhiều lần những tính năng và workflow tuyệt vời từng được kỳ vọng trở nên khó dùng vì đủ lý do như tăng giá, cảm giác hiệu năng bị hạ xuống, dịch vụ ngừng hoạt động, bị thay thế, v.v., nên tôi thấy mệt mỏi
Tôi đã dựng một thiết bị nhỏ và gần như ổn định với Qwen3.6, hiện đang từ từ tự thêm các tính năng mình cần. Tôi không biết nó có đủ sức cạnh tranh với Claude hay không, và cũng đã thôi kiểm chứng. Hiện tại nó đã mang lại giá trị đủ lớn và vẫn tiếp tục tốt lên; dù ở đâu đó cỏ có thể xanh hơn, tôi thích việc thứ dưới chân mình không bị thay đổi
Tôi muốn nói thêm rằng với những ai không có đủ bộ nhớ để chạy các model lớn cỡ 32GB, các model đã được prune cũng có hiệu năng khá tốt. Nếu dùng máy nhỏ, đáng thử model pruned unsloth Q4 quantization của GLM 4.7 Flash, vừa trong 14GB: https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
Thường thì tôi dùng LM Studio cho những việc kiểu này, nhưng unsloth cũng có ứng dụng studio riêng có thể phù hợp hơn với các model quantization dạng này. Tôi đã dùng GLM 4.7 Flash làm model chính trong vài tháng; nó rất bền bỉ, rất nhanh, và có vẻ là lựa chọn tốt trên phần cứng hạn chế
Ví dụ Claude mới được điều chỉnh cho coding kiểu agent, nên thậm chí có thể có hại cho coding không theo kiểu agent; Fable 5 trông có vẻ tốt nhưng chi phí suy luận cao, và nhiều khả năng sẽ bị hạ hiệu năng hoặc thay đổi giới hạn/giá sau khi ra mắt. Gemini 3.5 có giới hạn rộng rãi hơn nhưng hiệu năng kém hơn một chút
Phiên bản mới ra mắt và số phiên bản tăng lên, nhưng tôi tự hỏi liệu mọi thay đổi có thật sự là tiến bộ hay chỉ là tuning khác đi trong khi hiệu năng trên mỗi đô la vẫn tương tự đầu năm nay. Thay đổi thực sự lại thấy nhiều hơn ở các model nhỏ như Qwen hay Gemma 4 31B, nhất là khi tính cả khả năng đa ngôn ngữ thì khá kỳ diệu
Vừa đăng xong tôi xem so sánh trước/sau của Fable; bản được đưa trở lại có hiệu năng BridgeBench tụt thảm hại vì họ vẫn đang tiếp tục chỉnh model: https://x.com/Hesamation/status/2072692225100612032
Nó không nhanh bằng Claude tôi dùng ở công ty, nhưng chạy local đủ tốt, và không phải lo những chuyện như credit hay tính năng đột ngột biến mất
Tôi rất thích Copilot CLI. Cảm giác nó logic hơn Claude Code và ít ma sát hơn
Tôi cũng thích việc có thể tùy ý xoay vòng dùng nhiều model. Ví dụ kiểu “lập kế hoạch bằng Opus 4.6, kiểm chứng kế hoạch đó và lấy phản hồi bằng GPT 5.4, rồi triển khai bằng Sonnet 4.6”
Nhưng vì thay đổi giá Copilot hồi tháng 6, cả cá nhân tôi lẫn toàn bộ bộ phận trong công ty đều phải chuyển sang Claude Code. Hồi tháng 4–5, chúng tôi chỉ vượt một chút credit đi kèm và chi thêm vài đô mỗi tháng, nhưng từ tháng 6 thì cứ 2–3 ngày là dùng hết ngân sách tháng
Từ góc nhìn khách hàng, đây là một đợt tăng giá hoàn toàn điên rồ, và tôi không hiểu Microsoft đã nghĩ gì. Kể cả đó là mức giá cần thiết để bền vững, họ đáng lẽ nên chờ đến khi đối thủ thay đổi giá trước. Tôi cũng sẽ không ngạc nhiên nếu tháng trước Copilot mất hơn 50% khách hàng
Nếu cuối cùng tất cả các hãng lớn đều điều chỉnh về mức giá như vậy, có lẽ nhà nước sẽ phải vận hành AI truy cập công cộng giống như TV. Kiểu dùng model mở miễn phí, dùng tiền thuế vận hành vài data center, đặt giới hạn khu vực và throttle nghiêm ngặt, nhưng cho học sinh/sinh viên và người dân dùng tự do
Nếu vài năm nữa mọi mức giá AI đều ngang Copilot, chỉ các công ty unicorn mới dùng nổi, còn phần còn lại sẽ không có cơ hội cạnh tranh với những công ty dùng AI
Nói thẳng ra là chuyển chi phí sang người dùng: https://platform.claude.com/docs/en/about-claude/pricing
Anthropic cũng cung cấp gói đăng ký, nhưng doanh nghiệp thường không muốn dùng gói đó. Vì nội dung gửi qua đường đó có thể được dùng để huấn luyện hoặc trở thành một phần của model
Nếu dùng mà không có sự cho phép rõ ràng từ chủ lao động, đó có thể là vi phạm hợp đồng, và nếu bị kiện thì hậu quả có thể rất nghiêm trọng
Đồng thời, để chuẩn bị cho lúc Claude Code rốt cuộc không còn là món hời nữa vì phải khớp với chi phí token thực tế, chúng tôi đang thử AWS Bedrock và Deepinfra cho các model trọng số mở
Claude vượt xa về mặt công cụ, nhưng chỉ định model theo từng sub-agent và quyền truy cập tất cả model là tính năng tốt hơn tổng tất cả những gì Claude hiện cung cấp
Ở công ty, giới hạn duy nhất cho lượng AI có thể dùng mỗi tháng là đô la, nên thứ giúp giảm chi phí chính là model và môi trường thực thi tốt nhất đối với tôi. Copilot cũng làm tốt hơn trong việc tự động phân bổ model phù hợp hơn cho sub-agent, còn Claude thường dùng model đắt hơn
Tuy vậy vẫn có những model hiệu quả có thể thực thi kế hoạch do model tốt hơn tạo ra. Nghĩ đến việc auto model selection của Microsoft, trong cấu trúc giá lỗ trước đây, lại chọn model suy luận tối tân cho các việc như giải quyết xung đột phụ thuộc thì cũng hơi ngượng
Khi phát triển VS 2026, tôi dùng GitHub Copilot và chuyển qua lại giữa ChatGPT và Claude; đó là trước khi tôi biết đến Claude Code và ứng dụng Codex
Copilot khá ổn với nhu cầu của tôi, và 10 USD/tháng là đủ
Nhưng khi mô hình giá mới được áp dụng vào tháng trước, 10 USD đã hết chỉ sau vài ngày. Tôi hiểu mức giá cũ là không bền vững, nhưng việc đó khiến tôi chuyển sang Claude Code và Codex, và không có lý do gì để nhìn lại. Token của Claude Code và Codex cũng đang được trợ giá mạnh, nhưng cứ tận hưởng khi điều tốt đẹp còn kéo dài
Có thể cảm nhận được sự khác biệt giữa việc dùng Claude thông qua Copilot và dùng Claude trực tiếp trong Claude Code. Tôi không biết Microsoft đang làm gì ở phía sau
Anthropic đang nhỉnh hơn một chút ở cả môi trường chạy lẫn mô hình, nên họ có lợi thế của cả hai phía
Phía Microsoft có lẽ cũng là cùng một mô hình, nhưng các công cụ và prompt xung quanh tệ hơn nên kết quả dường như cũng tệ hơn
Hiện tôi đang dùng môi trường chạy reasonix cho DeepSeek, và khi cache hit thì chi phí gần như miễn phí. Ngay cả khi dùng các nhà cung cấp Mỹ không trợ giá như Digital Ocean hay Cloudflare cũng vậy
Ngôn ngữ mục tiêu là C++ và không có vấn đề gì
Tôi thích cách dùng Claude trong VS Code thông qua Copilot, và cảm thấy nó cho ra code tốt hơn vì có thể kiểm soát chất lượng code tốt hơn. Nó minh bạch hơn nhiều so với Claude Code, là mã nguồn mở, và giao diện IDE cho nhiều khả năng kiểm soát ngữ cảnh cũng như sản phẩm sinh ra hơn
Chi phí tăng không chỉ thuần túy do tăng giá, mà còn do agent của mô hình Opus dùng nhiều token hơn. Vì vậy tôi đã chuyển sang Claude Code và vẫn đang hài lòng với Opus 4.6. Fable và 4.7 thường làm các tác vụ ở đơn vị lớn hơn rồi đi chệch hướng và tự tạo giả định, khiến kết quả trở nên lộn xộn
Cuối cùng cũng đã có một lựa chọn thay thế từ nhà cung cấp lớn mà doanh nghiệp có thể dùng
Mọi người vẫn muốn có cách chạy mô hình Trung Quốc trên một nhà cung cấp đáng tin cậy, và GitHub đã cung cấp điều đó
Nếu tin benchmark thì hiệu năng ở mức Sonnet 4.6. Còn có đáng dùng với mức giá của GitHub hay không thì phải chờ xem
GPT-5.4 từng là hệ số 1x cho người đăng ký hằng năm, giờ thành 6x. Số request premium hết sạch chỉ sau vài prompt. GitHub Copilot 10 USD/tháng trước đây từng là lựa chọn có hiệu quả chi phí tốt nhất vì có thể dùng rẻ các mô hình từ phòng thí nghiệm AI của Mỹ
Nó lòng vòng với những việc Claude làm xong trong một lần. Tuy nhiên đường dùng của tôi là Ollama Cloud, và tôi không biết họ cung cấp mô hình thật hay bản lượng tử hóa; lượng tử hóa có thể đã làm giảm hiệu năng
Dù vậy, tin tốt là đã có tiền lệ. Nếu Microsoft giờ cung cấp Kimi K2.7 thì có thể chẳng bao lâu nữa họ cũng cung cấp GLM 5.2, và đó thực sự là một mô hình rất cạnh tranh
Synthetic vận hành các mô hình riêng với giá hợp lý, bao gồm GLM5.2 và Kimi K2.7-Code
Link giới thiệu: https://synthetic.new/?referral=kwjqga9QYoUgpZV
Input: 0,95 USD, cache hit: 0,19 USD, output: 4,00 USD
Đây là cùng mức giá Moonshot thu, và xấp xỉ tầm giá GPT 5.4 mini nên là một lựa chọn không tệ
Lấy ví dụ một prompt ngớ ngẩn lãng phí token cho ngữ cảnh: “Hãy chơi tic-tac-toe một mình trên bàn 5x5. Nếu đặt được 5 quân thành một hàng thì thắng.”
Trên Kimi K2.7 tốn 0,006 USD và có thể xem toàn bộ dấu vết suy luận thô. GPT-5.4 mini tốn 0,016 USD và bị tóm tắt
Nếu bạn tò mò thì cả hai đều đi nước cờ ngu đến khó tin
Kimi:
A B C D E
1 . . . . .
2 . . . . .
3 X X X X X
4 . O O O O
5 . . . . .
GPT 5.4 mini:
1: X X X X X
2: O O . . .
3: . . O . .
4: . . . O .
5: . . . . O
Nhân tiện, với ai tò mò, GPT 5.5 cũng chơi dở như rác giống 5.4 mini nhưng chi phí gấp 4 lần
Fable tạo ra một ván chơi có vẻ hợp lý với chi phí 40 cent
X X O O O
O O X X X
X X X O O
X O O X O
X O X X O
Ý hay đấy. Tôi thử yêu cầu Haiku trong Claude Chat trên iOS làm y hệt, thì nó tạo một game React tương tác, triển khai luật chơi rồi để tôi tự chơi
Input 1 USD, output 5 USD mà nước đi khôn ngoan đấy, Anthropic!
Các mô hình ngôn ngữ lớn yếu ở game, nhưng viết một agent học tăng cường để học chính trò chơi đó thì hoàn toàn khả thi
Nếu cực kỳ rảnh, tôi định cho hai mô hình đấu cờ vua với nhau
Chắc ở đâu đó đã có benchmark cờ vua hoặc giải đấu mô hình ngôn ngữ lớn rồi
Việc AWS Bedrock hỗ trợ những mô hình kiểu này quá nghèo nàn thật kỳ lạ
Chỉ có Kimi 2.5, qwen 3 coder, DeepSeek V3.2, GLM 5 gì đó, chứ không có các mô hình mới nhất
Instance Inf2 cần AWS Neuron [1]. Cũng có thể việc port mô hình để chạy trên phần cứng đó mất quá nhiều thời gian
[1] https://aws.amazon.com/ai/machine-learning/neuron/
Chi phí chạy chắc chắn rẻ hơn nhiều so với các mô hình khác, và hôm qua tôi dùng thử khoảng một giờ thì kết quả trông khá hứa hẹn
Tôi thấy trong thảo luận trên Reddit rằng đội ngũ đang đánh giá glm5.2, nên hy vọng sẽ có thêm nhiều mô hình nữa
Có phải GitHub Copilot đang ở vị thế tốt nhất với tư cách một nền tảng cho doanh nghiệp không?
Nó hỗ trợ Claude, GPT, Gemini, và giờ còn hỗ trợ cả mô hình trọng số mở. Các tổ chức lớn dù sao cũng trả ở mức phí API, nên chi phí dùng ở đâu cũng tương tự
Nó có agent CLI và SDK khá tốt, giờ còn có cả ứng dụng desktop. Cũng có agent được host, và còn có thể chạy ‘Agentic Workflows’ trong CI
Có phải danh tiếng của nó đã xuống quá thấp nên mọi người chỉ chú ý đến các lựa chọn thay thế? Hay người dùng ngoài doanh nghiệp bị đẩy ra vì chi phí theo mức sử dụng, nên không còn tạo được marketing miễn phí?
Copilot từng đáng giữ lại vì token rẻ đến mức vô lý, nhưng sau khi chuyển sang mức giá mới thì nó trở thành một dịch vụ tương tự openrouter mà số lượng mô hình lại ít hơn nhiều
Tôi không biết chính xác lý do, nhưng cảm giác không ổn
Ở công ty chuyện này thường xuyên được nhắc tới, vì những người phụ trách quản lý nhà cung cấp không hiểu hệ sinh thái mô hình ngôn ngữ lớn, nên họ nghĩ Claude qua Copilot và Claude qua Claude Code là như nhau
Mỗi khi được yêu cầu giải thích sự khác biệt, chỉ cần so sánh nhanh đặt cạnh nhau thì 3–4 lần trong 5 lần sẽ lộ rõ hiệu năng thấp hơn một cách rất kịch tính
Nếu là một đội nhỏ định thử Copilot, tôi muốn cảnh báo rằng các bạn có thể mất vài giờ loay hoay với thiết lập thanh toán theo tài liệu cũ
Tóm lại, cuối cùng chúng tôi nhận được email từ GitHub nói rằng “Copilot Business được cung cấp cho các đội mua từ 10 giấy phép trở lên”. Điều này không được ghi trong tài liệu, nhưng những người khác cũng gặp chuyện tương tự: https://github.com/orgs/community/discussions/199346
Chúng tôi sẽ tiếp tục dùng Cursor trong thời gian tới, và đang dùng Kimi làm chính dưới tên “Composer”
Cuối cùng cũng ra rồi. Đây có phải là LLM trọng số mở đầu tiên của Copilot không? Xem như cánh cửa đã mở