1 điểm bởi GN⁺ 22 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Kimi K2.7 Code được thêm vào GitHub Copilot, trở thành mô hình trọng số mở đầu tiên có thể chọn trong bộ chọn mô hình
  • GitHub lưu trữ mô hình trên Microsoft Azure, mang đến nhiều lựa chọn mô hình hơn và tùy chọn chi phí thấp hơn cho quy trình phát triển mã
  • Việc tính phí áp dụng theo giá niêm yết của nhà cung cấp trong cơ chế tính phí dựa trên mức sử dụng; chi phí thực tế cần được kiểm tra trong tài liệu về giá mô hình và yêu cầu của Copilot
  • Được triển khai theo từng giai đoạn trước tiên cho các gói Copilot Pro, Pro+, Max và có thể dùng trong bộ chọn mô hình của Visual Studio Code
  • Với Copilot Business và Enterprise, mặc định là bị vô hiệu hóa, nên trước khi tổ chức sử dụng, quản trị viên cần bật chính sách và rà soát bảo mật, tuân thủ, quản trị dữ liệu

Mô hình trọng số mở đầu tiên được thêm vào Copilot

  • Kimi K2.7 Code là mô hình trọng số mở được cung cấp chính thức trong GitHub Copilot
  • Được thêm vào như mô hình trọng số mở đầu tiên có thể chọn trong bộ chọn mô hình của Copilot
  • Cung cấp nhiều lựa chọn mô hình hơn và tùy chọn chi phí thấp hơn trong quy trình phát triển mã
  • GitHub lưu trữ mô hình trên Microsoft Azure

Tính phí dựa trên mức sử dụng

  • Kimi K2.7 Code được tính phí theo giá niêm yết của nhà cung cấp trong cơ chế tính phí dựa trên mức sử dụng
  • Có thể xem tiêu chí tính phí chi tiết trong tài liệu GitHub Copilot’s pricing for models and requests

Phạm vi cung cấp trong Copilot

  • Kimi K2.7 Code được triển khai dần trước tiên cho các gói Copilot Pro, Pro+, Max
  • Người dùng có thể chọn mô hình này trong bộ chọn mô hình của Visual Studio Code
  • Việc triển khai diễn ra theo từng giai đoạn, và GitHub tiếp tục giám sát chất lượng cũng như hiệu năng của mô hình
  • Dự kiến sẽ mở rộng sang Copilot Business, Enterprise và các giao diện sử dụng bổ sung trong vài tuần tới

Client và giao diện được hỗ trợ

  • Bộ chọn mô hình có thể dùng trong các môi trường sau
    • Visual Studio Code 1.127.0 trở lên
    • Visual Studio 17.14.6 trở lên
    • Copilot CLI
    • GitHub Copilot cloud agent
    • GitHub Copilot App
    • github.com
    • GitHub Mobile iOS và Android
    • JetBrains 1.9.1-251 trở lên
    • Xcode
    • Eclipse

Thiết lập quản trị cho Business và Enterprise

  • Kimi K2.7 Code mặc định bị tắt trong Copilot BusinessCopilot Enterprise
  • Để thành viên trong tổ chức chọn được mô hình, quản trị viên gói phải bật chính sách Kimi K2.7 Code trong phần cài đặt Copilot
  • Nếu chính sách vẫn ở trạng thái tắt, tổ chức đó sẽ không thể sử dụng mô hình
  • Quản trị viên được khuyến nghị rà soát trước khi bật để đảm bảo mô hình trọng số mở phù hợp với các yêu cầu nội bộ về bảo mật, tuân thủ và quản trị dữ liệu

Tài liệu và kênh phản hồi

1 bình luận

 
Ý kiến trên Hacker News
  • Tôi gần như đã mất hứng thú với các sản phẩm AI dựa trên đám mây
    Đã có quá nhiều lần những tính năng và workflow tuyệt vời từng được kỳ vọng trở nên khó dùng vì đủ lý do như tăng giá, cảm giác hiệu năng bị hạ xuống, dịch vụ ngừng hoạt động, bị thay thế, v.v., nên tôi thấy mệt mỏi
    Tôi đã dựng một thiết bị nhỏ và gần như ổn định với Qwen3.6, hiện đang từ từ tự thêm các tính năng mình cần. Tôi không biết nó có đủ sức cạnh tranh với Claude hay không, và cũng đã thôi kiểm chứng. Hiện tại nó đã mang lại giá trị đủ lớn và vẫn tiếp tục tốt lên; dù ở đâu đó cỏ có thể xanh hơn, tôi thích việc thứ dưới chân mình không bị thay đổi

    • Vui vì đây là bình luận đứng đầu. Tôi cũng đang dùng hoàn toàn local
      Tôi muốn nói thêm rằng với những ai không có đủ bộ nhớ để chạy các model lớn cỡ 32GB, các model đã được prune cũng có hiệu năng khá tốt. Nếu dùng máy nhỏ, đáng thử model pruned unsloth Q4 quantization của GLM 4.7 Flash, vừa trong 14GB: https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
      Thường thì tôi dùng LM Studio cho những việc kiểu này, nhưng unsloth cũng có ứng dụng studio riêng có thể phù hợp hơn với các model quantization dạng này. Tôi đã dùng GLM 4.7 Flash làm model chính trong vài tháng; nó rất bền bỉ, rất nhanh, và có vẻ là lựa chọn tốt trên phần cứng hạn chế
    • Qwen3.6-35B-A3B-UD-Q4_K_M chạy trên chiếc 1060 cũ của tôi với khoảng 11 token/giây. Việc mọi thứ đã đi được đến mức này thật sự khó tin
    • Dạo này tiến bộ AI nhìn chung có cảm giác là đang đẩy mạnh các khác biệt tinh chỉnh
      Ví dụ Claude mới được điều chỉnh cho coding kiểu agent, nên thậm chí có thể có hại cho coding không theo kiểu agent; Fable 5 trông có vẻ tốt nhưng chi phí suy luận cao, và nhiều khả năng sẽ bị hạ hiệu năng hoặc thay đổi giới hạn/giá sau khi ra mắt. Gemini 3.5 có giới hạn rộng rãi hơn nhưng hiệu năng kém hơn một chút
      Phiên bản mới ra mắt và số phiên bản tăng lên, nhưng tôi tự hỏi liệu mọi thay đổi có thật sự là tiến bộ hay chỉ là tuning khác đi trong khi hiệu năng trên mỗi đô la vẫn tương tự đầu năm nay. Thay đổi thực sự lại thấy nhiều hơn ở các model nhỏ như Qwen hay Gemma 4 31B, nhất là khi tính cả khả năng đa ngôn ngữ thì khá kỳ diệu
      Vừa đăng xong tôi xem so sánh trước/sau của Fable; bản được đưa trở lại có hiệu năng BridgeBench tụt thảm hại vì họ vẫn đang tiếp tục chỉnh model: https://x.com/Hesamation/status/2072692225100612032
    • Nghe khá hấp dẫn, nhưng để làm được mức này thì cần Mac mini cấu hình nào?
    • Tôi cũng đang chạy Qwen3.6 trên một chiếc MBP cũ và dùng khá hài lòng
      Nó không nhanh bằng Claude tôi dùng ở công ty, nhưng chạy local đủ tốt, và không phải lo những chuyện như credit hay tính năng đột ngột biến mất
  • Tôi rất thích Copilot CLI. Cảm giác nó logic hơn Claude Code và ít ma sát hơn
    Tôi cũng thích việc có thể tùy ý xoay vòng dùng nhiều model. Ví dụ kiểu “lập kế hoạch bằng Opus 4.6, kiểm chứng kế hoạch đó và lấy phản hồi bằng GPT 5.4, rồi triển khai bằng Sonnet 4.6”
    Nhưng vì thay đổi giá Copilot hồi tháng 6, cả cá nhân tôi lẫn toàn bộ bộ phận trong công ty đều phải chuyển sang Claude Code. Hồi tháng 4–5, chúng tôi chỉ vượt một chút credit đi kèm và chi thêm vài đô mỗi tháng, nhưng từ tháng 6 thì cứ 2–3 ngày là dùng hết ngân sách tháng
    Từ góc nhìn khách hàng, đây là một đợt tăng giá hoàn toàn điên rồ, và tôi không hiểu Microsoft đã nghĩ gì. Kể cả đó là mức giá cần thiết để bền vững, họ đáng lẽ nên chờ đến khi đối thủ thay đổi giá trước. Tôi cũng sẽ không ngạc nhiên nếu tháng trước Copilot mất hơn 50% khách hàng
    Nếu cuối cùng tất cả các hãng lớn đều điều chỉnh về mức giá như vậy, có lẽ nhà nước sẽ phải vận hành AI truy cập công cộng giống như TV. Kiểu dùng model mở miễn phí, dùng tiền thuế vận hành vài data center, đặt giới hạn khu vực và throttle nghiêm ngặt, nhưng cho học sinh/sinh viên và người dân dùng tự do
    Nếu vài năm nữa mọi mức giá AI đều ngang Copilot, chỉ các công ty unicorn mới dùng nổi, còn phần còn lại sẽ không có cơ hội cạnh tranh với những công ty dùng AI

    • Bạn nói lẽ ra họ nên chờ đến khi đối thủ thay đổi giá, nhưng về cơ bản họ đã làm vậy rồi
      Nói thẳng ra là chuyển chi phí sang người dùng: https://platform.claude.com/docs/en/about-claude/pricing
      Anthropic cũng cung cấp gói đăng ký, nhưng doanh nghiệp thường không muốn dùng gói đó. Vì nội dung gửi qua đường đó có thể được dùng để huấn luyện hoặc trở thành một phần của model
      Nếu dùng mà không có sự cho phép rõ ràng từ chủ lao động, đó có thể là vi phạm hợp đồng, và nếu bị kiện thì hậu quả có thể rất nghiêm trọng
    • Đợt tăng giá đúng là điên rồ. Công ty công việc chính của tôi cũng đang chuyển từ Copilot sang đăng ký Claude Code
      Đồng thời, để chuẩn bị cho lúc Claude Code rốt cuộc không còn là món hời nữa vì phải khớp với chi phí token thực tế, chúng tôi đang thử AWS Bedrock và Deepinfra cho các model trọng số mở
    • Lần đầu tiên sau vài tháng, tôi dùng hết credit Claude ở chỗ làm nên quay lại Copilot, và bất ngờ là cũng ổn
      Claude vượt xa về mặt công cụ, nhưng chỉ định model theo từng sub-agent và quyền truy cập tất cả model là tính năng tốt hơn tổng tất cả những gì Claude hiện cung cấp
      Ở công ty, giới hạn duy nhất cho lượng AI có thể dùng mỗi tháng là đô la, nên thứ giúp giảm chi phí chính là model và môi trường thực thi tốt nhất đối với tôi. Copilot cũng làm tốt hơn trong việc tự động phân bổ model phù hợp hơn cho sub-agent, còn Claude thường dùng model đắt hơn
    • Hỏi nghiêm túc: bạn có thể giải thích thêm phần nào khiến bạn thấy Copilot CLI tốt hơn Claude Code không? Nếu có lựa chọn thì tôi dùng OpenCode, nên tò mò điều gì ở Copilot CLI khiến bạn thích hơn
    • Cách để hệ thống tự chọn model không còn bền vững nữa
      Tuy vậy vẫn có những model hiệu quả có thể thực thi kế hoạch do model tốt hơn tạo ra. Nghĩ đến việc auto model selection của Microsoft, trong cấu trúc giá lỗ trước đây, lại chọn model suy luận tối tân cho các việc như giải quyết xung đột phụ thuộc thì cũng hơi ngượng
  • Khi phát triển VS 2026, tôi dùng GitHub Copilot và chuyển qua lại giữa ChatGPT và Claude; đó là trước khi tôi biết đến Claude Code và ứng dụng Codex
    Copilot khá ổn với nhu cầu của tôi, và 10 USD/tháng là đủ
    Nhưng khi mô hình giá mới được áp dụng vào tháng trước, 10 USD đã hết chỉ sau vài ngày. Tôi hiểu mức giá cũ là không bền vững, nhưng việc đó khiến tôi chuyển sang Claude CodeCodex, và không có lý do gì để nhìn lại. Token của Claude Code và Codex cũng đang được trợ giá mạnh, nhưng cứ tận hưởng khi điều tốt đẹp còn kéo dài
    Có thể cảm nhận được sự khác biệt giữa việc dùng Claude thông qua Copilot và dùng Claude trực tiếp trong Claude Code. Tôi không biết Microsoft đang làm gì ở phía sau

    • Môi trường chạy cực kỳ quan trọng. Các công cụ có thể dùng và system prompt khác nhau tùy môi trường chạy
      Anthropic đang nhỉnh hơn một chút ở cả môi trường chạy lẫn mô hình, nên họ có lợi thế của cả hai phía
      Phía Microsoft có lẽ cũng là cùng một mô hình, nhưng các công cụ và prompt xung quanh tệ hơn nên kết quả dường như cũng tệ hơn
    • Cảm giác cũng tương tự khi rời Copilot trong Zed
      Hiện tôi đang dùng môi trường chạy reasonix cho DeepSeek, và khi cache hit thì chi phí gần như miễn phí. Ngay cả khi dùng các nhà cung cấp Mỹ không trợ giá như Digital Ocean hay Cloudflare cũng vậy
    • Tôi cũng đã chuyển sang Cursor. Chỉ cần cho nó biết cách gọi msbuild là nó tự chỉnh sửa được, không cần plugin Visual Studio native
      Ngôn ngữ mục tiêu là C++ và không có vấn đề gì
    • Trong vài tuần gần đây, chi phí GitHub Copilot đã phình lên đáng kể; việc trước đây tốn 100 USD thì nay cần 300 USD
      Tôi thích cách dùng Claude trong VS Code thông qua Copilot, và cảm thấy nó cho ra code tốt hơn vì có thể kiểm soát chất lượng code tốt hơn. Nó minh bạch hơn nhiều so với Claude Code, là mã nguồn mở, và giao diện IDE cho nhiều khả năng kiểm soát ngữ cảnh cũng như sản phẩm sinh ra hơn
      Chi phí tăng không chỉ thuần túy do tăng giá, mà còn do agent của mô hình Opus dùng nhiều token hơn. Vì vậy tôi đã chuyển sang Claude Code và vẫn đang hài lòng với Opus 4.6. Fable và 4.7 thường làm các tác vụ ở đơn vị lớn hơn rồi đi chệch hướng và tự tạo giả định, khiến kết quả trở nên lộn xộn
    • Với Claude 4.8 Opus, hạn mức Copilot có lẽ đã hết chỉ sau 2–3 prompt. Tôi đã đoán là sẽ không ổn, nhưng không ngờ đến mức này. Khi còn kéo dài thì nó đã rất tốt
  • Cuối cùng cũng đã có một lựa chọn thay thế từ nhà cung cấp lớn mà doanh nghiệp có thể dùng
    Mọi người vẫn muốn có cách chạy mô hình Trung Quốc trên một nhà cung cấp đáng tin cậy, và GitHub đã cung cấp điều đó
    Nếu tin benchmark thì hiệu năng ở mức Sonnet 4.6. Còn có đáng dùng với mức giá của GitHub hay không thì phải chờ xem

    • Microsoft đã chuyển sang tính phí theo token thì cần cung cấp lựa chọn rẻ hơn
      GPT-5.4 từng là hệ số 1x cho người đăng ký hằng năm, giờ thành 6x. Số request premium hết sạch chỉ sau vài prompt. GitHub Copilot 10 USD/tháng trước đây từng là lựa chọn có hiệu quả chi phí tốt nhất vì có thể dùng rẻ các mô hình từ phòng thí nghiệm AI của Mỹ
    • Tôi không tin benchmark. Tôi đã thử Kimi K2.7 nhiều lần và thấy thất vọng
      Nó lòng vòng với những việc Claude làm xong trong một lần. Tuy nhiên đường dùng của tôi là Ollama Cloud, và tôi không biết họ cung cấp mô hình thật hay bản lượng tử hóa; lượng tử hóa có thể đã làm giảm hiệu năng
      Dù vậy, tin tốt là đã có tiền lệ. Nếu Microsoft giờ cung cấp Kimi K2.7 thì có thể chẳng bao lâu nữa họ cũng cung cấp GLM 5.2, và đó thực sự là một mô hình rất cạnh tranh
    • Có thể tôi lại bị gọi là người quảng bá, nhưng vì có liên quan nên tôi không bận tâm
      Synthetic vận hành các mô hình riêng với giá hợp lý, bao gồm GLM5.2Kimi K2.7-Code
      Link giới thiệu: https://synthetic.new/?referral=kwjqga9QYoUgpZV
  • Input: 0,95 USD, cache hit: 0,19 USD, output: 4,00 USD
    Đây là cùng mức giá Moonshot thu, và xấp xỉ tầm giá GPT 5.4 mini nên là một lựa chọn không tệ
    Lấy ví dụ một prompt ngớ ngẩn lãng phí token cho ngữ cảnh: “Hãy chơi tic-tac-toe một mình trên bàn 5x5. Nếu đặt được 5 quân thành một hàng thì thắng.”
    Trên Kimi K2.7 tốn 0,006 USD và có thể xem toàn bộ dấu vết suy luận thô. GPT-5.4 mini tốn 0,016 USD và bị tóm tắt
    Nếu bạn tò mò thì cả hai đều đi nước cờ ngu đến khó tin
    Kimi:

    A B C D E
    1 . . . . .
    2 . . . . .
    3 X X X X X
    4 . O O O O
    5 . . . . .

    GPT 5.4 mini:

    1: X X X X X
    2: O O . . .
    3: . . O . .
    4: . . . O .
    5: . . . . O

    • Nhân tiện, với ai tò mò, GPT 5.5 cũng chơi dở như rác giống 5.4 mini nhưng chi phí gấp 4 lần
      Fable tạo ra một ván chơi có vẻ hợp lý với chi phí 40 cent

      X X O O O
      O O X X X
      X X X O O
      X O O X O
      X O X X O

    • Ý hay đấy. Tôi thử yêu cầu Haiku trong Claude Chat trên iOS làm y hệt, thì nó tạo một game React tương tác, triển khai luật chơi rồi để tôi tự chơi
      Input 1 USD, output 5 USD mà nước đi khôn ngoan đấy, Anthropic!

    • Các mô hình ngôn ngữ lớn yếu ở game, nhưng viết một agent học tăng cường để học chính trò chơi đó thì hoàn toàn khả thi

    • Nếu cực kỳ rảnh, tôi định cho hai mô hình đấu cờ vua với nhau
      Chắc ở đâu đó đã có benchmark cờ vua hoặc giải đấu mô hình ngôn ngữ lớn rồi

  • Việc AWS Bedrock hỗ trợ những mô hình kiểu này quá nghèo nàn thật kỳ lạ
    Chỉ có Kimi 2.5, qwen 3 coder, DeepSeek V3.2, GLM 5 gì đó, chứ không có các mô hình mới nhất

    • Không biết đây là quyết định về sản phẩm hay do hạn chế GPU
      Instance Inf2 cần AWS Neuron [1]. Cũng có thể việc port mô hình để chạy trên phần cứng đó mất quá nhiều thời gian
      [1] https://aws.amazon.com/ai/machine-learning/neuron/
  • Chi phí chạy chắc chắn rẻ hơn nhiều so với các mô hình khác, và hôm qua tôi dùng thử khoảng một giờ thì kết quả trông khá hứa hẹn
    Tôi thấy trong thảo luận trên Reddit rằng đội ngũ đang đánh giá glm5.2, nên hy vọng sẽ có thêm nhiều mô hình nữa

  • Có phải GitHub Copilot đang ở vị thế tốt nhất với tư cách một nền tảng cho doanh nghiệp không?
    Nó hỗ trợ Claude, GPT, Gemini, và giờ còn hỗ trợ cả mô hình trọng số mở. Các tổ chức lớn dù sao cũng trả ở mức phí API, nên chi phí dùng ở đâu cũng tương tự
    Nó có agent CLI và SDK khá tốt, giờ còn có cả ứng dụng desktop. Cũng có agent được host, và còn có thể chạy ‘Agentic Workflows’ trong CI
    Có phải danh tiếng của nó đã xuống quá thấp nên mọi người chỉ chú ý đến các lựa chọn thay thế? Hay người dùng ngoài doanh nghiệp bị đẩy ra vì chi phí theo mức sử dụng, nên không còn tạo được marketing miễn phí?

    • rug pull đổi giá mà không báo trước không được phía doanh nghiệp đón nhận tích cực
    • Chúng tôi đã hủy gói của tất cả mọi người và triển khai liteLLM nội bộ
      Copilot từng đáng giữ lại vì token rẻ đến mức vô lý, nhưng sau khi chuyển sang mức giá mới thì nó trở thành một dịch vụ tương tự openrouter mà số lượng mô hình lại ít hơn nhiều
    • Trước đây thì đúng, nhưng kể từ khi họ tự quyết định khai tử dịch vụ của mình thì không còn nữa
    • Không hiểu sao Copilot cho cảm giác ngốc hơn Claude trong VS Code hay Codex trong VS Code
      Tôi không biết chính xác lý do, nhưng cảm giác không ổn
    • Môi trường thực thi của Copilot tệ so với các môi trường thực thi dựa trên CLI khác mà tôi dùng để so sánh. Tệ đến mức đáng kinh ngạc
      Ở công ty chuyện này thường xuyên được nhắc tới, vì những người phụ trách quản lý nhà cung cấp không hiểu hệ sinh thái mô hình ngôn ngữ lớn, nên họ nghĩ Claude qua Copilot và Claude qua Claude Code là như nhau
      Mỗi khi được yêu cầu giải thích sự khác biệt, chỉ cần so sánh nhanh đặt cạnh nhau thì 3–4 lần trong 5 lần sẽ lộ rõ hiệu năng thấp hơn một cách rất kịch tính
  • Nếu là một đội nhỏ định thử Copilot, tôi muốn cảnh báo rằng các bạn có thể mất vài giờ loay hoay với thiết lập thanh toán theo tài liệu cũ
    Tóm lại, cuối cùng chúng tôi nhận được email từ GitHub nói rằng “Copilot Business được cung cấp cho các đội mua từ 10 giấy phép trở lên”. Điều này không được ghi trong tài liệu, nhưng những người khác cũng gặp chuyện tương tự: https://github.com/orgs/community/discussions/199346
    Chúng tôi sẽ tiếp tục dùng Cursor trong thời gian tới, và đang dùng Kimi làm chính dưới tên “Composer”

  • Cuối cùng cũng ra rồi. Đây có phải là LLM trọng số mở đầu tiên của Copilot không? Xem như cánh cửa đã mở