1 điểm bởi GN⁺ 5 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • ZCode là harness chính thức của GLM-5.2, nhằm kết hợp công cụ phát triển và AI agent để xử lý lập kế hoạch, lập trình, review và triển khai trong một luồng duy nhất
  • ZCode 3.0 nhấn mạnh tối ưu hóa cho GLM-5.2 và cải thiện cộng tác đa agent, đồng thời làm nổi bật việc tích hợp với GLM trên toàn bộ các tác vụ suy luận và lập trình
  • Tác vụ ví dụ là tạo mới một game Gomoku AI chạy trên trình duyệt; sau khi tạo index.html, app.js, styles.css, bước kiểm tra node --check app.js cũng vượt qua
  • Gói giá được đưa ra gồm Lite $16.2/tháng, Pro $64.8/tháng, Max $144/tháng; giá và quyền lợi cuối cùng cần kiểm tra trên z.ai
  • Cung cấp bộ cài cho macOS, Windows, Linux; Linux là Beta với các gói x64·ARM64 .deb và AppImage

Harness phát triển được điều chỉnh cho GLM-5.2

  • ZCode là công cụ kết hợp AI agent với các công cụ phát triển hiện có để giúp lập kế hoạch, lập trình, review và triển khai diễn ra liền mạch hơn
  • Định vị sản phẩm là “Simple, Fast, Vibe‑Ready” và được giới thiệu là harness chính thức của GLM-5.2
  • ZCode 3.0 đã được tối ưu hóa cho GLM-5.2 và nêu cải thiện cộng tác đa agent là thay đổi chính

Ví dụ về luồng công việc

  • Danh sách tác vụ ví dụ gồm gomoku-ai, zcode-website, zcode-desktop, release-bot
  • gomoku-ai là tác vụ tạo một game Gomoku thông minh, tức cờ caro năm quân
    • Người chơi thi đấu với thuật toán thông minh
    • Mục tiêu là đặt các nước đi chiến lược và phát hiện chính xác điều kiện thắng
  • Theo log tác vụ, repository hiện có trống hoặc gần như trống, nên luồng tiến hành theo hướng tạo ứng dụng từ đầu
    • Chạy git status --short trả về lỗi rằng thư mục hiện tại không phải là Git repository
    • Sau đó các file index.html, app.js, styles.css được viết

Kết quả triển khai Gomoku

  • Ví dụ hoàn chỉnh là một game Gomoku chạy độc lập trên trình duyệt
    • Render bàn cờ 15×15
    • Người chơi có thể đặt quân đen
    • Phát hiện chiến thắng theo bốn hướng
    • Làm nổi bật đường thắng
    • Theo dõi lượt và số nước đi
    • Hỗ trợ khởi động lại game
  • AI không chọn nước ngẫu nhiên mà chọn bằng phương pháp heuristic
    • Tìm kiếm các nước ứng viên xung quanh
    • Chấm điểm các mẫu tấn công có lợi cho chính nó
    • Chấm điểm các nước phòng thủ để chặn mối đe dọa của người chơi
    • Cộng thêm mức ưu tiên trung tâm
    • Chọn nước mạnh nhất
  • Có thể bật tùy chọn overlay AI focus area để xem các vị trí ứng viên mạnh mà AI đã cân nhắc
  • Ở bước xác minh, node --check app.js đã vượt qua
  • Chưa thực hiện chạy tương tác trên trình duyệt; bước còn lại là mở index.html trong trình duyệt để chơi

Tác vụ dài hạn và điều khiển bên ngoài

  • ZCode cung cấp tính năng Goals cho các tác vụ dài hạn
    • Quản lý việc lập kế hoạch, thực thi và xác minh liên tục trong các tác vụ phức tạp
  • Với tính năng Bot control, có thể khởi động và điều chỉnh ZCode từ WeChat, Feishu, Telegram
  • Tích hợp với GLM-5.2 được tối ưu hóa trên toàn bộ suy luận, lập trình và cộng tác đa agent

Gói giá và tải xuống

  • GLM Coding Plan đưa ra ba gói giá
    • Lite: cho tác vụ nhẹ, $16.2/tháng, gồm mức sử dụng cơ bản
    • Pro: cho tác vụ chuyên nghiệp, $64.8/tháng, gồm mức sử dụng gấp 5 lần Lite
    • Max: cho tác vụ có mức sử dụng cao, $144/tháng, gồm mức sử dụng gấp 20 lần Lite
  • Giá và quyền lợi của các gói có thể thay đổi; chi tiết cuối cùng cần kiểm tra trên z.ai
  • All Downloads cung cấp bộ cài theo từng nền tảng
    • macOS: Apple Silicon .dmg v3.2.2, Intel .dmg v3.2.2
    • Windows: 64-bit .exe v3.2.2, ARM64 .exe v3.2.2
    • Linux: x64 .deb, x64 AppImage, ARM64 .deb, ARM64 AppImage v3.2.2 được đánh dấu Beta

1 bình luận

 
Ý kiến trên Hacker News
  • Hơi ngạc nhiên vì có vẻ nó không phải mã nguồn mở. Gợi so sánh với Mimo Code https://github.com/XiaomiMiMo/MiMo-Code. Mimo là CLI, còn cái này là ứng dụng desktop

    • Tôi cũng không biết cần làm gì với một ứng dụng desktop. Mấy thứ như thế này nên chạy trên VM headless, và nếu cần thì còn có thể thêm các tùy chọn như --dangerously-skip-permissions. Ngay cả khi không có cờ đó, tôi cũng không tin nó trên desktop/laptop của mình
    • Nó là CLI vì đã tách phần mã desktop của opencode ra. Nhà cung cấp mô hình Go/Zen của opencode cũng bị tách ra theo
      Tôi đoán là họ đã dùng khá nhiều thay thế chuỗi để nhanh chóng trông như một nhà cung cấp hạng một. Dù vậy, họ vẫn có thể thêm lại opencode như một nhà cung cấp chung
    • Có lẽ cũng không có gì đáng ngạc nhiên. Harness đang trở nên quan trọng gần như chính mô hình nền tảng vậy. Đã có trường hợp chỉ nhờ harness mà kết quả benchmark cải thiện gần gấp đôi
      Tôi nghĩ harness đang nhanh chóng trở thành một thành phần cốt lõi của chính “mô hình”. Một công ty nhìn thấy cơ hội kiếm tiền rồi giữ harness ở chế độ đóng là điều hoàn toàn không lạ
    • Họ cũng có thể đang gửi một số yêu cầu của người dùng sang Anthropic để thu thập dữ liệu giao dịch cho mô hình riêng. Nếu vậy thì có thể họ cần gắn thêm các bộ theo dõi yêu cầu mà họ muốn che giấu
    • Nếu Anthropic đang bày tỏ lo ngại mạnh về việc chưng cất Claude, và thậm chí còn xem harness như một con hào bảo vệ, thì việc phía còn lại cũng không muốn để lộ mình đang làm tốt đến đâu và tiếp cận theo cách nào cũng chẳng có gì quá bất ngờ
  • Z.ai có tài liệu tích hợp với gần như mọi agent dựa trên CLI phổ biến: https://docs.z.ai/devpack/tool/others
    Nếu bạn đã quen với agent lập trình giao diện terminal thì không cần agent desktop. Dù vậy, với những ai thích kiểu UI của Codex App/Claude App thì có vẫn tốt

    • Ở đây động lực có lẽ là nhiều token hơn. Tôi nhớ là khi dùng harness riêng thì giới hạn thoáng hơn
    • Tôi đang dùng GLM 5.2 trong OpenCode, chạy trong container Docker với CodeNomad gắn GUI web vào. Có thể truy cập từ bất cứ đâu, và ngoài mô hình thuê bao của Anthropic ra thì mọi mô hình đều chạy tốt
    • Đáng khen là đội Z.ai đã thêm hỗ trợ Linux ngay từ ngày đầu
  • Trông khá đẹp. Tôi không chắc mình có muốn dùng thay OpenCode không. OpenCode cũng có ứng dụng desktop, và cá nhân tôi thích UI terminal bên đó hơn. Thành thật mà nói, tôi còn thấy nó tốt hơn cả UI terminal của Claude Code. Bản desktop thì cơ bản hơn, nhưng vẫn đủ ổn: https://opencode.ai/download
    Tuy vậy, điểm thú vị là họ tung ra cùng lúc khá nhiều thứ được nối từ https://chat.z.ai/, như ZCode, OCR.z.ai, Image.z.ai, Audio.z.ai, AutoClaw, v.v.
    Đó là khối lượng khá lớn để một tổ chức làm được
    Tôi cũng đã thử gói Pro coding, nhưng xét theo số token cần để hoàn thành một số tác vụ nhất định thì có vẻ hạn mức không nhiều hơn Opus là bao. Dù sao thì bản thân GLM 5.2 cũng khá ổn, kiểu như một Sonnet mạnh hơn

    • UI terminal bên đó khá nặng và hay crash nếu so với Claude Code
  • Thật ấn tượng khi các công ty dùng những cụm như “bao gồm mức sử dụng cơ bản” [1] hay “giới hạn tiêu chuẩn” [2], rồi xây các gói cao hơn bằng bội số của cái “cơ bản” đó nhưng lại không công bố giá trị cơ bản thực sự là gì
    Có vẻ giá trị cơ bản được quyết định theo biên lợi nhuận của tháng này
    [1]: https://zcode.z.ai/en#:~:text=Base%20usage%20allowance%20inc...
    [2]: https://support.google.com/gemini/answer/16275805?hl=en#:~:t...

    • Khi chạy ứng dụng thì nó có cho biết mức sử dụng cơ bản thực tế. Chỉ là tên gói khác với trên trang web
      Gói Start: 5 triệu token mỗi ngày (3 triệu cho GLM-5.2, 2 triệu cho GLM-5 Turbo)
      For individuals: hạn mức +150%, từ $18.00 USD+, hạn mức Coding Plan chuyên dụng cho nhà phát triển cá nhân
    • Cái này thật sự tệ. Chúng tôi cố gắng công khai minh bạch hết mức có thể nên đã đăng ở đây: https://synthetic.new/rate-limits
    • Đó là lý do ACCC của Úc đáng quý. Nếu đây là một công ty Úc thì họ đã không để kiểu lập lờ này trôi qua
    • Đây là chiến lược có thể phản tác dụng. Công cụ khó đoán còn tệ hơn cả công cụ dở
  • Với góc nhìn của người dùng GPT-5.5/Codex hằng ngày, tôi tò mò GLM-5.2/ZCode so với chúng ra sao trên một codebase đã được thiết lập sẵn cho agent coding

    • GLM 5.2 đang ở một vùng lưng chừng khó xử. Nó quá lớn để chạy ở nhà, và nếu so với các mô hình có hiệu năng tương tự thì lại đắt và chậm. Có một biểu đồ hay ở đây: https://deepswe.datacurve.ai/
      Đây chỉ là so sánh giá API. Nếu tính cả các gói thuê bao của Anthropic và OpenAI thì không còn cùng mặt bằng nữa. Gói Codex $200 có thể dễ dàng dùng tới 1 tỷ token mỗi tuần ở GPT 5.5 high/xhigh
      Xét như mô hình trọng số mở có hiệu năng tốt nhất thì nó khá thú vị, nhưng hiện tại có vẻ chưa có chỗ đứng thật rõ trên thị trường
    • Tóm lại, GLM sẽ khiến công việc mất nhiều thời gian hơn đáng kể, và tùy độ phức tạp còn có thể tiêu tốn nhiều token hơn
      Nhưng nó cũng rẻ hơn nhiều nên với tôi vẫn đáng dùng. Tôi có nhiều trải nghiệm với Claude hơn, nhưng tôi xem nó gần như ngang Opus 4.1
  • Xét về UI thì trông giống Codex hơn hẳn Claude Code. Thực chất đây là bản sao y hệt của Codex

    • Rất đồng ý. Biểu tượng bàn tay, cách dùng trường văn bản, cả kiểu sidebar cũng giống Codex 1:1. Tiêu đề gây hiểu lầm. Nó không hề gần với Claude Code
    • Vì vậy việc giữ Codex ở dạng không công khai còn trông buồn cười hơn. Phần mềm giờ đây không còn là hào lũy của riêng ai nữa. Cứ để nó mở ra thôi
  • Tôi tò mò không biết có ai dùng terminal UI hay harness trung lập với nhà cung cấp để gần như chuyển đổi nhà cung cấp một cách mượt mà cho công việc phát triển không
    Tôi muốn có ngữ cảnh cục bộ kiểu “đây là 3 nhà cung cấp AI, cái này dùng cho tác vụ lập trình, cái kia dùng để viết văn xuôi, cái khác dùng để tạo ảnh”

    • https://opencode.ai/
      OpenCode là agent harness đầu tiên tôi dùng và đến giờ tôi vẫn rất thích. Có thể cấu hình nhiều nhà cung cấp, mã nguồn mở, và cũng có nhiều người đóng góp cốt lõi
      Một lựa chọn khác là Pi(Pi agent harness). Đây là một lựa chọn nhẹ rất tuyệt và hỗ trợ nhiều nhà cung cấp. Cũng có thể dùng máy chủ mô hình cục bộ
    • Tôi đã dùng cả Pi lẫn OpenCode suốt 6 tháng qua, và trong cùng khoảng thời gian đó chưa từng mở các harness độc quyền như Claude Code, Codex hay Cursor. Hiện tôi đang dùng Pi, và có thể chuyển mượt ngay giữa phiên sang bất kỳ mô hình nào của bất kỳ nhà cung cấp nào mình muốn. Bạn cũng có thể trỏ nó tới mô hình đang chạy cục bộ
      Có vẻ mọi người chưa nhận ra hướng này tiện hơn đến mức nào. Theo tôi thì Claude Code và Codex hoàn toàn dựa vào vendor lock-in
    • Có thể làm được với role-model, bộ định tuyến mô hình do tôi tạo. Nó định tuyến theo vai trò, tác vụ, v.v. Có extension cho Pi để coding agent có thể chỉ định metadata của yêu cầu như vai trò, năng lực, v.v.
      https://github.com/try-works/role-model
    • Nếu chưa thử thì https://pi.dev đáng để dùng thử
      Tôi đã chỉ dùng Pi suốt mấy tháng nay và còn mở rộng nó nữa: https://a.l3x.in/ai. Chủ yếu tôi dùng GLM-4.7, rồi 5.1, và giờ là 5.2, gần như không còn gì để đòi hỏi thêm
      Tôi vẫn đang tinh chỉnh workflow theo hướng “Github/Forgejo first”, nhưng hiện đã khá hài lòng rồi. Phần lớn các phiên chạy như tác vụ CI/CD, được kích hoạt bằng bình luận "/pi", rồi tạo PR hoặc push commit vào PR: https://github.com/shaftoe/pi-coding-agent-action
    • Tôi đã viết một skill cho Codex và Claude Code. Cách làm là chỉ định một orchestrator cho worktree mặc định, rồi để N worktree phụ có bất kỳ loại AI worker nào cũng được
      Orchestrator biết AI client nào đang chạy trong từng worktree, nên việc chỉ định gửi tác vụ nào cho AI nào khá dễ
      Tôi chạy Claude hoặc Codex trong tab của từng worktree. Cũng có một chút hướng dẫn riêng theo từng AI terminal UI, ví dụ Codex giám sát còn thô sơ hơn Claude Code, nên tôi có ghi thêm cách để worker Codex theo dõi “mail” mới cho đúng
      Khi làm việc với orchestrator ở worktree mặc định, orchestrator sẽ giao việc cho các worker và để họ trả lời những câu hỏi nhỏ. Nó kéo kết quả lên và nếu cần thì cũng giúp dọn dẹp ngữ cảnh
      Orchestrator và các worker giao tiếp qua một hệ thống tệp chia sẻ đơn giản dưới tmp/*, và cùng nhau có thể xử lý khối lượng công việc lớn, đa dạng
      Vì tôi dùng iTerm2 nên cũng thêm Python dành riêng cho iTerm2 để “đánh thức” worker bằng cách chỉnh sửa input rồi gửi đi, hoặc thực hiện những thao tác mà terminal UI chặn lại (như /clear)
  • Tôi thích các mô hình trọng số mở của Trung Quốc cung cấp token rẻ, nhưng chỉ dùng cho dự án cá nhân
    Trung Quốc có tiền sử đánh cắp sở hữu trí tuệ và bí mật thương mại, còn tòa án Trung Quốc từ lâu đã ưu ái công ty trong nước. Trong khi đó, Mỹ có hệ thống tòa án mạnh để thực thi quyền sở hữu trí tuệ. Nếu bạn muốn đem sở hữu trí tuệ, bí mật thương mại và dữ liệu của công ty ra mạo hiểm chỉ vì vài token rẻ, thì cứ dùng dịch vụ Z.ai

    • Nói cho công bằng thì mô hình Z.AI cũng có thể dùng trên hạ tầng không phải của Trung Quốc
    • Mỹ cũng vậy thôi
  • Sự tách biệt giữa mô hình và công cụ quan trọng chẳng kém gì sự phân lập giữa lập pháp và tư pháp. Công cụ hay harness nào không thực sự là mã nguồn mở thì cứ nên phớt lờ. Những thứ đó sẽ dần len vào đời sống rồi siết cổ bạn bằng vendor lock-in

  • Tôi thấy hệ thống agent mã nguồn đóng của Trung Quốc khó mà tin tưởng được
    Về thực chất, nó là một hộp đen có gần như toàn bộ quyền người dùng, nên chẳng khác nào giao toàn bộ hệ thống cho một máy chủ do Trung Quốc sở hữu. Nếu dùng OpenCode và nhà cung cấp GLM thì ít nhất vẫn có thể giám sát được nó đã đọc tệp nào, chỉnh sửa tệp nào và chạy lệnh nào
    Hơn nữa, luật an ninh quốc gia của Trung Quốc ràng buộc doanh nghiệp phải hợp tác về mặt pháp lý với cơ quan tình báo và hoạt động phản gián của nhà nước [0]. Nếu cài thứ này lên máy trạm của doanh nghiệp và công ty đủ lớn, thì khả năng bị theo dõi không còn chỉ là rủi ro mà gần như là điều chắc chắn
    [0]: https://en.wikipedia.org/wiki/National_Intelligence_Law_of_t...

    • Đồng ý. Đối thủ cạnh tranh của Mỹ cũng khó tin chẳng kém. Theo tôi, ở đây mã nguồn mở mới là câu trả lời
    • Ít nhất thì trọng số mô hình đã được công khai. Tôi không phải người Mỹ, nên xét trên mọi phương diện có thể thì phía này đáng tin hơn nhiều
      Người ta nói như thể cơ quan tình báo Mỹ đứng về phía thiện, nhưng ít nhất với tôi thì hoàn toàn không phải vậy
    • Nhà cung cấp của Mỹ cũng y hệt như thế
    • Chỉ cần chạy nó trong container dưới Opencode là được. Nó hoạt động rất tốt, và tôi thậm chí đã nâng cấp lên gói Pro nữa (khoảng $60/tháng). Nếu muốn dùng trong container, trong các dự án trên hồ sơ của tôi có thông tin. Toàn bộ mã đó đều là mã nguồn mở, và tôi làm ra vì cần cho công việc của mình. Chắc chắn cũng còn vô số cách khác
      Tuy vậy, dù công ty ở quốc gia nào đi nữa, tôi cực lực phản đối việc chạy bất kỳ agent nào trên bare metal. Tôi đã đề cập điểm này một cách trực tiếp và lặp đi lặp lại trong bài viết của mình
      Gần đây có người chất vấn tại sao lại chạy phần mềm có quá ít sao, nhưng với kiểu lập luận đó thì tôi cũng chẳng có gì để nói nhiều. Tôi đã từng thiết kế và xây dựng các hệ thống phục vụ hàng chục nghìn người dùng. Tôi không làm cho vui. Cách tôi xây dựng không phải kiểu phổ biến và tôi cũng không khuyên người khác làm theo, nhưng nó hợp với tôi và cũng hợp với cách tôi tư duy để xử lý các hệ thống phức tạp
      Dùng hay không là quyền của mỗi người, nhưng nếu định kiếm chuyện mà không có căn cứ tử tế thì cũng nên chuẩn bị tinh thần bị đáp trả. Trong sự nghiệp, tôi đã mắc không ít sai lầm, và tôi cho rằng việc chịu trách nhiệm là rất quan trọng để trưởng thành. Nếu ai đó mang đến những phê bình hợp lệ và thực chất, tôi sẵn sàng cùng họ cộng tác để dùng mã của tôi
    • Vì vậy tôi thích dùng Reasonix cùng với Deepseek. Nếu khớp cache thì yêu cầu gần như miễn phí, và tuyến đó cũng đi qua các nhà cung cấp Mỹ không được trợ giá như Digital Ocean hoặc Cloudflare