ZCode: Harness chính thức cho GLM-5.2
(zcode.z.ai)- ZCode là harness chính thức của GLM-5.2, nhằm kết hợp công cụ phát triển và AI agent để xử lý lập kế hoạch, lập trình, review và triển khai trong một luồng duy nhất
- ZCode 3.0 nhấn mạnh tối ưu hóa cho GLM-5.2 và cải thiện cộng tác đa agent, đồng thời làm nổi bật việc tích hợp với GLM trên toàn bộ các tác vụ suy luận và lập trình
- Tác vụ ví dụ là tạo mới một game Gomoku AI chạy trên trình duyệt; sau khi tạo
index.html,app.js,styles.css, bước kiểm tranode --check app.jscũng vượt qua - Gói giá được đưa ra gồm Lite $16.2/tháng, Pro $64.8/tháng, Max $144/tháng; giá và quyền lợi cuối cùng cần kiểm tra trên z.ai
- Cung cấp bộ cài cho macOS, Windows, Linux; Linux là Beta với các gói x64·ARM64
.debvà AppImage
Harness phát triển được điều chỉnh cho GLM-5.2
- ZCode là công cụ kết hợp AI agent với các công cụ phát triển hiện có để giúp lập kế hoạch, lập trình, review và triển khai diễn ra liền mạch hơn
- Định vị sản phẩm là “Simple, Fast, Vibe‑Ready” và được giới thiệu là harness chính thức của GLM-5.2
- ZCode 3.0 đã được tối ưu hóa cho GLM-5.2 và nêu cải thiện cộng tác đa agent là thay đổi chính
Ví dụ về luồng công việc
- Danh sách tác vụ ví dụ gồm
gomoku-ai,zcode-website,zcode-desktop,release-bot gomoku-ailà tác vụ tạo một game Gomoku thông minh, tức cờ caro năm quân- Người chơi thi đấu với thuật toán thông minh
- Mục tiêu là đặt các nước đi chiến lược và phát hiện chính xác điều kiện thắng
- Theo log tác vụ, repository hiện có trống hoặc gần như trống, nên luồng tiến hành theo hướng tạo ứng dụng từ đầu
- Chạy
git status --shorttrả về lỗi rằng thư mục hiện tại không phải là Git repository - Sau đó các file
index.html,app.js,styles.cssđược viết
- Chạy
Kết quả triển khai Gomoku
- Ví dụ hoàn chỉnh là một game Gomoku chạy độc lập trên trình duyệt
- Render bàn cờ 15×15
- Người chơi có thể đặt quân đen
- Phát hiện chiến thắng theo bốn hướng
- Làm nổi bật đường thắng
- Theo dõi lượt và số nước đi
- Hỗ trợ khởi động lại game
- AI không chọn nước ngẫu nhiên mà chọn bằng phương pháp heuristic
- Tìm kiếm các nước ứng viên xung quanh
- Chấm điểm các mẫu tấn công có lợi cho chính nó
- Chấm điểm các nước phòng thủ để chặn mối đe dọa của người chơi
- Cộng thêm mức ưu tiên trung tâm
- Chọn nước mạnh nhất
- Có thể bật tùy chọn overlay AI focus area để xem các vị trí ứng viên mạnh mà AI đã cân nhắc
- Ở bước xác minh,
node --check app.jsđã vượt qua - Chưa thực hiện chạy tương tác trên trình duyệt; bước còn lại là mở
index.htmltrong trình duyệt để chơi
Tác vụ dài hạn và điều khiển bên ngoài
- ZCode cung cấp tính năng Goals cho các tác vụ dài hạn
- Quản lý việc lập kế hoạch, thực thi và xác minh liên tục trong các tác vụ phức tạp
- Với tính năng Bot control, có thể khởi động và điều chỉnh ZCode từ WeChat, Feishu, Telegram
- Tích hợp với GLM-5.2 được tối ưu hóa trên toàn bộ suy luận, lập trình và cộng tác đa agent
Gói giá và tải xuống
- GLM Coding Plan đưa ra ba gói giá
- Lite: cho tác vụ nhẹ, $16.2/tháng, gồm mức sử dụng cơ bản
- Pro: cho tác vụ chuyên nghiệp, $64.8/tháng, gồm mức sử dụng gấp 5 lần Lite
- Max: cho tác vụ có mức sử dụng cao, $144/tháng, gồm mức sử dụng gấp 20 lần Lite
- Giá và quyền lợi của các gói có thể thay đổi; chi tiết cuối cùng cần kiểm tra trên z.ai
- All Downloads cung cấp bộ cài theo từng nền tảng
- macOS: Apple Silicon
.dmgv3.2.2, Intel.dmgv3.2.2 - Windows: 64-bit
.exev3.2.2, ARM64.exev3.2.2 - Linux: x64
.deb, x64 AppImage, ARM64.deb, ARM64 AppImage v3.2.2 được đánh dấu Beta
- macOS: Apple Silicon
1 bình luận
Ý kiến trên Hacker News
Hơi ngạc nhiên vì có vẻ nó không phải mã nguồn mở. Gợi so sánh với Mimo Code https://github.com/XiaomiMiMo/MiMo-Code. Mimo là CLI, còn cái này là ứng dụng desktop
--dangerously-skip-permissions. Ngay cả khi không có cờ đó, tôi cũng không tin nó trên desktop/laptop của mìnhTôi đoán là họ đã dùng khá nhiều thay thế chuỗi để nhanh chóng trông như một nhà cung cấp hạng một. Dù vậy, họ vẫn có thể thêm lại opencode như một nhà cung cấp chung
Tôi nghĩ harness đang nhanh chóng trở thành một thành phần cốt lõi của chính “mô hình”. Một công ty nhìn thấy cơ hội kiếm tiền rồi giữ harness ở chế độ đóng là điều hoàn toàn không lạ
Z.ai có tài liệu tích hợp với gần như mọi agent dựa trên CLI phổ biến: https://docs.z.ai/devpack/tool/others
Nếu bạn đã quen với agent lập trình giao diện terminal thì không cần agent desktop. Dù vậy, với những ai thích kiểu UI của Codex App/Claude App thì có vẫn tốt
Trông khá đẹp. Tôi không chắc mình có muốn dùng thay OpenCode không. OpenCode cũng có ứng dụng desktop, và cá nhân tôi thích UI terminal bên đó hơn. Thành thật mà nói, tôi còn thấy nó tốt hơn cả UI terminal của Claude Code. Bản desktop thì cơ bản hơn, nhưng vẫn đủ ổn: https://opencode.ai/download
Tuy vậy, điểm thú vị là họ tung ra cùng lúc khá nhiều thứ được nối từ https://chat.z.ai/, như ZCode, OCR.z.ai, Image.z.ai, Audio.z.ai, AutoClaw, v.v.
Đó là khối lượng khá lớn để một tổ chức làm được
Tôi cũng đã thử gói Pro coding, nhưng xét theo số token cần để hoàn thành một số tác vụ nhất định thì có vẻ hạn mức không nhiều hơn Opus là bao. Dù sao thì bản thân GLM 5.2 cũng khá ổn, kiểu như một Sonnet mạnh hơn
Thật ấn tượng khi các công ty dùng những cụm như “bao gồm mức sử dụng cơ bản” [1] hay “giới hạn tiêu chuẩn” [2], rồi xây các gói cao hơn bằng bội số của cái “cơ bản” đó nhưng lại không công bố giá trị cơ bản thực sự là gì
Có vẻ giá trị cơ bản được quyết định theo biên lợi nhuận của tháng này
[1]: https://zcode.z.ai/en#:~:text=Base%20usage%20allowance%20inc...
[2]: https://support.google.com/gemini/answer/16275805?hl=en#:~:t...
Gói Start: 5 triệu token mỗi ngày (3 triệu cho GLM-5.2, 2 triệu cho GLM-5 Turbo)
For individuals: hạn mức +150%, từ $18.00 USD+, hạn mức Coding Plan chuyên dụng cho nhà phát triển cá nhân
Với góc nhìn của người dùng GPT-5.5/Codex hằng ngày, tôi tò mò GLM-5.2/ZCode so với chúng ra sao trên một codebase đã được thiết lập sẵn cho agent coding
Đây chỉ là so sánh giá API. Nếu tính cả các gói thuê bao của Anthropic và OpenAI thì không còn cùng mặt bằng nữa. Gói Codex $200 có thể dễ dàng dùng tới 1 tỷ token mỗi tuần ở GPT 5.5 high/xhigh
Xét như mô hình trọng số mở có hiệu năng tốt nhất thì nó khá thú vị, nhưng hiện tại có vẻ chưa có chỗ đứng thật rõ trên thị trường
Nhưng nó cũng rẻ hơn nhiều nên với tôi vẫn đáng dùng. Tôi có nhiều trải nghiệm với Claude hơn, nhưng tôi xem nó gần như ngang Opus 4.1
Xét về UI thì trông giống Codex hơn hẳn Claude Code. Thực chất đây là bản sao y hệt của Codex
Tôi tò mò không biết có ai dùng terminal UI hay harness trung lập với nhà cung cấp để gần như chuyển đổi nhà cung cấp một cách mượt mà cho công việc phát triển không
Tôi muốn có ngữ cảnh cục bộ kiểu “đây là 3 nhà cung cấp AI, cái này dùng cho tác vụ lập trình, cái kia dùng để viết văn xuôi, cái khác dùng để tạo ảnh”
OpenCode là agent harness đầu tiên tôi dùng và đến giờ tôi vẫn rất thích. Có thể cấu hình nhiều nhà cung cấp, mã nguồn mở, và cũng có nhiều người đóng góp cốt lõi
Một lựa chọn khác là Pi(Pi agent harness). Đây là một lựa chọn nhẹ rất tuyệt và hỗ trợ nhiều nhà cung cấp. Cũng có thể dùng máy chủ mô hình cục bộ
Có vẻ mọi người chưa nhận ra hướng này tiện hơn đến mức nào. Theo tôi thì Claude Code và Codex hoàn toàn dựa vào vendor lock-in
https://github.com/try-works/role-model
Tôi đã chỉ dùng Pi suốt mấy tháng nay và còn mở rộng nó nữa: https://a.l3x.in/ai. Chủ yếu tôi dùng GLM-4.7, rồi 5.1, và giờ là 5.2, gần như không còn gì để đòi hỏi thêm
Tôi vẫn đang tinh chỉnh workflow theo hướng “Github/Forgejo first”, nhưng hiện đã khá hài lòng rồi. Phần lớn các phiên chạy như tác vụ CI/CD, được kích hoạt bằng bình luận
"/pi", rồi tạo PR hoặc push commit vào PR: https://github.com/shaftoe/pi-coding-agent-actionOrchestrator biết AI client nào đang chạy trong từng worktree, nên việc chỉ định gửi tác vụ nào cho AI nào khá dễ
Tôi chạy Claude hoặc Codex trong tab của từng worktree. Cũng có một chút hướng dẫn riêng theo từng AI terminal UI, ví dụ Codex giám sát còn thô sơ hơn Claude Code, nên tôi có ghi thêm cách để worker Codex theo dõi “mail” mới cho đúng
Khi làm việc với orchestrator ở worktree mặc định, orchestrator sẽ giao việc cho các worker và để họ trả lời những câu hỏi nhỏ. Nó kéo kết quả lên và nếu cần thì cũng giúp dọn dẹp ngữ cảnh
Orchestrator và các worker giao tiếp qua một hệ thống tệp chia sẻ đơn giản dưới
tmp/*, và cùng nhau có thể xử lý khối lượng công việc lớn, đa dạngVì tôi dùng iTerm2 nên cũng thêm Python dành riêng cho iTerm2 để “đánh thức” worker bằng cách chỉnh sửa input rồi gửi đi, hoặc thực hiện những thao tác mà terminal UI chặn lại (như
/clear)Tôi thích các mô hình trọng số mở của Trung Quốc cung cấp token rẻ, nhưng chỉ dùng cho dự án cá nhân
Trung Quốc có tiền sử đánh cắp sở hữu trí tuệ và bí mật thương mại, còn tòa án Trung Quốc từ lâu đã ưu ái công ty trong nước. Trong khi đó, Mỹ có hệ thống tòa án mạnh để thực thi quyền sở hữu trí tuệ. Nếu bạn muốn đem sở hữu trí tuệ, bí mật thương mại và dữ liệu của công ty ra mạo hiểm chỉ vì vài token rẻ, thì cứ dùng dịch vụ Z.ai
Sự tách biệt giữa mô hình và công cụ quan trọng chẳng kém gì sự phân lập giữa lập pháp và tư pháp. Công cụ hay harness nào không thực sự là mã nguồn mở thì cứ nên phớt lờ. Những thứ đó sẽ dần len vào đời sống rồi siết cổ bạn bằng vendor lock-in
Tôi thấy hệ thống agent mã nguồn đóng của Trung Quốc khó mà tin tưởng được
Về thực chất, nó là một hộp đen có gần như toàn bộ quyền người dùng, nên chẳng khác nào giao toàn bộ hệ thống cho một máy chủ do Trung Quốc sở hữu. Nếu dùng OpenCode và nhà cung cấp GLM thì ít nhất vẫn có thể giám sát được nó đã đọc tệp nào, chỉnh sửa tệp nào và chạy lệnh nào
Hơn nữa, luật an ninh quốc gia của Trung Quốc ràng buộc doanh nghiệp phải hợp tác về mặt pháp lý với cơ quan tình báo và hoạt động phản gián của nhà nước [0]. Nếu cài thứ này lên máy trạm của doanh nghiệp và công ty đủ lớn, thì khả năng bị theo dõi không còn chỉ là rủi ro mà gần như là điều chắc chắn
[0]: https://en.wikipedia.org/wiki/National_Intelligence_Law_of_t...
Người ta nói như thể cơ quan tình báo Mỹ đứng về phía thiện, nhưng ít nhất với tôi thì hoàn toàn không phải vậy
Tuy vậy, dù công ty ở quốc gia nào đi nữa, tôi cực lực phản đối việc chạy bất kỳ agent nào trên bare metal. Tôi đã đề cập điểm này một cách trực tiếp và lặp đi lặp lại trong bài viết của mình
Gần đây có người chất vấn tại sao lại chạy phần mềm có quá ít sao, nhưng với kiểu lập luận đó thì tôi cũng chẳng có gì để nói nhiều. Tôi đã từng thiết kế và xây dựng các hệ thống phục vụ hàng chục nghìn người dùng. Tôi không làm cho vui. Cách tôi xây dựng không phải kiểu phổ biến và tôi cũng không khuyên người khác làm theo, nhưng nó hợp với tôi và cũng hợp với cách tôi tư duy để xử lý các hệ thống phức tạp
Dùng hay không là quyền của mỗi người, nhưng nếu định kiếm chuyện mà không có căn cứ tử tế thì cũng nên chuẩn bị tinh thần bị đáp trả. Trong sự nghiệp, tôi đã mắc không ít sai lầm, và tôi cho rằng việc chịu trách nhiệm là rất quan trọng để trưởng thành. Nếu ai đó mang đến những phê bình hợp lệ và thực chất, tôi sẵn sàng cùng họ cộng tác để dùng mã của tôi