- Swarms là tính năng điều phối đa tác nhân vốn tồn tại bên trong Claude Code nhưng chưa từng được công khai
- Người dùng không còn trò chuyện với một AI coder đơn lẻ mà tương tác với AI đóng vai trò trưởng nhóm
- Trưởng nhóm không trực tiếp viết mã mà lập kế hoạch, phân chia công việc và tổng hợp kết quả, rồi phân vai cho các tác nhân cấp dưới
- Sau khi kế hoạch được phê duyệt, các tác nhân công nhân chuyên biệt sẽ chạy song song để đảm nhiệm việc triển khai thực tế
- Điều này cho thấy Claude Code đang mở rộng vượt ra ngoài một công cụ đơn lẻ thành quy trình phát triển theo đội nhóm
Cách hoạt động
- Khi người dùng phê duyệt kế hoạch, hệ thống chuyển sang Delegation Mode
- Nhiều tác nhân công việc chuyên biệt được tạo ra và làm việc song song
- Mỗi tác nhân phụ trách các công việc triển khai thực tế như viết mã, phân tích, chỉnh sửa
- Các tác nhân điều phối tiến độ và phụ thuộc thông qua việc nhắn tin cho nhau
- Mọi kết quả đều được tổng hợp về trưởng nhóm và trả về dưới dạng phản hồi cuối cùng
Công cụ claude-sneakpeek
- Repo claude-sneakpeek cung cấp một bản dựng song song của Claude Code với feature flag đã được mở
- Có thể trải nghiệm các tính năng chưa công bố, bao gồm chế độ Swarms, và chạy trong môi trường tách biệt hoàn toàn với cài đặt Claude Code hiện có
- Sử dụng cấu hình, phiên, máy chủ MCP và thông tin xác thực riêng biệt
- Cung cấp các tính năng bổ sung đã được tích hợp trong Claude Code nhưng vẫn chưa công khai
- Hỗ trợ chạy đa tác nhân nguyên bản thông qua Swarm mode
- Tạo tác nhân nền thông qua Delegate mode
- Cung cấp tính năng nhắn tin giữa các thành viên và quản lý quyền sở hữu công việc
- Hỗ trợ các model và nhà cung cấp riêng
- Hỗ trợ Z.ai, MiniMax, OpenRouter và có thể kết nối model cục bộ thông qua cc-mirror
1 bình luận
Ý kiến trên Hacker News
Thành thật mà nói thì điều này có thể nghe như điên rồ, nhưng đây là lúc tôi từng nhận được mã có chất lượng cao nhất
Chi phí cao hơn khoảng 10 lần, nhưng tôi để một instance Opus quản lý cả một “đội dự án” gồm nhiều sub-agent
Công việc là port một máy chủ Java legacy sang C# .NET 10, và tôi đã dùng 9 agent, Kanban 7 giai đoạn, cùng cấu trúc Git Worktree tách biệt
Mỗi vai trò như sau —
Manager (Claude Opus 4.5): vòng lặp sự kiện toàn cục đánh thức agent theo trạng thái Kanban
Product Owner (Claude Opus 4.5): phụ trách chiến lược, ngăn scope creep
Scrum Master (Opus 4.5): ưu tiên backlog và phân ticket
Architect (Sonnet 4.5): chỉ phụ trách thiết kế, không triển khai
Archaeologist (Grok-Free): chỉ đọc phần decompile Java legacy khi cần
CAB (Opus 4.5): người gác cổng từ chối tính năng ở giai đoạn thiết kế và code
Dev Pair (Sonnet 4.5 + Haiku 4.5): vòng lặp AD-TDD, Junior viết test fail, Senior sửa
Librarian (Gemini 2.5): quản lý tài liệu và kích hoạt retrospective
Thành thật mà nói, nếu hỏi “có thật sự cần thế không?” thì chắc là “không”, nhưng nhìn các AI agent cộng tác với nhau quá vui
Phiên bản quy trình ban đầu có ở đây trong ảnh
Tôi muốn biết nó hoàn toàn dựa trên prompt, là plugin, hay là cấu trúc gọi lặp bằng script
Tôi cũng tò mò Kanban nằm ở đâu
Nó gồm một điều phối viên và vài agent chuyên biệt như chuyên gia backend, frontend, DB
Cốt lõi là điều phối viên. Nó giảm tải nhận thức cho tôi và theo dõi tiến độ tổng thể rất tốt
Kiểu như “tôi không muốn nói chuyện với con khỉ, tôi muốn nói chuyện với người kéo đàn”, lúc đầu sẽ là phỏng vấn manager và program manager, rồi sau đó họ tự vận hành và chỉ yêu cầu demo với cập nhật. Khá buồn cười
Thực ra đây là cách tận dụng tính năng sub-agent được tích hợp sẵn trong Claude
Không cần phải tự làm một thứ như lớp trừu tượng tmux 300 nghìn dòng bằng Go
Chỉ cần bảo Claude làm việc song song bằng các sub-agent chạy nền
Nên có chỗ đặt file để truyền prompt, theo dõi tiến độ và báo cáo, đồng thời tôi khuyên nên giới hạn mỗi agent trong một worktree riêng
Tôi đang tổng hợp pattern này tại workforest.space
Hầu hết mọi người đang cố làm riêng một orchestrator, nhưng thực ra chính Claude mới là orchestrator tốt nhất
Khác biệt với các công cụ hiện có là đây là trừu tượng hóa theo đơn vị công việc, chứ không phải theo đơn vị hội thoại
Claude Code trước đây bị giới hạn vì vấn đề của ứng dụng bên thứ ba nên tập trung vào hội thoại, nhưng Claude Code Web là thứ đầu tiên mở rộng điều đó
Cách này để AI tự điều phối công việc, người dùng không cần liên tục ném prompt vào nữa
Nó phức tạp, nhưng đang tiến hóa thành cấu trúc AI quản lý AI khác
Tuy vậy, chi tiết lập kế hoạch vẫn còn thiếu nên độ tin cậy vẫn thấp
Agent chính chuyển sang chế độ ngữ cảnh lấy ủy quyền làm trung tâm, đồng thời tích hợp hệ thống tác vụ theo nhóm và hệ thống mailbox
Đây là mức độ tích hợp mà plugin không thể làm được
Tôi hay xếp commit chồng lên như PR rồi dọn bằng rebase, và việc đó khá đau đớn
Giờ có vẻ tôi có thể cải thiện bằng cách chia thành 2~3 nhánh và quản lý sao cho giảm xung đột nhất
Cách này giúp giữ context gọn gàng mà vẫn cho ra kết quả chất lượng cao
Tôi muốn code phát triển theo hướng ngắn hơn và chất lượng hơn
Nhưng có vẻ xu hướng hiện tại đang đi ngược lại
Khi model vững hơn, common sense và vòng phản hồi mạnh hơn thì chắc sẽ hữu ích, nhưng hiện tại nó lại làm vấn đề nặng hơn theo kiểu “càng nhiều code càng tốt”
Có thể tạo ra demo đẹp mắt, nhưng trong môi trường production thực tế thì tôi nghĩ code sẽ phức tạp hơn 10~100 lần
Khi Claude bảo thêm thống kê test coverage vào CI, vì chưa cài nyc nên nó định tự tái hiện Istanbul bằng bash
Cuối cùng tôi phải bảo “cứ cài nyc đi”
Dù vậy, những thử nghiệm kiểu này có vẻ sẽ giúp mở rộng giới hạn của model
Có thể không phải bây giờ, nhưng khoảng 2026 thì biết đâu sẽ khả thi
Tôi ước trên HN có một cuộc bình chọn định kỳ để khảo sát bảng xếp hạng độ phổ biến của AI coding agent
Giống như TIOBE Index theo ngôn ngữ, tôi muốn xem xu hướng model nào đang được ưa chuộng
Cuộc đua xếp hạng rốt cuộc chỉ là một chu kỳ hype lặp đi lặp lại
Thú vị là MiniMax 2.1 lại đứng trên phần lớn GPT
Trên openrouter.ai cũng có thể ước lượng sơ bộ throughput và chi phí của model
Nhờ đó mà tôi đã dùng Opus 4.5 làm model chính chỉ một tuần sau ngày phát hành
Khoảng 80% người dùng của nó dùng Claude Code, và 75% ở môi trường darwin-arm64
Claude tạo quá nhiều code nên có vấn đề khó review
Một số người nói “miễn test pass là được”, nhưng với các dự án cần bảo trì dài hạn thì điều đó khá bất an
Tôi tò mò trải nghiệm của những người đã thử kiểu sinh code YOLO trong các dự án vận hành lâu dài
Chất lượng code vẫn còn thấp và việc debug cũng thường sai
Dù vậy, nó vẫn hữu ích cho việc tìm kiếm, hiểu vấn đề và mở rộng ý tưởng
Nếu là dự án thử nghiệm cá nhân thì cách tiếp cận YOLO cũng ổn
Làm vậy có thể tự động hóa việc sinh code mà vẫn giữ được mức hiểu hệ thống
Tôi để Codex đề xuất các điểm cần review, rồi kiểm chứng độ chính xác của chúng trong review thật
Có câu “giờ đây không còn là nói chuyện với AI coder mà là với team lead”,
nhưng buồn cười ở chỗ ngay cả tweet đó trông cũng như do AI viết
Có vẻ đến 2026, agent orchestrator sẽ trở thành xu hướng chính
Việc dùng nguyên các thuật ngữ phần mềm hiện có như team lead, team member... sẽ giúp tăng khả năng hiểu và chấp nhận
Nếu Anthropic có thể tự điều phối model của mình thì những lớp như vậy sẽ trở nên không cần thiết
Cuối cùng cốt lõi vẫn là messaging và task management
Câu “nói với team lead và cả team, hãy làm cái nút này thành màu đỏ” thật buồn cười
Kết luận cuối cùng vẫn là “được rồi, giờ hãy làm cái nút thành màu đỏ!” Quá đúng chất châm biếm
Xem video này là sẽ hiểu cảm giác đó
Nếu thêm hướng dẫn trong CLAUDE.md, bạn có thể điều chỉnh để nó không dùng swarm mode cho các việc vặt
Gần đây ở phiên bản 2.1.9, cách vòng lặp chính điều phối các sub-agent đã thay đổi hoàn toàn
Xuất hiện các log như “FTSChunkManager agent vẫn đang chạy nhưng đang có tiến triển nên hãy chờ”, kèm stack trace và đầu ra JSON
Tôi đã trực tiếp thấy kiểu hoạt động này trong ứng dụng desktop Claude Code
Bên dưới task chính có vô số agent worker leader đi khám phá codebase, viết báo cáo và danh sách TODO
Một hệ thống khác sẽ tổng hợp chúng để tạo schema và kế hoạch tổng thể
Tôi tạo riêng các chat devops, frontend, architecture, security, và sau khi mỗi chat kết thúc thì nó để lại log rồi cập nhật qua lại cho nhau
Nếu cho nó dùng terminal bằng cách SSH vào droplet, Claude sẽ tự lặp lại build, sửa, test và xác minh
Chỉ trong 3 ngày tôi đã hoàn thành dự án này