Vì sao điều phối đa tác tử lại khó vận hành hiệu quả?
(shalomeir.substack.com)Gần đây, dự án ‘Paperclip’ — thứ hứa hẹn cho phép vận hành một “công ty zero-human” bằng AI — đã trở thành chủ đề nóng. Dự án này tổ chức các tác tử theo sơ đồ tổ chức của một công ty, giao cho chúng các vai trò như CEO, trưởng nhóm, nhân sự thực thi; khi xác định sứ mệnh của công ty và các dự án chi tiết, chúng sẽ bắt đầu làm việc một cách tự chủ. Chỉ trong một tháng, dự án đã vượt mốc 40.000 sao trên GitHub.
Trước đó cũng đã có Gastown với cách tiếp cận tương tự khi dùng hình ảnh ẩn dụ “thành phố” cho các tác tử, rồi đến Claude Code Agent Teams của Anthropic, hay tác tử đám mây của Cursor — trên toàn ngành, xu hướng “vận hành nhiều tác tử như một tổ chức” đang hiện rõ.
Tôi cũng không cưỡng lại được sự tò mò trước xu hướng này nên đã thử dùng Gastown và Paperclip. Nếu tính theo chi phí token API thì tôi đã chi khoảng $5,000. 🫠
Nói kết luận trước, đúng là có một số mảng cho thấy hiệu quả rõ ràng, nhưng các giới hạn còn nổi bật hơn nhiều.
Chi phí token tiêu tốn cao gấp 5–10 lần so với một tác tử đơn lẻ nhưng năng suất không tăng tương ứng; các tác tử liên tục gặp vấn đề như đánh mất ngữ cảnh, bàn giao công việc bị đứt đoạn giữa chừng, hoặc tự đánh dấu những kết quả sai là “hoàn thành”. Vì vậy tôi đã tổng hợp lại những vấn đề mình gặp phải cùng các insight rút ra từ đó:
→ 3 nút thắt cấu trúc của điều phối đa tác tử
→ Vì sao ẩn dụ “thành phố” hay “công ty” lại không thực sự hiệu quả
→ Cấu trúc nào đủ vững để dùng trong thực chiến
→ 5 tiêu chí và cách chấm điểm để xác định phần việc nào trong công việc của tôi có thể ủy quyền cho tác tử
Hy vọng bài viết sẽ hữu ích với những ai đang suy nghĩ về việc “nên giao gì, và không nên giao gì” trong thời đại tác tử.
Chưa có bình luận nào.