- Tác tử lập trình AI tối giản do nhóm Princeton·Stanford, những người tạo ra SWE-bench và SWE-agent, phát triển
- Tác tử kỹ thuật phần mềm AI siêu nhẹ chỉ gồm khoảng 100 dòng mã Python, hoạt động mà không cần file cấu hình khổng lồ hay monorepo
- Chỉ dùng bash làm công cụ, nên tương thích với bất kỳ mô hình nào ngay cả khi không có giao diện tool-calling của LLM
- Đạt hơn 74% trên benchmark SWE-bench verified, và cũng ghi nhận mức tương đương với Gemini 3 Pro
- Mỗi hành động được thực thi độc lập bằng
subprocess.run, nên không cần shell session duy trì trạng thái; khi chuyển sang Docker cũng chỉ đơn giản là thay bằng docker exec
- Cấu trúc lịch sử hoàn toàn tuyến tính khiến trajectory và các thông điệp được gửi cho LLM là giống hệt nhau, rất phù hợp cho debug và fine-tuning
- Hỗ trợ triển khai trên nhiều môi trường sandbox khác nhau như local, Docker/Podman, Singularity/Apptainer, Bubblewrap, Contree
- Hỗ trợ mọi mô hình thông qua litellm, openrouter, portkey..., tương thích với endpoint
/completion và /response cũng như interleaved thinking
- Được áp dụng tại Meta, NVIDIA, IBM, Essential AI, Nebius, Anyscale, Princeton·Stanford và nhiều nơi khác
- So với Claude Code, khởi động nhanh hơn nhiều; đồng thời có thể dùng làm baseline để đánh giá năng lực thuần của LLM mà không bị overfit vào scaffold của tác tử
- Cung cấp CLI (
mini), batch inference, trình duyệt trajectory, và Python binding (DefaultAgent, LitellmModel, LocalEnvironment)
- Giấy phép MIT
1 bình luận
Giờ thì việc tự phát triển agent trực tiếp trở nên dễ dàng hơn rồi.