8 điểm bởi xguru 11 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Tác tử lập trình AI tối giản do nhóm Princeton·Stanford, những người tạo ra SWE-bench và SWE-agent, phát triển
  • Tác tử kỹ thuật phần mềm AI siêu nhẹ chỉ gồm khoảng 100 dòng mã Python, hoạt động mà không cần file cấu hình khổng lồ hay monorepo
  • Chỉ dùng bash làm công cụ, nên tương thích với bất kỳ mô hình nào ngay cả khi không có giao diện tool-calling của LLM
  • Đạt hơn 74% trên benchmark SWE-bench verified, và cũng ghi nhận mức tương đương với Gemini 3 Pro
  • Mỗi hành động được thực thi độc lập bằng subprocess.run, nên không cần shell session duy trì trạng thái; khi chuyển sang Docker cũng chỉ đơn giản là thay bằng docker exec
  • Cấu trúc lịch sử hoàn toàn tuyến tính khiến trajectory và các thông điệp được gửi cho LLM là giống hệt nhau, rất phù hợp cho debug và fine-tuning
  • Hỗ trợ triển khai trên nhiều môi trường sandbox khác nhau như local, Docker/Podman, Singularity/Apptainer, Bubblewrap, Contree
  • Hỗ trợ mọi mô hình thông qua litellm, openrouter, portkey..., tương thích với endpoint /completion/response cũng như interleaved thinking
  • Được áp dụng tại Meta, NVIDIA, IBM, Essential AI, Nebius, Anyscale, Princeton·Stanford và nhiều nơi khác
  • So với Claude Code, khởi động nhanh hơn nhiều; đồng thời có thể dùng làm baseline để đánh giá năng lực thuần của LLM mà không bị overfit vào scaffold của tác tử
  • Cung cấp CLI (mini), batch inference, trình duyệt trajectory, và Python binding (DefaultAgent, LitellmModel, LocalEnvironment)
  • Giấy phép MIT

1 bình luận

 
ragingwind 8 giờ trước

Giờ thì việc tự phát triển agent trực tiếp trở nên dễ dàng hơn rồi.