2 điểm bởi namcher9428 4 ngày trước | 1 bình luận | Chia sẻ qua WhatsApp

Khi sử dụng Codex, tôi thấy khá bất tiện khi những yêu cầu mơ hồ lại dẫn thẳng tới việc thay đổi mã nguồn, nên tôi đang tạo ra một công cụ CLI để sắp xếp việc này thành một quy trình phát triển có cấu trúc hơn.

NambaAI không phải là công cụ thay thế Codex, mà gần với một lớp workflow hoạt động xung quanh Codex.

Ý tưởng cơ bản là như sau.

request → SPEC → execution → validation → PR handoff

Nói cách khác, thay vì chuyển ngay yêu cầu của người dùng sang khâu triển khai, công cụ sẽ giúp sắp xếp trước mục tiêu, phạm vi, ràng buộc và tiêu chí chấp nhận, lưu chúng lại dưới dạng file SPEC rồi mới tiến hành công việc.

Hiện tại công cụ được xây dựng xoay quanh luồng sau.

namba project
namba plan "yêu cầu công việc"
namba run SPEC-XXX
namba sync
namba pr
namba land

Tôi cũng đang thử nghiệm một luồng queue để xử lý nhiều SPEC theo thứ tự.

Lý do tôi tạo ra công cụ này là vì khi AI coding ngày càng tiện lợi hơn, quá trình thay đổi thường khó truy vết, hoặc về sau khó xác nhận nó đã được triển khai theo tiêu chí nào. Đặc biệt, khi dùng Codex lặp đi lặp lại, tôi cảm thấy những điều như “đã thống nhất sẽ làm gì”, “phạm vi đến đâu”, “đã kiểm chứng như thế nào”, “cần xem gì trong PR” rất dễ trở nên mơ hồ.

NambaAI là một nỗ lực nhằm giảm bớt vấn đề đó theo các cách sau.

  • Sắp xếp trước mục tiêu và phạm vi trước khi bắt đầu công việc
  • Tạo file SPEC trước khi triển khai
  • Ghi lại kết quả thực thi và evidence kiểm chứng
  • Tạo tài liệu bàn giao PR
  • Sắp xếp các thay đổi do Codex tạo ra để con người dễ review hơn
  • Quản lý như một quy trình phát triển có thể lặp lại, thay vì các prompt dùng một lần

Mục tiêu không phải là tạo ra một autonomous agent đa dụng như các AI agent framework hiện có. Hiện tại, công cụ tập trung vào Codex, vào việc chia nhỏ công việc thành những đơn vị mà lập trình viên có thể xem xét và lưu lại được.

Dự án vẫn đang ở giai đoạn đầu nên còn nhiều thiếu sót.

  • Thiếu ví dụ sử dụng thực tế
  • Cần cải thiện tài liệu onboarding
  • Thiếu eval pack
  • Cần rà soát bảo mật cho installer/hook
  • Cần kiểm thử chéo trên macOS, Linux, Windows
  • Thiếu so sánh với các AI coding harness hiện có
  • Thiếu kiểm chứng trên các dự án thực tế

Đây là dự án mã nguồn mở ban đầu do tôi tự làm, và hiện tại hơn là một sản phẩm có độ hoàn thiện cao thì nó đang ở giai đoạn kiểm chứng hướng đi.

Tôi đặc biệt muốn nhận được phản hồi từ những người đang dùng Codex trong công việc thực tế hoặc trong các dự án cá nhân, nhất là về các điểm sau.

  1. Liệu workflow Codex dựa trên SPEC như thế này có thực sự hữu ích trong quá trình phát triển hay không
  2. Phần nào trông có vẻ bị thiết kế quá mức
  3. Nếu áp dụng vào dự án thực tế thì cần thêm những cơ chế đảm bảo độ tin cậy nào
  4. Có công cụ hay pattern hiện có nào đáng để so sánh hay không
  5. Có điểm nào trong quy trình cài đặt/sử dụng trông bất tiện hoặc rủi ro hay không

Các ý kiến phê bình cũng hoàn toàn được hoan nghênh. Vì đây עדיין là giai đoạn đầu, nên lúc này biết được chính xác điểm nào còn yếu sẽ hữu ích hơn nhiều so với những lời khen tốt đẹp.

1 bình luận

 
namcher9428 4 ngày trước

Mục tiêu ban đầu là làm cho CLI, nhưng dạo này tôi lại đang dùng nó trên codex desktop! Tôi từng lo có thể sẽ xung đột với harness tích hợp sẵn của Codex desktop, nhưng may là nó tương thích rất mượt haha

Ngoài ra còn phải phản ánh cả nội dung cập nhật codex 0.131.0 lần này nữa, và vì tôi chỉ dùng mỗi harness này nên vẫn liên tục thấy những chỗ còn thiếu, nhưng cuối cùng thì thứ thiếu nhất vẫn là sức người...