Tôi chủ yếu dùng Claude để tạo nhiều agent và thiết lập workflow để tự động làm toàn bộ từ thiết kế, phát triển đến kiểm thử. Có rất nhiều bài viết về những cách đó, nhưng tôi tò mò không biết khi thực tế vận hành thì sẽ như thế nào. Cũng có nhiều bài viết nói về việc dùng các mô hình khác nhau cho thiết kế, phát triển, kiểm thử, v.v., và mô hình nào phù hợp với công việc nào.
Hiện tại tôi đang dùng một thứ gọi là Cursor; với những việc được nhắc đến, mô hình sẽ tự thiết lập mọi thứ và làm tất cả chỉ bằng công cụ này, nhưng tôi vẫn phải liên tục theo dõi, trao đổi và định hướng cho nó. Tôi muốn biết nếu dùng Claude theo cách đã nói ở trên thì có thể trở thành hoàn toàn tự động hay không. Theo kinh nghiệm của tôi, dự án càng lớn thì nếu không liên tục định hướng, kết quả càng dễ đi chệch hoặc thiếu sót. Có bài viết hay video nào trình bày chi tiết về phương pháp "hoàn toàn tự động" đó không? Khi xem những bài viết hay video như vậy, tôi vẫn chưa thấy được một cách làm đủ chi tiết để có thể làm theo.
4 bình luận
Thay vì theo đuổi trạng thái tự động hóa hoàn toàn, tôi nghĩ chiến lược thực tế hơn là chia nhỏ công việc và xác định bên phụ trách cho từng phần. Ví dụ, có thể giao cho LLM việc nhận diện mẫu, trích xuất ý nghĩa và kết nối với tri thức phổ quát, còn con người đảm nhận việc gán ý nghĩa, bổ sung ngữ cảnh và ra quyết định. Nếu áp dụng ví dụ này vào lập trình, có thể ủy thác cho LLM việc tạo mã lặp lại hoặc viết test case, còn con người phụ trách quyết định kiến trúc và mô hình hóa domain. Khi đó, vấn đề sẽ được thu hẹp lại thành có thể tự động hóa việc ra quyết định đến mức nào, và tôi nghĩ bạn sẽ dễ tìm được những trường hợp cụ thể hơn.
Cảm ơn câu trả lời. Như tôi đã đề cập trong bài đăng gốc, tôi cũng chú ý đến những bài viết như vậy, nhưng vì chúng không bàn đến các phương pháp cụ thể nên tôi tự hỏi liệu có tài liệu hay thông tin nào được nhiều người biết đến hay không.
Tuy có nhiều bài viết và bài giảng nói như thể gần đây có thể giải quyết mọi thứ bằng AI agent, dù không rõ có phải vì tình hình kinh tế hay không, nhưng thực tế đến hiện tại vẫn rất khó để chỉ dùng AI mà làm được mọi thứ tới mức 100%. Tùy lĩnh vực, tôi cho rằng tối đa chỉ vào khoảng 70-80%, và để vượt qua mức này thì nhất định cần có chuyên gia trong lĩnh vực đó.
Tôi vẫn chưa từng thấy bài viết hay video nào giải thích về phương pháp luận của kiểu “hoàn toàn tự động”, nhưng có vẻ hiện đang có những thảo luận và thử nghiệm liên quan được tiến hành rải rác ở nhiều nơi.
Tôi nghĩ các bài viết dưới đây sẽ là gợi ý cho câu hỏi của tác giả!
https://anthropic.com/engineering/…
https://openai.com/ko-KR/index/harness-engineering/
https://github.com/karpathy/autoresearch
https://www.minimax.io/news/minimax-m27-en