Andrej Karpathy: AI coding tác tử đã làm thay đổi thế giới
(x.com/karpathy)> “Thời đại phải tự tay gõ code” đã kết thúc
- Trong 2 tháng qua, lập trình đã trải qua một sự thay đổi đột ngột chứ không phải tiến triển dần dần, và riêng tháng 12 vừa rồi là bước ngoặt mang tính quyết định
- Chất lượng, tính nhất quán dài hạn (long-term coherence), độ bền bỉ (tenacity) của các mô hình đã được cải thiện mạnh, đến mức có thể xử lý trọn vẹn những tác vụ lớn và dài
- Vì thế, quy trình làm việc lập trình cơ bản trước đây đã chịu một sự thay đổi mang tính phá vỡ rất lớn
- Ví dụ, cuối tuần qua tôi đã xây dựng một dashboard phân tích video cục bộ cho camera tại nhà
- Nội dung chỉ thị đưa cho tác tử
> “Tôi sẽ cung cấp IP nội bộ và tên người dùng/mật khẩu của DGX Spark, hãy đăng nhập rồi thiết lập khóa SSH, cấu hình vLLM, tải và benchmark Qwen3-VL, dựng server endpoint cho suy luận video, xây dựng dashboard web UI cơ bản, kiểm thử toàn bộ, thiết lập dịch vụ systemd, ghi chép memory note, và viết báo cáo Markdown” - Tác tử đã tự động làm việc trong khoảng 30 phút: gặp nhiều vấn đề, tự tìm lời giải trực tuyến, xử lý từng cái một, rồi viết code, kiểm thử, debug, cấu hình dịch vụ và cuối cùng nộp báo cáo
- Tôi không trực tiếp động tay vào bất cứ phần nào; một dự án mà chỉ 3 tháng trước còn cần trọn cả cuối tuần thì giờ đã trở thành việc chỉ cần quên đi và chờ 30 phút là xong
- Kể từ khi máy tính được phát minh, thời đại tự tay gõ code trong editor nay đã kết thúc
- Giờ là thời đại chạy các AI agent, ra chỉ thị công việc bằng tiếng Anh, rồi quản lý song song và rà soát chúng
- Phần thưởng lớn nhất là tiếp tục nâng tầng trừu tượng, tức thiết kế để một bộ điều phối chạy dài hạn với đúng công cụ, bộ nhớ và chỉ thị có thể quản lý hiệu quả nhiều instance Code chạy song song
- Đòn bẩy có thể đạt được ở cấp độ “agentic engineering” cao nhất hiện nay là cực kỳ lớn
- Tất nhiên, mọi thứ vẫn chưa hoàn hảo, và vẫn cần định hướng cấp cao, khả năng phán đoán, gu (taste), giám sát, công việc lặp lại, cùng các gợi ý và ý tưởng
- Nó hoạt động tốt hơn nhiều trong một số kịch bản, đặc biệt là khi đặc tả công việc rõ ràng và có thể xác minh/kiểm thử chức năng
- Cốt lõi là rèn luyện trực giác để phân rã công việc hợp lý, giao cho tác tử những phần nó làm tốt, và hỗ trợ ở những phần còn lại
- Hiện tại, ngành phần mềm hoàn toàn không ở trong giai đoạn “business as usual” chút nào
5 bình luận
Nếu Andrej Karpathy nói vậy thì là vậy.
Tôi không mở VS Code, mà đang cho Copilot agent viết mã cho nhiều dự án ngay trên trang GitHub. Agent còn trực tiếp dùng Playwright để chụp screenshot trang web và hiển thị luôn, làm được đủ thứ.
Nhờ vậy mà nhiều toy project từng chết yểu đang được hồi sinh. :-)
Vì vậy mới nói là SaaS rồi sẽ chết hết... Bên tôi cũng đang dần thay thế các công cụ nội bộ bằng cách để AI agent tạo ra từng cái một, và tôi cũng thấy lo sợ không biết sau hồi kết của SaaS thì sẽ là một thời đại như thế nào nữa.
Các công cụ nội bộ hay những dạng SaaS đơn giản chắc chắn sẽ bị thay thế rất nhanh, nhưng từ góc nhìn của một lập trình viên solo tự làm sản phẩm, có lẽ chính lúc này mới thực sự là thời đại của đòn bẩy cực lớn.
Trước đây, nếu phải dùng 80% năng lượng cho việc “gõ” để hiện thực hóa ý tưởng, thì giờ chi phí phát triển gần như tiến về 0. Rốt cuộc, cuộc cạnh tranh sắp tới có cảm giác sẽ hoàn toàn chuyển từ chuyện ai viết code giỏi hơn sang cuộc chiến “ai tìm ra nỗi bất tiện của thị trường nhanh hơn và lên kế hoạch tốt hơn”.
Có vẻ thời đại tự mình gõ code rồi viết chương trình thực sự đã kết thúc.
Tôi đang đưa 13 dự án lên ứng dụng Codex để làm việc, nhưng trong số đó chỉ có 3 dự án là đang mở cửa sổ code.
Một trong những công cụ tôi tạo gần đây và dùng hiệu quả nhất thì tôi còn chưa từng nhìn mã của nó lần nào.
Với sản phẩm dùng cho production thì dĩ nhiên vẫn còn nhiều thứ phải cân nhắc và vẫn phải qua review code, nhưng những thứ như công cụ nội bộ thì nó làm ra thực sự rất tốt.