-
Gần đây, AI coding có thể nhanh chóng tạo ra “mã chạy được”, nhưng có ý kiến cho rằng nó vẫn chưa thể tự động tạo ra cả một “sản phẩm tốt” như người dùng kỳ vọng
-
Tác giả nhìn nhận nguyên nhân chính ở 2 điểm
- AI thiếu kiến thức thường thức/tri thức ngầm
- Trong cấu trúc huấn luyện dựa trên RLVR, việc “chạy mã thành công” dễ được thưởng hơn là tạo ra “mã/sản phẩm tốt”
-
Ví dụ được đưa ra gồm ảo giác Sejong Đại Vương dùng MacBook Pro, bài kiểm tra tiệm rửa xe, và việc thất bại khi tạo hình ảnh lớp học/học sinh Hàn Quốc; qua đó tác giả chỉ ra rằng ngay cả các mô hình mới nhất cũng có thể bỏ lỡ những điểm kỳ lạ mà con người nhận ra ngay lập tức
-
Nếu phần thưởng của RLVR cho coding quá thiên về việc có chạy được hay không, LLM có thể tạo ra
try-except, fallback và logic phòng thủ quá mức, làm tích tụ nợ kỹ thuật -
Cốt lõi là: cờ vây chỉ cần thắng là được, nhưng phần mềm thì không phải chỉ “chạy tạm được”, mà phải là “sản phẩm con người muốn và sẵn sàng trả tiền”
-
Theo góc nhìn AJI (Artificial Jagged Intelligence) của Karpathy, điểm yếu hiện tại của AI nằm ở “taste”, cảm quan sản phẩm và lĩnh vực thường thức ngầm
-
Anthropic cũng cho rằng mảng thiết kế/taste hiện vẫn do con người đảm nhiệm nhiều, nhưng ranh giới này đang được đàm phán lại khi mô hình tiếp tục cải thiện
-
Tác giả dự đoán khoảng cách này sẽ dần thu hẹp khi mô hình được cải thiện, chẳng hạn từ GPT-5.4 lên GPT-5.5
-
Cuối cùng, khi AI đạt được mức độ cảm quan và phán đoán khó phân biệt với con người, nó sẽ vượt qua bài kiểm tra Turing, và thời điểm đó có thể được xem là AGI
Tóm tắt:
Vấn đề của AI coding không phải là “không viết được mã”, mà là “không biết sản phẩm con người thực sự muốn là gì và vì thế tối ưu vào kết quả có thể chạy được”. Vai trò hiện tại của con người là bù đắp cho phần thiếu hụt của AI về thường thức, taste và năng lực phán đoán sản phẩm.
Chưa có bình luận nào.