4 điểm bởi davespark 2025-10-20 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Cựu giám đốc AI của OpenAI và Tesla, Andrej Karpathy, gần đây trong podcast của Dwarkesh Patel đã đưa ra chẩn đoán thực tế tỉnh táo về tương lai của AI agent và mốc thời gian AGI. Trong lúc ngành đang đồng loạt hô vang “năm của AI agent”, ông đã thành thật thẳng thắn chia sẻ vì sao điều đó phải là “10 năm của AI agent”, và vấn đề nền tảng hiện tại của học tăng cường là gì.

Điểm chính:

  • “Hút supervision như dùng ống hút” – Cách làm RL hiện nay, đánh giá toàn bộ quá trình chỉ bằng một tín hiệu đúng duy nhất sau hàng trăm lần thử, về bản chất là cực kỳ kém hiệu quả và nhiều nhiễu
  • Năng lực thực sự của AI lập trình: điều mà dự án nanochat đã cho thấy – Trong quá trình dựng một bản sao ChatGPT gồm 8.000 dòng, AI agent bộc lộ điểm yếu nghiêm trọng trong việc viết mã mới, với giới hạn tốt nhất chỉ dừng ở mức tự động hoàn thiện
  • “Thảm họa” sụp đổ của mô hình: cái bẫy tiềm ẩn của dữ liệu tổng hợp – Mọi mẫu mà LLM tạo đều mang phân phối “sụp đổ âm thầm”, và đó là lý do vì sao khi yêu cầu ChatGPT kể một vài câu đùa thì nó chỉ lặp lại khoảng 3 lần

Chưa có bình luận nào.

Chưa có bình luận nào.