LLM vẫn còn một chặng đường dài phía trước
- LLM về bản chất chỉ là ghi nhớ rất nhiều thông tin rồi lấy ra sử dụng, nên không thể nói là đã có trí tuệ thực sự ở mức con người. Trí tuệ thực sự ở mức con người là khả năng khái quát hóa chỉ từ lượng dữ liệu học rất hạn chế và vẫn giải quyết được vấn đề trong những tình huống hoàn toàn mới.
- Để phân biệt chó và mèo, con người chỉ cần xem vài tấm ảnh, nhưng mô hình CNN cần tới 25.000 bức ảnh. Bộ não con người có thể phân loại đối tượng rất nhanh và chính xác chỉ với lượng dữ liệu học cực nhỏ, điều mà AI hiện nay không thể so sánh được.
- Ngay cả khi giải cùng một bài toán, nếu không hiểu nguyên lý mà chỉ dựa vào kinh nghiệm từng giải những bài tương tự để nhớ ra công thức phù hợp rồi áp dụng, thì đó chỉ là tra cứu giỏi chứ khó có thể xem là trí tuệ thực sự. Cần phân biệt giữa người đạt 100 điểm nhờ học thuộc và người đạt 100 điểm nhờ hiểu nguyên lý.
- Đây cũng chính là lý do khiến LLM hiện tại càng mở rộng quy mô thì hiệu năng càng tăng, nhưng vẫn tiếp tục bị ảo giác. Khi lượng học tăng lên, số “công thức” có thể lấy ra dùng cũng tăng, nên có thể đối phó với nhiều tình huống hơn; còn khi không tìm được hoặc tìm sai “công thức” phù hợp thì sẽ sinh ra ảo giác.
- Tuy vậy, việc giải quyết vấn đề bằng công thức đã học cũng là điều con người thường làm. Trừ một số rất ít người đặc biệt, đa số chúng ta đều sống bằng cách áp dụng những công thức đã nhớ vào từng tình huống; chỉ là ngay ở đây cũng tồn tại khác biệt giữa AI và con người.
- AI hiện nay tìm kiếm theo cách nông, trong khi con người có thể tìm kiếm sâu thông qua chuỗi suy nghĩ nối tiếp nhau.
- Khái niệm được gọi là “trí tuệ” có thể chia lại thành ba cấp độ sau.
- Khả năng quan sát hiện tượng, hiểu nguyên lý và vận dụng vào nhiều phạm vi khác nhau (thiên tài)
- Khả năng xem xét sâu nhiều mẫu đã học và tận dụng mẫu tối ưu (người bình thường)
- Khả năng xem xét nông nhiều mẫu đã học và dùng cái được tìm thấy nhanh nhất (LLM hiện tại)
- Vị trí hiện tại của LLM là số 3; lý tưởng nhất là tiến tới số 1, và nếu không thì ít nhất cũng phải lên được số 2 thì mới có thể tiến tới AGI (Artificial General Intelligence) như chúng ta vẫn nói đến.
ARC Prize với giải thưởng 1 triệu USD
- Ông đã phát triển một phương pháp kiểm tra để đánh giá liệu một hệ thống có sở hữu trí tuệ thực sự ở mức con người hay không, và từ đó tạo ra cuộc thi ARC Prize với giải thưởng 1 triệu USD. (https://www.kaggle.com/competitions/arc-prize-2024)
- Trên trang chủ chính thức của cuộc thi (https://arcprize.org/) bạn có thể thử giải các câu đố; với con người thì độ khó chỉ cỡ một bài kiểm tra IQ, nhưng AI đến nay vẫn chưa giải tốt được các bài toán này.
Chia sẻ thành quả sẽ giúp tiến bộ nhanh hơn
- OpenAI đã lan rộng trong ngành một văn hóa không chia sẻ thông tin, khiến sự xuất hiện của AGI bị trì hoãn ít nhất khoảng 5 đến 10 năm.
- Để tạo ra AGI cần rất nhiều thử nghiệm, nhưng vì OpenAI thu hút sự chú ý nên toàn bộ nguồn lực nhân sự và vật lực của ngành lại dồn cả vào những nơi chỉ tập trung xây dựng LLM.
- Hệ quả tất yếu là các lĩnh vực nghiên cứu khác bị giảm hỗ trợ và tiến triển chậm hơn.
- Không chỉ vậy, khác với trước đây, ngay cả khi OpenAI công bố bài báo thì họ cũng không chia sẻ chi tiết kỹ thuật, khiến các nhà nghiên cứu khác trong ngành khó tiếp tục phát triển những nghiên cứu khác dựa trên các bài báo đó.
- Trước khi OpenAI xuất hiện, như với bài báo Attention is all you need, các nhà nghiên cứu từ nhiều tổ chức từng hợp tác vượt qua ranh giới đơn vị để thúc đẩy sự phát triển nhanh chóng của AI; nhưng OpenAI đã phổ biến một văn hóa không chia sẻ các phát hiện của mình với toàn ngành, từ đó cản trở tiến bộ chung.
- Ông kỳ vọng rằng thông qua cuộc thi ARC Prize, các nhà nghiên cứu sẽ lại tích cực chia sẻ thành quả với nhau, để tốc độ phát triển của ngành một lần nữa được đẩy nhanh.
2 bình luận
Có vẻ như mô hình o1 đã tiến rất gần đến mức số 2.
Vâng, tôi cũng nghĩ vậy.