- Trong nghiên cứu trí tuệ nhân tạo, việc thiếu một định nghĩa rõ ràng về AGI (Artificial General Intelligence) đang làm mờ ranh giới giữa năng lực nhận thức ở mức con người và AI hiện tại
- Bài báo này đề xuất một khung định lượng được để định nghĩa AGI là “AI có sự đa dạng và mức độ thành thạo nhận thức của một người trưởng thành được giáo dục tốt”
- Dựa trên lý thuyết Cattell-Horn-Carroll (CHC), một mô hình tiêu biểu của nghiên cứu nhận thức con người, nghiên cứu phân rã trí tuệ chung của con người thành 10 lĩnh vực nhận thức cốt lõi và áp dụng chúng vào đánh giá AI
- Thông qua khung này, nghiên cứu đã lượng hóa hồ sơ nhận thức của GPT-4 và GPT-5; GPT-4 đạt điểm AGI 27%, còn GPT-5 đạt 57%
- Điều này cho thấy AI đang tiến bộ rất nhanh, nhưng cũng gợi ý rằng vẫn còn khoảng cách lớn tới AGI do thiếu hụt các năng lực nhận thức nền tảng như lưu trữ trí nhớ dài hạn
Sự cần thiết của việc định nghĩa AGI và nhận diện vấn đề
- AGI (Artificial General Intelligence) được xem là một trong những bước tiến công nghệ quan trọng nhất trong lịch sử loài người, nhưng định nghĩa của nó mơ hồ nên gây ra nhiều tranh cãi
- Khi AI dần chinh phục những lĩnh vực từng được cho là cần trí thông minh của con người như toán học hay nghệ thuật, tiêu chuẩn của “AGI” cũng liên tục dịch chuyển
- Vì thế, các cuộc thảo luận về thời điểm hay mức độ đạt tới AGI trở nên kém hiệu quả, đồng thời che khuất khoảng cách thực sự giữa AI hiện tại và AGI
- Bài báo này đưa ra một khung định lượng và có hệ thống để loại bỏ sự mơ hồ đó
- Định nghĩa được đề xuất: “AGI là AI có sự đa dạng và mức độ thành thạo nhận thức của một người trưởng thành được giáo dục tốt”
- Điều này không chỉ nói đến khả năng thực hiện một nhiệm vụ đơn lẻ, mà là trí tuệ có cả độ rộng (versatility) lẫn độ sâu (proficiency) của nhận thức
Cách tiếp cận dựa trên mô hình nhận thức con người
- Để hiện thực hóa định nghĩa AGI theo hướng thực chất, nghiên cứu lấy cấu trúc nhận thức của con người làm mô hình
- Trí tuệ chung của con người không phải là một năng lực đơn lẻ, mà là tổ hợp của nhiều năng lực nhận thức đa dạng được hình thành qua tiến hóa
- Chính các năng lực này cho phép con người thích nghi và hiểu thế giới
- Nghiên cứu dựa trên lý thuyết Cattell-Horn-Carroll (CHC)
- Lý thuyết CHC là mô hình trí tuệ con người đã được kiểm chứng thực nghiệm mạnh mẽ nhất, tổng hợp phân tích nhân tố từ các bài kiểm tra năng lực nhận thức được tích lũy hơn 100 năm
- Từ sau thập niên 1990–2000, phần lớn các bài kiểm tra trí tuệ lâm sàng đều được thiết kế dựa trên mô hình CHC
- CHC phân loại trí tuệ con người theo cấu trúc phân tầng gồm năng lực cấp cao (rộng) và năng lực cấp thấp (chi tiết)
- Ví dụ: suy luận quy nạp, trí nhớ liên tưởng, định hướng không gian
Thiết kế khung đánh giá cho AI
- Nghiên cứu điều chỉnh hệ thống trắc nghiệm tâm lý đo lường đã được tích lũy qua nhiều thập kỷ để phù hợp với việc đánh giá AI
- Trong khi các đánh giá AI trước đây phụ thuộc vào hiệu suất trên các tác vụ tổng quát, nghiên cứu này trực tiếp kiểm chứng việc AI có sở hữu các năng lực nhận thức chi tiết trong CHC hay không
- Bằng cách áp dụng cho AI các bài kiểm tra có cùng hình thức với trắc nghiệm nhận thức dành cho con người, nghiên cứu đo lường sự đa dạng và mức độ thành thạo nhận thức
- Kết quả được biểu diễn bằng điểm AGI chuẩn hóa (0–100%), trong đó 100% nghĩa là AGI hoàn chỉnh
- GPT-4 được đánh giá ở mức 27%, GPT-5 ở mức 57%, cho thấy tiến bộ nhanh nhưng đồng thời vẫn còn khoảng cách rất lớn
- Kết quả thực nghiệm cho thấy AI có thể rất mạnh ở các benchmark phức tạp, nhưng với những nhiệm vụ nhận thức cơ bản vốn đơn giản với con người thì chỉ giải được khoảng một nửa
- Điều này cho thấy AI hiện tại có thể rất xuất sắc trong một số lĩnh vực cụ thể, nhưng cấu trúc trí tuệ tổng thể vẫn hẹp hơn con người về bề rộng nhận thức
10 thành phần nhận thức cốt lõi
- Khung này xác định 10 lĩnh vực nhận thức cốt lõi dựa trên các năng lực rộng của CHC, và gán cho mỗi lĩnh vực trọng số như nhau (10%)
- Kiến thức tổng quát (General Knowledge, K): độ rộng hiểu biết thực tế về thế giới như kiến thức thường thức, văn hóa, khoa học, khoa học xã hội, lịch sử
- Năng lực đọc và viết (Reading & Writing, RW): năng lực xử lý văn bản như giải mã ngôn ngữ, đọc hiểu, viết, sử dụng văn phong
- Năng lực toán học (Mathematical Ability, M): kiến thức toán và khả năng giải quyết vấn đề trong số học, đại số, hình học, xác suất, giải tích
- Suy luận tại chỗ (On-the-Spot Reasoning, R): khả năng kiểm soát chú ý linh hoạt để giải quyết vấn đề mới mà không phụ thuộc vào tri thức sẵn có
- Trí nhớ làm việc (Working Memory, WM): khả năng duy trì và thao tác đồng thời thông tin văn bản, thính giác và thị giác
- Lưu trữ trí nhớ dài hạn (Long-Term Memory Storage, MS): khả năng học và lưu giữ thông tin mới một cách bền vững
- Truy xuất trí nhớ dài hạn (Long-Term Memory Retrieval, MR): khả năng gọi lại chính xác tri thức đã lưu trữ và tránh bịa ký ức (confabulation)
- Xử lý thị giác (Visual Processing, V): khả năng nhận diện, phân tích, tạo sinh và dò tìm thông tin thị giác
- Xử lý thính giác (Auditory Processing, A): khả năng phân biệt, nhận diện và sử dụng sáng tạo các kích thích âm thanh như giọng nói, nhịp điệu, âm nhạc
- Tốc độ (Speed, S): khả năng thực hiện nhanh các nhiệm vụ nhận thức đơn giản, bao gồm tốc độ tri giác, thời gian phản ứng và độ trôi chảy xử lý
- Thông qua 10 lĩnh vực này, có thể thực hiện đánh giá đa phương thức bao trùm văn bản, thị giác và thính giác, đồng thời chẩn đoán chính xác điểm mạnh và điểm yếu của AI
Hồ sơ nhận thức của AI hiện tại và các hàm ý
- Kết quả so sánh năng lực nhận thức của GPT-4 và GPT-5 cho thấy chúng mạnh ở các lĩnh vực thiên về tri thức nhưng thiếu hụt rõ rệt ở các lĩnh vực liên quan đến trí nhớ
- Đặc biệt, năng lực lưu trữ trí nhớ dài hạn được chỉ ra là thiếu hụt lớn nhất
- Điều này cho thấy AI hiện tại vẫn thiếu cấu trúc nhận thức nền tảng cần thiết để đạt tới trí tuệ chung ở mức con người
- Khung này có thể được dùng như một công cụ theo dõi định lượng sự phát triển của AI
- Thông qua điểm AGI, có thể lượng hóa rõ ràng tốc độ tiến bộ giữa các mô hình và phần khoảng cách còn lại
- Trong nghiên cứu AI tương lai, đây có thể đóng vai trò là chỉ số nhấn mạnh tầm quan trọng của sự phát triển cân bằng về nhận thức
Kết luận
- Nghiên cứu này loại bỏ sự mơ hồ trong thảo luận về AGI và đưa ra một định nghĩa định lượng dựa trên mô hình nhận thức con người
- Thông qua đánh giá 10 lĩnh vực nhận thức dựa trên lý thuyết CHC, có thể đo lường khách quan độ rộng và độ sâu nhận thức của AI
- Kết quả của GPT-4 và GPT-5 cho thấy AI đang phát triển nhanh, nhưng vẫn còn khác biệt lớn với con người ở các yếu tố nhận thức cốt lõi như trí nhớ, suy luận và năng lực tích hợp cảm giác
- Khung được đề xuất có tiềm năng trở thành tiêu chuẩn đánh giá chuẩn hóa cho nghiên cứu AGI trong tương lai
1 bình luận
Ý kiến trên Hacker News
Việc định nghĩa AGI là "sự đa dạng nhận thức và mức độ thành thạo của một người trưởng thành được giáo dục tốt" có vẻ là mục tiêu quá tham vọng
Thực ra, ngay cả một AI có năng lực nhận thức ở mức trẻ em chưa qua giáo dục cũng đã là một thành tựu khổng lồ
Tôi nghĩ việc hiện thực hóa trí thông minh ở mức động vật thôi cũng sẽ là một sự kiện mang tính lịch sử của nhân loại
Nếu thực sự tạo ra AI đa dụng, thì có lẽ đó sẽ chỉ là một mô hình gồm vài chục tỷ tham số, có thể tìm thông tin trên mạng, chỉ giữ ký ức khi cần, biết lập kế hoạch và mở rộng tri thức
Nó không cần biết 30 ngôn ngữ, cũng không cần thuộc lòng toàn bộ Wikipedia
Một mô hình hiệu quả như vậy mới chính là định nghĩa AGI trong suy nghĩ của tôi
Bài kiểm tra Turing trước đây cuối cùng cũng bộc lộ lỗ hổng — chỉ vì vượt qua được một người thẩm vấn trung bình không có nghĩa là có trí thông minh thực sự
Nếu có thể định nghĩa được trí thông minh (I) thật sự, thì tính tổng quát (G) sẽ tự nhiên đi theo
Sau khi đọc bài báo, điều tôi cảm nhận là hoàn toàn không có thảo luận nào về ‘ý thức (awareness)’
Nhận thức về bản chất cần đến ý thức, nhưng ý thức thì rất khó diễn đạt hay đo lường bằng ngôn ngữ
Phật giáo và triết học đã nghiên cứu hàng nghìn năm nhưng vẫn không thể định nghĩa được
Bố tôi là giáo sư tâm trắc học, và ông nói rằng ngay cả công cụ đo trí thông minh của con người cũng quá không hoàn hảo
Ngôn ngữ có thể chứa tri thức của con người, nhưng không thể nắm bắt được "tia lửa của ý thức"
Nếu thiền, ta sẽ thấy dù suy nghĩ biến mất thì hành động vẫn có thể diễn ra — những quá trình phi ngôn ngữ như thế này không thể được mô hình học
Tôi cho rằng LLM không thể hiện thực hóa quá trình tư duy vô thức kiểu này vì cấu trúc dự đoán ngôn ngữ của nó
Cả não người lẫn LLM đều thực hiện việc dung hợp khái niệm bậc cao và kết hợp vector ở bên trong
Vấn đề là chúng chưa có học liên tục, trí nhớ dài hạn và xử lý ngữ cảnh vô hạn
Nếu giải quyết được ba điều này, tôi tin rằng chúng ta sẽ tiến gần AGI thêm một bước
Không thể chứng minh sự tồn tại của ý thức, nên lấy nó làm tiền đề là không hiệu quả
Không cần đợi tranh cãi triết học ngã ngũ, chúng ta đã và đang tạo ra những cỗ máy biết suy nghĩ và suy luận
Thế nhưng các cuộc thảo luận về AI lúc nào cũng chỉ nói đến một loại trí thông minh
Tôn giáo hay thiền định nhấn mạnh rằng ‘ý thức tồn tại trong cơ thể’, nhưng các cuộc thảo luận về AGI lại xem khía cạnh siêu việt này như một khiếm khuyết
Vì khi ý thức xuất hiện thì sẽ có tính tự chủ và quyền lợi đi kèm
Giới công nghiệp muốn một "công cụ ngoan ngoãn" không có trách nhiệm đạo đức
Tôi chỉ có thể chắc chắn rằng chính mình có ý thức
Vì vậy, ý thức không phải là chỉ dấu hữu ích của trí thông minh
Tôi cho rằng việc tách trí thông minh của con người khỏi sinh học là sai lầm
Tư duy của con người bén rễ sâu trong trạng thái sinh học và chu kỳ tiến hóa
Trình độ cờ vua có thể so sánh được, nhưng cảm xúc và suy luận của con người gần với sinh học hơn là logic
Vì không có đói khát, cái chết hay cảm xúc, nên nó không có động lực nội tại để tự khám phá hoặc tự cải thiện
Con người trưởng thành từ bên trong, còn AI được huấn luyện từ bên ngoài
Vì vậy tôi nghĩ LLM khó có thể đạt đến AGI theo nghĩa con người
Nhưng tôi hoài nghi giả định đó
Cuối cùng rất có thể định nghĩa về ‘trí thông minh’ sẽ được định nghĩa lại để khớp với những gì AI thể hiện
Nó gần với câu hỏi tôn giáo hơn, và ta chỉ đang mô tả nó theo cách kỹ thuật
LLM có thể tiến sát mô tả đó, nhưng có thể vẫn không phải là trí thông minh thật sự
Tôi nghĩ trí thông minh không bị trói buộc vào sinh học của con người
Bài báo này cho cảm giác như trộn điểm SAT với cách định giá của giới đầu tư mạo hiểm
Định nghĩa AGI là “AI có mọi năng lực nhận thức của con người” vốn đã mơ hồ
Bài báo nói rằng họ “đưa ra một định nghĩa cụ thể về AGI”, nhưng rốt cuộc vẫn dựa vào chuẩn mơ hồ là ‘người trưởng thành được giáo dục tốt’
AI đã vượt mức người trưởng thành trong nhiều lĩnh vực
Cái mà bài báo gọi là hồ sơ nhận thức "gập ghềnh" (jagged) thực ra là đặc tính tự nhiên của mọi loại trí thông minh tùy theo môi trường
Vì thế đây không phải là định nghĩa AGI, mà chỉ là một khung đo lường sự mất cân đối nhận thức của AI
Điều đáng ngạc nhiên là AI lại mất cân đối (jagged) hơn con người rất nhiều
AI quả thật thú vị về mặt kỹ thuật, nhưng các cuộc thảo luận kiểu “AGI là gì” thì quá chán
Nó giống như mỗi lần nói về điện toán lượng tử lại phải bắt đầu bằng ‘qubit là gì’
Công nghệ không phải là đích đến mà là một quá trình cải tiến liên tục
Cuối cùng mọi công nghệ rồi cũng cũ đi và chỉ còn lại như một nỗi hoài niệm
AI cũng sẽ tiếp tục phát triển, nhưng chúng ta chỉ là con ếch trong nồi nước sôi đang dần quen với tốc độ đó
Dù không phải đích đến, nó vẫn hoàn toàn đáng để bàn luận
Bản chất của ý thức và tư duy đã là chủ đề được tranh luận từ hàng trăm năm trước
Trông có vẻ như một góc nhìn mới, nhưng thực ra chỉ là hâm nóng lại triết học cũ
Bài báo này sai ngay từ gốc ở chỗ cố áp nguyên xi công cụ đo trí thông minh cho con người vào máy móc
Ví dụ, ‘dual N-back test’ được thiết kế để đo sự biến thiên trí nhớ làm việc ở người, nhưng với mô hình transformer thì điều đó không có ý nghĩa
Các bài kiểm tra trí thông minh của con người được xây dựng trên tiền đề là chúng tương quan với thành tích ngoài đời thực của con người
Vì vậy, việc AI làm tốt bài kiểm tra IQ không có nghĩa là nó có thể hành xử như một con người có IQ cao trong thế giới thực
Chúng ta đã có SAGI (Stupid Artificial General Intelligence) rồi
Có những mặt nó nhanh hơn hay giỏi hơn con người, nhưng đồng thời cũng có những mặt rất ngớ ngẩn
Giống như máy bay không bay như chim, nhưng vẫn bay được
Thảo luận liên quan có trong When Will AI Transform the Economy?
Giống như ‘Naive Set Theory’ mà các nhà toán học dùng, một khái niệm đơn giản nhưng thực dụng
Điều thú vị là trên HN, đa số xem AI hiện tại là ‘đồ giả’ hoặc ‘đồ chơi’, nhưng
những người thành công nhất thế giới lại đang đổ hàng nghìn tỷ đô la vào nó
Không biết ai đúng, nhưng sự tương phản cực đoan này rất thú vị
Ngay cả khi tạo ra thứ vô giá trị, bạn vẫn có thể thành công
Việc GPT-5 đạt 58% nghe có vẻ quá cao
Trên thực tế, nó không hề gần AGI đến thế
Hơn nữa, việc Gary Marcus và Yoshua Bengio cùng xuất hiện trong một bài báo cũng thật lạ
Dạo này danh sách tác giả tự nó trông như một màn trình diễn