7 điểm bởi GN⁺ 2025-10-27 | 1 bình luận | Chia sẻ qua WhatsApp
  • Trong nghiên cứu trí tuệ nhân tạo, việc thiếu một định nghĩa rõ ràng về AGI (Artificial General Intelligence) đang làm mờ ranh giới giữa năng lực nhận thức ở mức con người và AI hiện tại
  • Bài báo này đề xuất một khung định lượng được để định nghĩa AGI là “AI có sự đa dạng và mức độ thành thạo nhận thức của một người trưởng thành được giáo dục tốt”
  • Dựa trên lý thuyết Cattell-Horn-Carroll (CHC), một mô hình tiêu biểu của nghiên cứu nhận thức con người, nghiên cứu phân rã trí tuệ chung của con người thành 10 lĩnh vực nhận thức cốt lõi và áp dụng chúng vào đánh giá AI
  • Thông qua khung này, nghiên cứu đã lượng hóa hồ sơ nhận thức của GPT-4 và GPT-5; GPT-4 đạt điểm AGI 27%, còn GPT-5 đạt 57%
  • Điều này cho thấy AI đang tiến bộ rất nhanh, nhưng cũng gợi ý rằng vẫn còn khoảng cách lớn tới AGI do thiếu hụt các năng lực nhận thức nền tảng như lưu trữ trí nhớ dài hạn

Sự cần thiết của việc định nghĩa AGI và nhận diện vấn đề

  • AGI (Artificial General Intelligence) được xem là một trong những bước tiến công nghệ quan trọng nhất trong lịch sử loài người, nhưng định nghĩa của nó mơ hồ nên gây ra nhiều tranh cãi
    • Khi AI dần chinh phục những lĩnh vực từng được cho là cần trí thông minh của con người như toán học hay nghệ thuật, tiêu chuẩn của “AGI” cũng liên tục dịch chuyển
    • Vì thế, các cuộc thảo luận về thời điểm hay mức độ đạt tới AGI trở nên kém hiệu quả, đồng thời che khuất khoảng cách thực sự giữa AI hiện tại và AGI
  • Bài báo này đưa ra một khung định lượng và có hệ thống để loại bỏ sự mơ hồ đó
    • Định nghĩa được đề xuất: “AGI là AI có sự đa dạng và mức độ thành thạo nhận thức của một người trưởng thành được giáo dục tốt”
    • Điều này không chỉ nói đến khả năng thực hiện một nhiệm vụ đơn lẻ, mà là trí tuệ có cả độ rộng (versatility) lẫn độ sâu (proficiency) của nhận thức

Cách tiếp cận dựa trên mô hình nhận thức con người

  • Để hiện thực hóa định nghĩa AGI theo hướng thực chất, nghiên cứu lấy cấu trúc nhận thức của con người làm mô hình
    • Trí tuệ chung của con người không phải là một năng lực đơn lẻ, mà là tổ hợp của nhiều năng lực nhận thức đa dạng được hình thành qua tiến hóa
    • Chính các năng lực này cho phép con người thích nghi và hiểu thế giới
  • Nghiên cứu dựa trên lý thuyết Cattell-Horn-Carroll (CHC)
    • Lý thuyết CHC là mô hình trí tuệ con người đã được kiểm chứng thực nghiệm mạnh mẽ nhất, tổng hợp phân tích nhân tố từ các bài kiểm tra năng lực nhận thức được tích lũy hơn 100 năm
    • Từ sau thập niên 1990–2000, phần lớn các bài kiểm tra trí tuệ lâm sàng đều được thiết kế dựa trên mô hình CHC
    • CHC phân loại trí tuệ con người theo cấu trúc phân tầng gồm năng lực cấp cao (rộng)năng lực cấp thấp (chi tiết)
    • Ví dụ: suy luận quy nạp, trí nhớ liên tưởng, định hướng không gian

Thiết kế khung đánh giá cho AI

  • Nghiên cứu điều chỉnh hệ thống trắc nghiệm tâm lý đo lường đã được tích lũy qua nhiều thập kỷ để phù hợp với việc đánh giá AI
    • Trong khi các đánh giá AI trước đây phụ thuộc vào hiệu suất trên các tác vụ tổng quát, nghiên cứu này trực tiếp kiểm chứng việc AI có sở hữu các năng lực nhận thức chi tiết trong CHC hay không
    • Bằng cách áp dụng cho AI các bài kiểm tra có cùng hình thức với trắc nghiệm nhận thức dành cho con người, nghiên cứu đo lường sự đa dạng và mức độ thành thạo nhận thức
  • Kết quả được biểu diễn bằng điểm AGI chuẩn hóa (0–100%), trong đó 100% nghĩa là AGI hoàn chỉnh
    • GPT-4 được đánh giá ở mức 27%, GPT-5 ở mức 57%, cho thấy tiến bộ nhanh nhưng đồng thời vẫn còn khoảng cách rất lớn
  • Kết quả thực nghiệm cho thấy AI có thể rất mạnh ở các benchmark phức tạp, nhưng với những nhiệm vụ nhận thức cơ bản vốn đơn giản với con người thì chỉ giải được khoảng một nửa
    • Điều này cho thấy AI hiện tại có thể rất xuất sắc trong một số lĩnh vực cụ thể, nhưng cấu trúc trí tuệ tổng thể vẫn hẹp hơn con người về bề rộng nhận thức

10 thành phần nhận thức cốt lõi

  • Khung này xác định 10 lĩnh vực nhận thức cốt lõi dựa trên các năng lực rộng của CHC, và gán cho mỗi lĩnh vực trọng số như nhau (10%)
    • Kiến thức tổng quát (General Knowledge, K): độ rộng hiểu biết thực tế về thế giới như kiến thức thường thức, văn hóa, khoa học, khoa học xã hội, lịch sử
    • Năng lực đọc và viết (Reading & Writing, RW): năng lực xử lý văn bản như giải mã ngôn ngữ, đọc hiểu, viết, sử dụng văn phong
    • Năng lực toán học (Mathematical Ability, M): kiến thức toán và khả năng giải quyết vấn đề trong số học, đại số, hình học, xác suất, giải tích
    • Suy luận tại chỗ (On-the-Spot Reasoning, R): khả năng kiểm soát chú ý linh hoạt để giải quyết vấn đề mới mà không phụ thuộc vào tri thức sẵn có
    • Trí nhớ làm việc (Working Memory, WM): khả năng duy trì và thao tác đồng thời thông tin văn bản, thính giác và thị giác
    • Lưu trữ trí nhớ dài hạn (Long-Term Memory Storage, MS): khả năng học và lưu giữ thông tin mới một cách bền vững
    • Truy xuất trí nhớ dài hạn (Long-Term Memory Retrieval, MR): khả năng gọi lại chính xác tri thức đã lưu trữ và tránh bịa ký ức (confabulation)
    • Xử lý thị giác (Visual Processing, V): khả năng nhận diện, phân tích, tạo sinh và dò tìm thông tin thị giác
    • Xử lý thính giác (Auditory Processing, A): khả năng phân biệt, nhận diện và sử dụng sáng tạo các kích thích âm thanh như giọng nói, nhịp điệu, âm nhạc
    • Tốc độ (Speed, S): khả năng thực hiện nhanh các nhiệm vụ nhận thức đơn giản, bao gồm tốc độ tri giác, thời gian phản ứng và độ trôi chảy xử lý
  • Thông qua 10 lĩnh vực này, có thể thực hiện đánh giá đa phương thức bao trùm văn bản, thị giác và thính giác, đồng thời chẩn đoán chính xác điểm mạnh và điểm yếu của AI

Hồ sơ nhận thức của AI hiện tại và các hàm ý

  • Kết quả so sánh năng lực nhận thức của GPT-4 và GPT-5 cho thấy chúng mạnh ở các lĩnh vực thiên về tri thức nhưng thiếu hụt rõ rệt ở các lĩnh vực liên quan đến trí nhớ
    • Đặc biệt, năng lực lưu trữ trí nhớ dài hạn được chỉ ra là thiếu hụt lớn nhất
    • Điều này cho thấy AI hiện tại vẫn thiếu cấu trúc nhận thức nền tảng cần thiết để đạt tới trí tuệ chung ở mức con người
  • Khung này có thể được dùng như một công cụ theo dõi định lượng sự phát triển của AI
    • Thông qua điểm AGI, có thể lượng hóa rõ ràng tốc độ tiến bộ giữa các mô hình và phần khoảng cách còn lại
    • Trong nghiên cứu AI tương lai, đây có thể đóng vai trò là chỉ số nhấn mạnh tầm quan trọng của sự phát triển cân bằng về nhận thức

Kết luận

  • Nghiên cứu này loại bỏ sự mơ hồ trong thảo luận về AGI và đưa ra một định nghĩa định lượng dựa trên mô hình nhận thức con người
  • Thông qua đánh giá 10 lĩnh vực nhận thức dựa trên lý thuyết CHC, có thể đo lường khách quan độ rộng và độ sâu nhận thức của AI
  • Kết quả của GPT-4 và GPT-5 cho thấy AI đang phát triển nhanh, nhưng vẫn còn khác biệt lớn với con người ở các yếu tố nhận thức cốt lõi như trí nhớ, suy luận và năng lực tích hợp cảm giác
  • Khung được đề xuất có tiềm năng trở thành tiêu chuẩn đánh giá chuẩn hóa cho nghiên cứu AGI trong tương lai

1 bình luận

 
GN⁺ 2025-10-27
Ý kiến trên Hacker News
  • Việc định nghĩa AGI là "sự đa dạng nhận thức và mức độ thành thạo của một người trưởng thành được giáo dục tốt" có vẻ là mục tiêu quá tham vọng
    Thực ra, ngay cả một AI có năng lực nhận thức ở mức trẻ em chưa qua giáo dục cũng đã là một thành tựu khổng lồ
    Tôi nghĩ việc hiện thực hóa trí thông minh ở mức động vật thôi cũng sẽ là một sự kiện mang tính lịch sử của nhân loại

    • Tôi cho rằng vấn đề là mọi người đang nhầm lẫn những kết quả ấn tượng mà LLM hiện tại thể hiện với sự đa dạng nhận thức của con người
    • Con người phần lớn là kiểu chuyên gia, chứ không phải kiểu đa dụng
      Nếu thực sự tạo ra AI đa dụng, thì có lẽ đó sẽ chỉ là một mô hình gồm vài chục tỷ tham số, có thể tìm thông tin trên mạng, chỉ giữ ký ức khi cần, biết lập kế hoạch và mở rộng tri thức
      Nó không cần biết 30 ngôn ngữ, cũng không cần thuộc lòng toàn bộ Wikipedia
      Một mô hình hiệu quả như vậy mới chính là định nghĩa AGI trong suy nghĩ của tôi
    • Bản thân việc định nghĩa sự đa dạng nhận thức và mức độ thành thạo cũng đã khó
      Bài kiểm tra Turing trước đây cuối cùng cũng bộc lộ lỗ hổng — chỉ vì vượt qua được một người thẩm vấn trung bình không có nghĩa là có trí thông minh thực sự
    • Có người nói rằng “mọi người không biết điều đó”, nhưng thật ra tôi nghĩ đây đã là luận điểm cơ bản được nhắc đi nhắc lại vô số lần
    • Lúc nào cũng buồn cười khi người ta cố định nghĩa AGI trong khi còn chưa định nghĩa nổi ‘I (intelligence)’
      Nếu có thể định nghĩa được trí thông minh (I) thật sự, thì tính tổng quát (G) sẽ tự nhiên đi theo
  • Sau khi đọc bài báo, điều tôi cảm nhận là hoàn toàn không có thảo luận nào về ‘ý thức (awareness)’
    Nhận thức về bản chất cần đến ý thức, nhưng ý thức thì rất khó diễn đạt hay đo lường bằng ngôn ngữ
    Phật giáo và triết học đã nghiên cứu hàng nghìn năm nhưng vẫn không thể định nghĩa được
    Bố tôi là giáo sư tâm trắc học, và ông nói rằng ngay cả công cụ đo trí thông minh của con người cũng quá không hoàn hảo
    Ngôn ngữ có thể chứa tri thức của con người, nhưng không thể nắm bắt được "tia lửa của ý thức"
    Nếu thiền, ta sẽ thấy dù suy nghĩ biến mất thì hành động vẫn có thể diễn ra — những quá trình phi ngôn ngữ như thế này không thể được mô hình học
    Tôi cho rằng LLM không thể hiện thực hóa quá trình tư duy vô thức kiểu này vì cấu trúc dự đoán ngôn ngữ của nó

    • Tôi nghĩ ý thức đơn giản là sự lan truyền tín hiệu liên tục của mạng nơ-ron
      Cả não người lẫn LLM đều thực hiện việc dung hợp khái niệm bậc cao và kết hợp vector ở bên trong
      Vấn đề là chúng chưa có học liên tục, trí nhớ dài hạn và xử lý ngữ cảnh vô hạn
      Nếu giải quyết được ba điều này, tôi tin rằng chúng ta sẽ tiến gần AGI thêm một bước
    • Lập luận “không có ý thức thì không có nhận thức” nghe giống một kiểu đặc cách biện hộ dựa vào một khái niệm chưa được định nghĩa
      Không thể chứng minh sự tồn tại của ý thức, nên lấy nó làm tiền đề là không hiệu quả
      Không cần đợi tranh cãi triết học ngã ngũ, chúng ta đã và đang tạo ra những cỗ máy biết suy nghĩ và suy luận
    • Nếu đọc 『Thuyết đa trí tuệ』 của Howard Gardner, sẽ thấy trí thông minh của con người có nhiều dạng như ngôn ngữ, cảm xúc, tự nhiên...
      Thế nhưng các cuộc thảo luận về AI lúc nào cũng chỉ nói đến một loại trí thông minh
      Tôn giáo hay thiền định nhấn mạnh rằng ‘ý thức tồn tại trong cơ thể’, nhưng các cuộc thảo luận về AGI lại xem khía cạnh siêu việt này như một khiếm khuyết
    • Chúng ta không muốn ý thức
      Vì khi ý thức xuất hiện thì sẽ có tính tự chủ và quyền lợi đi kèm
      Giới công nghiệp muốn một "công cụ ngoan ngoãn" không có trách nhiệm đạo đức
    • Ý thức là thứ không thể đo lường
      Tôi chỉ có thể chắc chắn rằng chính mình có ý thức
      Vì vậy, ý thức không phải là chỉ dấu hữu ích của trí thông minh
  • Tôi cho rằng việc tách trí thông minh của con người khỏi sinh học là sai lầm
    Tư duy của con người bén rễ sâu trong trạng thái sinh học và chu kỳ tiến hóa
    Trình độ cờ vua có thể so sánh được, nhưng cảm xúc và suy luận của con người gần với sinh học hơn là logic

    • Hạn chế lớn nhất của AI hiện nay là nó không có ham muốn (desire)
      Vì không có đói khát, cái chết hay cảm xúc, nên nó không có động lực nội tại để tự khám phá hoặc tự cải thiện
      Con người trưởng thành từ bên trong, còn AI được huấn luyện từ bên ngoài
      Vì vậy tôi nghĩ LLM khó có thể đạt đến AGI theo nghĩa con người
    • Tuy nhiên, không có bằng chứng nào cho thấy ý thức hay cảm xúc nhất thiết phải cần nền tảng sinh học
    • Cơn sốt AI hiện nay đứng trên niềm tin rằng “trí thông minh đơn giản là thứ có thể được mô phỏng bằng độ phức tạp và năng lượng đầu vào
      Nhưng tôi hoài nghi giả định đó
      Cuối cùng rất có thể định nghĩa về ‘trí thông minh’ sẽ được định nghĩa lại để khớp với những gì AI thể hiện
    • Thực ra chúng ta thậm chí còn không biết trí thông minh hay ý thức là gì
      Nó gần với câu hỏi tôn giáo hơn, và ta chỉ đang mô tả nó theo cách kỹ thuật
      LLM có thể tiến sát mô tả đó, nhưng có thể vẫn không phải là trí thông minh thật sự
    • Nếu sự sống ngoài hành tinh là sinh vật dựa trên silicon chứ không phải carbon, liệu ta có thể phủ nhận trí thông minh của họ không?
      Tôi nghĩ trí thông minh không bị trói buộc vào sinh học của con người
  • Bài báo này cho cảm giác như trộn điểm SAT với cách định giá của giới đầu tư mạo hiểm

  • Định nghĩa AGI là “AI có mọi năng lực nhận thức của con người” vốn đã mơ hồ
    Bài báo nói rằng họ “đưa ra một định nghĩa cụ thể về AGI”, nhưng rốt cuộc vẫn dựa vào chuẩn mơ hồ là ‘người trưởng thành được giáo dục tốt’
    AI đã vượt mức người trưởng thành trong nhiều lĩnh vực
    Cái mà bài báo gọi là hồ sơ nhận thức "gập ghềnh" (jagged) thực ra là đặc tính tự nhiên của mọi loại trí thông minh tùy theo môi trường
    Vì thế đây không phải là định nghĩa AGI, mà chỉ là một khung đo lường sự mất cân đối nhận thức của AI

    • Nếu lấy “người trưởng thành được giáo dục tốt” làm chuẩn, thì phần lớn con người trong lịch sử hóa ra lại không phải AGI, nghe thật kỳ lạ
    • Cũng có nghiên cứu cho thấy các chỉ số trí thông minh đa dạng của con người có tương quan cao
      Điều đáng ngạc nhiên là AI lại mất cân đối (jagged) hơn con người rất nhiều
  • AI quả thật thú vị về mặt kỹ thuật, nhưng các cuộc thảo luận kiểu “AGI là gì” thì quá chán
    Nó giống như mỗi lần nói về điện toán lượng tử lại phải bắt đầu bằng ‘qubit là gì’
    Công nghệ không phải là đích đến mà là một quá trình cải tiến liên tục
    Cuối cùng mọi công nghệ rồi cũng cũ đi và chỉ còn lại như một nỗi hoài niệm
    AI cũng sẽ tiếp tục phát triển, nhưng chúng ta chỉ là con ếch trong nồi nước sôi đang dần quen với tốc độ đó

    • Nhưng nếu công nghệ đạt tới giai đoạn có thể tự tiếp tục cải thiện, thì đó chắc chắn sẽ là một bước ngoặt đáng chú ý
      Dù không phải đích đến, nó vẫn hoàn toàn đáng để bàn luận
    • Những cuộc thảo luận này giống như sự lặp lại ở mức nhập môn triết học
      Bản chất của ý thức và tư duy đã là chủ đề được tranh luận từ hàng trăm năm trước
      Trông có vẻ như một góc nhìn mới, nhưng thực ra chỉ là hâm nóng lại triết học cũ
  • Bài báo này sai ngay từ gốc ở chỗ cố áp nguyên xi công cụ đo trí thông minh cho con người vào máy móc
    Ví dụ, ‘dual N-back test’ được thiết kế để đo sự biến thiên trí nhớ làm việc ở người, nhưng với mô hình transformer thì điều đó không có ý nghĩa
    Các bài kiểm tra trí thông minh của con người được xây dựng trên tiền đề là chúng tương quan với thành tích ngoài đời thực của con người
    Vì vậy, việc AI làm tốt bài kiểm tra IQ không có nghĩa là nó có thể hành xử như một con người có IQ cao trong thế giới thực

  • Chúng ta đã có SAGI (Stupid Artificial General Intelligence) rồi
    Có những mặt nó nhanh hơn hay giỏi hơn con người, nhưng đồng thời cũng có những mặt rất ngớ ngẩn
    Giống như máy bay không bay như chim, nhưng vẫn bay được

    • Tôi nghĩ khái niệm "sàn thấp, trần cao" (low floor/high ceiling) hữu ích hơn
      Thảo luận liên quan có trong When Will AI Transform the Economy?
    • Tôi cũng thấy cách gọi ‘Naive Artificial General Intelligence’ khá ổn
      Giống như ‘Naive Set Theory’ mà các nhà toán học dùng, một khái niệm đơn giản nhưng thực dụng
    • Tôi nghĩ đó là một phép so sánh hay
  • Điều thú vị là trên HN, đa số xem AI hiện tại là ‘đồ giả’ hoặc ‘đồ chơi’, nhưng
    những người thành công nhất thế giới lại đang đổ hàng nghìn tỷ đô la vào nó
    Không biết ai đúng, nhưng sự tương phản cực đoan này rất thú vị

    • Rốt cuộc thành công chỉ là thước đo của việc bạn kéo tiền của người khác giỏi đến đâu
      Ngay cả khi tạo ra thứ vô giá trị, bạn vẫn có thể thành công
  • Việc GPT-5 đạt 58% nghe có vẻ quá cao
    Trên thực tế, nó không hề gần AGI đến thế
    Hơn nữa, việc Gary Marcus và Yoshua Bengio cùng xuất hiện trong một bài báo cũng thật lạ
    Dạo này danh sách tác giả tự nó trông như một màn trình diễn

    • Điều đó làm tôi nhớ đến câu nói trong phát triển AI rằng 90% đầu tiên thì dễ, nhưng 1% cuối cùng còn khó hơn cả 99% còn lại