Hiện tượng ảo giác vĩnh viễn của LLM: thực tế mà chúng ta phải chấp nhận

(arxiv.org)

1 điểm bởi GN⁺ 2024-09-16 | 1 bình luận | Chia sẻ qua WhatsApp

Ảo giác của LLM không phải là lỗi trong một số tình huống, mà là đặc tính cốt lõi của hệ thống; khi phạm vi ứng dụng mở rộng, cần đưa giới hạn này vào làm tiền đề khi đánh giá
Ảo giác bắt nguồn từ cấu trúc toán học và logic, nên khó có thể loại bỏ hoàn toàn chỉ bằng cải tiến kiến trúc, tập dữ liệu hay kiểm chứng sự thật
Phân tích này dựa trên lý thuyết tính toán và định lý bất toàn thứ nhất của Gödel, tham chiếu đến các bài toán bất khả quyết như Halting Problem, Emptiness Problem và Acceptance Problem
Ở từng giai đoạn như cấu thành dữ liệu huấn luyện, truy xuất sự thật, phân loại ý định và sinh văn bản, vẫn luôn còn xác suất khác 0 tạo ra ảo giác
“Structural Hallucinations” xem ảo giác là một thuộc tính cấu trúc nội tại của LLM, thách thức quan niệm phổ biến rằng có thể giảm thiểu hoàn toàn ảo giác

Giới hạn cấu trúc của ảo giác LLM

Khi LLM được sử dụng rộng rãi trong nhiều lĩnh vực, cần xem xét một cách phê phán những giới hạn nội tại của mô hình
Ảo giác không phải là lỗi ngẫu nhiên, mà gần như là đặc điểm không thể tránh khỏi của hệ thống LLM
Theo góc nhìn này, không thể loại bỏ ảo giác chỉ bằng mô hình tốt hơn, tập dữ liệu lớn hơn hay công cụ xác minh bên ngoài

Vì sao khó loại bỏ hoàn toàn

Ảo giác phát sinh từ cấu trúc toán học và logic của LLM
Chỉ cải thiện kiến trúc, cải thiện tập dữ liệu và cơ chế kiểm chứng sự thật thì khó có thể loại bỏ hoàn toàn ảo giác
Phân tích sử dụng lý thuyết tính toán và định lý bất toàn thứ nhất của Gödel
- Các bài toán bất khả quyết liên quan được nêu gồm Halting Problem, Emptiness Problem và Acceptance Problem

Khả năng ảo giác còn tồn tại ở mỗi giai đoạn xử lý

Mọi giai đoạn trong quy trình của LLM đều có xác suất khác 0 tạo ra ảo giác
- Cấu thành dữ liệu huấn luyện
- Truy xuất sự thật
- Phân loại ý định
- Sinh văn bản
Ngay cả khi bổ sung cho một giai đoạn cụ thể, khả năng ảo giác trong toàn bộ hệ thống cũng không biến mất

Structural Hallucinations

“Structural Hallucinations” là khái niệm xem ảo giác như một thuộc tính nội tại của hệ thống LLM
Khái niệm này nhấn mạnh tính tất yếu về mặt toán học của ảo giác, đồng thời mâu thuẫn với quan niệm hiện có rằng có thể giảm thiểu hoàn toàn ảo giác
Trong thực tiễn, cần xem ảo giác của LLM không phải là đối tượng để loại bỏ hoàn toàn, mà là một ràng buộc luôn tồn tại

1 bình luận

GN⁺ 2024-09-16

Ý kiến trên Hacker News

Có lẽ đã tránh được hiểu nhầm nếu người ta không đặt tên cho khái niệm “tạo ra thông tin sai trong quá trình sinh văn bản theo xác suất” là hallucination
Từ này nghe như có gì đó trục trặc trong hoạt động bình thường của mô hình, nhưng thực tế hoạt động bình thường của mô hình là tạo ra văn bản nghe có vẻ hợp lý
“Hallucination” không phải là lỗi của mô hình mà là một phán đoán giá trị mà chúng ta gán cho văn bản đầu ra, nghĩa là văn bản đó không phù hợp với mục đích
Từ góc nhìn này, giảm hallucination và căn chỉnh về cơ bản là cùng một vấn đề, nên rất khó giải quyết riêng từng cái
- Đúng vậy. Đây là một phán đoán giá trị mang tính hậu nghiệm chứ không phải thuật ngữ chính xác
  Nếu bám sát nghĩa của từ “hallucination” thì có thể nói mô hình lúc nào cũng đang hallucinate, chỉ là khi tình cờ tạo ra nội dung đúng về mặt khách quan thì ta không gọi nó như vậy mà thôi
  Nếu bài báo đã tổng hợp hữu ích vấn đề định nghĩa này thì đó có thể là một đóng góp đáng giá
- Tôi không rõ thuật ngữ này ban đầu được dùng như thế nào, nhưng chính sự thiếu chính xác đó lại có vẻ có lợi cho phe muốn thổi phồng năng lực của LLM
  Nó khiến vấn đề trông như một “bug” tạm thời thay vì giới hạn bản chất của công nghệ, từ đó có thể làm nhà đầu tư và người mua hiểu sai về bản chất thực sự của nó
- Nếu hiện tượng này đơn giản được gọi là makin' stuff up thì không khí chắc đã rất khác
  Con người cũng luôn bịa ra mọi thứ, thậm chí còn bịa những thứ vô lý hơn AI rất nhiều, nên cũng phải tự hỏi con người có thật sự thông minh hay không / không hoàn toàn là đùa đâu
- Tôi đã thấy thuật ngữ bịa lấp chỗ trống (confabulation) vài lần, và thấy nó phản ánh tốt hơn những gì đang xảy ra ở LLM
- Cả lĩnh vực AI/học máy nói chung đã tạo ra thuật ngữ dựa vào nhân hoá, rồi những thuật ngữ đó lại được củng cố thêm bằng các câu chuyện kể
Có vẻ hallucination gần với việc khi nhận câu hỏi thì mô hình buột miệng nói luôn câu trả lời khả dĩ đầu tiên xuất hiện
Con người thường không làm vậy. Ta có ký ức về việc từng trả lời sai những câu hỏi như thế, và trước khi nói còn đối chiếu nội bộ với kiến thức khác để làm một kiểu kiểm tra lẽ thường
Vì vậy thay vì kỳ vọng LLM lập tức tạo ra đáp án đúng, có lẽ nên cho nó không gian để tự phản tỉnh
Suy nghĩ của con người cũng thường đi qua tranh luận và thoả hiệp nội bộ giữa nhiều vai trò và persona, và chỉ sau khi có “bản nháp” ban đầu thì mới có thể hình dung thêm bối cảnh như hậu quả của việc nói ra câu trả lời đó
Vì thế, đánh giá trí tuệ của LLM chỉ dựa trên “phản ứng trực giác” đầu tiên với prompt có thể là một cách tiếp cận sai
- Khi hỏi con người về điều họ không biết, suy nghĩ đầu tiên không phải là bịa ra câu trả lời mà là không biết
  Muốn bịa ra một câu chuyện còn phải tốn công, và nếu không được rèn luyện thì đa phần cũng không làm giỏi. Có những người tự nhiên làm vậy, nhưng thường bị xem là một dạng rối loạn
  LLM không có khái niệm “không biết”, nó chỉ viết ra thứ khớp nhất với dữ liệu huấn luyện. Vì trong dữ liệu huấn luyện không có quá nhiều câu “không biết”, nên đó cũng không phải câu trả lời tự nhiên
  Tôi từng hỏi danh sách quán bar ở một thành phố nhỏ, và nó bịa ra rất thuyết phục toàn bộ tên, địa chỉ, cả số điện thoại. Nếu ép một người bình thường không rành thành phố đó phải đưa ra câu trả lời nghe hợp lý mà không được nói “không biết”, cuối cùng họ có thể cũng bịa ra được, nhưng chắc chắn đó không phải ý nghĩ đầu tiên
- Không có lý do gì phải so LLM với tâm trí con người, và kiểu so sánh đó giống một thói quen xấu là muốn nhân hoá mọi thứ
  LLM không có trực giác và cũng không trải nghiệm thời gian. Nó không phải đứa trẻ căng thẳng vì sắp hết giờ thi nên đánh bừa, mà là sản phẩm của việc phát triển phần mềm chạy theo vibe sau khi từ bỏ hơn nửa thế kỷ truyền thống buộc máy tính phải cho ra đáp án đúng
- Chẳng có trí tuệ nào để mà đánh giá cả. Nó không thông minh, và bên trong cũng không có logic hay sự suy xét nào
- Có lẽ vì họ chưa từng hỏi tôi điều gì cả. Nhất là lúc đang uống cà phê mà bị hỏi câu kỹ thuật, nếu mỗi câu trả lời sai tôi được 1 xu thì giờ đã là triệu phú rồi
- Não người dường như gắn tư duy với thực tại được quan sát theo một cách nào đó
  Những phần xử lý cảm giác và suy luận tương tác với những phần xử lý ký ức, còn các loại ký ức khác nhau thì xử lý sự dung hoà. Những ký ức có ý nghĩa đôi khi còn được củng cố mạnh hơn những thứ chỉ tình cờ nhìn thấy
  LLM có vẻ không làm những việc này, và theo thiết kế thì yếu hơn não trong việc giảm hallucination
  Có lẽ một hướng nghiên cứu lấy cảm hứng từ não là xem những vùng trông bất thường ở người bị ảo giác trong não bộ và mô hình vận hành của chúng, rồi xem có thể áp dụng vào LLM hay không
  Ý tưởng áp dụng các mô hình có cấu trúc như hồi hải mã vào mạng nơ-ron cũng đã được nhiều nhà nghiên cứu theo đuổi
Tôi cho rằng kiến trúc hiện tại về bản chất là đầy hallucination, nên sẽ hạn chế nghiêm trọng việc sử dụng thực tế, đặc biệt là các trường hợp sử dụng mà kỳ vọng bị thổi phồng thường nhắc tới
Tuy vậy, bài này đặt tiêu chuẩn cho “không hallucinate” cao đến mức gần như bất khả thi
Nó giống như nhắc lại những giới hạn nền tảng đã quá quen thuộc của hệ hình thức và tính toán cơ học, rồi đưa ra kết luận hiển nhiên rằng LLM cũng chia sẻ những giới hạn đó
Trừ khi lôi nhị nguyên luận hay các kiểu siêu tính toán lượng tử đầy suy đoán vào, nếu không thì các giới hạn này cũng áp dụng rất nhiều cho con người
- Ngược lại, một LLM đã loại bỏ hallucination gần như trở thành thiết bị copy-paste
  Tính chất thú vị của LLM đến từ chỗ nó có thể bịa ra thứ gì đó mà vẫn làm cho nó nghe hợp lý
- C.S. Peirce là người nổi bật trong việc mô tả suy luận quy nạp giả thuyết và cũng ảnh hưởng khá mạnh đến công trình AI cổ điển của John Sowa, ông có một góc nhìn thú vị
  Ông cho rằng vật chất và tinh thần đều là có thật, nhưng không tách đôi, mà có một sự chuyển tiếp trơn tru và liên tục giữa chúng
  Tuy vậy, dù bản tính của tinh thần và vật chất là gì đi nữa, vẫn có bằng chứng thuyết phục rằng con người tạo ra ý nghĩa cho các biểu tượng thông qua quá trình mà Peirce gọi là ký hiệu vận hành (semiosis)
  Chúng ta vẫn chưa có một ngành ký hiệu học được hình thức hoá đúng mức cho việc này, và trong lĩnh vực đó có rất nhiều triết học ứng dụng toán học thú vị nhưng cũng không ít thứ nhảm nhí hàn lâm
  Chừng nào chưa làm được điều đó thì sẽ rất khó tạo ra cỗ máy tự động thực hiện ký hiệu vận hành, và trong một thời gian nữa vẫn sẽ còn khác biệt về chất giữa năng lực của con người và LLM
- Thành thật mà nói, điều gây ấn tượng là nó dở đến mức nào
  Tôi không thể nói là đã dùng hết mọi mô hình, nhưng đa số thất bại rất nhanh trước những yêu cầu như “hãy giải thích một quá trình trong đó ba thực thể tương tác với nhau”
  Với hai thực thể thì thường còn xử lý được, nhưng rồi cuối cùng chúng bắt đầu nói vòng vo lặp lại cùng một điều, hoặc ở nhiều mô hình còn lặp nguyên cả đoạn văn, và đến ba thì có vẻ hoàn toàn quá sức
  Có lẽ LLM vẫn có vai trò trong những lĩnh vực kiểu “đốt tiền để tạo ra thứ đa phần là sai, nhưng vì chi phí kiểm chứng rẻ nên nếu may ra có ý tưởng hay thì vẫn vớt được”
Việc đo lường dữ liệu huấn luyện không hoàn chỉnh có vẻ không mấy ý nghĩa
Ngay từ đầu, học chẳng phải là xử lý dữ liệu không hoàn chỉnh sao? Nếu dữ liệu hoàn chỉnh thì không cần machine learning, chỉ cần tạo một hàm ánh xạ đầu vào sang đầu ra là được
Machine learning là lấp đầy chỗ trống bằng dự đoán, và việc học nói chung cũng vậy
Vì thế, điều mà lý thuyết này nhắm tới cũng áp dụng được cho trí tuệ và việc học của con người
Có thể nói LLM luôn bị ảo giác, nhưng con người cũng luôn bị ảo giác
Vấn đề thật sự cần giải là làm sao để LLM ảo giác giống con người
- Cách diễn giải “machine learning là lấp đầy chỗ trống bằng dự đoán” có vẻ hơi rộng lượng với machine learning dựa trên mạng nơ-ron
  Machine learning được thiết kế để giải bài toán, và khác với AI cổ điển ở chỗ có thể suy ra hàm từ rất nhiều dữ liệu thay vì tự tay xây thuật toán
  Nhưng kiểu “trí tuệ” của machine learning hiện nay khác với tư duy con người. Con người không cần hàng triệu ví dụ để biết con mèo là gì; chỉ cần xem hai ba lần cũng có thể tiếp tục nhận diện về sau
  Chỉ cần nhìn một con mèo đen cũng có thể nhận ra những con mèo nhà khác là mèo, và nhìn trẻ con thì biết thực tế đúng là vậy
  Trí tuệ là khả năng nghĩ ra lời giải mà không cần tri thức có sẵn, và thực thể càng thông minh thì càng cần ít dữ liệu. Càng tiến gần tới một hệ thống thông minh hơn, dữ liệu cần thiết để tạo ra hiệu quả không nên tăng mà phải giảm đi
- Đúng, nhưng khác biệt rất lớn tùy việc ta yêu cầu mô hình nội suy hay ngoại suy
  Nói chung, mô hình làm tốt hơn nhiều ở vế đầu và gặp vấn đề lớn ở vế sau
Cách LLM ảo giác hiện nay có vẻ liên quan chặt chẽ đến cách nó biểu diễn tri thức
Nhìn vào hàm chi phí thì có lý do nó được gọi là log-likelihood. Mục tiêu thực tế không phải là các khái niệm của một mô hình vững chắc về thế giới thực và các câu trả lời nhất quán với chúng, mà là tạo ra một chuỗi token nghe có vẻ hợp lý theo nghĩa trừu tượng nhất
Khi mô hình ảo giác, theo một nghĩa nào đó nó vẫn đang làm khá tốt việc mà ta đã huấn luyện nó làm: tạo ra văn bản có xác suất cao, và ngầm lùi về những mẫu hình tổng quát hơn trong dữ liệu huấn luyện như ngữ pháp hay lựa chọn từ ngữ đơn giản
Có thể tưởng tượng rằng với một thay đổi kiến trúc phù hợp, vấn đề ảo giác có thể được giải quyết hoàn toàn hoặc gần như hoàn toàn
Chỉ là vẫn còn là câu hỏi bỏ ngỏ liệu có thể tạo ra một mô hình vẫn huấn luyện hiệu quả trong khi áp dụng những thay đổi đó hay không
- Nếu ai đó tìm ra được thay đổi kiến trúc như vậy, thì kết quả tạo ra sẽ không còn được gọi là LLM nữa, và bài báo sẽ thành đúng
- Không thể giải quyết hoàn toàn vấn đề này. Về mặt toán học, nó không thể quyết định được, và thật ra ngay cả không có preprint này thì trực giác cũng đã cho thấy như vậy
  Dù vậy, câu hỏi hay hơn là liệu ta có thể đạt được hiệu năng đủ tốt hay không
Để dùng LLM hiệu quả, về cơ bản ta phải học cách sử dụng một công nghệ không đáng tin cậy và phi xác định
Có vẻ nhiều người gần như không vượt qua nổi rào cản này
- Sự trung thực và chính xác tạo ra niềm tin
  Khi tin tưởng một thứ gì đó, ta ít phải xây dựng mô hình tinh thần về việc nó có thể đánh lừa mình theo cách nào và phải phản ứng ra sao, nên gánh nặng nhận thức sẽ thấp hơn
  Vì vậy, ít nhất với tôi, LLM hữu ích nhưng gây căng thẳng
- LLM về bản chất không phi xác định. Ví dụ, sinh bằng greedy sampling rất đơn giản
Có lẽ đã đến lúc bong bóng vỡ
- Trước đó chúng ta phải đạt được cái mà mình gọi là “AGI” đã
  Thậm chí còn phải định nghĩa nó trước, nhưng thực tế là chẳng ai biết AGI là gì. Vậy nên nó có thể là bất cứ thứ gì
  Việc Sam vẫn không tin AGI đã đạt được ngay cả sau GPT-3.5, ChatGPT, GPT-4 đa phương thức và o1 (Strawberry), dường như có nghĩa rằng AGI rốt cuộc là việc chiếm đoạt sáng tạo và lao động của hàng tỷ người, huy động hàng trăm tỷ USD và đưa tất cả lên một hệ thống dựa trên UBI, trong khi người trong cuộc trở nên giàu có
  Ảo giác trông giống như cái cớ để nói rằng AGI vẫn chưa đạt được. Nhờ vậy họ có thể tiếp tục huy động thêm tiền cho chi phí năng lượng huấn luyện và suy luận của những mô hình vẫn sẽ tiếp tục ảo giác
  Chỉ sau khi OpenAI đã chiếm đoạt toàn bộ giá trị và người trong cuộc đã rút tiền mặt xong, họ mới muốn bong bóng vỡ làm 95% startup AI biến mất. Còn OpenAI thì là ngoại lệ
- LLM khuếch đại cả trí thông minh lẫn sự ngu ngốc
  Vì vậy Terence Tao xem LLM cỡ bằng một nghiên cứu sinh trung bình, và còn đang tiến bộ thêm, còn bạn thì chỉ ngồi chờ nó chết
Không nhất thiết phải “sống chung với nó”
Cứ đơn giản là không dùng, phớt lờ nó, và phản đối việc lan rộng và chấp nhận nó. Tôi sẽ tiếp tục làm vậy
- Về mặt kỹ thuật thì đúng. Rốt cuộc Donald Knuth đến giờ vẫn không dùng email
  Nhưng “chúng ta” trên phạm vi toàn cầu gần như chắc chắn sẽ không làm theo lời kêu gọi đó
- Đây là kiểu “phản tiến bộ”. Chúng ta phải luôn theo đuổi tiến bộ, kể cả khi nó dẫn tới cánh cổng địa ngục của sự sụp đổ hiện thực do chính mình tạo ra. Tôi muốn nói rằng hãy cứ tiến vào xứ sở kỳ quái đó
- Tôi muốn dùng, và nhiều người khác cũng dùng. Nếu muốn tụt lại phía sau thì cứ tự nhiên
LLM sẽ đi theo con đường của expert system
Về sau có lẽ chúng ta sẽ ngạc nhiên vì sao mình từng nghĩ điều đó là khả thi
Tôi muốn khuyên đừng tự nhốt mình vào bản sắc hẹp là chuyên gia AI. Ngoài kia sắp khá lạnh rồi
Không đồng ý — https://arxiv.org/abs/2406.17642
Nghiên cứu liên quan bàn về halting problem và các bài toán khó tính toán
Dĩ nhiên LLM không thể trả lời các bài toán khó tính toán
Tôi cũng không hiểu vì sao việc trả lời câu hỏi về halting problem bằng “điều đó không thể tính được” lại phải bị gọi là ảo giác

Hiện tượng ảo giác vĩnh viễn của LLM: thực tế mà chúng ta phải chấp nhận

Giới hạn cấu trúc của ảo giác LLM

Vì sao khó loại bỏ hoàn toàn

Khả năng ảo giác còn tồn tại ở mỗi giai đoạn xử lý

Structural Hallucinations

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News