1 điểm bởi GN⁺ 2024-09-16 | 1 bình luận | Chia sẻ qua WhatsApp

LLMs Will Always Hallucinate, and We Need to Live With This

Mở đầu

  • Khi các mô hình ngôn ngữ lớn (LLM) được sử dụng rộng rãi trong nhiều lĩnh vực, việc xem xét một cách phê phán những giới hạn cố hữu của chúng là rất quan trọng
  • Nghiên cứu này lập luận rằng ảo giác của mô hình ngôn ngữ không chỉ là lỗi đơn thuần mà là một đặc tính tất yếu của các hệ thống này

Bản chất của ảo giác

  • Ảo giác bắt nguồn từ cấu trúc toán học và logic nền tảng của LLM
  • Không thể loại bỏ hiện tượng này thông qua cải tiến kiến trúc, nâng cao chất lượng tập dữ liệu hay các cơ chế kiểm chứng sự thật
  • Dựa trên lý thuyết tính toán và định lý bất toàn thứ nhất của Gödel, nghiên cứu viện dẫn tính bất khả quyết của các bài toán như bài toán dừng, bài toán khoảng trắng và bài toán chấp nhận

Ảo giác ở mọi giai đoạn của quy trình LLM

  • Có xác suất xảy ra ảo giác ở mọi giai đoạn như thu thập dữ liệu huấn luyện, truy xuất sự thật, phân loại ý định và sinh văn bản
  • Giới thiệu khái niệm ảo giác cấu trúc để xác lập đây là đặc tính bản chất của các hệ thống này

Kết luận

  • Bằng cách xác lập tính chắc chắn về mặt toán học của hiện tượng ảo giác, nghiên cứu thách thức quan niệm trước đây rằng có thể giảm thiểu hoàn toàn hiện tượng này

Tóm tắt của GN⁺

  • Nghiên cứu này chứng minh bằng toán học rằng ảo giác của LLM là điều tất yếu, nhấn mạnh rằng không thể loại bỏ hoàn toàn
  • Giải thích bản chất của ảo giác thông qua lý thuyết tính toán và định lý bất toàn của Gödel
  • Cho thấy ảo giác có thể xảy ra ở mọi giai đoạn của LLM
  • Nghiên cứu này gợi ý rằng điều quan trọng là phải hiểu rõ các giới hạn của LLM và chấp nhận chúng

1 bình luận

 
GN⁺ 2024-09-16
Ý kiến trên Hacker News
  • Bằng cách chứng minh hiện tượng ảo giác bằng tính chắc chắn toán học, bài viết này thách thức quan niệm trước đây rằng ảo giác có thể được giải quyết hoàn toàn

    • Vì thuật ngữ "ảo giác" tạo ra nhận thức rằng có vấn đề trong hoạt động bình thường của mô hình, nên nếu chọn một thuật ngữ khác thì có lẽ đã tránh được sự hiểu lầm
    • Ảo giác không phải là lỗi vận hành của mô hình, mà là một đánh giá giá trị rằng văn bản được tạo ra không phù hợp với mục đích
    • Việc giảm ảo giác và tạo ra "alignment" là cùng một vấn đề
  • Ảo giác là kết quả của việc đưa ra câu trả lời khả dĩ đầu tiên cho một câu hỏi

    • Con người đã có kinh nghiệm trả lời trước đó cho hầu hết các câu hỏi, và ghi nhớ sai lầm để không lặp lại
    • Con người suy nghĩ trước khi nói và liên hệ phản ứng ban đầu với các tri thức khác
    • Không nên kỳ vọng LLM sẽ ngay lập tức tạo ra câu trả lời đúng
    • Quá trình tư duy của con người có nhiều vai trò và persona khác nhau
    • Chỉ sau khi hình thành câu trả lời "bản nháp" ban đầu thì mới tạo thêm ngữ cảnh bổ sung
    • Đánh giá trí tuệ dựa trên "phản ứng trực giác" đầu tiên của LLM là một phán đoán sai lầm
  • Kiến trúc hiện tại về bản chất đã chứa "ảo giác", nên hạn chế việc sử dụng thực tiễn

    • Bài viết này đưa ra giới hạn bất khả thi của trạng thái "không ảo giác"
    • Tái khẳng định những giới hạn nền tảng của các hệ thống hình thức và tính toán cơ học
    • Giới hạn này cũng áp dụng cho con người
  • Ảo giác của LLM có liên quan đến cách biểu đạt tri thức

    • Ngay cả khi mô hình ảo giác, nó vẫn tạo ra văn bản có vẻ hợp lý đúng như cách nó đã được huấn luyện
    • Nó dựa vào các mẫu phổ biến trong dữ liệu huấn luyện, tức ngữ pháp và lựa chọn từ ngữ
    • Có thể giải quyết vấn đề ảo giác bằng những thay đổi kiến trúc phù hợp
    • Tuy nhiên, vẫn chưa rõ những thay đổi đó có thể tương thích với việc huấn luyện mô hình hiệu quả hay không
  • Dữ liệu huấn luyện không hoàn chỉnh không phải là thứ đáng để đo lường

    • Dữ liệu không hoàn chỉnh là bản chất của việc học
    • Nếu có dữ liệu hoàn chỉnh thì không cần machine learning; chỉ cần tạo một hàm ánh xạ đầu vào sang đầu ra
    • Machine learning là lấp đầy khoảng trống dựa trên dự đoán
    • Điều này cũng áp dụng tương tự cho trí tuệ và việc học của con người
    • LLM sẽ luôn ảo giác, nhưng con người cũng luôn ảo giác
    • Vấn đề thực sự là làm cho LLM ảo giác giống con người
  • LLM sẽ trở nên giống như một "expert system"

    • Khuyến nghị không nên tự giới hạn bản thân là một chuyên gia AI
  • Để làm việc hiệu quả với LLM, về bản chất cần có khả năng sử dụng một công nghệ không đáng tin cậy và phi quyết định

    • Nhiều người gặp khó khăn trong việc vượt qua rào cản này
  • Đã đến lúc bong bóng vỡ

  • Chúng ta không cần phải "chấp nhận" LLM

    • Có thể không dùng, phớt lờ, hoặc phản đối sự lan rộng và việc chấp nhận nó
  • Bài luận văn này được viết tệ và khó tin rằng đã phát triển được một lý thuyết toán học có ý nghĩa

    • Ví dụ: 10 trang đầu hoàn toàn vô nghĩa