Các nhà nghiên cứu MIT trình diễn kỹ thuật khám phá tri thức của mô hình ngôn ngữ lớn
- Phát hiện rằng khi phản hồi prompt của người dùng, các mô hình ngôn ngữ lớn sử dụng một cơ chế đơn giản để truy xuất tri thức đã được lưu trữ.
- Các nhà nghiên cứu đã tận dụng cơ chế đơn giản này để xác định những gì mô hình biết về nhiều chủ đề khác nhau, đồng thời có thể sửa thông tin được lưu trữ sai.
Độ phức tạp của mô hình ngôn ngữ lớn
- Mô hình ngôn ngữ lớn đang được sử dụng trong nhiều lĩnh vực như hỗ trợ khách hàng, sinh mã và dịch ngôn ngữ, nhưng nguyên lý vận hành của chúng vẫn chưa được hiểu đầy đủ.
- Các nhà nghiên cứu từ MIT và những tổ chức khác đã nghiên cứu cơ chế mà các mô hình học máy khổng lồ này dùng để truy xuất tri thức đã lưu trữ.
Cơ chế truy xuất tri thức đơn giản
- Kết quả nghiên cứu cho thấy các mô hình ngôn ngữ lớn thường sử dụng một hàm tuyến tính đơn giản để khôi phục và giải mã các sự thật đã lưu trữ.
- Mô hình sử dụng cùng một hàm giải mã cho các loại sự thật tương tự.
- Hàm tuyến tính là một phương trình biểu diễn mối quan hệ theo đường thẳng giữa hai biến.
Khám phá những gì mô hình biết
- Bằng cách xác định các hàm tuyến tính cho nhiều sự thật khác nhau, nhóm nghiên cứu đã khám phá những gì mô hình biết về các chủ đề mới và xác định tri thức đó được lưu ở đâu trong mô hình.
- Khi sử dụng kỹ thuật đã phát triển cùng các hàm đơn giản được suy ra, họ phát hiện rằng ngay cả khi mô hình đưa ra câu trả lời sai, nó thường vẫn lưu trữ thông tin đúng.
Trực quan hóa tri thức của mô hình
- Các nhà nghiên cứu dùng các hàm này để xác định mô hình thực sự tin điều gì là đúng về những chủ đề khác nhau.
- Ví dụ, bắt đầu với prompt "Bill Bradley was a" rồi dùng các hàm giải mã cho "plays sports" và "attended university", họ kiểm tra liệu mô hình có biết rằng Bill Bradley là một cầu thủ bóng rổ và từng học tại Đại học Princeton hay không.
- Bằng kỹ thuật khám phá này, họ tạo ra một lưới gọi là 'attribute lens' để trực quan hóa nơi thông tin về một quan hệ cụ thể được lưu trữ trong nhiều tầng của transformer.
Ý kiến của GN⁺
- Nghiên cứu này nâng mức độ hiểu biết về cách các mô hình ngôn ngữ lớn lưu trữ và truy xuất tri thức thực tế lên thêm một bước.
- Kết quả nghiên cứu gợi mở khả năng dùng việc chỉnh sửa tri thức để giảm xu hướng mô hình cung cấp thông tin sai và ngăn lỗi trong chatbot AI.
- Nếu được áp dụng, công nghệ này có thể góp phần nâng cao độ tin cậy của AI và giúp cải thiện trải nghiệm người dùng.
- Tuy nhiên, vì không phải mọi sự thật đều được mã hóa theo cách tuyến tính, nên vẫn cần thêm nghiên cứu để xác định liệu kỹ thuật này có thể áp dụng cho mọi kiểu truy xuất tri thức hay không.
- Các dự án mã nguồn mở cung cấp chức năng tương tự bao gồm BERT của Google và dòng GPT của OpenAI; chúng cũng đang góp phần giúp hiểu rõ hơn nguyên lý hoạt động của mô hình ngôn ngữ lớn.
- Khi áp dụng công nghệ mới, cần cân nhắc sự cân bằng giữa độ phức tạp của mô hình và khả năng diễn giải; lợi ích có thể đạt được khi chọn kỹ thuật này là cải thiện độ chính xác và độ tin cậy của mô hình.
1 bình luận
Ý kiến Hacker News
Công trình đáng kinh ngạc này làm nổi bật một số vấn đề lớn nhất hiện nay của lĩnh vực AI
Cấu trúc của ngôn ngữ là thứ làm cho Word2Vec trở nên khả thi
Giúp hiểu ý nghĩa của việc sự thật được lưu trữ như một hàm tuyến tính
Tò mò về loại hàm được dùng để mã hóa kiến thức lập trình
Nhận thấy sự tương đồng với vai trò của vector quan hệ trong Word2Vec
LLM có vẻ là một cơ chế nén rất tốt
Gợi nhớ đến ví dụ embedding "King - Man + Woman = Queen"
Khó hiểu làm sao một "tệp CSV/cơ sở dữ liệu/mô hình" với 7 tỷ "tham số" lại có thể cung cấp một LLM/GPT tương tác am hiểu gần như mọi chủ đề
Thích việc bài báo này rất hay và đã tiến hành các thí nghiệm để kiểm chứng những ý tưởng này
Khả năng có thể tách phần suy luận khỏi phần thông tin