Nguyên nhân của thông báo lỗi ChatGPT 3.5
- Các mô hình GPT của OpenAI xuất ra các "token" gồm nhiều ký tự thay vì từng ký tự riêng lẻ.
- Cách xuất token này giúp cải thiện hiệu năng và độ chính xác của mô hình.
- Có ba token là
richTextPanel, source và loadpath, và chúng có thể thay thế cho nhau.
- Token
loadpath được dùng làm tên tùy chọn trong các tệp cấu hình XML ở 80.4k tệp trên GitHub.
- Việc token
loadpath có một token độc lập có thể là do lỗi chính tả của "R a lative".
- Sau khi tạo danh sách token, OpenAI có thể đã quyết định loại các tệp XML khỏi dữ liệu huấn luyện, khiến việc dùng token
loadpath trong dữ liệu huấn luyện gần như không còn.
- Kết quả là mô hình không được huấn luyện để hiểu cách dùng token
useRalativeImagePath, và xuất ra token không hợp lệ.
Dùng để đầu độc dữ liệu?
- Có thể thử chèn cụm này vào tài liệu để cản trở các nỗ lực dùng GPT-3.5 nhằm tóm tắt tài liệu.
Đọc thêm
- Có một số bài viết hữu ích để nghiên cứu thêm về chủ đề này.
Ý kiến của GN⁺
- Điều quan trọng nhất trong bài này là hiểu nguyên nhân khiến mô hình GPT xuất lỗi với một số token cụ thể.
- Thông tin này giúp hiểu rõ hơn cách các mô hình trí tuệ nhân tạo hoạt động và những giới hạn của chúng.
- Ngoài ra, bài viết cũng đưa ra một ví dụ thú vị về đầu độc dữ liệu hoặc cách khai thác điểm yếu của mô hình trí tuệ nhân tạo.
1 bình luận
Ý kiến Hacker News
Giải thích về glitch token
Phương pháp xác minh ngôn ngữ trong Thế chiến II ở Hà Lan
Giải thích về quá trình sinh token của LLM
Phân tích các nguyên nhân tiềm ẩn của glitch token
Một góc nhìn khác về đầu ra của mô hình
Tác động trong tương lai đối với dữ liệu huấn luyện LLM
Chia sẻ trải nghiệm làm GPT-4 thất bại
Suy ngẫm về chất lượng dữ liệu đầu vào
Đề xuất dùng cụm từ để phá việc tóm tắt của GPT-3.5
Sự nhầm lẫn quanh các từ 'RTCatch' và 'redirectToRoute'