ChatGPT tùy chỉnh bằng chính tài liệu của tôi?

(news.ycombinator.com)

4 điểm bởi GN⁺ 2023-12-26 | 1 bình luận | Chia sẻ qua WhatsApp

Có một thread liên quan từ 5 tháng trước, nhưng có thể đã là thông tin lỗi thời, nên đang tìm lại cách tiếp cận tính đến tháng 12/2023
Trọng tâm của câu hỏi là đâu là cách tốt nhất để cung cấp một tập tài liệu tùy chỉnh cho LLM nhằm nhận được câu trả lời ít bị ảo giác và có chất lượng khá tốt
Không chỉ giới hạn ở việc tự huấn luyện mô hình, mà bao quát cả các phương thức khiến mô hình trả lời dựa trên tài liệu, bao gồm cả các cách tiếp cận như RAG

1 bình luận

GN⁺ 2023-12-26

Ý kiến trên Hacker News

Việc huấn luyện trên tài liệu thực ra không diễn ra; nhiều startup dùng thuật ngữ này nhưng trên thực tế họ dùng RAG (Retrieval-Augmented Generation).
- Llamaindex được xem là lựa chọn tốt nhất.
- Phần lớn các startup tuyên bố huấn luyện trên tài liệu thực chất đang dùng RAG.
- Khuyến nghị tìm các script tự động tạo cặp câu hỏi và câu trả lời bằng qLoRA.
- Rất hiếm trường hợp được dùng thành công cho kho tri thức tài liệu cá nhân; chủ yếu được dùng cho các kỹ năng như toán học, suy luận, Python, v.v.
- Đã được chứng minh bằng thực nghiệm rằng chỉ đơn giản đưa một tập tài liệu vào fine-tuning là không hiệu quả.
Cần cân nhắc các cách tiếp cận khác nhau tùy theo lượng tài liệu.
- RAG hoạt động tốt với tập dữ liệu nhỏ, và Llamaindex đã làm rất nhiều kỹ thuật trong lĩnh vực này.
- Kết hợp fine-tuning và RAG hiệu quả với các tập dữ liệu lớn có kiến thức có thể dễ dàng tìm thấy trên internet.
- Tiền huấn luyện liên tục là cần thiết khi có tập dữ liệu rất lớn và kiến thức độc quyền.
AWS Bedrock dễ sử dụng; có thể tải tài liệu lên S3, đồng bộ vào cơ sở dữ liệu vector và dùng qua API.
- Bedrock là một sản phẩm cung cấp nhiều mô hình khác nhau cùng một API chung.
h2ogpt là một triển khai RAG đầy đủ tính năng, có thể xử lý tài liệu ở nhiều định dạng và hỗ trợ nhiều cách triển khai hosting mô hình.
Có thể mua tài khoản ChatGPT và tải tài liệu của mình lên, từ đó tạo ra AI hội thoại tùy chỉnh.
GPT4 Assistants hiện có thể xử lý RAG theo mặc định, và PrivateGPT là một trong những lựa chọn nổi tiếng cho việc này.
Copilot Builder của Microsoft Office cho phép người dùng tạo AI Copilot chỉ trong vài giây bằng cách chỉ định URL cơ bản, tệp đã tải lên, v.v.
Cheshire Cat là một framework trợ lý AI lưu tài liệu dưới dạng "ký ức" để có thể truy xuất lại sau này.
Có một video hướng dẫn cách fine-tune Mistral 7B bằng QLoRA, đồng thời đề cập rằng kỹ thuật RAG có thể là lựa chọn phù hợp hơn.

Ask HN: Tính đến tháng 12/2023, làm thế nào để huấn luyện LLM/ChatGPT tùy chỉnh bằng chính tài liệu của tôi?

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News