- Toàn bộ mã nguồn, trọng số mô hình và bộ dữ liệu huấn luyện được công bố theo giấy phép Apache-2.0
- 4 thành phần chính
- Instruction-Tuned LLM được fine-tune từ GPT-NEOX-20B với 43 triệu bộ lệnh
- Customization Recipe có thể fine-tune phù hợp với tác vụ của riêng bạn
- Extensible Retrieval System có thể tăng cường câu trả lời bằng cách lấy thông tin từ các nguồn có thể được cập nhật theo thời gian thực ở giai đoạn suy luận, như document repo và API
- Moderation Model được thiết kế để lọc các câu hỏi mà bot sẽ trả lời, bằng cách fine-tune GPT-JT-6B
- Hợp tác giữa LAION và Ontocord: bộ dữ liệu OIG chứa 43 triệu lệnh (được công bố riêng)
Chưa có bình luận nào.