Stability AI công bố StableVicuna, chatbot LLM RLHF mã nguồn mở đầu tiên trên thế giới

xguru · 2023-05-01T10:32:02+09:00

Tinh chỉnh theo chỉ thị và huấn luyện RLHF trên Vicuna v0 13B SFT (Supervised Fine-Tuning) bằng 3 bộ dữ liệu OpenAssistant Conversations Dataset (OASST1) GPT4All Prompt Generations Alpaca Có thể tải xuống trên HuggingFace dưới dạng weight delta cho mô hình LLaMA (cần dữ liệu LLaMA gốc)

(stability.ai)

16 điểm bởi xguru 2023-05-01 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Tinh chỉnh theo chỉ thị và huấn luyện RLHF trên Vicuna v0 13B
SFT (Supervised Fine-Tuning) bằng 3 bộ dữ liệu
- OpenAssistant Conversations Dataset (OASST1)
- GPT4All Prompt Generations
- Alpaca
Có thể tải xuống trên HuggingFace dưới dạng weight delta cho mô hình LLaMA (cần dữ liệu LLaMA gốc)

Stability AI công bố StableVicuna, chatbot LLM RLHF mã nguồn mở đầu tiên trên thế giới

Bài viết liên quan

Chưa có bình luận nào.