Stability AI công bố StableVicuna, chatbot LLM RLHF mã nguồn mở đầu tiên trên thế giới
(stability.ai)- Tinh chỉnh theo chỉ thị và huấn luyện RLHF trên Vicuna v0 13B
- SFT (Supervised Fine-Tuning) bằng 3 bộ dữ liệu
- OpenAssistant Conversations Dataset (OASST1)
- GPT4All Prompt Generations
- Alpaca
- Có thể tải xuống trên HuggingFace dưới dạng weight delta cho mô hình LLaMA (cần dữ liệu LLaMA gốc)
Chưa có bình luận nào.