16 điểm bởi xguru 2023-05-01 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Tinh chỉnh theo chỉ thị và huấn luyện RLHF trên Vicuna v0 13B
  • SFT (Supervised Fine-Tuning) bằng 3 bộ dữ liệu
    • OpenAssistant Conversations Dataset (OASST1)
    • GPT4All Prompt Generations
    • Alpaca
  • Có thể tải xuống trên HuggingFace dưới dạng weight delta cho mô hình LLaMA (cần dữ liệu LLaMA gốc)

Chưa có bình luận nào.

Chưa có bình luận nào.