Alpaca-LoRA: Tinh chỉnh chỉ dẫn LLaMA bằng Low-Rank

xguru · 2023-03-22T10:17:02+09:00

Thử tinh chỉnh chỉ dẫn cho LLaMA trên phần cứng cá nhân bằng Low-Rank Adaptation Mô hình có thể chạy trên Raspberry Pi, đồng thời cho chất lượng tương tự text-davinci-003 Mã huấn luyện có thể chạy trong vòng 5 giờ trên một RTX 4090 duy nhất Sử dụng PEFT (Parameter-Efficient Fine-Tuning) của Hugging Face và bitsandbytes của Tim Dettmer để fine-tuning với chi phí thấp và hiệu quả

(github.com/tloen)

19 điểm bởi xguru 2023-03-22 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Thử tinh chỉnh chỉ dẫn cho LLaMA trên phần cứng cá nhân bằng Low-Rank Adaptation
Mô hình có thể chạy trên Raspberry Pi, đồng thời cho chất lượng tương tự text-davinci-003
Mã huấn luyện có thể chạy trong vòng 5 giờ trên một RTX 4090 duy nhất
Sử dụng PEFT (Parameter-Efficient Fine-Tuning) của Hugging Face và bitsandbytes của Tim Dettmer để fine-tuning với chi phí thấp và hiệu quả

Alpaca-LoRA: Tinh chỉnh chỉ dẫn LLaMA bằng Low-Rank

Bài viết liên quan

Chưa có bình luận nào.