LLaMA-Adapter V2: Công cụ tinh chỉnh LLaMA hiệu quả
(github.com/ZrrSkywalker)- Có thể huấn luyện LLaMA thành mô hình Instruction-Following & MultiModal chỉ trong 1 giờ với vỏn vẹn 1,2 triệu tham số có thể huấn luyện
- Alpaca cần 7B tham số, 13G dung lượng lưu trữ và 3 giờ, trong khi
LLaMA-Adapter chỉ cần 1,2M tham số, 4,7M dung lượng lưu trữ và 1 giờ là đủ
1 bình luận
Đây chẳng phải điểm chính là đã dùng phương thức PEFT tương tự LoRA và hơn hết là hỗ trợ Visual Context sao? Các cách tiếp cận SFT (Instruction Fine Tune) của PEFT cho LLaMA vốn đã quá nhiều rồi...