Mistral-finetune - Tinh chỉnh mô hình Mistral
(github.com/mistralai)- Bộ mã nguồn nhẹ giúp tinh chỉnh các mô hình của Mistral theo cách hiệu quả về bộ nhớ và hiệu năng
- Dựa trên LoRA, phần lớn trọng số được đóng băng và chỉ huấn luyện thêm 1–2% trọng số dưới dạng Low-Rank Matrix Perturbation
- Để tối đa hóa hiệu quả, nên sử dụng GPU A100 hoặc H100; mã nguồn được tối ưu cho thiết lập huấn luyện đa GPU trên một node duy nhất, nhưng với các mô hình nhỏ như 7B thì một GPU đơn cũng là đủ
Ghi chú: Mục tiêu của repository này là cung cấp một điểm khởi đầu đơn giản và có hướng dẫn để tinh chỉnh mô hình Mistral. Vì vậy, nó mang tính định hướng quan điểm khá rõ rệt (đặc biệt liên quan đến định dạng dữ liệu) và không nhằm bao quát nhiều kiến trúc mô hình hoặc loại phần cứng khác nhau. Với cách tiếp cận tổng quát hơn, hãy tham khảo các dự án xuất sắc khác như torchtune
Chưa có bình luận nào.