Alpaca và sự tăng tốc của phát triển LLM on-device

xguru · 2023-03-15T11:19:23+09:00

Những thay đổi trong 3 ngày sau bài viết "SD Moment đang đến" Chạy được trên Raspberry Pi 4GB bằng llama.cpp. 10 giây mỗi token Giờ có thể chạy dễ dàng với Dalai Sau khi đạt 26 giây mỗi token trên Pixel 6 bằng llama.cpp, đã cải thiện xuống còn 1 giây mỗi token trên Pixel 5 Stanford phát hành Alpaca, bản fine-tune LLaMA 7B Stanford's Alpaca Điểm yếu lớn của mô hình LLaMA là thiếu "instruction tuning" cho hỏi-đáp Một trong những đổi mới lớn của OpenAI là bổ sung instruction tuning vào GPT-3 Stanford cung cấp 52.000 mẫu huấn luyện cho việc này và giúp có thể huấn luyện chỉ với $100 Mô hình nhỏ nhất 7B giờ đã có thể chạy trên Raspberry Pi/điện thoại di động, và cho kết quả rất ấn tượng Tuy vậy, hiện vẫn chưa dùng được cho mục đích thương mại (không thể vì 3 lý do: giấy phép của LLaMA / dữ liệu instruction set được tạo từ mô hình OpenAI / không thiết kế biện pháp an toàn) Điều này có ý nghĩa gì? Mô hình cấp phép của LLaMA không quá liên quan với tôi LLaMA đã cho thấy có thể huấn luyện một mô hình ngôn ngữ lớp GPT-3 bằng các tài nguyên nhìn chung là sẵn có llama.cpp đã cho thấy có thể chạy LLM trên phần cứng tiêu dùng ở mức 4GB Alpaca cho thấy chỉ với 52K mẫu và chi phí $100 cũng có thể fine-tune mô hình 7B (giảm xuống 4GB bằng lượng tử hóa 4bit), và cho kết quả tương tự text-davinci-003 mới nhất Dù vậy, thứ được dùng để so sánh là mô hình 7B đầy đủ (13.48GB, số thực dấu phẩy động 16bit), chứ không phải mô hình 4GB đã giảm xuống 4bit; tôi vẫn chưa thấy tài liệu nào so sánh rõ ràng sự khác biệt chất lượng giữa hai bên

(simonwillison.net)

11 điểm bởi xguru 2023-03-15 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Những thay đổi trong 3 ngày sau bài viết "SD Moment đang đến"
- Chạy được trên Raspberry Pi 4GB bằng llama.cpp. 10 giây mỗi token
- Giờ có thể chạy dễ dàng với Dalai
- Sau khi đạt 26 giây mỗi token trên Pixel 6 bằng llama.cpp, đã cải thiện xuống còn 1 giây mỗi token trên Pixel 5
- Stanford phát hành Alpaca, bản fine-tune LLaMA 7B

Stanford's Alpaca

Điểm yếu lớn của mô hình LLaMA là thiếu "instruction tuning" cho hỏi-đáp
Một trong những đổi mới lớn của OpenAI là bổ sung instruction tuning vào GPT-3
Stanford cung cấp 52.000 mẫu huấn luyện cho việc này và giúp có thể huấn luyện chỉ với $100
Mô hình nhỏ nhất 7B giờ đã có thể chạy trên Raspberry Pi/điện thoại di động, và cho kết quả rất ấn tượng
Tuy vậy, hiện vẫn chưa dùng được cho mục đích thương mại (không thể vì 3 lý do: giấy phép của LLaMA / dữ liệu instruction set được tạo từ mô hình OpenAI / không thiết kế biện pháp an toàn)

Điều này có ý nghĩa gì?

Mô hình cấp phép của LLaMA không quá liên quan với tôi
LLaMA đã cho thấy có thể huấn luyện một mô hình ngôn ngữ lớp GPT-3 bằng các tài nguyên nhìn chung là sẵn có
llama.cpp đã cho thấy có thể chạy LLM trên phần cứng tiêu dùng ở mức 4GB
Alpaca cho thấy chỉ với 52K mẫu và chi phí $100 cũng có thể fine-tune mô hình 7B (giảm xuống 4GB bằng lượng tử hóa 4bit), và cho kết quả tương tự text-davinci-003 mới nhất
- Dù vậy, thứ được dùng để so sánh là mô hình 7B đầy đủ (13.48GB, số thực dấu phẩy động 16bit), chứ không phải mô hình 4GB đã giảm xuống 4bit; tôi vẫn chưa thấy tài liệu nào so sánh rõ ràng sự khác biệt chất lượng giữa hai bên

Alpaca và sự tăng tốc của phát triển LLM on-device

Stanford's Alpaca

Điều này có ý nghĩa gì?

Bài viết liên quan

Chưa có bình luận nào.