MiniLLM - Chạy LLM trên GPU cá nhân

xguru · 2023-03-30T10:45:01+09:00

Hệ thống tối giản để chạy các LLM mới nhất trên GPU Nvidia dành cho người tiêu dùng Hỗ trợ nhiều LLM (LLAMA, BLOOM, OPT) với quy mô lên tới 170B Hỗ trợ nhiều loại GPU Nvidia khác nhau Mã nguồn nhỏ gọn, dễ sử dụng, viết bằng Python Bên trong sử dụng thuật toán GPTQ để nén 3-bit nhằm giảm thiểu mức sử dụng bộ nhớ GPU

(github.com/kuleshov)

22 điểm bởi xguru 2023-03-30 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Hệ thống tối giản để chạy các LLM mới nhất trên GPU Nvidia dành cho người tiêu dùng
Hỗ trợ nhiều LLM (LLAMA, BLOOM, OPT) với quy mô lên tới 170B
Hỗ trợ nhiều loại GPU Nvidia khác nhau
Mã nguồn nhỏ gọn, dễ sử dụng, viết bằng Python
Bên trong sử dụng thuật toán GPTQ để nén 3-bit nhằm giảm thiểu mức sử dụng bộ nhớ GPU

MiniLLM - Chạy LLM trên GPU cá nhân

Bài viết liên quan

Chưa có bình luận nào.