30 điểm bởi xguru 2023-12-04 | 4 bình luận | Chia sẻ qua WhatsApp
  • Hỗ trợ chạy LLM dễ dàng trên hầu hết máy tính mà không cần cài đặt, chỉ với 1 tệp
  • Framework kết hợp llama.cpp và Cosmopolitan Libc
    • Chỉ với 1 bản build có thể chạy trên nhiều HĐH và nhiều kiến trúc CPU khác nhau
  • Cung cấp mô hình LLaVA có thể trò chuyện và nhận diện hình ảnh làm ví dụ
    • Chỉ cần tải tệp 4GB llava-v1.5-7b-q4-server.llamafile rồi chạy là xong
    • Với Mac/Linux/BSD, chỉ cần chmod +x rồi chạy ngay
    • Với Windows, chỉ cần thêm .exe vào sau phần mở rộng rồi chạy ngay
    • Khi chạy, trình duyệt sẽ tự động mở và hiển thị giao diện trò chuyện
  • Ngoài ra còn cung cấp các llamafile như Mistral-7B-Instruct, WizardCoder-Python-13B, v.v.

4 bình luận

 
edunga1 2023-12-19

curl --location https://huggingface.co/jartine/llava-v1.5-7B-GGUF/… > llamafile

Chỉ cần một lệnh curl là có thể chạy ngay, thật sự quá ấn tượng..

 
cosine20 2023-12-08

Wow, đỉnh thật đó hahaha

 
ragingwind 2023-12-04

Có vẻ là có thể chạy thật sự rất dễ.

 
xguru 2023-12-04

Đã từng được đăng trên GN⁺, nhưng có lẽ vì phần giới thiệu bằng AI tóm tắt chưa đủ nên không được chú ý, nên tôi tổng hợp lại thêm một lần nữa. Có vẻ là một thử nghiệm khá thú vị.
Có thể triển khai và chạy LLM dưới dạng một tệp duy nhất với "Llamafile"

Mô hình cơ bản là LLaVA: Visual Instruction Tuning

Vào thời điểm công bố thì Cosmopolitan và RedBean trông khá đùa vui, vậy mà giờ lại được dùng theo cách này. Có vẻ sẽ là một trường hợp sử dụng rất tuyệt vời.