Hướng dẫn chạy Llama 2 trên máy cục bộ
(replicate.com)- Bạn có thể chạy Llama 2 trên thiết bị của mình mà không cần kết nối Internet.
- Có ba công cụ mã nguồn mở có thể chạy Llama 2 trên máy cục bộ: Llama.cpp, Ollama và MLC LLM.
- Llama.cpp là bản port của Llama viết bằng C/C++, hỗ trợ Mac, Windows và Linux.
- Ollama là ứng dụng macOS cho phép chạy Llama 2 qua giao diện dòng lệnh.
- MLC LLM cho phép bạn chạy Llama 2 trên điện thoại, bao gồm cả iOS và Android.
- Ollama khuyến nghị tối thiểu 8GB RAM để chạy mô hình 3B, 16GB cho mô hình 7B và 32GB cho mô hình 13B.
- MLC LLM hỗ trợ các phiên bản 7B, 13B và 70B của Llama 2, nhưng hiện vẫn đang ở bản beta cho người dùng iPhone.
- Bạn có thể chia sẻ các sản phẩm sáng tạo và nhận hỗ trợ trong cộng đồng Discord.
- Replicate cung cấp tùy chọn chạy và tinh chỉnh Llama 2 trên đám mây.
2 bình luận
Chạy trên Mac Studio M2 và hoạt động khá tốt.
Ý kiến Hacker News