5 điểm bởi GN⁺ 2023-07-26 | 2 bình luận | Chia sẻ qua WhatsApp
  • Bạn có thể chạy Llama 2 trên thiết bị của mình mà không cần kết nối Internet.
  • Có ba công cụ mã nguồn mở có thể chạy Llama 2 trên máy cục bộ: Llama.cpp, Ollama và MLC LLM.
  • Llama.cpp là bản port của Llama viết bằng C/C++, hỗ trợ Mac, Windows và Linux.
  • Ollama là ứng dụng macOS cho phép chạy Llama 2 qua giao diện dòng lệnh.
  • MLC LLM cho phép bạn chạy Llama 2 trên điện thoại, bao gồm cả iOS và Android.
  • Ollama khuyến nghị tối thiểu 8GB RAM để chạy mô hình 3B, 16GB cho mô hình 7B và 32GB cho mô hình 13B.
  • MLC LLM hỗ trợ các phiên bản 7B, 13B và 70B của Llama 2, nhưng hiện vẫn đang ở bản beta cho người dùng iPhone.
  • Bạn có thể chia sẻ các sản phẩm sáng tạo và nhận hỗ trợ trong cộng đồng Discord.
  • Replicate cung cấp tùy chọn chạy và tinh chỉnh Llama 2 trên đám mây.

2 bình luận

 
haebom 2023-07-28

Chạy trên Mac Studio M2 và hoạt động khá tốt.

 
GN⁺ 2023-07-26
Ý kiến Hacker News
  • Người dùng cung cấp hướng dẫn build Llama 2 trên Windows, bao gồm cài đặt CUDA Toolkit và tải model.
  • Một hàm PowerShell được chia sẻ để chạy Llama 2 dễ dàng hơn.
  • Có nhắc đến một buổi livestream coding để fine-tune Llama 2 trên GPU Google Colab A100 bằng PEFT/Lora.
  • Một bình luận viên đề xuất dùng suy luận Hugging Face để tận dụng GPU trên máy Linux.
  • Một bản fork của mã nguồn Llama 2 gốc có thể chạy trên CPU hoặc MPS (GPU M1/M2) được chia sẻ.
  • GPT4All được khuyến nghị để sử dụng Llama 2 dễ dàng trên macOS hoặc Windows.
  • Có cảnh báo về việc pipe trực tiếp script từ website vào bash.
  • Một bình luận viên thảo luận về tiềm năng của Llama 2 trong việc diễn giải và sử dụng hình ảnh.
  • Có người đặt câu hỏi về mục đích sử dụng Llama 2 ngoài phạm vi nghiên cứu.
  • Những giới hạn của mô hình LLM được nhắc đến, trong đó có việc nó từ chối tạo đối tượng JSON về bộ phim 'Ma Trận'.