Ollama v0.1.33 - Hỗ trợ Llama 3 + Phi 3 + Qwen 110B

xguru · 2024-04-30T09:22:01+09:00

Hỗ trợ mẫu mới Llama 3: mẫu mới của Meta và là LLM mở có hiệu năng tốt nhất cho đến nay Phi 3 Mini: mẫu mở gọn nhẹ mới của Microsoft với 3,8 tỷ tham số Moondream: mô hình ngôn ngữ-thị giác cỡ nhỏ được thiết kế để chạy hiệu quả trên thiết bị biên Dolphin Llama 3: mẫu không kiểm duyệt do Eric Hartford huấn luyện dựa trên Llama 3. Bao gồm nhiều năng lực về giáo dục, hội thoại và lập trình Qwen 110B: mẫu kích thước 100B tham số cho thấy hiệu năng nổi bật trong các bài đánh giá (Alibaba) Sửa lỗi Sửa lỗi API bị gián đoạn do mô hình không thoát Sửa lỗi hết bộ nhớ trên máy Mac Apple Silicon Sửa lỗi hết bộ nhớ khi chạy các mẫu kiến trúc Mixtral Tính năng đồng thời thử nghiệm OLLAMA_NUM_PARALLEL: xử lý nhiều yêu cầu đồng thời cho một mẫu duy nhất OLLAMA_MAX_LOADED_MODELS: tải nhiều mẫu cùng lúc Cần thiết lập biến môi trường OLLAMA_NUM_PARALLEL=4 OLLAMA_MAX_LOADED_MODELS=4 ollama serve

(github.com/ollama)

8 điểm bởi xguru 2024-04-30 | 1 bình luận | Chia sẻ qua WhatsApp

Hỗ trợ mẫu mới
- Llama 3: mẫu mới của Meta và là LLM mở có hiệu năng tốt nhất cho đến nay
- Phi 3 Mini: mẫu mở gọn nhẹ mới của Microsoft với 3,8 tỷ tham số
- Moondream: mô hình ngôn ngữ-thị giác cỡ nhỏ được thiết kế để chạy hiệu quả trên thiết bị biên
- Dolphin Llama 3: mẫu không kiểm duyệt do Eric Hartford huấn luyện dựa trên Llama 3. Bao gồm nhiều năng lực về giáo dục, hội thoại và lập trình
- Qwen 110B: mẫu kích thước 100B tham số cho thấy hiệu năng nổi bật trong các bài đánh giá (Alibaba)
Sửa lỗi
- Sửa lỗi API bị gián đoạn do mô hình không thoát
- Sửa lỗi hết bộ nhớ trên máy Mac Apple Silicon
- Sửa lỗi hết bộ nhớ khi chạy các mẫu kiến trúc Mixtral
Tính năng đồng thời thử nghiệm
- OLLAMA_NUM_PARALLEL: xử lý nhiều yêu cầu đồng thời cho một mẫu duy nhất
- OLLAMA_MAX_LOADED_MODELS: tải nhiều mẫu cùng lúc
- Cần thiết lập biến môi trường
  - OLLAMA_NUM_PARALLEL=4 OLLAMA_MAX_LOADED_MODELS=4 ollama serve

1 bình luận

siabard 2024-04-30

Cần dùng nhiều mô hình nên giờ làm được rồi nhỉ. ^^=b

Ollama v0.1.33 - Hỗ trợ Llama 3 + Phi 3 + Qwen 110B

Bài viết liên quan

1 bình luận