Ollama 0.4 hỗ trợ Llama 3.2 Vision
(ollama.com)- Llama 3.2 Vision là mô hình sinh suy luận hình ảnh với kích thước 11B/90B
- Được tối ưu cho nhận thức thị giác, suy luận hình ảnh, tạo chú thích và trả lời các câu hỏi phổ quát về hình ảnh
- Có thể chạy bằng
ollama run llama3.2-vision:90b, sau đó thêm hình ảnh vào prompt để đặt câu hỏi - Ví dụ sử dụng: nhận diện chữ viết tay, OCR, diễn giải biểu đồ/bảng, hỏi đáp về hình ảnh
Chưa có bình luận nào.