8 điểm bởi xguru 2024-11-08 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Llama 3.2 Vision là mô hình sinh suy luận hình ảnh với kích thước 11B/90B
    • Được tối ưu cho nhận thức thị giác, suy luận hình ảnh, tạo chú thích và trả lời các câu hỏi phổ quát về hình ảnh
  • Có thể chạy bằng ollama run llama3.2-vision:90b, sau đó thêm hình ảnh vào prompt để đặt câu hỏi
  • Ví dụ sử dụng: nhận diện chữ viết tay, OCR, diễn giải biểu đồ/bảng, hỏi đáp về hình ảnh

Chưa có bình luận nào.

Chưa có bình luận nào.