LLaVA: Tinh chỉnh chỉ dẫn thị giác

xguru · 2023-04-22T10:32:01+09:00

"LLaVA : Large Language and Vision Assistant" Mô hình đa phương thức quy mô lớn kết hợp bộ mã hóa thị giác và Vicuna để hiểu thị giác và ngôn ngữ một cách tổng quát Hướng tới năng lực ở mức GPT-4 đa phương thức và độ chính xác SOTA trong hỏi đáp khoa học Công bố bài báo, mã nguồn và bản demo

(llava-vl.github.io)

6 điểm bởi xguru 2023-04-22 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

"LLaVA : Large Language and Vision Assistant"
Mô hình đa phương thức quy mô lớn kết hợp bộ mã hóa thị giác và Vicuna để hiểu thị giác và ngôn ngữ một cách tổng quát
Hướng tới năng lực ở mức GPT-4 đa phương thức và độ chính xác SOTA trong hỏi đáp khoa học
Công bố bài báo, mã nguồn và bản demo

LLaVA: Tinh chỉnh chỉ dẫn thị giác

Bài viết liên quan

Chưa có bình luận nào.