- Mô hình embedding văn bản
jina-embeddings-v2 hỗ trợ độ dài 8192 token
- Cạnh tranh với
text-embedding-ada-002 của OpenAI và cho thấy hiệu năng tốt hơn trong các benchmark về phân loại/tái xếp hạng/tìm kiếm/tóm tắt
- Được xây dựng lại từ đầu, có thể ứng dụng trong nhiều lĩnh vực với ngữ cảnh 8k: phân tích tài liệu pháp lý, nghiên cứu y học, phân tích văn học, dự báo tài chính, AI hội thoại, v.v.
- Có thể tải xuống 2 mô hình trên HuggingFace
- Base Model (0.27G): được thiết kế phù hợp cho các tác vụ cường độ cao đòi hỏi độ chính xác cao như nghiên cứu học thuật hoặc phân tích kinh doanh
- Small Model (0.07G): được tạo ra cho các ứng dụng nhẹ như app di động hoặc thiết bị có tài nguyên tính toán hạn chế
1 bình luận
Ý kiến trên Hacker News