- CSDL vector có thể nhúng trực tiếp bên trong ứng dụng, được thiết kế để thực hiện tìm kiếm tương đồng quy mô lớn với cấu hình tối thiểu
- Được xây dựng dựa trên engine Proxima của Alibaba, cung cấp khả năng mở rộng cấp production và hiệu năng tìm kiếm độ trễ thấp
- Hỗ trợ cả vector dày đặc (dense) và vector thưa (sparse), đồng thời có thể thực hiện truy vấn đa vector chỉ với một lệnh gọi
- Hỗ trợ tìm kiếm chính xác bằng cách kết hợp độ tương đồng ngữ nghĩa và lọc có cấu trúc thông qua tính năng tìm kiếm hybrid
- Ở dạng thư viện in-process có thể chạy ngay không cần máy chủ hay quá trình cấu hình, nên có thể vận hành ở bất cứ đâu như notebook, server, CLI, môi trường edge, v.v.
- Hỗ trợ nền tảng Linux (x86/ARM) và macOS, có thể cài đặt dễ dàng trong môi trường Python/Node.js
- Được cấu thành từ engine lõi dựa trên C++ và kiến trúc SWIG·Python binding, hỗ trợ tính toán hiệu năng cao và tích hợp với nhiều ngôn ngữ khác nhau
- Cải thiện thời gian tải chỉ mục và hiệu quả bộ nhớ nhờ tối ưu hóa
unordered_map cho tra cứu khóa trung bình O(1)
- Sử dụng phép toán lượng tử hóa Int4/Int8 để duy trì cân bằng giữa tốc độ và độ chính xác khi xử lý vector quy mô lớn
- Giấy phép Apache-2.0
2 bình luận
Alibaba trước đó đã tung ra một bản tên là AliSQL bằng cách fork MySQL trong bài liên quan bên dưới và còn ghép cả DuckDB vào cho tìm kiếm vector, nên có vẻ họ đang thử nghiệm khá nhiều điều mới. QWEN cũng vậy, trong thời đại AI thì Alibaba có vẻ là công ty Trung Quốc tích cực hoạt động mã nguồn mở nhất.
Thật sự thấy xuất hiện rất nhiều.