- Bài viết về một công cụ tìm kiếm Wikipedia mới chạy trên trình duyệt, có thể tìm kiếm ngoại tuyến
- Công cụ tìm kiếm có khả năng tìm kiếm theo thời gian thực trên một triệu trang Wikipedia, trả kết quả mỗi 10ms trên thiết bị di động
- Kích thước nhỏ của cơ sở dữ liệu công cụ tìm kiếm, hỗ trợ một triệu embedding mà không cần xử lý đặc biệt cho các trường hợp sử dụng thông thường
- Công cụ tìm kiếm sử dụng sentence transformer để tạo embedding tài liệu, nén embedding bằng product quantization, và dùng
pq.js để thực hiện tính toán khoảng cách trong trình duyệt
- Công cụ tìm kiếm dùng
transformers.js để chạy sentence transformer trong trình duyệt cho truy vấn
- Công cụ tìm kiếm sắp xếp embedding theo kích thước trang đã nén, để các trang có mật độ thông tin cao được phân tích trước và trả về trong top 10
- Công cụ tìm kiếm dùng Arrow thay vì JSON để đạt hiệu năng cao; Arrow có thể lưu trữ gọn các mảng product quantization số nguyên 8-bit
- Công cụ tìm kiếm sử dụng mô hình ONNX chạy trong WebAssembly, hiện chưa có tăng tốc GPU
- Công cụ tìm kiếm nhúng toàn bộ Wikipedia bằng sentence transformer, nén embedding bằng product quantization, và tự viết ONNX thủ công
- Công cụ tìm kiếm xuất
numpy sang Arrow để lưu trữ embedding và metadata, giúp gọn hơn nhiều cả trong bộ nhớ lẫn trên đĩa
- Công cụ tìm kiếm hỗ trợ tìm kiếm đa diện, cho phép tìm kiếm theo thời gian thực trong các danh mục con của sản phẩm
- Tác giả mời gọi phản hồi và đề xuất cải tiến, đặc biệt về việc hỗ trợ các mức lượng tử hóa khác nhau và các chiều embedding khác nhau
1 bình luận
Ý kiến trên Hacker News