"The web as a database"
- Công cụ tìm kiếm dựa trên embedding nhằm vượt qua giới hạn của tìm kiếm theo từ khóa, chỉ trả về các kết quả khớp chính xác với ý định của người dùng
- Hoạt động theo quy trình nhiều bước: tìm kiếm vector embedding trên toàn bộ web theo ngữ nghĩa truy vấn → xác minh bằng LLM → cung cấp kết quả đã tinh lọc
- Không hiển thị dưới dạng danh sách thông thường mà cung cấp kết quả theo định dạng bảng, có thể thêm các cột mong muốn để thu thập thông tin bổ sung theo kiểu bất đồng bộ
- Mỗi ô được tải riêng theo kiểu bất đồng bộ, được thiết kế để có thể khám phá web như một cơ sở dữ liệu
- Ví dụ, những điều kiện cụ thể và phức tạp như "startup công cụ phát triển mã nguồn mở đặt tại San Francisco, được thành lập trong giai đoạn 2021~2025" cũng có thể được tìm chính xác
- Với mỗi kết quả, LLM sẽ đánh giá liệu nó có thực sự phù hợp với điều kiện tìm kiếm hay không, đồng thời cung cấp căn cứ (nguồn) chứng minh rằng kết quả đáp ứng điều kiện đó
- Thời gian xử lý có thể mất từ vài phút đến vài giờ
- Ví dụ tìm kiếm: blog toán học do giáo viên dạy toán ngoài nước Mỹ tạo ra
- Video demo: https://youtu.be/Unt8hJmCxd4
- Tài liệu API: https://docs.exa.ai/websets
Chưa có bình luận nào.