Công cụ File Search mới ra mắt trên Google Gemini API giúp đơn giản hóa mang tính đột phá việc xây dựng hệ thống RAG (Retrieval-Augmented Generation):
- Thay vì quy trình phân đoạn, embedding và thiết lập vector DB phức tạp trước đây, chỉ cần tải tệp lên một lần (2 dòng code) là hệ thống tự động xử lý, rồi khi truy vấn sẽ tìm tài liệu liên quan và đưa vào mô hình.
- Lưu trữ và embedding cho truy vấn đều miễn phí, chỉ tính phí lập chỉ mục ban đầu ở mức $0.15/1 triệu token.
- Tệp được hỗ trợ: PDF, DOCX, TXT, v.v.
- Ví dụ thực tế cho thấy tìm kiếm trên 3.000 tệp được xử lý chỉ trong 2 giây, giúp rút ngắn đáng kể thời gian phát triển prototype.
- Ngoài ra còn cung cấp các tính năng như trích dẫn tự động, lọc metadata, v.v.
- Giới hạn: tối đa 10 store cho mỗi project, gói miễn phí 1GB.
- Đánh giá: hạ thấp rào cản gia nhập trong phát triển RAG, để tập trung hơn vào ứng dụng.
3 bình luận
Đúng là Google mà
Cảm ơn bạn đã chia sẻ. Chất lượng thế nào! Tôi thật sự rất tò mò.
Thấy họ cung cấp notebooklm như một dịch vụ nên mình đã nghĩ không biết rồi sẽ có lúc nó ra mắt dưới dạng kiểu notebooklm api hay không, vậy mà giờ họ phát hành luôn thành dịch vụ API tên là File Search, đúng là bất ngờ thật.
Mình cũng từng dựng pipeline/workflow để cố làm RAG cho tử tế, bật Ollama lên rồi đổi qua lại đủ loại model nên đúng là có rào cản kha khá (dù phải dùng thử mới biết được), nhưng nếu chất lượng được đảm bảo ở mức nào đó thì đúng là sẽ rất tiện để dùng