turbo-graph – chỉ mục constrained RAG bổ sung bộ nhớ đồ thị/bộ nhớ đệm bộ lọc lên trên turbovec
(github.com/bigmacfive)Xin chào. Tôi đã tạo ra turbo-graph, gắn thêm một lớp graph memory cho constrained RAG dựa trên turbovec/TurboQuant.
turbovec vốn đã hoạt động tốt khi dùng flat top-k hoặc có cheap allowlist. Nhưng trong RAG thực tế, truy vấn thường có dạng như sau.
tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates
Tổ hợp này cứ phải được tạo đi tạo lại ở Python/SQL/app layer mỗi lần, rồi lại chuyển vào vector search, rerank kết quả với graph/BM25, và lặp lại cả phần mã giải thích vì sao ra kết quả như vậy.
turbo-graph là một thử nghiệm nhằm giữ nguyên core tương thích với turbovec, đồng thời chuyển graph/metadata view compilation, cache reuse, graph rerank và explain telemetry ở xung quanh sang tầng chỉ mục.
Vì hiện vẫn đang ở giai đoạn Alpha, mục tiêu không phải là khuyên dùng ngay trong production, mà là muốn nhận phản hồi về việc API nào thực sự cần thiết trên các route RAG thực tế.
Chưa có bình luận nào.