- Giao diện thân thiện với người dùng cho QA dựa trên RAG (trích xuất-kết hợp-sinh)
- Được thiết kế cho cả người dùng phổ thông muốn thực hiện QA trên tài liệu và nhà phát triển muốn xây dựng pipeline RAG riêng
- Hỗ trợ nhiều LLM: các nhà cung cấp API LLM như OpenAI, AzureOpenAI, Cohere và cả LLM cục bộ (
ollama, llama-cpp-python)
- Cài đặt đơn giản: cung cấp script để bắt đầu nhanh
- Có thể kiểm thử pipeline RAG của riêng bạn với UI được xây dựng bằng Gradio (có cung cấp theme)
Tính năng chính
- Lưu trữ web UI cho QA tài liệu:
- Hỗ trợ đăng nhập nhiều người dùng
- Tổ chức tài liệu thành các bộ sưu tập riêng tư/công khai
- Có thể chia sẻ lịch sử chat và cộng tác
- Quản lý LLM và mô hình embedding:
- Hỗ trợ LLM cục bộ và các nhà cung cấp API phổ biến như OpenAI, Azure, Ollama, Groq
- Pipeline RAG lai:
- Mặc định kết hợp bộ truy xuất lai (toàn văn và vector) với reranking để đảm bảo chất lượng truy xuất tốt nhất
- Hỗ trợ QA đa phương thức:
- Có thể thực hiện hỏi đáp trên nhiều tài liệu có chứa biểu đồ và bảng
- Có thể chọn tùy chọn phân tích tài liệu đa phương thức trong UI
- Trích dẫn nâng cao và xem trước tài liệu:
- Cung cấp thông tin trích dẫn chi tiết để đảm bảo độ chính xác
- Có thể xem trích dẫn và điểm số liên quan cùng phần tô sáng trong trình xem PDF ngay trong trình duyệt
- Hiển thị cảnh báo khi trả về tài liệu có độ liên quan thấp
- Hỗ trợ các phương pháp suy luận phức tạp:
- Có thể trả lời các câu hỏi phức tạp/nhiều bước thông qua phân rã câu hỏi
- Hỗ trợ suy luận dựa trên agent bằng
ReAct, ReWOO và các agent khác
- Có thể cấu hình UI cài đặt:
- Có thể điều chỉnh trực tiếp trong UI các yếu tố chính của quá trình truy xuất và sinh nội dung (ví dụ: thiết lập prompt)
- Khả năng mở rộng:
- Được xây dựng trên Gradio nên có thể tự do tùy biến các thành phần UI
- Dự kiến hỗ trợ nhiều chiến lược lập chỉ mục và truy xuất tài liệu khác nhau. Cung cấp pipeline lập chỉ mục
GraphRAG làm ví dụ
3 bình luận
Có quá nhiều framework QA RAG, vậy điểm mạnh của cái này là gì nhỉ?
Trong lĩnh vực truy hồi thông tin và trong phần mô tả, QA không phải là quality assurance mà là question answering.
Tên nghe khá thú vị. Chỉ nhìn tên rồi đoán thì có lẽ đây là sự kết hợp của đáp án (kotae) + Doraemon (mon), nên thành Kotaemon chăng.