RLama - DocumentAI mã nguồn mở sử dụng Ollama
(rlama.dev)- Công cụ hỏi đáp dựa trên AI dành cho tài liệu, hoạt động bằng cách kết nối với mô hình Ollama cục bộ
- Có thể xây dựng, quản lý và tương tác với hệ thống RAG (Retrieval-Augmented Generation) phù hợp với các yêu cầu tài liệu hóa
- Có thể sử dụng trên macOS, Linux, Windows
- Lập chỉ mục thư mục tài liệu: Có thể lập chỉ mục các thư mục tài liệu để tìm kiếm và truy vấn thông minh, hỗ trợ nhiều định dạng tài liệu như văn bản, mã nguồn, PDF, DOCX
- Xử lý cục bộ: Sử dụng mô hình Ollama để xử lý toàn bộ dữ liệu ngay trên máy, không làm rò rỉ dữ liệu ra bên ngoài
- Phiên RAG tương tác: Có thể tạo các phiên tương tác để truy vấn cơ sở tri thức tài liệu.
- Dễ quản lý : Cung cấp các lệnh đơn giản để tạo, liệt kê và xóa hệ thống RAG
- Thân thiện với nhà phát triển: Được thiết kế bằng ngôn ngữ Go dành cho các nhà phát triển và người dùng kỹ thuật
1 bình luận
Ý kiến trên Hacker News
Hệ thống này không chia tài liệu thành các chunk mà gửi toàn bộ tài liệu tới Ollama dưới dạng yêu cầu embedding. Vì vậy nó chỉ hữu ích khi tài liệu nhỏ
Khuyến nghị nên hiển thị kết quả tìm kiếm cho người dùng. Chỉ riêng công cụ tìm kiếm vector cũng đã rất hữu ích
Khen ngợi dự án, kèm một vài ghi chú nhanh
Ghi chú về mã: ngạc nhiên là không thấy .ts (TypeScript) trong danh sách
Website rất gọn gàng. Tò mò không biết được code từ đầu hay dựa trên template
Tự xây RAG là việc rất dễ. Ollama có hướng dẫn bắt đầu nhanh. Có thể điều chỉnh quy trình theo đúng nhu cầu của mình
Hoài nghi về mức độ hữu ích của các công cụ kiểu này. Tò mò không biết chúng đáng tin đến đâu do vấn đề hallucination, và trích dẫn nguồn tốt đến mức nào
Không có thông tin về kiến trúc/tech stack của dự án. GitHub README hay website cũng không có
Là một nhà sử học nghiệp dư, tôi quét tài liệu trong kho lưu trữ và lưu dưới dạng tệp JPG. Tôi tự hỏi cách tốt nhất để hiểu được tập tri thức này là gì
Tò mò không biết nó có thể hoạt động cùng llama.cpp, engine của Ollama, hay không
Sẽ rất tốt nếu có giao diện API để có thể tích hợp vào các hệ thống khác
Dự án rất hay. Tò mò không biết nó được phát hành theo giấy phép nào. Chưa thấy được tài liệu hóa
Tò mò về hiệu năng của RAG. Chỉ ném vào một cơ sở dữ liệu vector thì chưa đủ để tạo ra giá trị