5 điểm bởi GN⁺ 2024-06-28 | 1 bình luận | Chia sẻ qua WhatsApp
  • Được thiết kế để thu hẹp khoảng cách giữa các thử nghiệm LLM cục bộ và hệ thống Retrieval-Augmented Generation (RAG) ở cấp độ production
  • Cung cấp một hệ thống RAG toàn diện và hiện đại, được xây dựng dễ sử dụng xoay quanh RESTful API dành cho nhà phát triển

Tính năng chính

  • Hỗ trợ đa phương thức: Hỗ trợ nhiều định dạng tệp như .txt, .pdf, .json, .png, .mp3.
  • Tìm kiếm lai: Kết hợp tìm kiếm ngữ nghĩa và từ khóa để cải thiện độ liên quan.
  • Graph RAG: Tự động trích xuất các mối quan hệ và xây dựng knowledge graph.
  • Quản lý ứng dụng: Quản lý tài liệu và người dùng hiệu quả, đồng thời cung cấp khả năng quan sát và phân tích phong phú.
  • Client-server: Hỗ trợ RESTful API.
  • Có thể cấu hình: Có thể provision ứng dụng bằng các tệp cấu hình trực quan.
  • Có thể mở rộng: Dễ dàng mở rộng ứng dụng thông qua mẫu builder + factory.
  • Dashboard: Cung cấp dashboard R2R, một ứng dụng React+Next.js mã nguồn mở cho trải nghiệm tương tác thân thiện với người dùng.

Dashboard R2R

Có thể tương tác với R2R bằng dashboard React+Next.js mã nguồn mở. Có thể bắt đầu bằng cách tham khảo Cookbook của dashboard.

1 bình luận

 
GN⁺ 2024-06-28
Ý kiến trên Hacker News
  • Độ chính xác và hiệu quả của việc trích xuất dữ liệu: Quá trình trích xuất dữ liệu là một thách thức quan trọng trong hệ thống RAG. Do cách tiếp cận OCR truyền thống còn thiếu sót, họ sử dụng cách tiếp cận LLM đa phương thức + OCR để tăng độ chính xác và tính nhất quán.

  • Kinh nghiệm vận hành stack tương tự: Đã vận hành một stack tương tự trong 2 năm, sử dụng các công nghệ như Pgvector, HyDe, tìm kiếm web + tìm kiếm tài liệu. Có dashboard tốt bao gồm log và phân tích.

  • Khó khăn khi bắt đầu nhanh: Phần quickstart thực tế không hề nhanh. Cần cung cấp cấu hình bao gồm Docker Compose và image Postgres. Việc phải clone một repo riêng để dùng dashboard cũng khá bất tiện.

  • Độ phức tạp của dự án: Dự án bao gồm nhiều thành phần nhưng không hẳn giúp việc phát triển dễ dàng hơn. Không rõ đây là SDK hay một bộ ứng dụng. Cần cung cấp trải nghiệm cài đặt "1 click" để có thể xem trước mọi tính năng.

  • Xác minh độ chính xác: Có câu hỏi về cách xác minh độ chính xác của câu trả lời. Họ muốn biết liệu có cách nào để truy vết quá trình câu trả lời được tạo ra hay không.

  • Khó khăn trong việc thu thập dữ liệu: Ở nhiều dự án RAG, bài toán thu thập dữ liệu vẫn chưa được giải quyết đúng mức. Có câu hỏi về cách ingest hàng loạt một lượng lớn tài liệu HTML vào hệ thống.

  • Thu thập dữ liệu đa phương thức: Có yêu cầu giải thích chi tiết hơn về quy trình thu thập dữ liệu đa phương thức. Có câu hỏi về các loại dữ liệu mà R2R hiện có thể xử lý và cách nhúng các loại dữ liệu phi văn bản.

  • Tối ưu cho đội ngũ phát triển: Có yêu cầu giải thích quá trình này đã trở nên nhanh hơn và tối ưu hơn cho đội ngũ phát triển như thế nào. Tiềm năng tăng tốc thời gian phát triển MVP (sản phẩm khả dụng tối thiểu) là rất lớn.

  • Làm việc với mã nguồn: Đang tìm một giải pháp RAG có thể hiểu mã nguồn. Ví dụ, họ muốn có khả năng hiểu được "sự kiện phân tích được gọi khi nhấn nút gửi".

  • Phản đối việc dùng Neo4j: Họ không muốn sử dụng Neo4j vì nó tiêu tốn nhiều tài nguyên.

  • Tích hợp với các frontend chat phổ biến: Có câu hỏi liệu có tích hợp với các frontend chat phổ biến như OpenWebUI hay không.