OpenDocuments – nền tảng RAG mã nguồn mở tìm kiếm tài liệu phân tán trong tổ chức bằng ngôn ngữ tự nhiên
(github.com/joungminsung)Đây là một nền tảng RAG self-hosted được tạo ra để giải quyết vấn đề tài liệu nhóm bị phân tán trên GitHub, Notion, Drive, Confluence... nên rất khó tìm kiếm.
Khi kết nối các nguồn tài liệu, hệ thống sẽ phân tích cú pháp/chia đoạn/tạo embedding để lập chỉ mục, và khi đặt câu hỏi bằng ngôn ngữ tự nhiên, nó sẽ trả lời kèm theo nguồn.
- Connector: GitHub, Notion, GDrive, S3, Confluence, Swagger, web crawler, tìm kiếm web Tavily
- Định dạng tệp: 12 loại gồm PDF, DOCX, XLSX, HTML, Jupyter, mã nguồn, email...
- LLM: có thể chạy cục bộ bằng Ollama (không rò rỉ dữ liệu). Cũng hỗ trợ OpenAI/Claude/Gemini/Grok
- Tìm kiếm: hybrid vector + từ khóa, reranking, cơ chế bảo vệ hallucination
- Tìm kiếm chéo Hàn-Anh
- Tích hợp Claude Code/Cursor qua máy chủ MCP
- Web UI, 17 lệnh CLI, TypeScript SDK
- Hệ thống plugin (parser/connector/model/middleware)
- Hỗ trợ triển khai bằng Docker
Ngăn xếp: TypeScript, Hono, React, SQLite, LanceDB, Turborepo
51 test suite / ~300 bài kiểm thử
Phát hành theo giấy phép MIT.
3 bình luận
Xin thông báo về bản cập nhật v0.2.0.
Trọng tâm của phiên bản này là loại bỏ rào cản cài đặt và cải thiện tính thực dụng khi sử dụng.
Tích hợp Ollama một chạm - tự động phát hiện trạng thái cài đặt → nếu chưa có thì tự động cài theo từng OS → đến cả việc tự động pull model embedding cũng được thực hiện trong một lần. Chỉ với một dòng
docker compose up, toàn bộ stack bao gồm cả LLM cục bộ sẽ được khởi chạy.Hội thoại nhiều lượt - ở phiên bản trước chỉ hỗ trợ truy vấn một lần, nhưng giờ đã có thể trò chuyện liên tục trong khi vẫn giữ được ngữ cảnh.
10+ bản vá bảo mật - đã sửa đồng loạt các vấn đề được phát hiện qua phản hồi từ cộng đồng và quá trình tự kiểm toán, như SQL injection FTS5, path traversal, tấn công cố định OAuth state, ReDoS, v.v.
Ngoài ra: tự động nạp
.env, tự thử lại 3 lần kèm thông báo lỗi cụ thể khi kết nối model thất bại, mở rộng toàn diện tài liệu Plugin API.Ghi chú phát hành: https://github.com/joungminsung/OpenDocuments/releases/
Nếu có lỗi hoặc điểm bất tiện nào khi sử dụng, chúng tôi sẽ rất cảm kích nếu bạn đăng issue trên GitHub.
Chúng tôi sẽ phản hồi ngay khi issue được đăng lên.
Việc phát hành gói npm đã bị bỏ sót. Xin lỗi những ai đã không cài đặt được sau khi clone. Hiện tại đã phát hành bình thường, nên nếu bạn thử lại bằng lệnh đã thay đổi trong Readme thì chúng tôi sẽ rất cảm kích.