- Công cụ nghiên cứu mạnh mẽ dựa trên AI, sử dụng nhiều LLM và tìm kiếm web để thực hiện phân tích lặp sâu
- Tích hợp các tính năng tìm kiếm như ArXiv, Wikipedia, Google, PubMed, DuckDuckGo, SerpAPI, RAG cục bộ, The Guardian và nhiều nguồn khác
- Có thể chạy cục bộ để tăng cường quyền riêng tư hoặc cấu hình LLM nền tảng đám mây để cải thiện hiệu năng
Tính năng nghiên cứu nâng cao
- Nghiên cứu chuyên sâu tự động: tạo câu hỏi tiếp nối một cách thông minh
- Theo dõi và xác minh nguồn: tự động theo dõi trích dẫn và nguồn
- Phân tích lặp: cung cấp phạm vi bao quát toàn diện với phân tích lặp nhiều bước
- Phân tích toàn bộ nội dung trang web: phân tích dựa trên toàn bộ nội dung thay vì chỉ snippet
Hỗ trợ LLM linh hoạt
- Hỗ trợ mô hình cục bộ: xử lý AI cục bộ dựa trên Ollama
- Hỗ trợ mô hình đám mây: hỗ trợ các LLM đám mây như Claude, GPT
- Tương thích mô hình Langchain: hỗ trợ nhiều mô hình Langchain khác nhau
- Có thể chọn mô hình: có thể cấu hình mô hình theo hiệu năng, tốc độ phản hồi, v.v.
Tùy chọn đầu ra phong phú
- Kết quả nghiên cứu chi tiết: cung cấp báo cáo chi tiết kèm trích dẫn
- Báo cáo nghiên cứu tổng hợp: cung cấp kết quả nghiên cứu toàn diện
- Tóm tắt nhanh: có thể tóm lược nội dung cốt lõi
- Theo dõi và xác minh nguồn: hỗ trợ theo dõi và xác minh nguồn
Thiết kế lấy quyền riêng tư làm trọng tâm
- Có thể chạy cục bộ: khi dùng mô hình cục bộ, toàn bộ dữ liệu được lưu trên thiết bị của người dùng
- Có thể cấu hình tìm kiếm: tăng cường bảo vệ quyền riêng tư
- Xử lý dữ liệu minh bạch: công khai rõ ràng cách dữ liệu được xử lý
Tích hợp tìm kiếm nâng cao
- Tự động chọn công cụ tìm kiếm: tự động chọn công cụ tìm kiếm theo nội dung truy vấn
- Tích hợp Wikipedia: tra cứu thông tin thực tế đáng tin cậy
- Tích hợp arXiv: tìm kiếm bài báo khoa học và nghiên cứu học thuật
- Tích hợp PubMed: tìm kiếm tài liệu nghiên cứu y học và y sinh
- Tích hợp DuckDuckGo: tìm kiếm web thông thường (có thể bị giới hạn tốc độ)
- Tích hợp SerpAPI: cung cấp kết quả tìm kiếm Google (cần API key)
- Google Programmable Search: cấu hình tìm kiếm tùy chỉnh (cần API key)
- Tích hợp The Guardian: tìm kiếm nội dung tin tức và báo chí (cần API key)
- Tìm kiếm RAG cục bộ: có thể tìm kiếm tài liệu cá nhân (dùng vector embedding)
- Tìm kiếm toàn bộ nội dung trang web: có thể tìm trong toàn bộ nội dung trang web
- Lọc và xác minh nguồn: có thể lọc theo các nguồn đáng tin cậy
- Có thể cấu hình tham số tìm kiếm: có thể thiết lập phạm vi tìm kiếm, khoảng thời gian, v.v.
Tìm kiếm tài liệu cục bộ (RAG)
- Tìm kiếm dựa trên vector embedding: có thể tìm nội dung trong tài liệu cá nhân
- Tạo bộ sưu tập tài liệu tùy chỉnh: có thể nhóm tài liệu theo chủ đề
- Bảo vệ quyền riêng tư: mọi tài liệu đều được xử lý cục bộ
- Chunking và truy xuất thông minh: phân đoạn và tìm kiếm nội dung tài liệu
- Tương thích nhiều định dạng tài liệu: hỗ trợ PDF, văn bản, Markdown, v.v.
- Tự động áp dụng meta-search tích hợp: có thể tích hợp tìm kiếm cục bộ và tìm kiếm web
Giao diện web
- Cung cấp dashboard: giao diện trực quan
- Cập nhật tiến độ theo thời gian thực: cung cấp trạng thái nghiên cứu theo thời gian thực
- Quản lý lịch sử nghiên cứu: có thể truy cập và quản lý các bản ghi nghiên cứu trước đó
- Xuất báo cáo PDF: có thể tải báo cáo nghiên cứu dưới dạng PDF
- Quản lý nghiên cứu: có thể dừng hoặc xóa các nghiên cứu đang chạy
Các tùy chọn công cụ tìm kiếm được hỗ trợ
- Auto: tự động chọn công cụ theo truy vấn
- Wikipedia: phù hợp để tra cứu thông tin và dữ kiện chung
- arXiv: phù hợp để tìm kiếm bài báo khoa học và học thuật
- PubMed: phù hợp cho nghiên cứu y sinh và y học
- DuckDuckGo: tìm kiếm web thông thường lấy quyền riêng tư làm trọng tâm
- The Guardian: tìm kiếm tin tức và báo chí (cần API key)
- SerpAPI: cung cấp kết quả tìm kiếm Google (cần API key)
- Google Programmable Search: tìm kiếm tùy chỉnh (cần API key)
4 bình luận
công nghệ mới. Đặc biệt hay cố liên hệ với AI.Có thể thiết lập nhiều tùy chọn khác nhau trong file Config. Có thể giới hạn cơ sở dữ liệu tìm kiếm chỉ còn PubMed để nâng chất lượng tài liệu lên thêm một mức. Cũng có thể cấu hình số lượng văn bản tìm kiếm mỗi lần hoặc sẽ tạo bao nhiêu chunk khi dùng RAG.
Xét đến việc hiện tại mới là 0.01V, thật đáng kinh ngạc khi một máy Local có thể tạo ra báo cáo đến mức này. Đặc biệt trong lĩnh vực khoa học sự sống, các chatbot thường dùng
cách diễn đạt mang tính khái quát, nhưng báo cáo được tạo bởi chương trình này lại dùng lối diễn đạt rất khoa học.Chương trình này hiện chưa hỗ trợ tiếng Hàn. Dù đặt câu hỏi bằng tiếng Hàn thì báo cáo vẫn được xuất ra bằng tiếng Anh.
Ngoài ra, khi nhận câu trả lời dưới dạng file PDF thông qua tính năng xuất PDF, có vấn đề là tiếng Hàn không hiển thị.
Nếu giải quyết được vấn đề Ref biến mất trong lúc tạo báo cáo và vấn đề gây ra ảo giác, thì tôi nghĩ đây sẽ là một công cụ thực sự mạnh mẽ.
Dùng thêm một thời gian thì có vẻ trên Ollama, trong số nhiều mô hình khác nhau, Qwen2.5 hoạt động tốt nhất. Deepseek-r1 khi Search lại tạo truy vấn kỳ lạ nên kéo về sai nội dung làm căn cứ, còn dòng Gemma thì nhận các prompt được đưa ra làm ví dụ là prompt thật nên cứ cố chèn đúng nội dung của chủ đề liên quan đó vào.
Ý kiến Hacker News
Hoan nghênh nỗ lực dành cho một không gian cục bộ và độ trung thực thấp. Tuy nhiên, khi đọc các ví dụ trong bài, tôi cảm thấy kết quả tạo ra hơi rối
Dự án này rất tuyệt
Tôi đã thử nhưng gặp rất nhiều lỗi nên không thể tạo báo cáo. Không có cách nào để tiếp tục khi quá trình tạo thất bại, nên nếu lệnh gọi API lỗi thì phải bắt đầu lại từ đầu
Cũng nên cân nhắc Kagi và Tavily API cho tìm kiếm web
Trông rất tuyệt. Tôi tò mò không biết nó so với tính năng RAG của open-webui thế nào
Tôi tự hỏi có ai dùng LLM (cục bộ) để trực tiếp tìm tài liệu liên quan trong một bộ sưu tập tư liệu mà không phụ thuộc vào tìm kiếm vector hay không
Làm rất tốt
Tôi tự hỏi đã có công cụ nào cung cấp trải nghiệm tìm kiếm bằng AI và trộn nội dung bookmark để tạo báo cáo hay chưa. Bookmark hiện giờ hầu như vô dụng. Cái này có thể khiến chúng trở nên hữu ích
Tôi nghĩ người nào tạo ra được GUI kiểu game 3D cho LLM sẽ vừa là Jobs/Gates/Musk tiếp theo vừa là người đoạt Nobel. Điều đó sẽ cho phép hàng triệu người nhìn vào bên trong LLM và giải quyết vấn đề căn chỉnh. Máy tính chỉ trở nên phổ biến sau khi có hệ điều hành với GUI, còn chatbot hiện nay giống dòng lệnh hơn. Tôi đã mở một ASK HN để chia sẻ các ý tưởng về an toàn AI
Không hiểu nổi. Ngay cả trình độ coding của học sinh tiểu học còn chưa tới chứ đừng nói đến mức học thuật, vậy mà sao lại đem ra chia sẻ...