- Buzee là ứng dụng tìm kiếm toàn văn có thể dùng trên Mac và Windows
- Công cụ giúp người dùng thực hiện tìm kiếm Full-Text nhanh trên tất cả tài liệu, hình ảnh, âm thanh, video, thư mục và lịch sử trình duyệt
- Có thể tìm kiếm tài liệu và thư mục cục bộ theo từ khóa, thời gian, loại hoặc kết hợp các yếu tố này
- Có thể loại trừ một tệp hay thư mục cụ thể khỏi quá trình lập chỉ mục, hoặc chỉ loại trừ nội dung
- Có thể hiển thị/ẩn ứng dụng bằng phím tắt toàn cục (
⎇ / Alt + Space)
- Điều hướng nhanh đến thanh tìm kiếm trong ứng dụng (
⌘ / Ctrl + F or K), chuyển đến scratchpad (⌘ / Ctrl + Shift + S)
- Xem thống kê về tệp và cung cấp hồ sơ tài liệu độc nhất
- Tính năng phụ: trích xuất văn bản từ PDF và hình ảnh, dùng scratchpad, tự động đồng bộ thay đổi của hệ thống tệp
- Gói cài đặt nhẹ và mức sử dụng bộ nhớ thấp
- Định dạng tệp được hỗ trợ
- Tài liệu: csv, docx, key, md, numbers, pages, pdf, pptx, txt, xlsx, xls
- Hình ảnh: jpg, jpeg, png, gif
- Sách: epub, mobi, azw3, pdf
- Âm thanh: mp3, wav, aac, flac, ogg
- Video: mp4, mkv, avi, mov, wmv
- Mã nguồn mở dựa trên Rust + NodeJS + Tauri
Tìm kiếm ngữ nghĩa
Bao gồm/loại trừ trong tìm kiếm
- Có thể dùng bộ lọc loại tệp hoặc nhập trực tiếp vào truy vấn tìm kiếm (ví dụ:
invoice pdf)
- Dùng dấu ngoặc kép cho từ khóa để tìm kiếm cụm từ chính xác (ví dụ:
"annual report")
- Dùng dấu gạch nối trước từ khóa cần loại trừ khỏi tìm kiếm (ví dụ:
"annual report" -2022 -pdf)
Tìm kiếm theo thời gian
- Có thể dùng bộ lọc phạm vi ngày hoặc chỉ định ngày/khoảng thời gian trực tiếp trong truy vấn tìm kiếm.
- Ví dụ:
**last month** pdf invoice, annual report ppt **this year**.
Build từ mã nguồn
- Buzee cho hiệu năng tốt nhất trên Mac, còn Windows và Linux chưa được thử nghiệm đầy đủ
- Sau khi cài Rust và NodeJS, có thể dùng các lệnh
npm install và cargo install để chạy ứng dụng ở chế độ phát triển
TODO / vấn đề đã biết
- Cần cải thiện nhiều tính năng như hiển thị phần văn bản khớp trong kết quả tìm kiếm, hỗ trợ truy vấn phức tạp khi tìm lịch sử trình duyệt, v.v.
- Cần phát triển các tính năng mới như thêm 'tag' cho tài liệu, tạo chế độ xem 'dashboard', thêm test vào codebase, v.v.
Tech stack
- Backend: Rust, Tauri v2, SQLite, Tantivy.
- Frontend: Svelte 4, TypeScript, TailwindCSS.
Kiến trúc
- Toàn bộ metadata của tệp được lưu trong bảng
document của SQLite
- Chỉ mục toàn văn được tạo trong bảng
metadata và lưu trong Tantivy
- Lịch sử của Firefox, Chrome và Arc được tìm kiếm thông qua cơ sở dữ liệu lịch sử tương ứng của từng trình duyệt
Giấy phép
3 bình luận
Vì là phiên bản 0.1.1 nên tôi cũng hơi ngần ngại... nhưng trước mắt chạy ổn không vấn đề gì.
Tuy nhiên, không rõ có phải vì đang dùng trên PC nên được thiết lập để sử dụng ít tài nguyên hơn không, nhưng tôi cảm thấy tốc độ lập chỉ mục hơi chậm.
Ngoài ra, việc có thể tìm cả văn bản bên trong tệp, bao gồm cả hình ảnh, cũng khá tiện. Nó gợi một chút cảm giác của Google Desktop.
recoll - công cụ tìm kiếm toàn văn cho máy tính để bàn
Ý kiến trên Hacker News
Một người dùng đề nghị chia sẻ hành trình vì sao thất bại và nếu bắt đầu vào thời điểm hiện tại thì sẽ làm khác đi như thế nào. Họ cũng nêu vấn đề liệu nhiều startup tìm kiếm đa năng thất bại là do thiếu thị trường hay do khó thích nghi
Có ý kiến cảm ơn vì đã mã nguồn mở dự án, đồng thời chỉ ra rằng nó không có tính năng tìm kiếm AI. Họ cho rằng ứng dụng có nền tảng vững chắc nhưng cần được trau chuốt thêm để trở nên thực dụng hơn
Một bình luận cho biết có thể dùng chương trình tên là Recoll để tìm kiếm nhiều loại tệp khác nhau. Họ nhấn mạnh khả năng tìm tài liệu MS-Word được lưu trong thư mục Thunderbird và mở tệp PDF chỉ bằng cách nhấp đúp
Có người nhắc đến vấn đề không tải xuống được và nói rằng công cụ này sẽ hữu ích trong môi trường mà lượng hồ sơ điện tử quá lớn khiến Windows Search không hoạt động. Họ nhấn mạnh sự cần thiết của việc quản lý tệp điện tử
Có người đùa rằng mình sẽ không dùng một chương trình tên là Labrador Retriever và chia sẻ ảnh chú chó của mình
Một bình luận nói đây là nỗ lực nhằm triển khai chức năng tương tự Microsoft SharePoint, đồng thời chỉ ra rằng việc thuyết phục các doanh nghiệp lấy MS làm trung tâm là vấn đề về mặt kinh doanh. Họ đặt câu hỏi liệu có thể xây dựng sản phẩm trên nền SharePoint hay không
Có người chỉ ra rằng liên kết tải xuống không hoạt động và đề xuất rằng các dự án mà GUI là giá trị chính nên kèm theo ảnh chụp màn hình
Có ý kiến đề xuất dùng phần mở rộng của duckdb để chạy SQL trực tiếp trên hệ thống tệp cho nhu cầu tìm kiếm tệp phức tạp
Một bình luận yêu cầu gợi ý về ứng dụng có thể tìm kiếm Google Drive, GitHub, GitLab, Box.com và các tệp cục bộ
Có ý kiến cảm ơn vì đã mã nguồn mở dự án, đồng thời chỉ ra rằng tài liệu còn thiếu. Người này cho biết đang xây dựng một hệ thống tài liệu hóa bằng AI và xin phép được viết tài liệu cũng như tạo PR. Họ giới thiệu dự án AkiraDocs