2 điểm bởi argo9 2026-04-20 | 1 bình luận | Chia sẻ qua WhatsApp

Nhà xuất bản: Trình quét đĩa LLM diskscan cho biết các tệp trùng lặp và bạn là kiểu người dùng nào

Việc khó khăn nhất trong công việc tại nhà xuất bản là sắp xếp tệp và thư mục. Vì rất thường xuyên phải sao chép một dự án vào nhiều thư mục khác nhau để làm việc, nên không chỉ máy của tôi mà trên ổ đĩa của nhân viên cũng phát sinh rất nhiều thư mục giống hệt nhau.

Tôi đã làm công cụ này bằng Python từ một năm trước, sau đó tạo thành ứng dụng bằng go whails, và lần này tiếp tục nâng cấp chức năng rồi xây dựng bằng Rust. Ngoài ra, công cụ còn xem định dạng tệp và các tệp ẩn để lập báo cáo về việc bạn là kiểu người dùng đĩa nào.

Trên Mac, Windows, Linux, NAS và cloud, công cụ so sánh các tệp và dự án trùng lặp để xác định có phải cùng một tệp hay không, phiên bản nào mới hơn, đồng thời loại bỏ toàn bộ các tệp không cần thiết trong tệp làm việc như ._.

Hiện công cụ thực hiện so sánh trùng lặp ở cấp độ đĩa và tạo báo cáo, đồng thời đối chiếu bản gốc dựa trên hash.

Công cụ còn có chức năng “xem tướng” dựa trên các tệp trên đĩa và đưa ra báo cáo về việc bạn đang làm công việc hay dự án mới nào. Đây là chương trình chạy cục bộ, và bạn có thể chọn local LLM như Ollama, LMStudio hoặc GeminiAPI, OpenAI API.

Tải xuống

Mac

https://drive.google.com/file/d/…

Bộ cài Windows

https://drive.google.com/file/d/…

https://drive.google.com/file/d/…

1 bình luận

 
bigcataroido 2026-04-21

Phần dọn dẹp tệp trùng lặp dựa trên hash có vẻ là một cách tiếp cận ổn định.

Tôi cũng từng gặp vấn đề tương tự trong công việc, ngay cả khi tên tệp giống nhau thì nội dung thực tế vẫn có thể khác, hoặc lẫn cả các tệp làm việc tạm thời (.tmp, ._ v.v.) nên chỉ so sánh đơn giản thì khá khó dọn dẹp cho gọn gàng.

Phần dùng LLM để cả báo cáo kiểu người dùng cũng khá thú vị, báo cáo này được tạo dựa trên tiêu chí nào vậy? Ví dụ, tôi tò mò không biết nó dựa trên cấu trúc tệp hay phân bố phần mở rộng.