3 điểm bởi GN⁺ 2024-03-17 | 1 bình luận | Chia sẻ qua WhatsApp
  • Tải xuống

    • TextSnatcher là một ứng dụng cho phép dễ dàng sao chép văn bản từ hình ảnh và thực hiện OCR chỉ trong vài giây.
  • Tính năng

    • Hỗ trợ nhiều ngôn ngữ.
    • Tính năng kéo để sao chép văn bản từ hình ảnh.
    • Có thể kéo trên mọi hình ảnh rồi dán.
    • Nhanh và dễ sử dụng.
    • Sử dụng Tesseract OCR 4.x để nhận dạng ký tự.
    • Có thể tìm hiểu thêm về Tesseract và ủng hộ dự án bằng cách gắn sao cho dự án Tesseract.
  • Screencast

    • textsnatcher-eng.mp4
    • textsnatcher-tamil.mp4
  • Ảnh chụp màn hình

    • Cung cấp ảnh chụp màn hình của ứng dụng.
  • Ủng hộ

    • Hướng dẫn cách ủng hộ nhà phát triển.
  • Bài đăng trên mạng xã hội

    • Chia sẻ bài viết trên LinkedIn về lý do tạo ra TextSnatcher.
  • Phụ thuộc

    • Cung cấp danh sách các phụ thuộc cần thiết trước khi cài đặt và chạy ứng dụng.
      • Phụ thuộc khi chạy: scrot, tesseract-ocr, dữ liệu ngôn ngữ của tesseract
      • Phụ thuộc khi build: granite, gtk+-3.0, gobject-2.0, gdk-pixbuf-2.0, libhandy-1, libportal-0.5
  • Cách cài đặt, build và chạy

    • Cung cấp các lệnh để clone TextSnatcher từ kho GitHub, rồi build và cài đặt bằng Meson.
  • Cảm hứng

    • TextSnatcher được lấy cảm hứng từ ReadMe của chính nó, cấu trúc ứng dụng, và ứng dụng MacOS là TextSniper.
    • Được tạo cho Linux bằng ❤️.

Ý kiến của GN⁺

  • TextSnatcher là một công cụ tiện lợi để trích xuất văn bản trong hình ảnh, đặc biệt hữu ích với người dùng Linux.
  • So với các ứng dụng khác dùng công nghệ OCR, việc sử dụng engine Tesseract OCR mang lại lợi thế về độ chính xác nhận dạng cao và hỗ trợ nhiều ngôn ngữ.
  • Là một dự án mã nguồn mở, nó tạo cơ hội để các nhà phát triển xem xét mã nguồn và đóng góp, đồng thời có thể liên tục được cải thiện nhờ sự hỗ trợ của cộng đồng.
  • Việc người dùng phải tự build và cài đặt có thể là rào cản ban đầu với một số người dùng ít kỹ thuật, nhưng đây cũng là thực tế thường thấy trong cộng đồng Linux.
  • Khi áp dụng công nghệ này, người dùng cần cân nhắc việc quản lý phụ thuộc và tính tương thích hệ thống; vì là mã nguồn mở nên có thể kỳ vọng các bản cập nhật liên tục về bảo mật và độ ổn định.

1 bình luận

 
GN⁺ 2024-03-17
Ý kiến trên Hacker News
  • Bình luận về việc sử dụng và chỉnh sửa script:

    • Một người dùng cho biết Dibby053 đang dùng một script sao chép từ StackOverflow, đồng thời đã điều chỉnh để nó hoạt động trên KDE, GNOME, Wayland và X11. Người này cũng nói đã thêm tính năng thông báo trạng thái.
    • Script này có các phụ thuộc như tesseract-ocr, imagemagick..., và tùy theo môi trường của người dùng sẽ dùng các công cụ khác nhau để chụp màn hình, cải thiện chất lượng ảnh nhằm tăng độ chính xác nhận diện văn bản, sau đó sao chép vào clipboard.
  • Bình luận về hiệu quả của Tesseract:

    • Một người dùng đặt câu hỏi liệu Tesseract có thực sự là công nghệ hiện đại hay không, đồng thời chia sẻ trải nghiệm rằng nó không thể chuyển đổi chính xác, đặc biệt với văn bản không phải tiếng Anh trong các bản quét độ phân giải thấp.
    • Một người dùng khác khuyến nghị công cụ chụp màn hình trong Microsoft PowerToys cho người dùng Windows và nhấn mạnh các phím tắt tiện lợi của nó.
    • Một người dùng nói rằng trải nghiệm dùng Tesseract trước đây của họ khá thất vọng, và họ tự hỏi liệu công nghệ này đã cải thiện đến mức gần như không cần hậu xử lý thủ công hay chưa.
    • Một người dùng cho biết đã thử bằng ứng dụng Flatpak và đánh giá rằng dù kết quả không hoàn hảo, phần lớn văn bản rõ ràng vẫn được nhận diện khá tốt.
  • Bình luận về các giải pháp tương tự trên nền tảng khác:

    • Có những đánh giá tích cực về một công cụ OCR dành cho người dùng macOS và cả nhà phát triển của công cụ đó.
    • Trên iOS, có một giải pháp dùng shortcut để chụp màn hình, trích xuất văn bản và dịch. Ngoài ra, trên các phiên bản iOS mới, người dùng có thể chọn trực tiếp và sao chép văn bản trong ảnh từ ứng dụng Photos.
  • Bình luận về các giải pháp cho desktop Linux:

    • Một người dùng nhắc đến ứng dụng Flatpak và nói rằng không phải mọi bản phân phối Linux đều hỗ trợ Flatpak, nhưng họ sẽ thử trên máy ảo Fedora. Người này cũng nhận xét rằng có nhiều công cụ tận dụng Tesseract, nhưng hiệu năng không tốt khi hình ảnh có nhiều nhiễu hoặc văn bản bị méo.