5 điểm bởi GN⁺ 2024-01-04 | 1 bình luận | Chia sẻ qua WhatsApp
  • Trả lời câu hỏi của một độc giả về cách thực hiện OCR miễn phí trên Mac bằng CLI hoặc Python.
  • Chia sẻ cách thiết lập một 'dịch vụ' OCR cục bộ miễn phí trên Mac thông qua Terminal, CLI và Python.
  • Mở ứng dụng Shortcuts, tạo một phím tắt mới, sau đó kéo action "Extract Text from Image" để thiết lập việc trích xuất văn bản từ hình ảnh.
  • Chọn "Shortcut Input" và đặt action "Copy to Clipboard" bên dưới action "Extract text from ...".
  • Đặt tên cho phím tắt và có thể thử chạy OCR trong Terminal bằng lệnh shortcuts run ocr-text -i <đường dẫn ảnh>.
  • Trong Python, sử dụng mô-đun subprocess để chạy OCR và in kết quả.

Ý kiến của GN⁺

  • Bài viết này chứa thông tin hữu ích giúp người dùng Mac sử dụng miễn phí tính năng OCR, từ đó nâng cao hiệu quả xử lý tài liệu.
  • Với thiết lập đơn giản bằng ứng dụng Shortcuts, người dùng có thể trích xuất văn bản trong hình ảnh, nên ngay cả những người không có kiến thức lập trình cũng dễ dàng tiếp cận.
  • Bằng việc trình bày cách triển khai quy trình tự động hóa bằng Python, bài viết cũng mang đến nội dung hấp dẫn cho các nhà phát triển.

1 bình luận

 
GN⁺ 2024-01-04
Ý kiến Hacker News
  • Trải nghiệm ấn tượng với framework Vision của Apple

    • Tác giả bài gốc (OP) đã sử dụng framework Vision của Apple trong một dự án cá nhân, xử lý OCR cho hàng chục nghìn ảnh chụp màn hình bảng tính rồi nhập vào cơ sở dữ liệu Postgres.
    • Do macOS không tương thích với Nvidia, họ đã thử các phương pháp OCR khác chạy trên CPU, nhưng các công cụ như Tesseract thường cho ra kết quả sai.
    • Framework Vision mang lại kết quả chất lượng cao nhất mà họ từng thấy, đồng thời dùng ít tài nguyên tính toán nhất.
    • Có vấn đề về độ ổn định của framework, nhưng đó có thể là lỗi do cách người dùng triển khai.
    • Họ đã dùng kết hợp vision.py và ocrmac của RHetTbull, và hài lòng với hiệu năng trên chiếc hackintosh i7 6700k.
    • Dù không phải lập trình viên, họ vẫn có thể giải quyết vấn đề nếu có đủ thời gian, nhưng tốn khá nhiều thời gian.
  • Trải nghiệm tương tự trên Windows và công cụ OCR của Microsoft PowerToys

    • Một người dùng khác đã thử làm việc tương tự trên Windows và phát hiện PowerToys, một dự án của Microsoft đã được cài sẵn, có tích hợp một công cụ OCR rất tốt.
    • Nhấn Win+Shift+T rồi chọn vùng cần quét, văn bản sẽ được sao chép vào clipboard.
  • Công cụ OCR mã nguồn mở được cung cấp miễn phí

    • Một người dùng đã phát triển một công cụ OCR mã nguồn mở miễn phí, cung cấp cả CLI lẫn UI.
  • Tính năng OCR tự động của các ứng dụng Mac

    • Một người dùng phát hiện rằng nhiều ứng dụng Mac như Safari, Preview và Notes tự động xử lý OCR cho hình ảnh, cho phép dễ dàng chọn văn bản trong ảnh để sao chép và dán sang nơi khác.
  • Đánh giá cao một công cụ OCR nhỏ cho Mac

    • Một người dùng là fan lớn của một công cụ OCR nhỏ được cài trên Macbook qua brew.
  • Công cụ OCR được đề xuất cho Windows: Text Extractor của PowerToys

    • Một bình luận đề xuất Text Extractor của PowerToys cho người dùng Windows.
  • Tính năng OCR mặc định trong macOS Ventura

    • Trên macOS Ventura trở lên, giao diện chụp ảnh đã tích hợp sẵn OCR; khi quét sang PDF bằng máy quét tương thích AirPrint, sẽ xuất hiện ô chọn OCR ở bảng bên phải.
  • Giải pháp trích xuất văn bản bằng PyXA

    • PyXA cung cấp một giải pháp dùng framework Vision để trích xuất văn bản từ một hoặc nhiều hình ảnh cùng lúc.
    • Vì đây chỉ là một phần của cả gói nên có thể là quá mức cần thiết cho các tác vụ dùng một lần, nhưng vẫn được nêu như một lựa chọn.
  • Tính năng tìm kiếm và sao chép văn bản trong ảnh của Raycast

    • Raycast chỉ dành cho macOS, có khả năng tìm kiếm văn bản trong ảnh và sao chép phần văn bản đó.
    • Có cung cấp liên kết tới video demo chính thức.
  • Câu hỏi về công nghệ tương tự tính năng 'Copy Subject' của Apple Vision

    • Một người dùng cho biết họ phụ thuộc rất nhiều vào tính năng 'Copy Subject' của Apple Vision, cảm thấy khả năng tiếp cận tính năng này quá hạn chế và hỏi về các công nghệ tương tự.