OCRmyPDF - Thêm lớp văn bản OCR vào tệp PDF đã quét

xguru · 2021-11-09T11:02:26+09:00

Tạo tệp PDF/A có thể tìm kiếm từ PDF thông thường Chèn chuỗi đã OCR bên dưới hình ảnh để hỗ trợ sao chép/dán Giữ nguyên độ phân giải của hình ảnh đã được nhúng sẵn Chèn thông tin OCR mà không làm hỏng tệp Tối ưu hóa hình ảnh PDF để giảm kích thước tệp Tận dụng toàn bộ lõi CPU để xử lý phân tán Hỗ trợ nguyên trạng hơn 100 ngôn ngữ bằng Tesseract OCR (bao gồm cả tiếng Hàn) Xử lý tốt và mở rộng hiệu quả ngay cả với các tệp dài hàng nghìn trang Đã được kiểm thử với hàng triệu tệp Linux/Mac/Windows (WSL)

(github.com)

17 điểm bởi xguru 2021-11-09 | 2 bình luận | Chia sẻ qua WhatsApp

Tạo tệp PDF/A có thể tìm kiếm từ PDF thông thường
Chèn chuỗi đã OCR bên dưới hình ảnh để hỗ trợ sao chép/dán
Giữ nguyên độ phân giải của hình ảnh đã được nhúng sẵn
Chèn thông tin OCR mà không làm hỏng tệp
Quảng cáo
Tối ưu hóa hình ảnh PDF để giảm kích thước tệp
Tận dụng toàn bộ lõi CPU để xử lý phân tán
Hỗ trợ nguyên trạng hơn 100 ngôn ngữ bằng Tesseract OCR (bao gồm cả tiếng Hàn)
Quảng cáo
Xử lý tốt và mở rộng hiệu quả ngay cả với các tệp dài hàng nghìn trang
Đã được kiểm thử với hàng triệu tệp
Linux/Mac/Windows (WSL)

2 bình luận

alstjr7375 2021-11-09

Tuyệt thật.

xguru 2021-11-09

Nghe nói công cụ này có nhiều tính năng hơn hẳn so với pdfsandwich được đăng vài ngày trước.

pdfsandwich - Công cụ tạo tệp PDF kiểu “sandwich” kết hợp hình ảnh và OCR https://vi.news.hada.io/topic?id=5334

OCRmyPDF - Thêm lớp văn bản OCR vào tệp PDF đã quét

Bài viết liên quan

2 bình luận