OCRmyPDF - Thêm lớp văn bản OCR vào tệp PDF đã quét
(github.com)<p>- Tạo tệp PDF/A có thể tìm kiếm từ PDF thông thường<br />
- Chèn chuỗi đã OCR bên dưới hình ảnh để hỗ trợ sao chép/dán <br />
- Giữ nguyên độ phân giải của hình ảnh đã được nhúng sẵn<br />
- Chèn thông tin OCR mà không làm hỏng tệp <br />
- Tối ưu hóa hình ảnh PDF để giảm kích thước tệp <br />
- Tận dụng toàn bộ lõi CPU để xử lý phân tán <br />
- Hỗ trợ nguyên trạng hơn 100 ngôn ngữ bằng Tesseract OCR (bao gồm cả tiếng Hàn)<br />
- Xử lý tốt và mở rộng hiệu quả ngay cả với các tệp dài hàng nghìn trang <br />
- Đã được kiểm thử với hàng triệu tệp <br />
- Linux/Mac/Windows (WSL)</p>
2 bình luận