- Hướng dẫn chỉnh sửa nội dung văn bản trong PDF: không cần công cụ thương mại như Adobe Acrobat
- Hướng dẫn chính cho người dùng Mac: có nhắc tới các công cụ cũng dùng được trên hầu hết các bản phân phối Linux
- Lưu trữ dữ liệu văn bản nén trong PDF: giải nén bằng công cụ dòng lệnh
qpdf
- Kiểm tra dữ liệu văn bản sau khi giải nén: xem trong trình soạn thảo văn bản với mã hóa và trạng thái liên kết với phông chữ cụ thể
- Độ phức tạp của mã hóa văn bản trong PDF: nhiều kiểu mã hóa có thể có, bao gồm cả mã hóa tùy biến được nhúng ngay trong tệp
- Trích xuất thông tin mã hóa: dùng công cụ dòng lệnh
pdffonts
- Cung cấp ví dụ về cách xác định phông chữ liên quan đến mã hóa nhúng và tìm bảng mã hóa nhúng của phông chữ đó
- Bảng mã hóa: ánh xạ các điểm mã hóa tùy biến sang các điểm Unicode
- Chuyển đổi bảng bằng Python: chuyển bảng thành từ điển và viết hàm mã hóa, giải mã
- Thay thế văn bản gốc bằng các hàm này: có thể thay văn bản gốc bằng văn bản thay thế đã được mã hóa theo kiểu tùy biến
1 bình luận
Ý kiến trên Hacker News