2 điểm bởi GN⁺ 2023-09-05 | 1 bình luận | Chia sẻ qua WhatsApp
  • Hướng dẫn chỉnh sửa nội dung văn bản trong PDF: không cần công cụ thương mại như Adobe Acrobat
  • Hướng dẫn chính cho người dùng Mac: có nhắc tới các công cụ cũng dùng được trên hầu hết các bản phân phối Linux
  • Lưu trữ dữ liệu văn bản nén trong PDF: giải nén bằng công cụ dòng lệnh qpdf
  • Kiểm tra dữ liệu văn bản sau khi giải nén: xem trong trình soạn thảo văn bản với mã hóa và trạng thái liên kết với phông chữ cụ thể
  • Độ phức tạp của mã hóa văn bản trong PDF: nhiều kiểu mã hóa có thể có, bao gồm cả mã hóa tùy biến được nhúng ngay trong tệp
  • Trích xuất thông tin mã hóa: dùng công cụ dòng lệnh pdffonts
  • Cung cấp ví dụ về cách xác định phông chữ liên quan đến mã hóa nhúng và tìm bảng mã hóa nhúng của phông chữ đó
  • Bảng mã hóa: ánh xạ các điểm mã hóa tùy biến sang các điểm Unicode
  • Chuyển đổi bảng bằng Python: chuyển bảng thành từ điển và viết hàm mã hóa, giải mã
  • Thay thế văn bản gốc bằng các hàm này: có thể thay văn bản gốc bằng văn bản thay thế đã được mã hóa theo kiểu tùy biến

1 bình luận

 
GN⁺ 2023-09-05
Ý kiến trên Hacker News
  • Đặc tả PDF rất phức tạp và hỗ trợ nhiều tính năng khác nhau, bao gồm chế độ hòa trộn lớp như trong Photoshop và nội dung bổ sung để sửa đổi nội dung trước đó.
  • PDF bao gồm mã hóa dựa trên mật khẩu với các mật khẩu "owner" và "user" khác nhau, cùng các tùy chọn ngăn in ấn hoặc sao chép văn bản.
  • Dù có tính chất phức tạp, PDF không phải là một định dạng nhị phân bất khả xâm phạm mà là một đồ thị đối tượng với nhiều kiểu khác nhau, được mô tả rõ trong đặc tả chính thức.
  • Các công cụ như mutool có thể được dùng để chuyển PDF sang phiên bản không có dữ liệu nén, giúp việc hiểu và chỉnh sửa dễ dàng hơn.
  • PDF hỗ trợ nhiều tính năng như đối tượng 3D, JavaScript, phim với đối tượng Flash nhúng, chú thích vô hình, và widget sử dụng tập con của XHTML và CSS.
  • Tuy nhiên, PDF về cơ bản là định dạng mô tả trang và biểu diễn cấu trúc tài liệu chứ không phải cách hiển thị của trang. Vì vậy, nên chỉnh sửa tài liệu gốc đã tạo ra PDF.
  • PDF chủ yếu nhằm mục đích hiển thị hoặc in ấn nội dung một cách hoàn hảo, nên gần với một định dạng hình ảnh hơn là hình ảnh thực tế chiếm ít byte hơn.
  • Các công cụ như qpdf và RUPS có thể được dùng để nắm cấu trúc và chỉnh sửa PDF.
  • Firefox cung cấp một cách dễ dàng để ký vào PDF.
  • Đặc tả PDF rất đồ sộ và phức tạp; ngay cả sau nhiều năm nghiên cứu, bạn vẫn có thể cảm thấy mình mới chỉ chạm vào bề mặt.