10 điểm bởi lifthrasiir 2022-12-15 | 2 bình luận | Chia sẻ qua WhatsApp

Tin Chrome dừng thử nghiệm JPEG XL (https://vi.news.hada.io/topic?id=7709) từng khiến issue tracker bị ngập trong câu hỏi vì sao lại xóa tính năng này. Đáp lại, phía AVIF đã từng đăng bộ dữ liệu benchmark do họ tự so sánh để biện hộ cho lập trường của mình (https://storage.googleapis.com/avif-comparison/index.html). Bài viết này là phần phân tích về tài liệu đó cùng với phản biện từ phía JPEG XL.

Không chỉ dừng ở việc ủng hộ hay phản đối JPEG XL, bài này còn chỉ ra những điểm quan trọng khi so sánh các định dạng ảnh, nên rất đáng đọc. Tóm tắt vài ý chính:

  • Tốc độ giải mã mà phía AVIF đưa ra dựa trên các phiên bản cũ của Chrome và libjxl, vì vậy bị phóng đại. Theo các phiên bản gần đây thì JPEG XL (thiết lập mặc định) ~= AVIF 12-bit < JPEG XL (thiết lập giải mã nhanh) ~= AVIF 8-bit < JPEG XL tái nén từ JPEG, và mỗi dấu bất đẳng thức chỉ chênh khoảng 10%.

  • So với tổng tốc độ giải mã, thời điểm ảnh có thể bắt đầu sử dụng được quan trọng hơn, và JPEG XL có lợi thế lớn ở đây vì hỗ trợ giải mã lũy tiến (progressive). (Đây cũng cùng ngữ cảnh với các câu chuyện như Largest Contentful Paint trên web.)

  • Hiệu năng mã hóa và chất lượng ảnh sau mã hóa đang bị đem ra so sánh một cách tách rời, nhưng libjxl có thể điều chỉnh hoàn toàn độc lập giữa hiệu năng mã hóa và chất lượng mã hóa, trong khi hầu hết các encoder khác bao gồm AVIF thì không thể, nên không thể so sánh theo cách đó.

  • Phạm vi chất lượng mục tiêu khi mã hóa được đưa ra quá rộng và không xét đến phân bố xác suất. Mức chất lượng thấp nhất được gọi là "On the fly" có chất lượng tệ đến mức gần như không ai có thể dùng cho bất kỳ mục đích nào. Ngoài ra, AVIF trung bình mạnh ở ảnh chất lượng thấp, nhưng chỉ cần kích thước tệp tăng lên một chút thì JPEG XL thường vượt trội rõ rệt; tuy nhiên cách lấy trung bình không phù hợp đã làm loãng thế mạnh này của JPEG XL.

  • Tập dữ liệu dùng để kiểm thử là không phù hợp. Với nén không mất dữ liệu, họ dùng tập Kodak là ảnh quét từ tạp chí, còn với nén mất dữ liệu lại dùng tập Noto Emoji vốn thường là đồ họa vector hoặc dùng nén không mất dữ liệu; cả hai đều không phải là các trường hợp sử dụng điển hình cho nén không mất dữ liệu và nén mất dữ liệu.

  • Nếu hiệu năng nén ảnh là câu chuyện của hiện tại, thì các tính năng mà định dạng ảnh hỗ trợ là câu chuyện của tương lai. Nếu một định dạng ảnh khi đã được đưa vào trình duyệt thì rất khó loại bỏ, vậy càng phải đánh giá với trọng tâm lớn hơn vào tính năng.

2 bình luận

 
lifthrasiir 2022-12-15

Vì viết vội trước khi đi làm nên có vài chỗ sai sót nhỏ (...), on the fly nói chính xác thì không phải là chất lượng thấp nhất mà là tốc độ cao nhất (tuy nhiên, ở hầu hết các encoder ngoại trừ JPEG XL, nó có tương quan nghịch với chất lượng). Ngoài ra, với bộ dữ liệu Kodak, không hiểu lúc đó tôi nghĩ gì mà lại viết là tạp chí, nhưng thực tế nó được quét từ phim.