14 điểm bởi GN⁺ 2024-04-05 | 1 bình luận | Chia sẻ qua WhatsApp
  • Đây là một thư viện mã hóa JPEG mới, duy trì mức độ tương thích cao đồng thời mang lại các tính năng được cải thiện và cải thiện tỷ lệ nén lên tới 35% ở các thiết lập nén chất lượng cao
  • Được thiết kế để cung cấp hình ảnh nhanh hơn, hiệu quả hơn và thỏa mãn thị giác hơn so với JPEG hiện có, đồng thời đạt được các mục tiêu này bằng các kỹ thuật mới
  • Cung cấp bộ mã hóa và giải mã hoàn toàn có thể tương tác với nhau, tuân thủ tiêu chuẩn JPEG gốc và định dạng 8-bit phổ biến nhất, đồng thời tương thích API/ABI với libjpeg-turbo và MozJPEG

Cách Jpegli hoạt động

  • Jpegli sử dụng các kỹ thuật mới như heuristic lượng tử hóa thích ứng lấy từ bản triển khai tham chiếu JPEG XL, lựa chọn ma trận lượng tử hóa được cải tiến, tính toán kết quả trung gian chính xác và khả năng sử dụng không gian màu tiên tiến hơn để giảm nhiễu và nâng cao chất lượng hình ảnh
  • Thông qua lượng tử hóa thích ứng, Jpegli cải thiện chất lượng hình ảnh và giảm kích thước tệp bằng cách điều biến theo không gian dead zone của quá trình lượng tử hóa dựa trên mô hình tâm sinh lý thị giác
  • Có thể tiếp tục cải thiện chất lượng và mật độ bằng cách sử dụng không gian màu XYB của JPEG XL

Thử nghiệm Jpegli

  • Để định lượng mức cải thiện chất lượng hình ảnh của Jpegli, nhóm đã nhờ các đánh giá viên crowdsourcing so sánh các cặp ảnh được mã hóa bằng ba codec: Jpegli, libjpeg-turbo và MozJPEG trên Cloudinary Image Dataset '22
  • Trong phép so sánh này chỉ so sánh phần mã hóa; phần giải mã luôn được thực hiện bằng libjpeg-turbo. Kết quả giữa các codec và các thiết lập được biểu diễn bằng điểm ELO lấy cảm hứng từ xếp hạng cờ vua để dễ so sánh hơn
  • Điểm ELO cao hơn thể hiện hiệu năng tổng thể tốt hơn trong nghiên cứu đánh giá. Jpegli đạt xếp hạng ELO cao hơn libjpeg-turbo ở 2.8 BPP so với 3.7 BPP của libjpeg-turbo, tức là cao hơn 32% so với bitrate của Jpegli

Kết quả

  • Jpegli cho thấy có thể nén hình ảnh chất lượng cao tốt hơn 35% so với các codec JPEG hiện có
  • Jpegli là một công nghệ mới đầy hứa hẹn có thể giúp Internet nhanh hơn và đẹp hơn

Ý kiến của GN⁺

  • Jpegli có vẻ là một công nghệ đột phá có thể cải thiện tốc độ tải trang web và nâng cao trải nghiệm người dùng. Vì nén ảnh là yếu tố quan trọng trong tối ưu hiệu năng web, thư viện này có thể sẽ rất hữu ích cho các nhà phát triển web.
  • Để công nghệ này thực sự được chấp nhận rộng rãi, khả năng tương thích và tích hợp với hạ tầng web hiện có sẽ là thách thức quan trọng. Đặc biệt, tính tương thích với các hệ thống xử lý ảnh hiện tại sẽ là một yếu tố then chốt.
  • Khả năng mã hóa 10+ bit trên mỗi thành phần mà Jpegli cung cấp có thể mang lại chi tiết tinh tế hơn trong các dải chuyển màu của ảnh, nhưng cần có sự phổ biến của phần cứng và phần mềm hỗ trợ điều này.
  • Sự phát triển của công nghệ nén ảnh cũng có thể mang lại lợi ích môi trường ở khía cạnh tiết kiệm dung lượng dữ liệu và không gian lưu trữ. Điều này sẽ đặc biệt rõ rệt ở các dịch vụ sử dụng nhiều hình ảnh dung lượng lớn.
  • Ở góc nhìn phản biện, thành công của Jpegli không chỉ phụ thuộc vào ưu thế kỹ thuật mà còn vào khả năng được thị trường chấp nhận và cạnh tranh trong quá trình tiêu chuẩn hóa. Vì đã có nhiều thư viện và tiêu chuẩn nén JPEG tồn tại, Jpegli sẽ cần chứng minh những lợi thế rõ ràng để nổi bật trên thị trường.

1 bình luận

 
GN⁺ 2024-04-05
Ý kiến Hacker News
  • Dự án JPEGLI

    • JPEGLI dùng hậu tố '-li' trong phương ngữ Đức Thụy Sĩ để chỉ một ảnh JPEG nhỏ. Hậu tố này được thêm vào từ để truyền tải cảm giác nhỏ nhắn và thân thiện của đồ vật.
    • Có vẻ như dự án bắt nguồn từ Google Zurich.
    • Một số dự án Google đáng chú ý khác dùng tiếng Đức Thụy Sĩ:
      • Gipfeli: dự án dành cho nén tốc độ cao, có nghĩa là bánh sừng bò.
      • Guetzli: bộ mã hóa JPEG theo tri giác, có nghĩa là bánh quy.
      • Weggli: công cụ tìm kiếm ngữ nghĩa, có nghĩa là ổ bánh mì.
      • Brotli: dự án cho nén không mất dữ liệu, có nghĩa là ổ bánh mì nhỏ.
  • Tác động tiềm năng của JPEGLI

    • Tuyên bố của JPEGLI dường như khiến nén mất dữ liệu của WebP không còn cần thiết nữa.
    • Có các ước tính nén tương tự WebP so với JPEG.
    • Điều này cũng đặt ra nghi vấn về giá trị của AVIF. AVIF có tỷ lệ nén cao hơn, nhưng là một định dạng ảnh bị giới hạn chỉ phù hợp cho các trường hợp sử dụng cơ bản; việc mã hóa và giải mã rất chậm, và không có bộ giải mã streaming nên phải tải toàn bộ AVIF về mới có thể bắt đầu giải mã.
    • JPEG XL vẫn có giá trị vì nó bao phủ phạm vi rộng hơn nhiều so với JPEG/JPEGLI, bao gồm bộ giải mã streaming phù hợp cho sử dụng trên Internet và hỗ trợ giải mã lũy tiến cho mạng di động.
  • Phương pháp đánh giá chất lượng ảnh của JPEGLI

    • Để định lượng mức cải thiện chất lượng ảnh của JPEGLI, họ đã nhờ các đánh giá viên crowdsourcing so sánh các cặp ảnh được mã hóa ở nhiều bitrate bằng ba codec: JPEGLI, libjpeg-turbo và MozJPEG, trên bộ dữ liệu Cloudinary Image Dataset '22.
    • Có ý kiến chỉ trích về cách đánh giá chất lượng ảnh. Con người có thể có xu hướng thích các màu bão hòa hơn, dù đó là biến dạng so với ảnh gốc.
    • Để đánh giá công bằng hơn, nên yêu cầu chọn ảnh nào thể hiện tốt hơn dựa trên ảnh gốc, và cho phép trả lời 'A', 'B', 'không chắc'.
    • Hệ thống xếp hạng Elo có thể không phù hợp, và cần có phân tích về những ảnh nào ảnh hưởng mạnh nhất đến việc xác định cách tiếp cận nào tốt hơn, cũng như lý do vì sao.
  • Hiệu năng của JPEGLI

    • Có vẻ kém cạnh tranh ở bitrate thấp.
    • Trong một dự án mã hóa ảnh ở chất lượng MozJPEG 60, khi thử chuyển sang JPEGLI, ảnh JPEGLI cho kết quả nhất quán là tệ hơn dù đã tinh chỉnh để tạo ra kích thước tệp tương tự.
  • Việc sử dụng hệ thống đánh giá Elo

    • Sẽ hữu ích nếu tác giả giải thích họ đã dùng hệ thống xếp hạng Elo như thế nào để đánh giá chất lượng ảnh.
    • Có thể suy đoán rằng khi một ảnh được đánh giá là tốt hơn ảnh khác thì được tính là một 'chiến thắng'.
    • Viết 'Elo' thay vì 'ELO' mới là đúng, vì đây là tên người chứ không phải từ viết tắt.
  • Chi tiết kỹ thuật của JPEGLI

    • JPEGLI có thể được mã hóa với các thành phần từ 10 bit trở lên.
    • Có câu hỏi về cách các bit bổ sung được mã hóa, liệu đây có phải là định dạng JPEG_R/"Ultra HDR" hay Google đã phát triển một giải pháp metadata mới.
  • Chất lượng kết quả của JPEGLI

    • Khi nén hoặc giải nén bằng JPEGLI, các phép tính chính xác hơn và hiệu quả hơn về mặt thị giác-tâm lý được thực hiện, giúp ảnh sắc nét hơn và có ít artifact quan sát được hơn.
    • Có câu hỏi liệu có liên kết tới các ảnh ví dụ thể hiện sự cải thiện này hay không.
  • Tính thực tiễn của JPEGLI

    • Có câu hỏi rằng khi dùng JPEGLI thay cho libjpeg-turbo, với cùng bitmap đầu vào và thiết lập chất lượng, đầu ra do JPEGLI tạo ra sẽ nhỏ hơn hay đẹp hơn, hay là cả hai.
    • Người bình luận muốn hiểu liệu việc tiết kiệm dung lượng có phải vì bộ mã hóa JPEGLI có thể tạo ra ảnh tương tự hoặc tốt hơn ở mức chất lượng thấp hơn hay không.
  • Ứng dụng tương lai của JPEGLI

    • Kỳ vọng rằng ImageOptim sẽ sớm hỗ trợ JPEGLI.
  • Ý kiến về chiến lược của Google

    • Có ý kiến rằng Google dường như sẽ làm mọi cách để không triển khai AVIF vào Chrome thay vì JPEG XL.
    • Đồng thời vẫn nhìn nhận rằng điều này vẫn có giá trị vì sẽ còn những người dùng chỉ tiêu thụ JPEG trong nhiều thập kỷ tới, dù Google là một công ty lớn.