1 điểm bởi GN⁺ 4 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • AV2 là đặc tả mã hóa video thế hệ tiếp theo của AOMedia, được xây dựng trên nền tảng AV1 với mục tiêu đạt hiệu suất nén cao hơn và truyền tải chất lượng cao ở bitrate thấp hơn
  • Đặc tả cuối cùng v1.0.0 bao gồm cú pháp bitstream, ngữ nghĩa và quy trình giải mã, đóng vai trò là tài liệu tham chiếu kỹ thuật để đánh giá mức độ tuân thủ của các triển khai AV2
  • Tiêu chuẩn được tối ưu cho streaming, phát sóng và hội nghị truyền hình thời gian thực, đồng thời hỗ trợ AR/VR, truyền tải màn hình chia nhỏ và cải thiện xử lý nội dung màn hình
  • Bản phát hành hiện tại gồm AV2 Bitstream & Decoding Process Specification v1.0.0 được công bố ngày 28/5/2026 và phần mềm tham chiếu AVM
  • Các nhà triển khai có thể sử dụng đặc tả trực tuyến, PDF, bảng tra cứu header C, Syntax Browser và thẻ AVM v1.0.0; bản nháp v13 vẫn được giữ lại để tham khảo

Tổng quan về AV2

  • AV2 là đặc tả mã hóa video thế hệ tiếp theo của Alliance for Open Media (AOMedia), được thiết kế để mang lại hiệu suất nén cao hơn trên nền tảng AV1
  • Mục tiêu là truyền tải video chất lượng cao với bitrate thấp hơn đáng kể, và được tối ưu cho nhu cầu streaming, phát sóng và hội nghị truyền hình thời gian thực
  • Đặc tả v1.0.0 là tài liệu tham chiếu kỹ thuật cuối cùng cho việc triển khai AV2, bao gồm cú pháp bitstream, ngữ nghĩa và quy trình giải mã cần thiết để đạt tuân thủ đầy đủ
  • AV2 hỗ trợ ứng dụng AR/VR, truyền tải màn hình chia nhỏ của nhiều chương trình, cải thiện xử lý nội dung màn hình và hoạt động trên dải chất lượng hình ảnh rộng hơn
  • AOMedia Video Model (AVM) được cung cấp làm phần mềm tham chiếu chính thức cho các nhà triển khai
  • Có thể gửi phản hồi và vấn đề tới wg-codec-chair@aomedia.org hoặc đăng lên AVM issue tracker

Bản phát hành và tài liệu triển khai

  • AV2 specification and reference code v1.0.0

    • Bản phát hành hiện tại là AV2 Bitstream & Decoding Process Specification v1.0.0 được công bố ngày 28/5/2026 cùng phần mềm tham chiếu AVM tương ứng
    • Read Online: tài liệu đặc tả v1.0.0 trực tuyến
    • Download PDF: PDF đầy đủ của đặc tả v1.0.0
    • Additional Tables: tệp header C của các bảng tra cứu được trích từ mục 9
    • Syntax Browser: trình duyệt để khám phá cùng lúc cấu trúc cú pháp và ngữ nghĩa
    • Software: phần mềm tham chiếu AVM ở thẻ v1.0.0
  • AV2 working draft v13

    • Bản nháp làm việc v13 được công bố ngày 5/1/2026 và đã được thay thế bởi v1.0.0
    • Nhãn “v13” chỉ mốc milestone của bản nháp làm việc, không có nghĩa là phiên bản mới hơn v1.0.0
    • Bản này được giữ lại cho mục đích tham khảo
    • Read Online: tài liệu trực tuyến v13
    • Additional Tables: các bảng bổ sung của v13
    • Syntax Browser: trình duyệt cú pháp của v13
    • Software: phần mềm tham chiếu research-v13.0.0
    • Release Notes: ghi chú phát hành v13
  • Tài liệu hỗ trợ sử dụng đặc tả

    • Đặc tả đầy đủ bao gồm từ phạm vi và định nghĩa đến phụ lục, bao quát định dạng, cú pháp, ngữ nghĩa và quy trình giải mã
    • Phiên bản PDF cung cấp đầy đủ đặc tả v1.0.0 để tham khảo ngoại tuyến
    • Additional Tables là tài liệu trích xuất các bảng tra cứu ở mục 9 thành tệp header C, hữu ích cho việc tham chiếu khi triển khai
    • Syntax Browser cung cấp Syntax Structures ở mục 5 và Semantics ở mục 6 trong giao diện chia đôi cửa sổ
    • Trong Syntax Browser, có thể xem song song định nghĩa cú pháp và ngữ nghĩa, nhấp vào các phần tử cú pháp, tìm kiếm ở cả hai mục và sao chép cấu trúc cú pháp
    • Reference Software là AVM tương ứng với đặc tả v1.0.0, và thẻ v1.0.0 là phiên bản tương ứng

1 bình luận

 
Ý kiến trên Hacker News
  • AV2 chỉ là một chặng trong hành trình rất dài, và ở trạng thái hiện tại thì gần như khó dùng trong thực tế
    Ngay cả trên phần cứng tốt, encoder thường chỉ đạt khoảng 1fps, nên có lẽ tình trạng này sẽ còn tiếp diễn ít nhất đến khoảng năm 2028 khi chip tăng tốc phần cứng AV2 đầu tiên xuất hiện, và phải tới khoảng 2030 thì stream AV2 mới trở nên phổ biến
    Nếu chỉ xét mức cải thiện hiệu quả thì 20~30% so với AV1 quả là đáng kể, nhưng AV2 có xứng đáng với cái giá đó hay không thì vẫn còn mơ hồ. Tuy vậy, hỗ trợ đa luồng là lợi thế lớn cho VR và thể thao trực tiếp, và việc có thể gửi kênh alpha dưới dạng một luồng riêng rồi ghép trong tệp để hỗ trợ video trong suốt đúng nghĩa cũng khá thú vị

    • Nhìn vào quỹ đạo của AV1 thì mã hóa bằng phần cứng không hẳn là bắt buộc. Có thì tốt, nhưng encoder hiện tại vẫn là encoder tham chiếu
      Giờ thông số kỹ thuật đã được chốt, tốc độ ở các encoder dành cho sản phẩm thực tế có thể được cải thiện lớn, chỉ là mã hóa thời gian thực có lẽ vẫn sẽ khó trước khi nó được đưa vào phần cứng
    • Nếu “tính năng bổ sung lớn nhất là hỗ trợ đa luồng”, thì tôi từng nghĩ đây là phạm vi của định dạng container hơn là codec video
    • Nếu theo xu hướng hiện tại thì tôi không nghĩ sắp tới sẽ sớm thấy encoder phần cứng AV2 trên PC. Năng lực sản xuất chip mới nhất, tốt nhất đang bị Apple và các công ty AI hút gần hết
      Trừ khi nhà sản xuất chip chuyển thiết kế AV2 sang quy trình cũ hơn và rẻ hơn, còn không thì với người dùng phổ thông sẽ rất khó. Các hãng chip TV Trung Quốc có thể nhét decoder AV2 kiểu để đánh dấu đủ tính năng, nhưng encoder thực sự thì khó mà kỳ vọng trong thời gian tới
    • Nhìn cách phát triển GPU đang chệch sang phía NPU, chuyện này có cảm giác như mục tiêu 2035 sớm nhất. Các hãng sẽ tìm cách tối đa hóa diện tích silicon cho phép toán ma trận
      Trong thời đại có những khoản đầu tư hàng nghìn tỷ vào data center, chi phí băng thông bị đẩy xuống hàng sau, và bên hưởng lợi có lẽ chỉ là YouTube hay Netflix. Với quy mô đó, có khi đầu tư vào cache ở cấp ISP còn rẻ hơn
    • Mục tiêu là “cung cấp video chất lượng cao ở bitrate thấp hơn nhiều”, nhưng nếu những thiết bị chậm thực sự cần điều đó còn chưa tồn tại, thì tôi không rõ ý nghĩa của nó là gì
  • Tôi tò mò AV2 sẽ cải thiện định dạng ảnh AVIF như thế nào. AVIF áp đảo các định dạng cạnh tranh ở ảnh tĩnh bitrate thấp, nhất là khi dùng chroma subsampling
    Nhưng với ảnh lossless thì không như vậy. So với JPEG XL lossless và WEBP lossless thì AVIF lossless gần như trông rất yếu

    • AVIF hiện là định dạng ảnh tôi thích nhất. Rất hiếm định dạng có đủ lossless, HDR, độ trong suốt, hỗ trợ trình duyệt
      Nó cũng rất xuất sắc với ảnh nén mạnh, và thật ngạc nhiên khi kích thước tệp có thể nhỏ đến thế nào. Không như HEIC hay Ultra HDR JPEG, vốn dùng mẹo kiểu sidecar gain map, AVIF hỗ trợ HDR gốc ngay trong chính định dạng tệp. Điều này không quan trọng với tất cả mọi người, nhưng tôi thích HDR, và AVIF là định dạng duy nhất có vẻ thực sự nghiêm túc với điều đó
    • Không phải lúc nào cũng vậy https://tonisagrista.com/blog/2023/jpegxl-vs-avif/
    • Nếu libavif có hỗ trợ AV2, chỉ cần cập nhật lên kiểu phiên bản như v2.0.0 là có thể nhận được hiệu quả bổ sung
    • Thành thật mà nói, thứ chúng ta cần lúc này không phải AVIF2. Đã có quá nhiều định dạng ảnh thiểu số rồi
  • Với AV1, hiện nhiều công ty đang tích cực làm claim chart, và gần như chắc chắn rồi cũng sẽ có kiện tụng. Quá trình tương tự cũng đã bắt đầu với AV2, chỉ là phần lớn đang chờ các vụ việc quanh AV1 chín muồi hơn
    Mọi người vẫn tiếp tục gọi các codec dòng AV là “miễn phí bản quyền”, nhưng trên thực tế nó ngày càng giống một canh bạc pháp lý và tài chính

    • Kiểu tranh luận này đã lặp lại suốt hàng chục năm rồi
      Tôi chưa bao giờ hiểu vì sao có người lại thích chuyện doanh nghiệp sở hữu toán học như kiểu cổ vũ một đội thể thao ở địa phương
      Trong một thời gian, tôi nghĩ là vì có nhiều người đã đổ rất nhiều công sức vào encoder H.264, nên những tá điền số hóa cảm thấy bực bội và ghen tị với những người bênh vực thứ tự do lộn xộn. Nhưng có vẻ một số người đơn giản là thích chính ý tưởng doanh nghiệp đánh thuế lên việc phân phối video
      May là những công ty tham lam đó đã nhiều lần tự bắn vào chân mình, và ảnh hưởng của họ đang giảm dần
    • AV1 ra đời được bao lâu rồi? Khoảng 8 năm, mà vẫn chưa có chủ bằng sáng chế đáng tin cậy nào
      Quanh các tiêu chuẩn nén lúc nào cũng có lũ kền kền bay vòng, nên không cần xem trọng quá mức. Kể cả có kiện tụng thì cũng có quỹ phòng vệ pháp lý để chống lại các yêu cầu vô căn cứ
    • Nếu codec dòng AV trông như một canh bạc pháp lý và tài chính, thì phương án thay thế là gì?
      H.265 có hai nhóm cấp phép HEVC mà bạn phải tham gia, và còn ít nhất hai công ty không thuộc các nhóm đó
      https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#P...
      Chọn codec không phải AVx có lẽ cũng chẳng ít phức tạp hơn hay giảm rủi ro kiện tụng hơn
    • Ý là kể cả so với thứ như HEVC cũng vậy sao? Nếu muốn chắc ăn với HEVC thì bạn phải trả tiền cho 3 nhóm bằng sáng chế với các điều khoản khác nhau, và ngoài ra còn có các chủ bằng sáng chế không thuộc nhóm nào có thể bất cứ lúc nào cũng đòi royalty theo điều kiện riêng của họ
    • Tiêu chuẩn truyền thông thì đáng ra không nên được cấp bằng sáng chế. Khả năng bị lạm dụng nhờ hiệu ứng khóa chặt là quá lớn
  • Sẽ mất bao lâu trước khi ai đó triển khai tiêu chuẩn này rồi bị Adobe hay Dolby kiện chỉ vì họ muốn nện ai đó một phát? Có thể kiến thức của tôi đã cũ, nhưng nếu nó “mở” như AV1 thì tôi khá hoài nghi việc từng công ty riêng lẻ có thực sự chấp nhận hay không. Lòng tham mà

    • Phải mất 7 năm để khiếu nại bằng sáng chế đầu tiên về AV1 đi tới tòa, và có vẻ sẽ còn mất khá lâu nữa để vụ đó được giải quyết
      Điều thú vị là nó không đến từ nhóm bằng sáng chế đã liên tục lên tin tức suốt mấy năm qua. Tức là có thể sẽ mất khá lâu trước khi có một nỗ lực như vậy xuất hiện
    • Bọn troll bằng sáng chế thật độc hại. Sẽ mất bao lâu để chúng nhận được sự hậu thuẫn toàn diện từ những kẻ làm lung lay tính độc lập của hệ thống tư pháp Mỹ vì lợi ích riêng? Mong là sự tha hóa đó bị chặn lại trước khi chuyện đó xảy ra
  • Hơi đùa nửa thật, tôi đã chờ một chiếc Apple TV hỗ trợ AV1, mà giờ lại thành ra phải chờ cả hỗ trợ AV2 trên Apple TV

    • Ngay cả iPhone 7 đã 10 năm tuổi cũng có thể phát hơn 200 phút video AV1 1080p bằng giải mã phần mềm qua VLC. iPhone 7 được phát hành sớm hơn AV1 khoảng 1 năm rưỡi
      Vì vậy, có lẽ khá an toàn khi cho rằng các thiết bị Apple TV hiện tại cũng có thể phát video AV1 bằng phần mềm. Cũng đã có bản phát hành VLC cho Apple TV
      https://www.videolan.org/vlc/download-appletv.html
      https://apps.apple.com/us/app/vlc-media-player/id650377962?p...
    • Ngoài hệ sinh thái Apple, AV1 gần như được hỗ trợ ở khắp mọi nơi
  • Tôi không phải chuyên gia mã hóa video, nhưng tự hỏi liệu trong tương lai có thể sẽ phụ thuộc nhiều hơn vào việc mạng AI tái tạo lại hình ảnh, giúp dữ liệu nhẹ hơn rất nhiều so với video nén theo kiểu chức năng cố định hay không
    Các neural codec như github.com/Orange-OpenSource/Cool-Chic là một ví dụ

    • Có lẽ điều này sẽ phụ thuộc vào việc smartphone có phổ biến NPU hay không, và liệu có xuất hiện API tiêu chuẩn để truy cập NPU hay không
      Tuy vậy, tôi không chắc codec dựa trên AI có thể cạnh tranh với phần cứng chức năng cố định về mức tiêu thụ pin hay không
  • AV1 vốn đã là một bước nhảy lớn hướng tới định dạng video mở và hiệu quả, và AV2 cũng là thứ đã được chờ đợi từ lâu
    Sẽ còn mất thời gian để được triển khai vào chip và phần cứng, rồi mới có thể dùng mã hóa/giải mã phần cứng hiệu quả và nhanh chóng, nhưng xét đến giá lưu trữ tăng và khủng hoảng chip, mức cải thiện hiệu quả khoảng 25% trông rất hứa hẹn

  • Dav2d nghe không xuôi tai đến vậy. Hy vọng trước đó sẽ có ai đó giỏi chơi chữ với tên kho lưu trữ đóng góp một cái tên hay hơn
    avi2ude? av2go?

    • rav2d có vẻ ổn — https://github.com/stukenov/rav2d. Đây là bản port Rust, và có cảm giác giống rav1d→dav1d
    • Rất khó tìm được một cái tên hay với av2
      Trong tiếng Pháp thì sẽ là d2vid, tức Deuvid
  • Hy vọng sẽ có một encoder khá nhanh xuất hiện. Encoder tham chiếu của AV1 cũng không tốt lắm, và ở đây có vẻ cũng vậy
    Nhưng ngay khi có thứ như SVT-AV2 thì chắc tôi sẽ rất hài lòng