- YouTube bị phát hiện đã áp dụng công nghệ hiệu chỉnh dựa trên AI cho video của một số kênh nổi tiếng mà không thông báo cho nhà sáng tạo hay người xem
- Các YouTuber âm nhạc Rick Beato và Rhett Shull phát hiện da, tóc và nếp nhăn trên quần áo trong video của họ đã thay đổi một cách tinh vi, từ đó lên tiếng về vấn đề này
- YouTube giải thích đây là “thử nghiệm giới hạn ở một số video Shorts”, và cho biết họ đã dùng machine learning truyền thống để cải thiện độ rõ nét và giảm nhiễu của video
- Tuy nhiên, các chuyên gia chỉ trích việc né tránh thuật ngữ và thiếu minh bạch, cho rằng “machine learning cũng là một phần của AI”, đồng thời cảnh báo nguy cơ làm suy giảm độ tin cậy của nội dung
- Trường hợp nội dung bị chỉnh sửa mà không có sự đồng ý của nhà sáng tạo lần này được xem là một ví dụ cho thấy vấn đề về tính xác thực và độ tin cậy của truyền thông số
Thử nghiệm hiệu chỉnh video AI bí mật của YouTube
- YouTube đã âm thầm áp dụng công nghệ nâng cao video dựa trên AI cho video của một số nhà sáng tạo nổi tiếng
- Các yếu tố hình ảnh trong video bị chỉnh sửa mà không có thông báo trước cho nhà sáng tạo hay người xem
- Rick Beato và Rhett Shull phát hiện kết cấu da, tóc, nếp nhăn quần áo, hình dáng tai trong video của họ đã bị thay đổi
- Beato cho biết “mái tóc trông kỳ lạ và tôi có cảm giác như mình đang trang điểm”
- Shull nói rằng “nó trông như được AI tạo ra”, đồng thời chỉ ra rằng niềm tin với người xem có thể bị tổn hại
Xác nhận thử nghiệm và lời giải thích của YouTube
- YouTube thừa nhận đang tiến hành một thử nghiệm quy mô nhỏ trên một số video Shorts
- Creator Liaison Rene Ritchie giải thích qua X (trước đây là Twitter) rằng đây là “một thử nghiệm dùng machine learning truyền thống để cải thiện độ rõ và giảm nhiễu của video”
- Họ cho rằng mức độ này tương tự như tính năng tự động hiệu chỉnh trên smartphone
- Tuy nhiên, giáo sư Samuel Woolley của Đại học Pittsburgh chỉ trích đây là cách diễn đạt gây hiểu lầm, cho rằng “machine learning là một nhánh con của AI”
Sự lan rộng của tiền xử lý bằng AI và vấn đề niềm tin
- Các chuyên gia cho rằng trường hợp này là một phần của xu hướng rộng hơn, trong đó AI tiền xử lý nội dung trước khi đến tay người dùng
- Samsung từng dùng AI để làm ảnh Mặt Trăng sắc nét hơn, còn “Best Take” của Google Pixel ghép nhiều biểu cảm khuôn mặt để tạo ra một bức ảnh hoàn hảo duy nhất
- Woolley cảnh báo đây là “hành vi chỉnh sửa và phân phối nội dung mà không có sự đồng ý của nhà sáng tạo”, tạo ra một lớp thao tác vô hình giữa người xem và phương tiện truyền thông
- Điều này dẫn tới lo ngại về tính xác thực của nội dung và tính minh bạch
Phản ứng của nhà sáng tạo và giới chuyên gia
- Beato có thái độ tích cực với động thái của YouTube, nói rằng đây là “một nền tảng luôn thử nghiệm công cụ mới”
- Ông kiềm chế chỉ trích khi nói rằng “YouTube đã thay đổi cuộc đời tôi”
- Ngược lại, các nhà phê bình cho rằng việc chỉnh sửa không thông báo trước tạo ra một tiền lệ nguy hiểm
- Họ nhấn mạnh rằng YouTube không chỉ là nền tảng giải trí mà còn là nền tảng chính cho tin tức, giáo dục và nội dung thông tin, nên độ chính xác và tính chân thực đặc biệt quan trọng
Hướng đi tương lai của truyền thông số
- Trường hợp lần này báo hiệu một tương lai mà AI tái cấu trúc nội dung trước cả khi người dùng nhận thức được điều đó
- Nó cho thấy ngay cả trước khi người xem nhấn nút phát, họ đã có thể được cung cấp một video có sự can thiệp của AI
- Nhu cầu về thông báo minh bạch khi sử dụng AI và quy trình xin sự đồng ý của nhà sáng tạo ngày càng trở nên rõ ràng
1 bình luận
Ý kiến trên Hacker News
Trong video trang điểm môi thì môi bị làm to hơn, còn trong video trang điểm mắt thì mắt bị làm to hơn — tức là AI nhận diện loại nội dung rồi tự động phủ filter
Có thể xem video liên quan tại đây. Việc chỉnh sửa nội dung do creator đăng lên mà không xin phép thật sự gây sốc
Influencer đó không rành kỹ thuật nên có lẽ đã nhầm là filter AI. Các khối chuyển động lơ lửng trên màn hình là hiện tượng điển hình của nén mạnh
Thật lạ khi trên diễn đàn kỹ thuật mà những khẳng định kiểu này lại được chấp nhận nguyên xi. Toàn bộ video thiếu chi tiết và dấu vết nén rất rõ
Trong điều khoản sử dụng thường có điều khoản cho phép nền tảng “làm bất cứ điều gì họ muốn”, nên sau này họ cũng có thể biện minh rằng đó là “thiết lập người dùng”
“Khi Meta tự động dịch giọng nói, họ thêm filter AI để khớp khẩu hình với âm thanh, và trong quá trình đó đôi khi một lớp filter kỳ lạ phủ lên cả khuôn mặt”
Còn chuyện áp filter khác nhau theo từng loại nội dung thì nghe giống suy đoán quá đà ở mức thuyết âm mưu
Da bị làm mịn quá mức, tóc trông như bôi sáp, và có những vòng lạ xuất hiện quanh các vật thể chuyển động
Lúc đầu tôi tưởng là upscaling phía client, nhưng vì nó được xử lý ở server nên cũng không thể tắt
Nếu mọi người quen dần với kiểu chất lượng này thì về sau khi nội dung do AI tạo ra bị trộn vào cũng sẽ khó mà nhận ra
Mọi người sẽ chỉ cuộn vô tận để xem quảng cáo và thứ nội dung làm tan chảy não bộ
ffmpeg -i source.mkv -i suspect.mkv -filter_complex "blend=all_mode=difference" diff_output.mkvCó rất nhiều khẳng định như vậy, nhưng tôi vẫn chưa thấy ai thật sự đăng video so sánh (diff) lên. Nếu có ai làm thì sẽ rất thú vị
Trong video YouTube, ở mốc 0:31 cô ấy đặt Shorts cạnh bản gốc
Ở bản chất lượng cao trên Patreon, khác biệt còn rõ hơn nhiều
Dạo này tôi thường chụp thumbnail rồi hỏi ChatGPT, hoặc đưa URL video vào công cụ trích xuất transcript để Gemini phân tích
Giờ những người làm clickbait gần như đã bị hạ xuống thành “người gợi ý chủ đề cho ChatGPT hỏi”
Tự ý “cải thiện” như vậy mà không hề báo cho creator biết thì không hề khôn ngoan
Cần có nhiều người thử nghiệm các nền tảng tốt hơn, đặc biệt là vì những creator nhỏ và vừa đang khổ sở vì các báo cáo bản quyền giả mạo
Một lựa chọn thay thế là các nền tảng như PeerTube trên Fediverse
Việc tăng engagement là phần của creator; nếu nền tảng can thiệp thì cuối cùng người dùng sẽ bỏ đi
Có ví dụ liên quan trong bài này
Nén mất dữ liệu và lượng tử hóa thích ứng có thể khiến da trông mịn hơn
Các nhà khoa học, chính trị gia, nhà kinh tế học và chuyên gia công nghệ bị sao chép hoàn toàn bằng AI rồi xuất hiện trong video
Bài liên quan: The Guardian đưa tin
Tôi không nghĩ Google có lý do gì để cung cấp dữ liệu sạch cho bên ngoài
Ví dụ kênh này dùng ảnh tóm tắt có vẻ được tạo bằng Stable Diffusion chứ không phải khung hình thật từ video
Tôi cũng từng thấy nó một lần trên kênh của mình, nhưng bây giờ tùy chọn đó đã biến mất. Hầu hết các kênh tôi theo dõi đều đang dùng tính năng này
Cá nhân tôi không thích nó
Ví dụ có thể nhập prompt ngay dưới video như “đổi tiếng Anh sang tiếng Gaelic”, “thay các câu đùa kiểu bố bằng lorem ipsum”, hay “biến con chó thành sinh vật ngoài hành tinh”
Nếu có thể chạy cục bộ ngay trong trình duyệt thì sẽ rất tuyệt, nhưng đến lúc đó có lẽ nó lại bị cấm về mặt pháp lý