- Trái với kỳ vọng rằng công nghệ tạo video AI sẽ hạ thấp rào cản sáng tạo, kết quả thực tế chỉ tạo ra những cảnh hời hợt và sáo mòn
- Nhiều mô hình như Sora, Runway ML, Veo tạo được những video hoàn thiện tốt về mặt kỹ thuật, nhưng rất khó làm ra tác phẩm có chủ ý và có tự sự
- Những video này mang thẩm mỹ gượng gạo đặc trưng của ‘video AI’, gây cho người xem cảm giác khó chịu và mất lòng tin
- Đặc biệt, video thông tin sai lệch và tin giả lan nhanh, chủ yếu nhắm vào người cao tuổi, khiến ranh giới giữa thực và hư cấu bị xóa nhòa
- Kết quả là video AI gây ra cả tác hại trực tiếp lẫn gián tiếp, đồng thời đẩy nhanh sự sụp đổ niềm tin đối với toàn bộ truyền thông hình ảnh
Kỳ vọng và thực tế khi là công cụ sáng tạo
- Khi Sora của OpenAI ra mắt, người dùng từng kỳ vọng có thể nhập bản phác thảo và kịch bản của mình để làm phim ngắn
- Nhưng khác với bản demo, video được tạo ra trong thực tế liên tục cho ra kết quả không khớp với cảnh mong muốn
- Tác giả cũng thử các mô hình khác như Runway ML, Veo, nhưng tất cả đều tạo ra những video trông có vẻ ổn nhưng thiếu nhất quán về mặt tự sự
- Những kết quả này không chỉ là giới hạn kỹ thuật đơn thuần, mà còn có đặc điểm rõ rệt đến mức có thể được xem là một phạm trù thẩm mỹ độc lập mang tên ‘video AI’
Một thung lũng kỳ lạ mới
- Video AI có chất liệu thị giác đặc trưng có thể nhận ra ngay lập tức, và tạo cảm giác hơi ‘sai sai’
- Dù không thể giải thích rõ, người xem vẫn bản năng nhận ra sự thiếu tự nhiên
- Tác giả cảm thấy ác cảm mạnh mẽ với những video như vậy, và những người xung quanh cũng có phản ứng tương tự
- Theo một bản tin của BBC, YouTube đang dùng AI để chỉnh sửa video mà không có sự đồng ý của nhà sáng tạo, khiến ngay cả video thật cũng trông như nhân tạo
- Xuất hiện hiện tượng khuôn mặt bị làm mịn hoặc sắc nét quá mức
- Kết quả là ranh giới giữa video thật và video AI trở nên mờ nhạt
Các trường hợp bị lạm dụng và thiệt hại lan rộng
- Nhóm người tiêu thụ chính của video AI là những người dùng với mục đích spam, lừa đảo và kích động
- Họ dùng công cụ AI để sản xuất hàng loạt thông tin sai lệch và nội dung bị thao túng
- Đặc biệt, người cao tuổi là nạn nhân chính, khi trong các nhóm chat gia đình và người quen, video giả mạo phát ngôn của người nổi tiếng hoặc thông tin sức khỏe sai lệch lan truyền rất nhanh
- Ví dụ: video lời khuyên của Denzel Washington, phát ngôn tôn giáo của Obama, hay việc Trump đổi lập trường
- Tác giả liên tục chỉ ra các dấu hiệu của video AI (ví dụ: watermark của Sora) và cách kiểm chứng sự thật, nhưng không thể theo kịp tốc độ lan truyền của thông tin
- Ngay cả trong phần bình luận YouTube cũng có rất nhiều người dùng thật đang nghiêm túc trò chuyện với các nhân vật giả
Sự sụp đổ của niềm tin
- Công nghệ video AI đang được dùng hiệu quả hơn cho thao túng và khai thác thay vì hỗ trợ nhà sáng tạo
- Dù từng cân nhắc các khả năng ứng dụng tích cực như giáo dục, khả năng tiếp cận và nghệ thuật, thực tế cho thấy mọi video AI đều dẫn tới kết quả có hại
- Tác hại trực tiếp: thông tin sai lệch, mạo danh nhân vật, thao túng nhóm dễ tổn thương
- Tác hại gián tiếp: đánh mất niềm tin đối với toàn bộ phương tiện truyền thông hình ảnh
- Tác giả đi đến kết luận rằng “ngay cả video AI vô hại cũng làm tăng tốc sự sụp đổ niềm tin”
Kết luận: từ rào cản sáng tạo đến rào cản niềm tin
- Video AI đang trở thành một công nghệ cực kỳ hiệu quả cho các mục đích xấu
- Rào cản kỹ thuật mà các nhà sáng tạo từng kỳ vọng sẽ vượt qua vẫn còn đó,
và giờ đây còn xuất hiện thêm một vấn đề lớn hơn là ‘rào cản niềm tin’
- Sự sụp đổ niềm tin này sẽ còn là một vấn đề khó khôi phục hơn nhiều
1 bình luận
Ý kiến trên Hacker News
99% mọi thứ tồn tại trên đời đều dở, và video AI cũng không ngoại lệ
Dù vậy, các video do những kênh YouTube như NeuralViz làm ra vẫn khá ấn tượng. Ví dụ, MV ADHD của Igorrr rất khớp với âm nhạc
Điểm chung của những video AI ‘hay’ này là AI không làm thay 99%. Vẫn có sự can thiệp của con người như dựng phim, diễn xuất, kịch bản, và họ không che giấu sự ‘kỳ quặc’ của AI mà còn tận dụng nó
Ví dụ, họ dùng trình tạo âm thanh AI để tạo sample sound, hoặc tự làm rồi công khai trên GitHub một bộ biểu tượng để ghi rõ có dùng AI hay không. Nhưng chỉ vì nhắc tới AI mà họ bị trút vào hàng loạt bình luận ác ý và cuối cùng đã gỡ video xuống
Sora cho cảm giác biến cái khó thành dễ, còn cái dễ thành khó. Tôi không nghĩ những người làm kiểu này sẽ được nhớ lâu
Dù vậy, tôi vẫn mong chi phí để làm ra kiểu video này cao hơn. Có lẽ đây không phải loại việc chỉ cần vài prompt đơn giản là xong
Gần đây trong quảng cáo, video do AI tạo ra đang ngày càng nhiều hơn. Chắc là để cắt giảm chi phí, nhưng kết quả là quảng cáo vốn trước đây chỉ gây khó chịu thì giờ đã đạt mức ghê gợn và gượng gạo
Khi nói về rủi ro AI, người ta chỉ bàn chuyện siêu trí tuệ, nhưng vấn đề thực tế là cuộc đua nội dung chất lượng thấp đang tăng tốc
Các dự án như The Codex Book cũng tạo cảm giác như đang bán tranh AI nhưng giả vờ là tác phẩm thủ công, nên tôi không tin tưởng
Nhiều người nói video AI mang lại ‘tự do sáng tạo’, nhưng trên thực tế phần lớn quyết định sáng tạo lại do AI đưa ra
Tông video, các cảnh cắt, màu sắc... rốt cuộc đều là kết quả học từ tác phẩm của người khác. Nói cách khác, video AI là một quá trình loại bỏ tính sáng tạo
Trước đây người ta từng chỉ trích nhạc sampling, nhưng giờ những nghệ sĩ như Fatboy Slim vẫn được công nhận; công nghệ rốt cuộc chỉ là một phương tiện biểu đạt mới
Tôi có ý tưởng làm phim, và nhờ AI mà giờ tôi có thể trực tiếp hình dung thành hình ảnh những gì có trong đầu
Lập luận “video AI là có hại” rồi cũng sẽ trở nên lỗi thời như câu “mọi loại video đều có hại” trước đây
Tôi đồng cảm với lo ngại của tác giả rằng “video AI khiến con người thao túng, lừa dối, bóc lột người khác”, nhưng kiểu lập luận nhị nguyên như “mọi video AI đều có hại” lại làm suy yếu thông điệp
Dĩ nhiên có nhiều video độc hại, nhưng đồng thời cũng có những tác phẩm nghệ thuật gây xúc động
Những kênh như kellyeld2323 và alffx123 là ví dụ
Ngay cả trước khi AI xuất hiện, phần lớn video trên internet đã là tuyên truyền, kích động phẫn nộ, thao túng tiêu dùng. Nếu áp cùng một tiêu chuẩn thì các video truyền thống vốn cũng đã đủ có hại
Tác giả đã chỉ ra đúng vấn đề, nhưng nguyên nhân gốc về mặt kỹ thuật là không thể kiểm soát
Các mô hình hiện tại như Sora, Veo, Runway là các bộ sinh xác suất nên không thể tạo ra đúng cảnh mà đạo diễn muốn
Với kẻ spam, chỉ cần một ‘gương mặt biết nói’ hay ‘thành phố đang cháy’ là đủ, nhưng nghệ sĩ thì cần góc máy, ánh sáng, tính nhất quán nhân vật thật chính xác
Trước khi các kỹ thuật kiểm soát không gian tiềm ẩn như phiên bản video của ControlNet phát triển hơn, video AI sẽ vẫn chỉ là máy tạo nhiễu số hơn là công cụ nghệ thuật
Tôi đồng ý rằng “AI không biến ai thành đạo diễn phim”, nhưng vấn đề thực tế là ngay cả người có tài cũng không có được cơ hội
Rất nhiều nhà sáng tạo không thể đưa tác phẩm ra thế giới vì thiếu vốn, thiếu mạng lưới quan hệ và cấu trúc ngành. AI có thể trở thành một cơ hội biểu đạt mới cho những người như vậy