1 điểm bởi GN⁺ 2025-08-27 | 1 bình luận | Chia sẻ qua WhatsApp
  • Video concert của Will Smith bị nghi là có khán giả giả do AI tạo ra, nhưng thực tế nó dựa trên các đoạn ghi hình của những người hâm mộ có thật
  • Video gây tranh cãi được tạo bằng cách trộn các cảnh biểu diễn với ảnh khán giả tại các lễ hội có thật, và một số cảnh khán giả đã được tạo hiệu ứng chuyển động bằng mô hình AI image-to-video
  • Tuy nhiên, khi được cộng thêm thử nghiệm hậu xử lý của YouTube Shorts (unblurring·denoise), khuôn mặt khán giả bị biến dạng kỳ quái và biển hiệu bị méo, khiến nó trông như đã bị AI thao túng
  • Cùng một video đăng trên Instagram·Facebook ít bị méo hơn, cho thấy cơ chế tự động chỉnh sửa của YouTube đã làm tình hình tệ hơn
  • Kết lại, khán giả là người thật, nhưng đây là một trường hợp gây tranh cãi thật-giả khi phần chỉnh sửa AI từ phía nghệ sĩ và bộ lọc của YouTube chồng lên nhau

Khởi đầu tranh cãi

  • Khi video dài 1 phút này được công bố, các hãng truyền thông lớn như Rolling Stone, NME, Mashable đã đưa tin về nghi vấn bị AI thao túng
  • Gương mặt khán giả trong video xuất hiện những biến dạng đặc trưng của AI, ngón tay thừa, ký hiệu kỳ quái
  • Đặc biệt, tấm biển có dòng “From West Philly to West Swizzy” bị nhận diện sai, làm tranh cãi càng bùng lên

Xác nhận cảnh biểu diễn thực tế

  • Video là bản dựng xen kẽ các cảnh khán giả từ Positiv Festival ở Orange, Pháp, cùng với Gurtenfestival·Paléo Festival ở Thụy SĩRonquieres Festival ở Bỉ
  • Ảnh chụp sự kiện liên quan và video do fan quay đã xác nhận cùng một người và cùng các biển hiệu, qua đó chứng minh đây là khán giả có thật
  • Cũng có cả tấm biển kể câu chuyện của một cặp đôi chống chọi với ung thư, và nhiều ảnh cùng video vẫn còn trên Instagram của Will Smith

Hai giai đoạn can thiệp của AI

  1. Đội ngũ của Will Smith đã dùng ảnh biểu diễn chính thức để tạo các clip ngắn bằng mô hình AI image-to-video (Runway, Veo 3, v.v.)
  2. Sau đó, hậu xử lý tự động của YouTube Shorts (unblur·denoise) được áp thêm, khiến video mờ hơn và biến dạng thiếu tự nhiên hơn

Thử nghiệm của YouTube Shorts

  • Bản đăng trên Instagram·Facebook tương đối rõ nét, nhưng YouTube áp dụng “thử nghiệm công nghệ tăng cường bằng AI”, khiến toàn bộ hình ảnh xuất hiện hiệu ứng méo mó
  • YouTube giải thích đây là “công nghệ làm sắc nét dựa trên machine learning truyền thống”, nhưng việc áp dụng mà không thông báo trước đã khiến tranh cãi lớn hơn
  • Sau phản ứng từ giới sáng tạo nội dung, công ty tuyên bố sẽ bổ sung tính năng opt-out

Kết luận

  • Phần lớn người dùng YouTube, Reddit, X đã tin rằng đây là “video dùng AI tạo ra fan giả”
  • Thực tế, khán giả thật đã xuất hiện, nhưng sau khi qua bước chuyển đổi image-to-video của đội ngũ Will Smith và hậu xử lý của YouTube, vẻ ngoài nhân tạo bị đẩy lên cực đại
  • Từ đó đặt ra nhu cầu phân biệt về mặt đạo đức giữa việc dùng mô hình image-to-video để thêm hiệu ứng hoạt họa ngắn cho ảnh sân khấu và việc tạo ra hoàn toàn một đám đông hư cấu
  • Kết lại, trường hợp này cho thấy hiện tượng một buổi diễn có thật lại trông ‘bớt thật hơn’ vì các công cụ AI

1 bình luận

 
GN⁺ 2025-08-27
Ý kiến trên Hacker News
  • Video được upscale bằng AI tạo cảm giác khó chịu chẳng khác gì sự gượng gạo trước khi tắt nội suy khung hình trên TV mới. Thật khó hiểu khi có người lại thấy kiểu độ nét nhân tạo sai lệch này là đẹp hơn. Gần đây tôi xem một bản upscale bằng AI của buổi diễn David Bowie & Nine Inch Nails, và đặc biệt ở mốc 2 phút, nó tạo ra cảm giác hiện thực bị lệch pha, khiến tôi cực kỳ bất an về mặt tâm lý. Video gốc tuy độ phân giải thấp nhưng lại giữ được bầu không khí và cảm giác có chủ ý tốt hơn nhiều. Giờ đã có máy quay và ống kính rất tốt rồi, chẳng cần ép chất lượng hình ảnh lên bằng AI làm gì
    • Điều đáng ngạc nhiên là có vẻ nhiều người lại thích kiểu chất lượng hình ảnh này. Hôm qua bạn đời tôi chọn điện thoại mới, và rất coi trọng chất lượng camera, thích việc phóng to vẫn nét. Nhưng sau một khoảng trễ ngắn sau khi zoom, nhìn hình ảnh bị tái cấu trúc nhân tạo, méo mó như bộ lọc upscale trong trình giả lập game console cũ, tôi thấy hơi chạnh lòng khi người mình thực sự yêu thích lại thích ảnh selfie làm mịn mặt và xóa tự nhiên, với phông nền bokeh giả trông rất thiếu tự nhiên, hơn là một bức ảnh chân thực
    • Tấm ảnh này thật sự rất buồn cười
    • Trước đây khi xem bộ phim truyền hình yêu thích trên TV mới của bố mẹ, tôi cứ thấy có gì đó lạ lạ, như thể phim rẻ tiền hơn, diễn xuất của diễn viên gượng hơn và lời thoại cũng dở hơn, nên cứ tự hỏi vì sao. Về sau mới biết thủ phạm là chế độ làm mượt tự động của TV đó. Đó là hiện tượng gọi là Soap Opera Effect
    • Việc cứ tiếp tục ép người tiêu dùng dùng những công nghệ họ không muốn là hệ quả của áp lực phải giữ giá cổ phiếu -> áp lực quản lý phải tăng thị phần -> gây sức ép lên PM phải thêm tính năng mới -> lập trình viên thì muốn thử công nghệ mới -> và rồi sinh ra những thứ như chatbot AI, tóm tắt bằng AI, màn hình cảm ứng trên ô tô, AI upscale mà chúng ta chẳng hề muốn
    • Đa số mọi người không thực sự nhận ra được khác biệt này. Tôi không có TV ở nhà, nhưng cứ sang nhà bạn là nhận ra ngay Soap Opera Effect. Cả hai lần tôi đều bảo họ thử tắt đi, và sau đó bạn tôi cũng đồng ý, không bật lại nữa. Nhưng thật ra phần lớn chỉ là họ tin lời tôi thôi, chứ tôi không chắc họ có thật sự nhận ra khác biệt hay không. Nếu bạn muốn thử tắt tính năng này, hãy tìm kiếm kiểu “tên hãng TV soap opera effect” là sẽ ra cách tìm cài đặt. Cần chú ý vì mỗi hãng thường dùng tên rất kỳ quặc cho nó. Ở đoạn 2 phút 6 giây, khuôn mặt thay đổi đặc biệt rõ, trong khi bản gốc ở đoạn đó khá mờ. Bản AI hoàn toàn không hiểu các hiệu ứng camera. So sánh bản upscale AI với bản gốc thì thấy rất rõ. Cảm ơn vì đã đưa cả hai link để dễ đối chiếu
  • Nhiều bình luận nói về YouTube, nhưng theo nội dung bài báo thì phần lớn công việc AI là do đội của Will dùng AI để biến ảnh tĩnh thành video. Trên thực tế, YouTube chỉ làm cho kết quả cuối cùng bớt mờ đi một chút, còn những artefact AI thật sự khó chịu thì chủ yếu phát sinh ở giai đoạn sản xuất video. Điều này chỉ áp dụng cho Shorts. Xem video so sánh
    • Trong video đó thì khó thấy rõ khác biệt
  • Tôi tự hỏi nếu Coldplay dùng công nghệ này vào mùa hè năm nay thì sẽ thế nào. Nói nghiêm túc thì xu hướng nhét AI vào mọi thứ khá đáng lo. Trước đây việc khám phá nhạc mới qua Spotify Discover Weekly thực sự rất vui, nhưng dạo này có quá nhiều bài do AI tạo ra nên trải nghiệm bị mất hứng
    • Tôi bắt đầu muốn bỏ Spotify, mua CD ở tiệm nhạc địa phương và tự xây dựng bộ sưu tập nhạc của mình bằng đầu đọc CD USB. Cứ mải chạy theo nhạc mới nhất và theo đuổi việc “có mọi bài hát trên đời” khiến tôi có cảm giác chúng ta đã đánh mất yếu tố cảm xúc của việc con người chia sẻ âm nhạc với nhau
    • Có thể đúng vậy. Niềm vui khi tình cờ phát hiện một viên ngọc quý trong hệ thống gợi ý âm nhạc là điều quan trọng, và khi nhạc do AI tạo bị trộn vào thì phép màu đó biến mất. Spotify chưa từng chính thức nói rằng họ đẩy mạnh gợi ý nhạc AI, nhưng trong 1 năm gần đây, nhạc AI đã bùng nổ trên toàn bộ các nền tảng streaming. Thuật toán của Spotify cũng thường gợi ý mà không phân biệt nhạc do người hay AI tạo ra, đặc biệt với ambient, lo-fi, EDM và pop dễ nghe — những thể loại AI rất dễ bắt chước. Cuối cùng, rất nhiều người thấy khó chịu khi AI len vào những lĩnh vực vốn cần sự tuyển chọn của con người hoặc cách tiếp cận mang tính nghệ thuật. Nếu bạn muốn, tôi cũng có thể tìm xem có cách nào lọc nhạc AI hoặc chỉ nhận gợi ý nhạc do con người làm trên từng dịch vụ hay không
  • Vấn đề cốt lõi thật sự ở đây là <i>sự đồng ý</i>. Ai cũng hiểu rằng khi vào địa điểm biểu diễn thì đồng nghĩa chấp nhận bị chụp ảnh, quay phim, nhưng liệu có ai thật sự đồng ý một cách rõ ràng cho việc đội ngũ của nghệ sĩ dùng AI biến khuôn mặt của mình thành video giả hay không thì rất đáng nghi ngờ. Tôi cũng thực sự tò mò không biết chuyện này có hợp pháp ở mọi quốc gia hay không
    • Có lẽ ở điều khoản trên trang mua vé hoặc biển báo ở cổng vào đã có những câu như “vào cửa đồng nghĩa chấp nhận bị ghi hình” các kiểu. Về mặt đạo đức thì không hay lắm, nhưng về pháp lý thì có lẽ là trường hợp đã được che chắn khá kỹ
  • Nếu tôi là người làm marketing, tôi sẽ cố tình khiến hình ảnh thật trông như do AI tạo để kiếm hiệu ứng lan truyền miễn phí. Chẳng gì thu hút chú ý bằng lỗi sai hay tranh cãi ảnh ghép. Nếu thực sự không phải đồ giả thì nghệ sĩ hay ê-kíp cũng chẳng bị thiệt gì. Tôi từng nói chuyện với quản lý mạng xã hội của một thương hiệu lớn, họ bảo đôi khi còn cố tình đăng bài sai chính tả để kéo thêm bình luận và tương tác
    • Người ta gọi đó là ragebait. Trong ngành marketing thì đây đã là chiêu khá phổ biến
    • Poster phim Naked Gun mới cố tình vẽ thừa ngón tay cũng là một ví dụ như vậy
  • Tôi không biết là phần cứng/phần mềm hay mắt của mình có vấn đề không, nhưng khi đặt YouTube và Instagram cạnh nhau thì tôi chẳng nhận ra khác biệt lớn nào. Nếu không phải mắt có vấn đề thì tôi nên kiểm tra gì, có cần nâng cấp màn hình không? GPU của tôi không tệ, nhưng tôi đang dùng cả bộ chuyển HDMI-VGA. Tuy vậy, ảnh tĩnh thì thật sự kỳ quặc đến mức khó mà chịu nổi. Tôi nghĩ video chắc cũng có nhiều khung hình bị bóp méo nhân tạo như thế
    • Video khác ở chỗ các sai lệch tinh vi hơn. Không phải khung hình nào cũng lộ rõ, nhưng thường có cảnh nền đột nhiên nét rồi lại mờ, hoặc phần tóc và cổ của nhân vật xuất hiện kết cấu kỳ lạ, còn viền mặt thì quá rõ trong khi da lại mịn một cách phi tự nhiên. Nó tạo cảm giác kiểu Max Headroom
  • Xung quanh tôi thật sự không có lấy một người muốn những tính năng này. Tôi rất muốn biết vì sao họ cứ liên tục đưa vào những thứ phức tạp và không cần thiết như vậy
    • Cũng giống như một số quốc gia thử nghiệm vũ khí ngoài thực địa để tích lũy kinh nghiệm, đôi lúc tôi tự hỏi liệu Google có đang xây dựng năng lực tổ chức để chuẩn bị cho ngày sau này thật sự khai thác AI một cách nghiêm túc hay không
    • Sự phức tạp có thể là điều tất yếu ở vài thứ, nhưng nếu không sinh lợi thì chẳng có lý do gì để thúc đẩy nó
  • PM của YouTube: “Hãy làm cho video do AI tạo và video thật khó phân biệt hơn nữa để người dùng thấy nó tự nhiên hơn!”
    • Tôi thậm chí không nghĩ là có ác ý có tính toán đến vậy. Những người thật sự cuồng AI chỉ đơn giản muốn nhét AI vào mọi sản phẩm, và nếu cấp trên nói “AI tuyệt lắm, cứ đưa vào đi” thì họ sẽ hất nó vào tất cả. Các cuộc họp cũng không còn xoay quanh “hãy giải quyết vấn đề X của người dùng” mà là “chúng ta có thể thay đổi phần nào của sản phẩm bằng AI?”
    • Sai lệch về động lực còn thực tế hơn là ác ý. KPI của ai đó được gắn với việc triển khai tính năng AI, và vì thế chỗ của bộ lọc sharpen + denoise cũ của YouTube giờ được thay bằng “AI enhancement”
    • Thực tế YouTube cũng có hướng dẫn giải thích về biến đổi bằng AI
    • Cách tiếp cận này ngược lại còn có thể khiến cả video tin tức thật cũng bị nghi là tổng hợp bằng AI, làm suy giảm niềm tin. Người ta sẽ càng cảnh giác hơn và ít tin hơn
    • Thế hệ sau này sẽ lớn lên trong một môi trường truyền thông hoàn toàn khác với các thế hệ trước
  • Đây là một trong những nỗ lực kiểu “hãy khiến AI trở nên hữu ích”, và tôi thực sự tự hỏi ai đã nghĩ ra tính năng này. Đằng nào cũng đã có bản gốc HD, thì chẳng có lý do gì phải tốn tiền cung cấp bản upscale nữa. Mà kể cả chỉ áp dụng cho video chất lượng thấp, nó vẫn bóp méo cảm giác chân thực nên càng thấy nghiêm trọng hơn
    • Với Google, tính chân thực không quan trọng. Thứ họ quan tâm là quảng cáo và mức độ tương tác
  • Nếu bán áo thun có dòng chữ “AI glitch”, rồi ảnh nào chụp cũng xuất hiện hiệu ứng kiểu này, thì cuối cùng thật giả sẽ càng khó phân biệt hơn nữa
    • Có lẽ theo thời gian, kiểu áo này sẽ trở thành một món đồ nhất thời rồi biến mất, giống như phụ kiện ngón tay thứ sáu (vấn đề tiêu biểu của AI tạo sinh) hay mặt nạ 5 chiếc kính (để né nhận diện khuôn mặt)
    • Loại áo đó thực ra đã tồn tại rồi, và nhiều trường hợp chỉ là in thẳng những câu do ChatGPT xuất ra mà không hề kiểm chứng gì cả