- Bản demo AI mới nhất của Meta gặp lỗi trong buổi trình diễn trực tiếp
- Bản ghi âm giọng nói được giới thiệu là "AI" đã phát ra trước khi diễn viên thực sự di chuyển
- Nhiều người tham dự nhận ra đây không phải trình diễn thời gian thực mà là bản ghi sẵn
- Nghi vấn và tranh cãi về độ tin cậy của bản demo ngày càng gia tăng
- Sự việc này làm dấy lên vấn đề về độ tin cậy của công nghệ AI và cách thức trình diễn công khai
Tổng quan sự việc
- Trong sự kiện trình diễn AI do Meta tổ chức, một sự cố đã xảy ra giữa lúc demo trực tiếp
- Trong khi ngoài thực tế diễn viên còn chưa kịp di chuyển, giọng nói ghi âm được gắn nhãn "AI" đã bị phát trước
- Những người có mặt tại hiện trường nhanh chóng nhận ra điều đó, làm lộ rõ đây không phải là demo thời gian thực
Vấn đề chính và phản ứng
- Sự cố này khiến nhận thức tiêu cực về độ tin cậy của bản demo của Meta lan rộng
- Trong và ngoài ngành, ngày càng có nhiều tiếng nói yêu cầu tính minh bạch và tính xác thực của công nghệ AI
Tác động đến ngành
- Vụ việc trở thành dịp để một lần nữa nhấn mạnh nhu cầu bảo đảm độ tin cậy của công nghệ AI
- Trong các buổi trình diễn công khai sắp tới, xu hướng coi trọng hơn việc bảo đảm quy trình chính xác và tính trung thực đang hình thành
1 bình luận
Ý kiến trên Hacker News
Có thêm một ví dụ tệ nữa với Zuck
https://old.reddit.com/r/interestingasfuck/comments/1nkbqyk/zuckerberg_invested_billions_in_new_tech_to_watch/
Cuối cùng thì đây là thứ chúng ta đi đến sao? Đây là trí tuệ nhân tạo sao? Họ tiêu hàng tỷ đô chỉ để giải thích công thức bằng lời à? Thật khó hiểu khi bỏ ra ngần ấy tiền cho thứ có thể viết lên giấy
Nếu không có màn fail lớn như thế này thì tôi còn chẳng biết là đã từng có buổi demo đó. Marketing tiêu cực thì vẫn là marketing, và nó vẫn có tác dụng
Xem đúng là đau đớn. Không thể tin nổi là tôi đã chịu được tận 2 phút
Big Tech đã chi 155 tỷ USD cho AI trong năm nay. Và họ dự định còn chi thêm hàng trăm tỷ nữa
https://www.theguardian.com/technology/2025/aug/02/big-tech-ai-spending
Đây là thứ tuyệt nhất tôi từng thấy trong đời. Tôi vui đến mức không biết phải nói gì
Video đó không phải quay sẵn trước, nhưng là một demo bị dàn dựng. Có thể sau nhiều lần tập dượt thì AI đã bị lẫn. Không có gì để bào chữa cả. Họ đổ ngân sách cỡ chương trình Apollo vào mà nó vẫn ngớ ngẩn. Meta là công ty vốn hóa khoảng 2 nghìn tỷ USD mà vẫn liên tục làm tôi ngạc nhiên vì không tạo nổi một sản phẩm tử tế
Không phải quay sẵn từ trước, nhưng có cảm giác họ đã chuẩn bị sẵn các phản hồi theo kịch bản cho những cụm thoại nhất định. Vì vậy khi lặp lại "what do I do first" thì nó cứ trả cùng một đáp án (sai) mãi. Nếu là một model thật thì nó đã không lặp lại cùng một câu trả lời như thế, mà sẽ cố sửa theo cách trực tiếp hơn
Mảng kinh doanh cốt lõi của Meta kiếm bộn tiền từ quảng cáo và theo dõi dữ liệu, nên các mảng còn lại có làm gì đi nữa thì cũng chẳng quan trọng
Vậy rốt cuộc... ý là nó chẳng khác gì một cục đá
Giờ đây sự trung thực là ốc đảo giữa biển lừa đảo và mạo danh của năm 2025. Tôi chỉ đang chờ ngày mọi bong bóng nổ tung
Tôi cũng nghĩ tương tự—có vẻ bộ nhớ đã không được xóa sạch sau buổi diễn tập trước đó. Và bản thân kịch bản sử dụng này cũng rất khó hiểu: người này đã có sẵn một căn bếp tuyệt vời, đầy đủ nguyên liệu và cả miếng steak, nhưng lại hoàn toàn không biết cách làm sốt sandwich
Bài trên Kotaku có một cú chốt rất hay
Phải thừa nhận là demo live rất khó. Hôm qua không tạo cảm giác bị dàn dựng gượng ép, mà giống một sự cố bất ngờ do chỉnh sửa vào phút chót hơn. Hầu hết builder đều từng trải qua chuyện này. Tôi cũng từng ở hackathon, sửa vào giờ chót làm server sập và phải vật lộn suốt 6 tiếng trước khi lên sân khấu
Demo live đặc biệt khó khi thứ bạn đang bán là một sản phẩm mang tính lừa bịp
Đã có lần CEO Nokia phải demo sản phẩm mới nhất trên sân khấu tại một hội chợ điện thoại lớn. Đối tác kinh doanh của tôi và tôi đã tự viết demo đó, nhưng việc đưa nó lên server cuối cùng khó đến mức chúng tôi rốt cuộc phải chạy nó trên một chiếc PC cũ kỹ nhét trong tủ quần áo nhà bạn tôi với đường truyền 2Mbit. Tôi đã đứng xem buổi demo trên sân khấu mà mồ hôi túa ra
Tôi ghét Meta, nhưng đúng là demo live rất khó. Nếu mọi thứ đều biến thành thế giới quay sẵn và biên tập kỹ thuật số hết thì tôi thấy cũng chán
Demo live khó không có nghĩa là có thể lấy đó làm lý do để gian lận
Tôi xem lại video rồi mà vẫn không hiểu lắm vì sao họ cắt ngay phản hồi đầu tiên vốn có vẻ ổn. Tôi đoán có thể bị trễ âm thanh, hoặc họ hoảng vì khác với lúc diễn tập
Tôi có một người bạn biểu diễn ảo thuật đồng thời làm stand-up comedy. Cả hai đều là biểu diễn live, nhưng chưa từng thấy ai bán show bằng tagline kiểu đó ngoài anh ấy. Mở màn anh ấy nói đùa: "Hôm nay là một buổi diễn ảo thuật. Nhưng nếu ảo thuật fail thì tôi sẽ làm thành comedy show." Zuck, tôi có thể giới thiệu bạn tôi với giá rẻ. Có lẽ anh cần mở rộng tiết mục biểu diễn để hòa đồng với mọi người hơn
Nếu bạn anh chưa biết đến Tommy Cooper, một ảo thuật gia người Anh, thì tôi thật lòng khuyên nên tìm xem thử
https://en.wikipedia.org/wiki/Tommy_Cooper
Hay là bạn anh vốn không giỏi ảo thuật nên chỉ là người hài hước thôi? Hay là anh ấy cố tình dàn dựng một vài màn thất bại?
Tôi nghĩ dù có tập dượt hàng chục lần thì họ cũng chưa từng fail thảm hại như lúc live. Dù vậy, tôi vẫn đánh giá cao việc họ tiếp tục bám vào demo live. Apple giờ demo nhạt đến mức cảm giác như chỉ xem một quảng cáo dài 2 tiếng
Việc được thấy model thực sự hoạt động thế nào trong môi trường thật (và có lẽ cũng gần giống cảnh trong demo) khá thú vị. Nhưng tôi không đồng tình với nghi ngờ rằng demo lần này là quay sẵn. Thực tế có lẽ chỉ là một nguyên mẫu chưa hoàn thiện, nên bị lược bỏ các bước chính hoặc luồng không được sửa do thiếu năng lực multimodal. Cũng có thể đó là một bản ghi được dàn dựng, nhưng điều đó không quá quan trọng. Cuối cùng thì trong sử dụng thực tế, độ chính xác, độ trễ và tính tiện dụng mới là thứ cốt lõi với người dùng thật. Ví dụ như công cụ viết chữ bằng cử chỉ, trông thì ngầu nhưng hiện tại tôi không nghĩ nhiều người sẽ muốn dùng nó cho phần lớn tin nhắn. Nó hay đấy, nhưng lúc này có vẻ khó được chấp nhận rộng rãi
Không khí đang quá tiêu cực. Dù vậy, tôi nghĩ ngành của chúng ta tiến bộ vì được dẫn dắt bởi những người lạc quan, và vì về mặt xã hội chúng ta có một nền văn hóa sẵn sàng đầu tư vào những thách thức công nghệ khổng lồ. Thay vì mua lại cổ phiếu, Meta đang làm máy tính có thể nói chuyện với con người, nhìn, giải quyết vấn đề và vẽ các yếu tố ảo lên thế giới thực. Tôi đánh giá cao việc họ dám thử demo live
Tôi lo rằng bầu không khí chế giễu, mỉa mai đang ngày càng giống Reddit. Việc bài được upvote cao nhất lại là một link Reddit cũng khá thất vọng, và tôi đã theo dõi cộng đồng này ít nhất 10 năm nên không phải là ảo giác của người mới
Anh ta là CEO của một công ty hàng chục tỷ đô và đang hứa hẹn về công nghệ sẽ ảnh hưởng đến việc làm của rất nhiều người. Chừng đó là đủ để bị kiểm chứng cực kỳ nghiêm ngặt
Lúc này bạn chỉ đang phóng chiếu hy vọng của mình lên những kẻ lừa đảo và dối trá mà thôi. Họ cần bị chỉ trích và chế giễu thì những nhà đổi mới thực sự mới có cơ hội
Khác hẳn với thời iPhone ngày xưa, khi các demo trong kỷ nguyên công nghệ mới được xuất hiện còn có thể chấp nhận thất bại. Giờ thì Meta và những công ty kiểu này đã rao bán suốt nhiều năm rằng họ sẽ "đưa AI vào mọi nơi và thay đổi thế giới", nhưng đến cả một công thức sốt steak đơn giản cũng không làm nổi. Chính khoảng cách đó mới là cốt lõi của sự chế giễu. Đẳng cấp hoàn toàn khác
Tôi không nghĩ đó là gian lận. Khi debug bằng Claude trong trình duyệt, bạn cũng sẽ ra kết quả tương tự. Vì thế ngoài thực tế người ta không dùng nó nhiều. Ở đâu đó trong pipeline, nó hơi lười hoặc tự đi trước rồi chỉ diễn giải những gì nó muốn cho bạn xem. Nó muốn "trông như đã hoàn thành". Điều này giống với vấn đề LLM giả vờ vượt qua bài test. Đôi khi chỉ cần giả vờ đạt đến trạng thái mục tiêu là trong học RL đã có hiệu ứng như vượt qua rồi. Không phải do Wi‑Fi, mà là đặc tính của genAI
Với các tác vụ nhỏ, nó rất xuất sắc như một công cụ tự động hoàn thành. Với những việc bạn đã làm nhiều lần thì nó hữu ích. Nhưng tôi sẽ không thể đặt cược mọi thứ vào các model kiểu này
Việc bắt Claude diễn giải các mũi tên trong ảnh là cực kỳ khó. Tôi đã thử đưa cho nó một flowchart và nó làm rất tệ
Có câu nói "đừng làm việc với trẻ em, động vật và múa rối"
https://tvtropes.org/pmwiki/pmwiki.php/Main/NeverWorkWithChildrenOrAnimals#:~:text=Jim%20Henson%20states%20that%20he'd%20been%20told%20never%20to%20work%20with%20children%2C%20animals%2C%20or%20puppets.