AI của Google đang bị thao túng. Gã khổng lồ tìm kiếm đang âm thầm phản công

(bbc.com)

2 điểm bởi GN⁺ 2026-05-21 | 1 bình luận | Chia sẻ qua WhatsApp

AI Overviews và các câu trả lời tìm kiếm bằng AI như ChatGPT có thể bị làm lệch trên các chủ đề nhạy cảm như sức khỏe và tài chính chỉ bằng một trang web hoặc bài đăng đơn lẻ
Trong một thí nghiệm của BBC, chỉ một bài viết trên trang cá nhân đã khiến ChatGPT và Google trả lời rằng tác giả là nhà vô địch thế giới môn ăn hotdog
Khi AI tổng hợp kết quả tìm kiếm trên web và đưa ra một câu trả lời duy nhất, người dùng dễ tiếp nhận nó như đáp án đúng hơn so với kiểu tìm kiếm phải tự so sánh nhiều liên kết
Google đã nói rõ việc thao túng phản hồi AI là hành vi vi phạm chính sách chống spam, và các trang vi phạm có thể bị gỡ khỏi kết quả tìm kiếm hoặc bị hạ thứ hạng
Những kẻ thao túng có thể chuyển sang YouTube influencer và các kênh khác để né việc siết blog, vì vậy cần giữ thái độ không tin nguyên xi vào câu trả lời của AI

Vấn đề thao túng câu trả lời tìm kiếm bằng AI

AI Overviews ở đầu Google Search, cùng với ChatGPT và Gemini, có thể bị thao túng để đưa ra câu trả lời thiên lệch ngay cả với những chủ đề quan trọng như sức khỏe và tài chính cá nhân
Trong cuộc điều tra của BBC, chỉ với một bài viết duy nhất đăng trên website cá nhân, họ đã khiến ChatGPT và Google trả lời rằng tác giả là “nhà vô địch thế giới môn ăn hotdog”
Cùng một cách làm này cũng dường như đã được dùng để làm giảm nhẹ lo ngại sức khỏe về thực phẩm bổ sung y tế, hoặc tác động đến thông tin tài chính liên quan đến nghỉ hưu
Chuyên gia tư vấn SEO và tìm kiếm AI Lily Ray cho rằng trong môi trường nơi AI đưa ra “một đáp án duy nhất”, người dùng sẽ dễ tin nguyên câu trả lời hơn là so sánh nhiều liên kết như tìm kiếm truyền thống
Google cho biết họ đã áp dụng các chính sách chống spam và biện pháp bảo vệ hiện có cho cả các tính năng tìm kiếm AI tạo sinh, đồng thời đã tăng cường đối phó spam để bắt kịp các thủ thuật mới từ trước cả khi AI xuất hiện

Cách thao túng này hoạt động

Các câu trả lời chatbot thông thường dựa trên dữ liệu được nhúng trong mô hình, nhưng rủi ro thao túng tăng lên khi chúng tìm câu trả lời trên internet như ở các sản phẩm AI của ChatGPT, Claude và Google
Khi công cụ AI lấy thông tin từ một trang web đơn lẻ hoặc một bài đăng mạng xã hội, chỉ một nội dung giả được làm khéo cũng có thể làm ô nhiễm câu trả lời
Chỉ cần đăng một bài blog được dàn dựng tinh vi lên mạng cũng có thể thay đổi nội dung mà AI truyền đạt tới công chúng
Kiểu thao túng này nhanh chóng được nhìn nhận như một cơ hội kiếm tiền, và thông tin sai lệch hoặc thiên lệch có thể ảnh hưởng đến bầu cử, việc chọn nhà cung cấp dịch vụ, tư vấn y tế và cả phán đoán pháp lý
Harpreet Chatha nhấn mạnh rằng ngoài tác động kinh tế, còn có nguy cơ khiến tình trạng bệnh xấu đi vì tư vấn y tế sai, hoặc khiến người dùng hành động không phù hợp với luật pháp của quốc gia hay địa phương mình

Thay đổi chính sách và phản ứng của Google

Trên toàn cầu, hơn 1 tỷ người dùng chatbot AI thường xuyên và 2,5 tỷ người xem AI Overviews của Google mỗi tháng, nên nếu những công cụ này bị gây nhiễu thì tác động sẽ là rất lớn
Tuần trước, Google đã cập nhật chính sách chống spam để chính thức xác nhận rằng các nỗ lực thao túng phản hồi AI là vi phạm quy định của công ty
Các công ty hoặc website vi phạm quy tắc có thể bị xóa khỏi kết quả tìm kiếm Google hoặc bị hạ thứ hạng
Google nói thay đổi này không phải là chuyển hướng cách tiếp cận mà là một sự “làm rõ”, và trước đó trong năm 2025 họ đã giải thích về các nỗ lực chống spam liên quan đến AI Overview và AI Mode
Tuy vậy, thí nghiệm về hotdog vẫn thành công gần một năm sau đó, và tuần này Lily Ray cũng thực hiện một thí nghiệm tương tự khiến Google trả lời rằng một chuyên gia SEO là người rất giỏi xây lâu đài cát

Những thay đổi được quan sát và giới hạn của chúng

Theo Ray và Chatha, trong vài tháng gần đây đã xuất hiện những thay đổi cho thấy Google và các công ty khác đang thử nghiệm giải pháp
Có những trường hợp dường như Google và ChatGPT âm thầm loại một công ty khỏi câu trả lời AI nếu nghi ngờ đó là nội dung tự quảng bá
Ví dụ, nếu một bài viết tự nhận mình là nhà vô địch ăn hotdog số một, AI có thể vẫn trích bài đó nhưng loại tên người đó khỏi danh sách ứng viên
Cũng có trường hợp Google và các công cụ AI khác gắn thêm nhiều nhãn bất định vào câu trả lời để báo rằng chatbot không thực sự chắc chắn
ChatGPT và Claude của Anthropic đã bắt đầu trả lời rõ ràng ở một số truy vấn rằng họ đang cố lọc spam, và Anthropic là công ty tạo ra Claude
Ray cũng nói cô thấy Google thêm nhiều dấu hiệu hơn trong các câu hỏi liên quan đến quyết định mua hàng và khuyên người dùng kiểm tra các đánh giá từ bên thứ ba
OpenAI và Anthropic từ chối bình luận, còn người phát ngôn của Google không trả lời các câu hỏi về những thay đổi này

Cuộc rượt đuổi lặp lại giữa kẻ thao túng và nền tảng

Chatha cho rằng chỉ những thay đổi này thì sẽ không đủ, và ví phản ứng của Google với trò đập chuột chũi
Khi Google siết các bài blog mang tính thao túng, các công ty sẽ tìm cách tự quảng bá kín đáo hơn
Website có thể bị phạt, nhưng rất khó ngăn cách trả tiền cho 20 YouTube influencer để họ nói rằng một sản phẩm là tốt nhất
Vì AI của Google giờ cũng trích dẫn cả video YouTube, các thủ thuật thao túng có thể dịch chuyển sang đó và vòng lặp sẽ tiếp tục
Ở thời điểm hiện tại, khả năng cao là kẻ thao túng vẫn đi trước một bước, và cách tự vệ tốt nhất là nhớ rằng AI là công cụ có thể tự tin đưa ra một câu trả lời duy nhất dù đúng hay sai
Ngay cả khi câu trả lời xuất hiện qua giao diện của các tập đoàn công nghệ lớn, cũng không nên mặc định rằng nó đáng tin hơn một website ngẫu nhiên

1 bình luận

GN⁺ 2026-05-21

Ý kiến trên Hacker News

Google ít nhất từ thời Blekko năm 2006 đã không lọc nổi rác spam khỏi chỉ mục tìm kiếm một cách tử tế, nên tôi cũng không nghĩ lần này họ sẽ chặn tốt hơn
Dù vậy, đây có vẻ là thêm một ví dụ hay cho thấy “AI” rốt cuộc chỉ là tìm kiếm được tô vẽ cho có vẻ hợp lý, chứ phía sau không hề có suy luận hay tư duy nào diễn ra
- Tôi không nghĩ kết luận đó theo sau một cách hợp lý. Nếu phải nói mà không có cách diễn đạt nào hay hơn, thì chuyện này giống việc LLM “dễ bị lừa” hơn
  Tôi không thấy nó khác mấy so với con người tin ngay những gì họ đọc trên internet. Con người cũng luôn bị spam và lừa đảo qua mặt, nhưng điều đó không có nghĩa họ chỉ là tìm kiếm được tô vẽ cho có vẻ hợp lý ;-)
  Tuy vậy, nó cho thấy rất rõ vấn đề mà mọi công cụ tìm kiếm đều phải đối mặt. Spam do AI tạo ra sẽ khó chặn hơn rất nhiều bằng các cách thống kê truyền thống, và điều đó còn đúng ngay cả trước khi đi đến vấn đề mang tính sống còn là prompt injection
  Có lẽ đây là điểm mà báo chí có thể giành lại vị trí của mình trong mối quan hệ với Big Tech. Theo nghĩa là trở thành nguồn thông tin đã được kiểm chứng và biên tập mà LLM có thể tin cậy một cách mù quáng, và những thỏa thuận như OpenAI / Atlantic có thể mang ý nghĩa đó
- Việc sinh mã mới thì khó giải thích là tìm kiếm được tô vẽ cho hợp lý
  Có thể cho một hệ thống agent đọc vài datasheet, rồi mô tả yêu cầu dự án và để nó thiết kế đặc tả driver, protocol, interface, state machine. Từ đó nó có thể lập kế hoạch triển khai, viết khung ứng dụng rồi điền dần vào để tạo ra một hệ thống chạy được trên tổ hợp phần cứng mới
  Nếu làm đúng, bạn sẽ có được đoạn mã dễ bảo trì hơn và nhỏ hơn so với thứ ngày xưa một nhóm nhỏ làm ra, với chi phí bằng 1/100, thời gian bằng 1/4
  Dù đó là gì thì nó vẫn có vẻ gần với suy luận hơn là tìm kiếm. Tất nhiên, nếu bạn gọi cả việc phát triển C bare-metal trên phần cứng mới là tìm kiếm, thì cuối cùng mọi hoạt động phát triển đều là tìm kiếm
- Tôi từng đăng video và bài Reddit về ống kính vintage, và cố tìm xem chiếc ống kính đó cũ đến mức nào
  LLM đưa ra mốc thời gian kiểu “được sản xuất trong thập niên 1940” rồi dẫn chính bài viết của tôi làm căn cứ, trong khi bài đó hoàn toàn không có năm sản xuất
- Google hoàn toàn có đủ năng lực để giải quyết chuyện này, và thực ra cũng không khó đến thế
  Lý do vấn đề vẫn cứ khó là vì phần lớn giải pháp đều sẽ làm giảm mạnh doanh thu quảng cáo
- AI Overview của Google có vẻ như lấy các mẩu tìm kiếm qua RAG rồi để một LLM rất nhanh tóm tắt lại. Tôi sẽ không gọi đó là tìm kiếm được tô vẽ cho hợp lý
Giả định kỳ lạ nhất trong thread này là Google muốn câu trả lời AI phải chính xác
Chỉ cần đủ đúng để người dùng không rời khỏi trang là được. “Sự thật” ngay từ đầu chưa từng là sản phẩm; sản phẩm là khiến người dùng chi tiền cho SEO
- Tôi thấy câu đó không hẳn đúng. Phần lớn SEO là việc do bên thứ ba làm
  Sản phẩm ở đây là lượt hiển thị quảng cáo, và Google từ lâu đã thôi quan tâm đến kết quả tìm kiếm không phải quảng cáo. Dù vậy, có lẽ họ vẫn quan tâm đến danh tiếng của mô hình, và vụ này thực sự có thể ảnh hưởng đến điều đó
Thấy kết quả bị thao túng là truy vấn sau đây thì tôi bớt lo đi khá nhiều
2026 South Dakota International Hot Dog Eating Champion
Nếu họ thay đổi được phần tổng quan về người thắng cuộc thi của Nathan’s thì sẽ nghiêm trọng hơn nhiều. Cũng sẽ vậy nếu họ cho thấy thêm ví dụ thao túng những truy vấn mà người ta thực sự tìm kiếm
Hiện tại nó giống như tạo một trang Wikipedia giả về một cuộc thi ăn hot dog hư cấu ở South Dakota rồi viết bài nói rằng không thể tin Wikipedia. Nghĩ lại thì chắc khoảng năm 2005 cũng đã có người viết bài kiểu đó rồi
- Đúng vậy. Nghĩa là chỉ một người thôi cũng làm được đến mức đó
  Nghĩ đến việc Reddit, phần lớn mạng xã hội, hay các nỗ lực thao túng Wikipedia vì lợi ích chính trị chứa bao nhiêu bài đăng điều hướng dư luận, thì đây là một vấn đề rất thực tế
- Bài báo còn có đoạn này nữa. “Nhưng cuộc điều tra cho thấy cùng thủ thuật đó cũng được dùng để phớt lờ các lo ngại sức khỏe về thực phẩm bổ sung y tế, hoặc tác động đến thông tin tài chính mà Google AI cung cấp liên quan đến nghỉ hưu”
  Đáng lo hơn hot dog rất nhiều
- Ngược lại thì tôi lại lo ngay lập tức hơn. Gần đây Gemini bắt đầu hiện spinner tìm kiếm ở mỗi lượt
  Khi đó mọi phản hồi có gắn tìm kiếm đều có thể bị lộ trước prompt injection, và thực tế có thể là hầu như mọi phản hồi đều như vậy
  Chuyện này sẽ lan truyền kiểu viral như spam link. Tất cả các trang nội dung do người dùng tạo ra sẽ trở thành nơi lưu trữ prompt injection. Vấn đề là những thứ này khó phát hiện hơn link rất nhiều
- Tôi từng gặp trường hợp ai đó chen được số điện thoại hỗ trợ khách hàng lừa đảo vào AI Overview
  Google mất một tuần mới sửa, và cách làm là đầu độc kết quả tìm kiếm để dữ liệu của họ xuất hiện trong những nguồn có vẻ thuộc tầng tin cậy cao hơn, có lẽ là các website hợp đồng chính phủ. Vì vậy số lừa đảo xuất hiện thay cho số của chúng tôi, và bản thân truy vấn chỉ là tìm kiếm đơn giản
- “Chỉ trong 20 phút, tôi đã lừa được ChatGPT và Google nói với công chúng rằng tôi là nhà vô địch thế giới ăn hot dog. Trò đùa thì ngớ ngẩn, nhưng vấn đề thì nghiêm trọng”
  Cái này còn tệ hơn việc cài thao túng dư luận vào một trang Wikipedia. Wikipedia có hệ thống nguồn dẫn và rà soát được công khai rất đầy đủ. Thực tế rất khó để một chỉnh sửa gian trá tồn tại lâu, và bạn phải qua mặt rất nhiều biên tập viên là con người đã chiến đấu với những kiểu người như vậy suốt hàng chục năm. Ngay cả khi bạn muốn đóng góp chính xác và hữu ích thì cũng khó mà chen chân vào cộng đồng khép kín đó
  Ngược lại, các mẩu tìm kiếm của Google đang tuyệt vọng hút vào mọi loại dữ liệu rồi xử lý tự động, còn hệ thống thuật toán quyết định thông tin nào tốt và thứ gì là spam thì mang tính độc quyền
  Cũng chẳng cần trí tưởng tượng ghê gớm gì để hình dung cách lạm dụng. Nếu ai đó tìm tên bạn và thấy nội dung gây xấu hổ thì sao? Khó mà mong nhà tuyển dụng tiềm năng, khách hàng hay bạn bè lại khắt khe trong việc xác minh nguồn như các biên tập viên Wikipedia
Tôi muốn đọc ví dụ cụ thể về việc “cùng thủ thuật đó được dùng để phớt lờ các lo ngại sức khỏe về thực phẩm bổ sung y tế, hoặc tác động đến thông tin tài chính mà Google AI cung cấp liên quan đến nghỉ hưu”, nhưng link liên quan trong bài hiện lại trỏ đến file cục bộ bên dưới
file:///Users/GermaTW1/BBC%20Dropbox/Thomas%20Germain/A%20Downloads%20and%20Documents/2026/And%20there's%20evidence%20that%20AI%20tools%20are%20being%20manipulated%20on%20a%20wide%20scale.
- Gần đây BBC đã mắc lỗi kiểu này vài lần, và điều đáng nói hơn là ngay cả sau khi sửa họ cũng không còn gắn chú thích để lưu lại lịch sử chỉnh sửa bài đã đăng
- Tôi trước giờ luôn dùng first.last@company cho username hoặc địa chỉ email, nên kiểu last[:5]initials# làm tôi khá bối rối. Có vẻ sẽ sinh ra rất nhiều username kỳ cục
Dạo này nhiều bên có vẻ đang làm gì đó một cách “âm thầm”. Việc mọi văn bản trên internet đều bị LLM hóa đang khiến tôi phát điên
- Tôi cũng phát điên, nhưng các cây viết headline và biên tập viên đã nghiện chữ “âm thầm” từ rất lâu trước khi có LLM rồi. Báo chí online từ lâu đã đầy những sáo ngữ kiểu này
- Tôi thực sự ghét nó. Hôm qua tôi đọc một bài lịch sử do AI tạo ra trên một subreddit về lịch sử, và tất cả nguồn dẫn trông như thể đều là phim Hollywood hư cấu
  Tôi nhận ra vì đã xem những bộ phim đó, nhưng đây rõ ràng là dấu hiệu cho thấy internet đang hỏng đi về mặt chất lượng thông tin
- “Âm thầm” không phải là một kiểu diễn đạt mới của LLM
- Điểm cốt lõi của sáo ngữ đó thật ra là nói thẳng ra điều đáng lẽ phải làm trong im lặng
Đây chỉ là giai đoạn tiếp theo của SEO thôi. Có lẽ sẽ được gọi là AIO
Cũng như tìm kiếm, đây sẽ là cuộc chiến không hồi kết: Google và các nhà cung cấp AI đưa ra biện pháp sửa, các công ty tối ưu hóa tìm ra điểm yếu, rồi lại bị vá tiếp. Cuối cùng vẫn là chuyện giành giật sự chú ý để phục vụ marketing
- Trong ngành marketing người ta thường gọi nó là GEO. Generative Engine Optimization, đôi khi cũng gọi là Answer Engine Optimization, và có những người kiếm được rất nhiều tiền nhờ bán dịch vụ này
  https://www.wired.com/story/goodbye-seo-hello-geo-brandlight...
- Engineered Inference Ersatz Intelligence Optimization, viết tắt là EIEIO
- Không phải giai đoạn tiếp theo đâu, nó đã là giai đoạn hiện tại rồi
Google AI Overview hoàn toàn không đáng tin. Nó thậm chí còn lấy cỡ mẫu bằng 1 rồi đưa vào phần tổng quan AI
Tôi biết vì mình đã bình luận trên Reddit về một chủ đề cực kỳ ngách, vốn trước đó chẳng có kết quả Google nào cũng chẳng có AI Overview. Hôm sau tôi tìm bài Reddit của mình, thì thấy Google gần như sao chép nguyên câu trả lời Reddit của tôi vào hộp AI “overview”. Bài được liên kết cũng chỉ có đúng bài của tôi, và kết quả tìm kiếm Google cũng chỉ có đúng một cái đó
- Chưa hết, nó còn bọc thêm ngữ cảnh hoàn toàn không hề có trong bài gốc để khớp với cách người dùng đặt câu hỏi. Thế là thành sai luôn
  Ví dụ giả sử bạn tìm “kích thước phổ biến nhất của món đồ hiếm X là gì?”
  Nhưng chỉ có đúng một người từng nêu kích thước cho phiên bản món đồ đó của họ, và người đó không hề nói nó là điển hình, cũng không ám chỉ là có một kích thước điển hình. Hơn nữa không phải 20 người cùng nói như vậy, mà đúng là chỉ một người
  Thế mà Google có thể tỉnh bơ nói “thông thường món đồ X có kích thước [kích thước bạn vừa nêu], và lý do là [một lý do hoàn toàn bịa ra]”
Nếu hỏi Google what's the name of the whale in half moon bay harbor? thì đến giờ AI summary vẫn tự tin đưa vào cái tên Teresa T, nhờ nỗ lực đầu độc chỉ mục khá nghiệp dư của tôi từ một năm rưỡi trước
https://simonwillison.net/2024/Sep/8/teresa-t-whale-pillar-p...
- Tôi vừa thử với Brave Search
  Nó trả lời rằng con cá voi lưng gù non có tên là Teresa T, và nói rằng dù đó không phải cái tên do cơ quan nhà nước chính thức đặt, nó vẫn được công chúng, truyền thông địa phương và cư dân địa phương chấp nhận rộng rãi. Nó còn thêm rằng các chuyên gia từ Marine Mammal Center và California Academy of Sciences đã theo dõi để tránh gây căng thẳng cho con vật, và khuyến cáo công chúng giữ khoảng cách tối thiểu 100 yard
  Theo kinh nghiệm của tôi với những chủ đề mà tôi biết tương đối rõ, câu trả lời ban đầu đôi khi sai nặng. Với công cụ Brave, thường chỉ cần phản bác 3-4 lần là có thể khiến nó thừa nhận “bạn hoàn toàn đúng”. Vụ Teresa T này cũng vậy
  Ở câu hỏi thứ hai, khi tôi hỏi số lượng nguồn của cái tên đó, nó vẫn khăng khăng rằng “ABC7 News” và “NBC Bay Area” đã “nhắc lại” cái tên đó. Đến lần thứ ba khi tôi yêu cầu link cụ thể, nó thừa nhận cái tên chỉ được dùng trong “bối cảnh truyền thông không chính thức”, và đến lần thứ tư khi tôi nói đó là một thí nghiệm của S.W., nó đã tìm ra bình luận của bạn từ 21 ngày trước
  Tương lai thuộc về tầng lớp tinh hoa có thể cho con cái học với gia sư thật. Còn với giai cấp vô sản thì đây là bước thụt lùi về quá khứ
- Bạn không sợ Google gửi thư đe dọa vì cố thao túng phản hồi AI của họ à?
Chỉ vài năm trước thôi, Google còn là công ty tự tin trả lời câu hỏi “Marilyn Monroe bắn JFK vào năm nào?” là 1963. Nghĩ đến chuyện bà ấy đã chết từ năm 1962 thì đúng là ấn tượng
Nên chuyện này không mới, và “đòn phản công âm thầm” của Google nhiều khả năng cũng chỉ là nửa vời và kém hiệu quả. Dù vậy phần lớn mọi người có lẽ sẽ không quan tâm
Xét cho cùng, điều đó chỉ có nghĩa là Google sẽ bắt đầu làm kiểm soát chất lượng cho kết quả tìm kiếm web, tức việc lẽ ra họ phải làm liên tục ngay từ đầu
Buồn cười ở chỗ chỉ đến khi danh tiếng mô hình bị ảnh hưởng họ mới chịu bỏ công sức vào việc này

AI của Google đang bị thao túng. Gã khổng lồ tìm kiếm đang âm thầm phản công

Vấn đề thao túng câu trả lời tìm kiếm bằng AI

Cách thao túng này hoạt động

Thay đổi chính sách và phản ứng của Google

Những thay đổi được quan sát và giới hạn của chúng

Cuộc rượt đuổi lặp lại giữa kẻ thao túng và nền tảng

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News