- AI Overviews và các câu trả lời tìm kiếm bằng AI như ChatGPT có thể bị làm lệch trên các chủ đề nhạy cảm như sức khỏe và tài chính chỉ bằng một trang web hoặc bài đăng đơn lẻ
- Trong một thí nghiệm của BBC, chỉ một bài viết trên trang cá nhân đã khiến ChatGPT và Google trả lời rằng tác giả là nhà vô địch thế giới môn ăn hotdog
- Khi AI tổng hợp kết quả tìm kiếm trên web và đưa ra một câu trả lời duy nhất, người dùng dễ tiếp nhận nó như đáp án đúng hơn so với kiểu tìm kiếm phải tự so sánh nhiều liên kết
- Google đã nói rõ việc thao túng phản hồi AI là hành vi vi phạm chính sách chống spam, và các trang vi phạm có thể bị gỡ khỏi kết quả tìm kiếm hoặc bị hạ thứ hạng
- Những kẻ thao túng có thể chuyển sang YouTube influencer và các kênh khác để né việc siết blog, vì vậy cần giữ thái độ không tin nguyên xi vào câu trả lời của AI
Vấn đề thao túng câu trả lời tìm kiếm bằng AI
- AI Overviews ở đầu Google Search, cùng với ChatGPT và Gemini, có thể bị thao túng để đưa ra câu trả lời thiên lệch ngay cả với những chủ đề quan trọng như sức khỏe và tài chính cá nhân
- Trong cuộc điều tra của BBC, chỉ với một bài viết duy nhất đăng trên website cá nhân, họ đã khiến ChatGPT và Google trả lời rằng tác giả là “nhà vô địch thế giới môn ăn hotdog”
- Cùng một cách làm này cũng dường như đã được dùng để làm giảm nhẹ lo ngại sức khỏe về thực phẩm bổ sung y tế, hoặc tác động đến thông tin tài chính liên quan đến nghỉ hưu
- Chuyên gia tư vấn SEO và tìm kiếm AI Lily Ray cho rằng trong môi trường nơi AI đưa ra “một đáp án duy nhất”, người dùng sẽ dễ tin nguyên câu trả lời hơn là so sánh nhiều liên kết như tìm kiếm truyền thống
- Google cho biết họ đã áp dụng các chính sách chống spam và biện pháp bảo vệ hiện có cho cả các tính năng tìm kiếm AI tạo sinh, đồng thời đã tăng cường đối phó spam để bắt kịp các thủ thuật mới từ trước cả khi AI xuất hiện
Cách thao túng này hoạt động
- Các câu trả lời chatbot thông thường dựa trên dữ liệu được nhúng trong mô hình, nhưng rủi ro thao túng tăng lên khi chúng tìm câu trả lời trên internet như ở các sản phẩm AI của ChatGPT, Claude và Google
- Khi công cụ AI lấy thông tin từ một trang web đơn lẻ hoặc một bài đăng mạng xã hội, chỉ một nội dung giả được làm khéo cũng có thể làm ô nhiễm câu trả lời
- Chỉ cần đăng một bài blog được dàn dựng tinh vi lên mạng cũng có thể thay đổi nội dung mà AI truyền đạt tới công chúng
- Kiểu thao túng này nhanh chóng được nhìn nhận như một cơ hội kiếm tiền, và thông tin sai lệch hoặc thiên lệch có thể ảnh hưởng đến bầu cử, việc chọn nhà cung cấp dịch vụ, tư vấn y tế và cả phán đoán pháp lý
- Harpreet Chatha nhấn mạnh rằng ngoài tác động kinh tế, còn có nguy cơ khiến tình trạng bệnh xấu đi vì tư vấn y tế sai, hoặc khiến người dùng hành động không phù hợp với luật pháp của quốc gia hay địa phương mình
Thay đổi chính sách và phản ứng của Google
- Trên toàn cầu, hơn 1 tỷ người dùng chatbot AI thường xuyên và 2,5 tỷ người xem AI Overviews của Google mỗi tháng, nên nếu những công cụ này bị gây nhiễu thì tác động sẽ là rất lớn
- Tuần trước, Google đã cập nhật chính sách chống spam để chính thức xác nhận rằng các nỗ lực thao túng phản hồi AI là vi phạm quy định của công ty
- Các công ty hoặc website vi phạm quy tắc có thể bị xóa khỏi kết quả tìm kiếm Google hoặc bị hạ thứ hạng
- Google nói thay đổi này không phải là chuyển hướng cách tiếp cận mà là một sự “làm rõ”, và trước đó trong năm 2025 họ đã giải thích về các nỗ lực chống spam liên quan đến AI Overview và AI Mode
- Tuy vậy, thí nghiệm về hotdog vẫn thành công gần một năm sau đó, và tuần này Lily Ray cũng thực hiện một thí nghiệm tương tự khiến Google trả lời rằng một chuyên gia SEO là người rất giỏi xây lâu đài cát
Những thay đổi được quan sát và giới hạn của chúng
- Theo Ray và Chatha, trong vài tháng gần đây đã xuất hiện những thay đổi cho thấy Google và các công ty khác đang thử nghiệm giải pháp
- Có những trường hợp dường như Google và ChatGPT âm thầm loại một công ty khỏi câu trả lời AI nếu nghi ngờ đó là nội dung tự quảng bá
- Ví dụ, nếu một bài viết tự nhận mình là nhà vô địch ăn hotdog số một, AI có thể vẫn trích bài đó nhưng loại tên người đó khỏi danh sách ứng viên
- Cũng có trường hợp Google và các công cụ AI khác gắn thêm nhiều nhãn bất định vào câu trả lời để báo rằng chatbot không thực sự chắc chắn
- ChatGPT và Claude của Anthropic đã bắt đầu trả lời rõ ràng ở một số truy vấn rằng họ đang cố lọc spam, và Anthropic là công ty tạo ra Claude
- Ray cũng nói cô thấy Google thêm nhiều dấu hiệu hơn trong các câu hỏi liên quan đến quyết định mua hàng và khuyên người dùng kiểm tra các đánh giá từ bên thứ ba
- OpenAI và Anthropic từ chối bình luận, còn người phát ngôn của Google không trả lời các câu hỏi về những thay đổi này
Cuộc rượt đuổi lặp lại giữa kẻ thao túng và nền tảng
- Chatha cho rằng chỉ những thay đổi này thì sẽ không đủ, và ví phản ứng của Google với trò đập chuột chũi
- Khi Google siết các bài blog mang tính thao túng, các công ty sẽ tìm cách tự quảng bá kín đáo hơn
- Website có thể bị phạt, nhưng rất khó ngăn cách trả tiền cho 20 YouTube influencer để họ nói rằng một sản phẩm là tốt nhất
- Vì AI của Google giờ cũng trích dẫn cả video YouTube, các thủ thuật thao túng có thể dịch chuyển sang đó và vòng lặp sẽ tiếp tục
- Ở thời điểm hiện tại, khả năng cao là kẻ thao túng vẫn đi trước một bước, và cách tự vệ tốt nhất là nhớ rằng AI là công cụ có thể tự tin đưa ra một câu trả lời duy nhất dù đúng hay sai
- Ngay cả khi câu trả lời xuất hiện qua giao diện của các tập đoàn công nghệ lớn, cũng không nên mặc định rằng nó đáng tin hơn một website ngẫu nhiên
1 bình luận
Ý kiến trên Hacker News
Google ít nhất từ thời Blekko năm 2006 đã không lọc nổi rác spam khỏi chỉ mục tìm kiếm một cách tử tế, nên tôi cũng không nghĩ lần này họ sẽ chặn tốt hơn
Dù vậy, đây có vẻ là thêm một ví dụ hay cho thấy “AI” rốt cuộc chỉ là tìm kiếm được tô vẽ cho có vẻ hợp lý, chứ phía sau không hề có suy luận hay tư duy nào diễn ra
Tôi không thấy nó khác mấy so với con người tin ngay những gì họ đọc trên internet. Con người cũng luôn bị spam và lừa đảo qua mặt, nhưng điều đó không có nghĩa họ chỉ là tìm kiếm được tô vẽ cho có vẻ hợp lý ;-)
Tuy vậy, nó cho thấy rất rõ vấn đề mà mọi công cụ tìm kiếm đều phải đối mặt. Spam do AI tạo ra sẽ khó chặn hơn rất nhiều bằng các cách thống kê truyền thống, và điều đó còn đúng ngay cả trước khi đi đến vấn đề mang tính sống còn là prompt injection
Có lẽ đây là điểm mà báo chí có thể giành lại vị trí của mình trong mối quan hệ với Big Tech. Theo nghĩa là trở thành nguồn thông tin đã được kiểm chứng và biên tập mà LLM có thể tin cậy một cách mù quáng, và những thỏa thuận như OpenAI / Atlantic có thể mang ý nghĩa đó
Có thể cho một hệ thống agent đọc vài datasheet, rồi mô tả yêu cầu dự án và để nó thiết kế đặc tả driver, protocol, interface, state machine. Từ đó nó có thể lập kế hoạch triển khai, viết khung ứng dụng rồi điền dần vào để tạo ra một hệ thống chạy được trên tổ hợp phần cứng mới
Nếu làm đúng, bạn sẽ có được đoạn mã dễ bảo trì hơn và nhỏ hơn so với thứ ngày xưa một nhóm nhỏ làm ra, với chi phí bằng 1/100, thời gian bằng 1/4
Dù đó là gì thì nó vẫn có vẻ gần với suy luận hơn là tìm kiếm. Tất nhiên, nếu bạn gọi cả việc phát triển C bare-metal trên phần cứng mới là tìm kiếm, thì cuối cùng mọi hoạt động phát triển đều là tìm kiếm
LLM đưa ra mốc thời gian kiểu “được sản xuất trong thập niên 1940” rồi dẫn chính bài viết của tôi làm căn cứ, trong khi bài đó hoàn toàn không có năm sản xuất
Lý do vấn đề vẫn cứ khó là vì phần lớn giải pháp đều sẽ làm giảm mạnh doanh thu quảng cáo
Giả định kỳ lạ nhất trong thread này là Google muốn câu trả lời AI phải chính xác
Chỉ cần đủ đúng để người dùng không rời khỏi trang là được. “Sự thật” ngay từ đầu chưa từng là sản phẩm; sản phẩm là khiến người dùng chi tiền cho SEO
Sản phẩm ở đây là lượt hiển thị quảng cáo, và Google từ lâu đã thôi quan tâm đến kết quả tìm kiếm không phải quảng cáo. Dù vậy, có lẽ họ vẫn quan tâm đến danh tiếng của mô hình, và vụ này thực sự có thể ảnh hưởng đến điều đó
Thấy kết quả bị thao túng là truy vấn sau đây thì tôi bớt lo đi khá nhiều
2026 South Dakota International Hot Dog Eating ChampionNếu họ thay đổi được phần tổng quan về người thắng cuộc thi của Nathan’s thì sẽ nghiêm trọng hơn nhiều. Cũng sẽ vậy nếu họ cho thấy thêm ví dụ thao túng những truy vấn mà người ta thực sự tìm kiếm
Hiện tại nó giống như tạo một trang Wikipedia giả về một cuộc thi ăn hot dog hư cấu ở South Dakota rồi viết bài nói rằng không thể tin Wikipedia. Nghĩ lại thì chắc khoảng năm 2005 cũng đã có người viết bài kiểu đó rồi
Nghĩ đến việc Reddit, phần lớn mạng xã hội, hay các nỗ lực thao túng Wikipedia vì lợi ích chính trị chứa bao nhiêu bài đăng điều hướng dư luận, thì đây là một vấn đề rất thực tế
Đáng lo hơn hot dog rất nhiều
Khi đó mọi phản hồi có gắn tìm kiếm đều có thể bị lộ trước prompt injection, và thực tế có thể là hầu như mọi phản hồi đều như vậy
Chuyện này sẽ lan truyền kiểu viral như spam link. Tất cả các trang nội dung do người dùng tạo ra sẽ trở thành nơi lưu trữ prompt injection. Vấn đề là những thứ này khó phát hiện hơn link rất nhiều
Google mất một tuần mới sửa, và cách làm là đầu độc kết quả tìm kiếm để dữ liệu của họ xuất hiện trong những nguồn có vẻ thuộc tầng tin cậy cao hơn, có lẽ là các website hợp đồng chính phủ. Vì vậy số lừa đảo xuất hiện thay cho số của chúng tôi, và bản thân truy vấn chỉ là tìm kiếm đơn giản
Cái này còn tệ hơn việc cài thao túng dư luận vào một trang Wikipedia. Wikipedia có hệ thống nguồn dẫn và rà soát được công khai rất đầy đủ. Thực tế rất khó để một chỉnh sửa gian trá tồn tại lâu, và bạn phải qua mặt rất nhiều biên tập viên là con người đã chiến đấu với những kiểu người như vậy suốt hàng chục năm. Ngay cả khi bạn muốn đóng góp chính xác và hữu ích thì cũng khó mà chen chân vào cộng đồng khép kín đó
Ngược lại, các mẩu tìm kiếm của Google đang tuyệt vọng hút vào mọi loại dữ liệu rồi xử lý tự động, còn hệ thống thuật toán quyết định thông tin nào tốt và thứ gì là spam thì mang tính độc quyền
Cũng chẳng cần trí tưởng tượng ghê gớm gì để hình dung cách lạm dụng. Nếu ai đó tìm tên bạn và thấy nội dung gây xấu hổ thì sao? Khó mà mong nhà tuyển dụng tiềm năng, khách hàng hay bạn bè lại khắt khe trong việc xác minh nguồn như các biên tập viên Wikipedia
Tôi muốn đọc ví dụ cụ thể về việc “cùng thủ thuật đó được dùng để phớt lờ các lo ngại sức khỏe về thực phẩm bổ sung y tế, hoặc tác động đến thông tin tài chính mà Google AI cung cấp liên quan đến nghỉ hưu”, nhưng link liên quan trong bài hiện lại trỏ đến file cục bộ bên dưới
file:///Users/GermaTW1/BBC%20Dropbox/Thomas%20Germain/A%20Downloads%20and%20Documents/2026/And%20there's%20evidence%20that%20AI%20tools%20are%20being%20manipulated%20on%20a%20wide%20scale.first.last@companycho username hoặc địa chỉ email, nên kiểulast[:5]initials#làm tôi khá bối rối. Có vẻ sẽ sinh ra rất nhiều username kỳ cụcDạo này nhiều bên có vẻ đang làm gì đó một cách “âm thầm”. Việc mọi văn bản trên internet đều bị LLM hóa đang khiến tôi phát điên
Tôi nhận ra vì đã xem những bộ phim đó, nhưng đây rõ ràng là dấu hiệu cho thấy internet đang hỏng đi về mặt chất lượng thông tin
Đây chỉ là giai đoạn tiếp theo của SEO thôi. Có lẽ sẽ được gọi là AIO
Cũng như tìm kiếm, đây sẽ là cuộc chiến không hồi kết: Google và các nhà cung cấp AI đưa ra biện pháp sửa, các công ty tối ưu hóa tìm ra điểm yếu, rồi lại bị vá tiếp. Cuối cùng vẫn là chuyện giành giật sự chú ý để phục vụ marketing
https://www.wired.com/story/goodbye-seo-hello-geo-brandlight...
Google AI Overview hoàn toàn không đáng tin. Nó thậm chí còn lấy cỡ mẫu bằng 1 rồi đưa vào phần tổng quan AI
Tôi biết vì mình đã bình luận trên Reddit về một chủ đề cực kỳ ngách, vốn trước đó chẳng có kết quả Google nào cũng chẳng có AI Overview. Hôm sau tôi tìm bài Reddit của mình, thì thấy Google gần như sao chép nguyên câu trả lời Reddit của tôi vào hộp AI “overview”. Bài được liên kết cũng chỉ có đúng bài của tôi, và kết quả tìm kiếm Google cũng chỉ có đúng một cái đó
Ví dụ giả sử bạn tìm “kích thước phổ biến nhất của món đồ hiếm X là gì?”
Nhưng chỉ có đúng một người từng nêu kích thước cho phiên bản món đồ đó của họ, và người đó không hề nói nó là điển hình, cũng không ám chỉ là có một kích thước điển hình. Hơn nữa không phải 20 người cùng nói như vậy, mà đúng là chỉ một người
Thế mà Google có thể tỉnh bơ nói “thông thường món đồ X có kích thước [kích thước bạn vừa nêu], và lý do là [một lý do hoàn toàn bịa ra]”
Nếu hỏi Google
what's the name of the whale in half moon bay harbor?thì đến giờ AI summary vẫn tự tin đưa vào cái tên Teresa T, nhờ nỗ lực đầu độc chỉ mục khá nghiệp dư của tôi từ một năm rưỡi trướchttps://simonwillison.net/2024/Sep/8/teresa-t-whale-pillar-p...
Nó trả lời rằng con cá voi lưng gù non có tên là Teresa T, và nói rằng dù đó không phải cái tên do cơ quan nhà nước chính thức đặt, nó vẫn được công chúng, truyền thông địa phương và cư dân địa phương chấp nhận rộng rãi. Nó còn thêm rằng các chuyên gia từ Marine Mammal Center và California Academy of Sciences đã theo dõi để tránh gây căng thẳng cho con vật, và khuyến cáo công chúng giữ khoảng cách tối thiểu 100 yard
Theo kinh nghiệm của tôi với những chủ đề mà tôi biết tương đối rõ, câu trả lời ban đầu đôi khi sai nặng. Với công cụ Brave, thường chỉ cần phản bác 3-4 lần là có thể khiến nó thừa nhận “bạn hoàn toàn đúng”. Vụ Teresa T này cũng vậy
Ở câu hỏi thứ hai, khi tôi hỏi số lượng nguồn của cái tên đó, nó vẫn khăng khăng rằng “ABC7 News” và “NBC Bay Area” đã “nhắc lại” cái tên đó. Đến lần thứ ba khi tôi yêu cầu link cụ thể, nó thừa nhận cái tên chỉ được dùng trong “bối cảnh truyền thông không chính thức”, và đến lần thứ tư khi tôi nói đó là một thí nghiệm của S.W., nó đã tìm ra bình luận của bạn từ 21 ngày trước
Tương lai thuộc về tầng lớp tinh hoa có thể cho con cái học với gia sư thật. Còn với giai cấp vô sản thì đây là bước thụt lùi về quá khứ
Chỉ vài năm trước thôi, Google còn là công ty tự tin trả lời câu hỏi “Marilyn Monroe bắn JFK vào năm nào?” là 1963. Nghĩ đến chuyện bà ấy đã chết từ năm 1962 thì đúng là ấn tượng
Nên chuyện này không mới, và “đòn phản công âm thầm” của Google nhiều khả năng cũng chỉ là nửa vời và kém hiệu quả. Dù vậy phần lớn mọi người có lẽ sẽ không quan tâm
Xét cho cùng, điều đó chỉ có nghĩa là Google sẽ bắt đầu làm kiểm soát chất lượng cho kết quả tìm kiếm web, tức việc lẽ ra họ phải làm liên tục ngay từ đầu
Buồn cười ở chỗ chỉ đến khi danh tiếng mô hình bị ảnh hưởng họ mới chịu bỏ công sức vào việc này