- Bài viết bàn về sự sụp đổ của niềm tin vào Internet, xoay quanh trường hợp phát hiện một bài báo giả do AI tạo ra về bản tái phát hành
Phantasy Star Fukkokuban cho Sega Genesis tại Nhật Bản, một tựa game thực tế không hề có nội dung như bài báo mô tả
- Một trang web xuất hiện ở vị trí cao trong kết quả tìm kiếm đã đăng bài chứa những chi tiết hoàn toàn sai sự thật như nâng cấp đồ họa, hiệu ứng thời tiết..., và sau đó được xác định là hư cấu do mô hình ngôn ngữ lớn (LLM) tạo ra
- Tác giả cũng trực tiếp xác nhận hiện tượng ảo giác (hallucination) do thiếu dữ liệu huấn luyện khi yêu cầu ChatGPT mô tả cùng trò chơi này, và nhận được thông tin sai về nền tảng và nội dung
- Loại nội dung tạo tự động này đang tràn vào các trang web quảng cáo phục vụ SEO, củng cố cơ chế phát tán thông tin sai nhưng nghe rất thuyết phục mà không qua kiểm chứng
- Kết luận là nền tảng tri thức dùng chung trên Internet đang bị phá hỏng, và thông tin đáng tin cậy hiện nay gần như chỉ còn có thể dựa vào các trang uy tín từ thời trước LLM
Trường hợp Phantasy Star Fukkokuban
Phantasy Star Fukkokuban cho Sega Genesis, phát hành tại Nhật năm 1994, là một bản tái phát hành giữ nguyên trò chơi gốc trên Master System
- Một số máy Genesis không thể chạy game Master System, nên cartridge này cũng không hoạt động trên các máy đó
- Khi cố xác nhận ngày phát hành của trò chơi, tác giả đã thấy ở đầu kết quả tìm kiếm một trang chứa thông tin sai lệch
- Trang web có vấn đề,
Press Start Gaming, đề cập đến nâng cấp đồ họa, hiệu ứng thời tiết, chu kỳ ngày đêm..., nhưng thực tế trò chơi không hề có những yếu tố đó
- Dù câu đầu tiên của bài viết là “Game data not found”, phía sau vẫn là một đoạn mô tả nghe có vẻ hợp lý do AI tạo ra
Vấn đề ảo giác của mô hình ngôn ngữ lớn
- LLM hoạt động dựa trên dự đoán token tiếp theo, và với các chủ đề hiếm không có trong dữ liệu huấn luyện, chúng có thể tạo ra hư cấu nghe rất hợp lý
- Bằng cách ghép series
Phantasy Star với ý nghĩa của từ Fukkokuban (bản phục khắc/tái bản), mô hình đã tưởng tượng ra một bản remake không hề tồn tại
- Khi tác giả yêu cầu ChatGPT mô tả cùng trò chơi, câu trả lời lại nhầm nó thành một bản compilation cho Sega Saturn
- Có vẻ mô hình đã nhầm với một trò khác là
Phantasy Star Collection
- Tương tự, với một trò hiếm khác mà tác giả từng đề cập là
Mahjong Daireikai, trên web tiếng Nhật cũng tồn tại mô tả hư cấu do AI tạo ra
Sự sụp đổ của niềm tin trên Internet
- Trang
Press Start Gaming được cho là một nền tảng nội dung tự động hóa nhằm kiếm doanh thu quảng cáo
- Phần chân trang có dòng “©2025 Cloud Gears Media”, nhưng mối liên hệ với một công ty thực sự là không rõ ràng
- Các trang như vậy ưu tiên hiển thị trên tìm kiếm (SEO) hơn là truyền đạt sự thật
- Với sự xuất hiện của LLM, chi phí tạo thông tin sai đã giảm mạnh, kéo theo làn sóng phát tán nội dung không kiểm chứng trên quy mô lớn
- Trước đây, dù là người viết lương thấp thì ít nhất vẫn có kiểm tra sự thật ở mức tối thiểu; còn bây giờ AI tạo ra cả những điều hoàn toàn bịa đặt
- Tác giả nói rằng “giờ đây rất khó tin các trang mới”, và bản thân đã phải chỉ dựa vào những cơ quan đã xây dựng uy tín từ trước thời AI
Hệ sinh thái thông tin bị tổn hại trong kỷ nguyên AI
- Tác giả đánh giá rằng tri thức dùng chung (
common) trên Internet đã bị tổn hại đến mức khó có thể đảo ngược
- Ngay cả nguồn tin đáng tin cậy cũng có nguy cơ bị ô nhiễm bởi nội dung AI
- Là ví dụ, tác giả nhắc đến trường hợp Ars Technica đăng một bài có trích dẫn do AI tạo rồi sau đó đính chính và rút lại
- Nếu LLM tiếp tục tích hợp nhiều dữ liệu hơn, có thể một ngày nào đó độ chính xác sẽ được cải thiện, nhưng thiệt hại hiện tại đã và đang xảy ra
- Tác giả nói “bài này chỉ là một lời càm ràm (
rant)”, nhưng qua đó nhấn mạnh cảm nhận rất thực về việc mất niềm tin vào Internet
Kết luận
- Hệ sinh thái nội dung xoay quanh AI và SEO đang ưu tiên hiệu suất sản xuất hơn là tính chân thực của thông tin
- Kết quả là các bài viết tạo tự động không qua kiểm chứng xuất hiện ở vị trí cao trên tìm kiếm, làm xói mòn nền tảng cho việc học hỏi và khám phá của người dùng
- Tác giả khép lại bài viết bằng tuyên bố “không thể tin Internet nữa”, qua đó cho thấy việc khôi phục niềm tin vào tri thức số là điều cấp bách
1 bình luận
Ý kiến trên Hacker News
Tôi đang cùng bạn bè xây dựng một mạng mesh cho khu tôi sống
Internet mở đã đi xuống từ lâu, nhưng LLM đang đẩy nhanh cái kết của nó
Tôi đã chấp nhận rằng Internet của những năm 90 đến đầu những năm 2000 nay đã chết
Từ giờ, tôi nghĩ mạng cục bộ đáng tin cậy sẽ là phương án thay thế
Thật buồn khi thực tế buộc ta phải rút về những không gian khép kín vì những kẻ chỉ chăm chăm kiếm tiền
Cốt lõi không phải là mạng mà là chất lượng nội dung
Chỉ cần tạo một diễn đàn chỉ mời những người đáng tin là đủ
Chúc bạn thành công với thử nghiệm đó
Hiện tôi đang tinh chỉnh một trình phát MP3 dựa trên mạng, vẫn còn ở giai đoạn đầu nhưng tôi khá lạc quan
Liên kết dự án
Tôi nghĩ một phần lý do khiến thông tin sai lệch trên mạng dạo này nhiều hơn trước rất nhiều có thể là do thị trường dự đoán (prediction markets)
Đây là một cấu trúc bóp méo chính nhận thức của con người để phục vụ việc đặt cược
Sau vụ siêu dẫn LK99 năm 2023, hiện tượng này tăng mạnh
Thị trường dự đoán cho phép giao dịch thông tin bằng tiền, nhưng chưa đủ lớn để thúc đẩy việc phát tán thông tin sai lệch có chủ đích
Tôi nghĩ nguyên nhân chính lại là các chính trị gia, influencer, và thông tin sai lệch mang tính tương tác nhằm kiếm doanh thu quảng cáo
Vấn đề là sự sụp đổ của niềm tin trên Internet
Trước đây chỉ là thỉnh thoảng bị lừa bởi thông tin sai, còn giờ thì tràn ngập nội dung do bot tái sản xuất
Tỷ lệ người thật so với bot gần như tiến về 0
Rốt cuộc chính chúng ta đã tự thiêu rụi web
Giờ có lẽ ngay cả những người từng điều khiển nó cũng không còn biết chuyện gì đang xảy ra
Nên rất có thể các mô hình hiện tại lại là phiên bản ít thiên lệch nhất còn tồn tại
Tôi từng nghĩ cách bảo vệ HN, nhưng cuối cùng có lẽ ngoài hệ thống dựa trên lời mời thì không còn đáp án nào khác
Dạo này tôi mệt mỏi về mặt cảm xúc vì thậm chí còn nghi ngờ liệu các bình luận có phải của con người hay không
Không khí như thể tin AI như một tôn giáo, nên lẫn lộn giữa tài khoản bot và bình luận đã qua lọc bởi AI
Fediverse như Mastodon vẫn còn lành mạnh, nhưng rồi một ngày nào đó nơi đó cũng sẽ bị ô nhiễm
Tỷ lệ tín hiệu trên nhiễu (SNR) của Internet đang ở mức thấp kỷ lục
Tôi nghĩ giải pháp duy nhất là chữ ký số đã xác thực là con người
Cần có cách chứng minh là con người mà vẫn giữ được tính ẩn danh, thông qua các cơ chế như eIDAS
Liên kết thảo luận liên quan
Cần một cấu trúc vẫn giữ được tính ẩn danh nhưng ngăn được tấn công Sybil
Tôi đã bị sốc khi tìm video về Intel i7-4790T
Phần lớn video gần đây đều là nội dung ‘slop’ đọc lại kịch bản do LLM tạo ra
Sản phẩm này thậm chí chưa từng được bán lẻ, vậy mà các kênh YouTube vẫn đăng hàng chục video mỗi ngày để kiếm tiền bằng liên kết tiếp thị Amazon
Video ví dụ 1 / Video ví dụ 2
Giờ đây khi chi phí làm nội dung giả gần như bằng 0, chúng ta cần cơ chế niềm tin có thể mở rộng
Cá nhân tôi thấy cấu trúc Web of Trust rất hấp dẫn
Sẽ có một số người bị loại ra, nhưng có lẽ đó là điều không tránh khỏi
Tôi đang xây dựng một kho lưu trữ phụ trợ dựa trên giao thức Gemini
Tôi chỉ định lưu lại những web được robots.txt cho phép
Không chỉ giữa cá nhân với nhau mà cả giữa các website cũng có thể hình thành mạng lưới tin cậy
Nó có thể bắt đầu từ cộng đồng địa phương hoặc nhóm sở thích, rồi dần mở rộng
Gần đây khi tìm thông tin về game mới của Hollow Knight, tôi đã thấy khá nhiều trang hướng dẫn giả do LLM tạo ra
Game mới ra được 6 tháng nên chưa có nhiều thông tin thật, có vẻ chúng được lập ra để kiếm doanh thu quảng cáo
Tôi tự hỏi liệu làm nội dung giả ngay cả với những chủ đề ngách như thế này có thật sự sinh lời hay không
Tức là ‘thuyết bất đối xứng của lời nhảm nhí’ đang vận hành ngoài đời thực
Website SEO tệ lại thường đáng tin hơn
Tôi nghĩ tương lai của Internet sẽ nghiêng về các cộng đồng dựa trên lời mời
Tôi tự hỏi liệu sẽ xuất hiện thế hệ diễn đàn tiếp theo, hay chúng ta sẽ quay về thời PHPBB
Chỉ những nội dung không trở thành mục tiêu của game hóa hay spam mới có thể sống sót
Không khí giống HN, nhưng được vận hành theo cấu trúc chỉ dành cho người được mời