Internet, đống rác thông tin ngập tràn AI

(aftermath.site)

6 điểm bởi GN⁺ 2024-01-12 | 1 bình luận | Chia sẻ qua WhatsApp

Tìm kiếm trên Internet từng dễ đến mức câu “let me Google that for you” còn có tác dụng, nhưng nay ngày càng có nhiều tình huống phải hỏi lại con người vì thông tin do AI tạo và kết quả tìm kiếm sai lệch
Google hiển thị ảnh chụp nhanh của trang ngay trong kết quả tìm kiếm thay vì chỉ đưa liên kết, phơi bày cả thông tin sai như câu trả lời AI của Quora rằng “trứng có thể tan chảy”
Sự suy giảm chất lượng tìm kiếm không chỉ là vấn đề câu trả lời AI đơn thuần, mà còn làm lung lay chính ngữ cảnh tìm kiếm, như trường hợp tìm viêm xoang lại dẫn đến kết quả về viêm dương vật
Một người dùng Twitter đã công khai cách đánh cắp lưu lượng truy cập: xuất URL đã được lập chỉ mục của trang đối thủ rồi dùng AI nhanh chóng tạo bài viết tương tự để vượt lên trên kết quả Google
Nghi vấn Sports Illustrated dùng AI viết bài và tác giả giả cho thấy việc sản xuất nội dung nhắm đến hiển thị trên tìm kiếm và doanh thu quảng cáo có thể làm tổn hại lòng tin của độc giả ra sao

Cách Google Search đưa câu trả lời sai lên trước

Trước đây, độ tin cậy của tìm kiếm cao đến mức có thể chế giễu người đặt câu hỏi online rằng “hãy tự Google đi”, và cụm “let me Google that for you” cũng được dùng trong bối cảnh đó
Giờ đây Internet có quá nhiều thông tin rác do AI tạo, khiến việc xác minh thông tin chỉ bằng kết quả tìm kiếm trở nên khó hơn và khả năng phải hỏi lại con người tăng lên
Thay vì chỉ hiển thị liên kết website, Google đưa một phần trang vào menu thả xuống dưới dạng ảnh chụp nhanh, để người dùng đọc kết quả mà không cần nhấp vào
- Cách này có thể khiến người dùng thấy thông tin sai trước khi kiểm tra ngữ cảnh gốc
- Tháng 9/2023 từng có trường hợp Google lấy câu trả lời do AI tạo của Quora và hướng dẫn sai rằng trứng có thể tan chảy
Trường hợp tìm kiếm viêm xoang nhưng trả về kết quả liên quan đến viêm dương vật cũng có thể tái hiện, cho thấy chính mức độ liên quan của kết quả tìm kiếm đang bị lung lay

Các trường hợp nội dung AI chiếm lĩnh kết quả tìm kiếm

Một người dùng Twitter tuyên bố đã thực hiện một vụ “heist” lưu lượng Internet nhằm vượt qua một website cụ thể trên kết quả Google Search
- Kiểm tra chỉ mục site của website mục tiêu
- Xuất các URL bài viết
- Dùng AI nhanh chóng viết bài dựa trên các URL đó
- Việc tự chỉnh sửa tiêu đề trang web được mô tả là “tùy chọn”
Sports Illustrated bị nghi ngờ sau bài của Futurism rằng nhiều bài viết đã được AI viết và gắn tên tác giả là những người không tồn tại
- Khi Futurism yêu cầu bình luận, nội dung đó đã bị xóa
- Sau đó Sports Illustrated cho biết các bài viết này do bên thứ ba viết, không phải sản phẩm do AI tạo, và các tác giả đã dùng bút danh
- Lời giải thích này không lý giải được vì sao bài viết bị xóa sau khi báo chí liên hệ
- Vẫn còn thực tế là Sports Illustrated đã công khai nói trong một bài của Wall Street Journal tháng 2/2023 rằng họ sẽ dùng AI để tạo nội dung và ý tưởng bài viết
Internet đang ngày càng giống không gian nơi máy móc giao tiếp với máy móc hơn là một kho lưu trữ để con người chia sẻ thông tin với nhau
Cụm “let me Google that for you” không còn hiệu lực như trước, và khả năng gặp thông tin sai hoặc sản phẩm bị thao túng hoàn toàn trong kết quả tìm kiếm đang tăng lên
Những người nắm quyền quyết định tài chính ở Sports Illustrated bị chỉ trích là quan tâm đến việc thao túng kết quả Google Search và kiếm doanh thu quảng cáo từ đó hơn là phục vụ độc giả một cách đúng nghĩa

1 bình luận

GN⁺ 2024-01-12

Ý kiến trên Hacker News

Sự lan rộng của LLM khiến chúng ta mất đi một heuristic từng rất hữu ích. Trước đây, có thể nhanh chóng lọc bỏ những bài đăng vô giá trị khi thấy chính tả và ngữ pháp tệ hại, nhưng với rác do AI tạo ra thì cách đó hoàn toàn không còn tác dụng
Khả năng dùng ngôn ngữ của nó gần như hoàn hảo, thậm chí còn tốt hơn đa số mọi người, nên ai cũng có thể lập tức tạo ra những bài viết bề ngoài có vẻ thuyết phục. Cũng không còn cần thuê copywriter như đám spam SEO ngày trước nữa, và trường hợp curl phải vật lộn với các báo cáo lỗi AI giả là một ví dụ điển hình: https://news.ycombinator.com/item?id=38845878
Đây mới chỉ là khởi đầu và mọi thứ sẽ còn tệ hơn nhiều, đến mức một ngày nào đó có thể sẽ không thể phân biệt được hạt với trấu
- Cần quyên góp nhiều hơn cho archive.org. Có khi Wayback Machine sẽ cắt bỏ mọi thứ xuất hiện sau khoảng năm 2020 và trở thành cách duy nhất để tìm dữ liệu hữu ích trên Internet
- Xu hướng là có tính chu kỳ. Các công cụ tìm kiếm từng giỏi hơn nhiều trong việc phát hiện website được liên kết, nhưng rồi mọi người chơi trò SEO, tung ra bài giả và liên kết chéo, khiến ai cũng lặp lại cùng những điều sáo rỗng và chất lượng tìm kiếm lao dốc
  Nếu chỉ lặp đi lặp lại cùng một ý tưởng thì chẳng có lý do gì để không tự động hóa, và cuối cùng mọi người sẽ quên mất bài viết tốt ban đầu đến từ đâu. Ví dụ như LLM thay thế Stack Overflow, còn Stack Overflow thay thế tài liệu kỹ thuật. Khi chi phí sản xuất gần như bằng 0, chẳng ai quan tâm đến chất lượng, rồi khi chán đủ nhiều thì hành vi có lẽ sẽ lại lắc sang phía ngược lại, quay về một web được tuyển chọn dựa trên truyền miệng
- Hồi học cấp 3 tôi từng làm SEO copywriting, và đầu ra của ChatGPT gần như y hệt loại bài tôi từng viết khi đó. Cốt lõi là chèn từ khóa cụ thể và viết những bài thông tin nông cạn chỉ hơi liên quan đến thứ đang muốn bán
  Theo thời gian, có thể xuất hiện một kiểu hiệu ứng xoáy kỳ lạ trong trí tuệ AI. Hiện giờ nếu hỏi ChatGPT theo kiểu câu hỏi của Stack Overflow thì sẽ lập tức nhận được câu trả lời kiểu Stack Overflow, nhưng tính chân thực và độ chính xác thì gần như là một canh bạc. Về sau, nếu mọi người phụ thuộc vào đó nhiều hơn và đăng lên Stack Overflow ít đi, cái giếng thông tin để AI học sẽ dần cạn, chỉ còn lại những vòng lặp dai dẳng đôi khi đúng. Công nghệ càng phát triển, điều này càng có thể trở thành vấn đề, và đến lúc đó có lẽ nó sẽ học từ tài liệu kỹ thuật
- Chính tả và ngữ pháp kém cũng có thể đơn giản là bài viết của người không phải bản ngữ
- Chuẩn. Tôi từng nghĩ mình nhớ Internet trước khi ClosedAI phá hỏng nó, nhưng giờ thì thậm chí còn muốn quay lại Internet năm 2020
  Nghiên cứu LLM có vẻ sẽ kéo theo sự xuống cấp của xã hội theo nhiều cách. Một người bạn của tôi đang học thạc sĩ, và ai cũng viết câu trả lời bằng ChatGPT, với kiểu diễn đạt dè dặt về mặt chính trị rồi tóm tắt ở cuối quá dễ nhận ra. Tôi chỉ mong họ bị đuổi học
Tôi đồng ý với tiêu đề, nhưng không cho rằng Internet đã thay đổi quá nhiều so với thời trước GPT-4, 3, 2. Các bài do thực tập sinh hay trợ lý ảo ở Ấn Độ viết về chủ đề phổ thông cũng dở chẳng kém nội dung do AI tạo ra, và cũng không dễ phân biệt
Việc các công cụ tìm kiếm ngày nay xếp hạng theo độ uy tín thay vì độ khớp giữa truy vấn và văn bản trang web cũng chẳng giúp ích gì. Giờ mọi người cũng không còn dùng web nhiều nữa mà sống trong các app, và việc duyệt trang web trên điện thoại thường chỉ xảy ra khi “google” một câu hỏi. Ngay cả khi đó, họ cũng thường không đi sâu quá một cấp rồi lại quay về trải nghiệm trong app
Web đã tệ từ lâu và còn tệ hơn nữa, nhưng có lẽ sắp tới nó sẽ không còn quan trọng. Độc giả giống như con ếch trong nồi nước nóng lên từ từ, và giờ nhiệt độ chỉ là tăng vọt khiến họ nhận ra tình hình
Nếu “web” còn muốn tồn tại trong tương lai, tôi nghĩ nó không chỉ phải chuyển sang một lớp ẩn danh hóa mới mà còn cần trao đổi tiền tệ thường xuyên để khiến việc tạo hàng loạt tài liệu chất lượng thấp trở nên khó hơn. Nếu 90% công chúng không muốn trả tiền thì cứ tiếp tục ăn rác vậy. Tôi dùng ví dụ con ếch bị luộc để nói rằng lượng spam đã tăng mạnh
- Hoàn toàn đồng ý. Đám spam SEO đã phá hỏng web công khai từ vài năm trước, và Google đã làm hết sức để khiến điều đó có thể xảy ra vì doanh thu quảng cáo
- Bạn đang bỏ qua biến số cốt lõi là số lượng. Nội dung do thực tập sinh hay outsource tạo ra vẫn có đó, nhưng ít nhất đó vẫn là rác do con người bỏ thời gian làm ra
  Giờ thì yếu tố từng giới hạn lượng rác đó đã biến mất
- Nội dung trên web đang chảy vào mạng xã hội, tin tức, và ebook được gọi là “sách”, tạo thành một xoáy mù vô hình của thông tin bị thao túng
  Khi nước thải chảy vào hệ thống nước sạch thì chẳng ai còn an toàn. Không thể yên tâm chỉ vì bạn dùng vòi nước nằm xa nguồn ô nhiễm
- Tôi đồng ý rằng nội dung chất lượng thấp luôn tồn tại. Nhưng vấn đề bây giờ là quy mô của thông tin gây hiểu lầm có thể được tạo ra
  Số lượng đã tăng hoặc đang tiếp tục tăng, nên giờ việc tìm được thứ hợp pháp và tử tế trở nên khó hơn nhiều. Nhận xét về app rất hay
- Tôi tò mò không biết thế hệ AI tiếp theo có thể giỏi đến mức nào trong việc sàng lọc web
  Sẽ ra sao nếu mọi nhà xuất bản đều được AI tự động đánh giá về khả năng dự đoán, thiên kiến và độ chính xác thực tế theo các mốc thời gian 1 năm, 2 năm, 5 năm?
Tôi không ngờ mình lại nói điều này, nhưng trong tình cảnh mạng internet công khai mong manh như hiện nay, việc mọi thông tin bị đóng silo trong Discord cũng không hẳn là tệ. Nếu không bị công cụ tìm kiếm lập chỉ mục thì gần như không có khả năng xuất hiện bên cạnh rác AI hoặc bị dùng làm dữ liệu huấn luyện
Tương lai của internet rốt cuộc vẫn là con người. Máy móc giờ đây ngay cả những tác vụ cơ bản từng làm tốt cũng không còn đáng tin, mà lại chọn hướng không làm được việc phức tạp nên đánh đổi luôn cả hiệu quả của tác vụ cơ bản
- Động lực nền tảng phá hỏng mọi công nghệ là thương mại hóa quá mức. Ở thời đại hiện nay, quảng cáo đã phá hỏng hoàn toàn các động lực của internet, đặc biệt là web
  Trong thời kỳ bán lẻ trực tuyến, giao dịch và mô hình kinh doanh còn minh bạch, nhưng trong nền kinh tế quảng cáo/chú ý phía sau thì mọi thứ trở nên mờ đục và méo mó. Hầu như tất cả các bên tham gia thực chất đang cấu kết theo hướng vui vẻ giết dần con người bằng cách kiếm tiền từ thời gian rảnh và sự chú ý của họ, rồi ép họ tiêu dùng
  Tôi vào Google năm 2010 và rời đi năm 2019; năm 2010 doanh thu hằng năm khoảng 30 tỷ USD, còn năm ngoái là 300 tỷ USD. Vì từ khi thành lập công ty đã duy trì tăng trưởng khoảng 20%/năm khá đều, nên để đạt mức đó trong năm 2024 thì cần thêm 60 tỷ USD doanh thu mới. Tức là trong vòng 1 năm phải tìm ra mức doanh thu tương đương hai Google của năm 2010, trong khi để xây dựng Google năm 2010 đã mất 12 năm, nên điều này vô lý
- Tôi phản đối mạnh. Từ rất lâu rồi tôi vẫn trả lời các câu hỏi về nhập cư trên mạng, và thường xuyên có người bình luận vào các thread từ vài năm trước hoặc nhắn riêng hỏi về nội dung đó. Nói cách khác, nội dung công khai theo thời gian sẽ giúp ích cho rất nhiều người
  Trong khi đó, nội dung trong các nhóm Facebook riêng tư cùng lắm chỉ sống được vài ngày. Nếu mục tiêu là chia sẻ kiến thức hữu ích với lượng khán giả rộng nhất có thể, thì các nhóm Discord là một bước thụt lùi lớn
- Chẳng phải câu chuyện sẽ khác đi nếu Discord bắt đầu bán dữ liệu đó cho các công ty AI sao
- Tôi không hiểu việc bị dùng làm dữ liệu huấn luyện liên quan gì đến vấn đề này. Cốt lõi là khả năng phân biệt rác AI và thông tin chính xác
- Discord cũng có thể tìm kiếm được: https://www.answeroverflow.com/
Lối thoát là tính xác thực, và chỉ nội dung có chữ ký mới có thể mang lại điều đó. Không thể tin bất cứ thứ gì theo mệnh giá vì nó có thể đã được tạo ra hoặc bị giả mạo
Khi ai cũng có thể đăng bất cứ thứ gì, và AI đăng còn nhiều hơn đến mức lấn át con người, thì chỉ có thể dựa vào danh tiếng và tính xác thực để lọc ra ai đã đưa ra cái gì và đã nói gì. Web of trust từng được thử trước đây, nhưng chưa bao giờ thoát khỏi góc nhìn rằng đó là đồ chơi của những kẻ lập dị đội mũ giấy bạc. Có lẽ giờ là lúc thử lại
- Nội dung có chữ ký hoàn toàn không bảo đảm rằng nội dung đó do con người viết hoặc biên tập. Vì rủi ro bị đánh cắp khóa, nó thậm chí còn không bảo đảm rằng chính người ký đã thực sự đăng nó
  Việc xác minh tính xác thực của nội dung số là điều bất khả thi về mặt vật lý, triết học lẫn kỹ thuật. Ở ranh giới giữa thế giới analog và thế giới số thì lúc nào cũng có thể gian lận
  Đây cũng là lý do blockchain không thể được áp dụng thành công cho chứng thực chuỗi cung ứng. Bạn có thể xác minh rằng vật phẩm số 523 có một hash hợp lệ gắn kèm, nhưng không thể chứng minh rằng hash đó thực sự được áp dụng cho vật phẩm số 523 ngoài đời chứ không phải đồ giả
- Tôi nghĩ ván cờ thật sự là hệ thống danh tính có thể chứng minh được. Khi các hệ thống danh tính hỗ trợ chứng thực (attestation) tràn tới, sẽ không còn quan trọng việc AI tạo ra kết quả chất lượng cao hay sản xuất hàng loạt rác thuần túy
  Trong trường hợp thứ hai, đó sẽ là chiến thắng lớn cho các chủ sở hữu nền tảng như Apple, Google, Microsoft (thông qua TPM). Vì họ có thể chứng minh rằng người dùng “không phải bot”. Sẽ không có gì đáng ngạc nhiên nếu 5 năm nữa, để tham gia internet một cách có ý nghĩa, bạn phải có quan hệ với một trong ba bên này
  Ngay cả khi AI “thất bại”, họ vẫn có lý do để tiếp tục thúc đẩy nó. Vì họ có thể chuyển một phần lớn người dùng internet sang mô hình thuê bao danh tính và chứng thực. Nếu không trả tiền, nội dung của bạn về cơ bản sẽ bị coi là rác do máy tạo ra và không được hiển thị
  Ở phía doanh nghiệp, có thể sẽ xuất hiện một cấu trúc khiến hệ thống SSL và ký mã trước đây trông như từ thiện. Có thể áp dụng thứ gì đó như BIMI cho mọi nội dung được đăng, rồi thu phí theo từng bài. Cũng có thể xuất hiện phân biệt giá kiểu trả càng nhiều thì càng “đáng tin”. Cuối cùng, tôi lo rằng danh tính và chứng thực của các dịch vụ chính phủ sẽ bị chuyển giao cho các công ty tư nhân như Google hay Apple, và danh tính thực của con người sẽ bị buộc chặt với chứng thực của những công ty đó
  1. https://www.w3.org/TR/webauthn/#sctn-defined-attestation-for...
  2. https://bimigroup.org/
- Tôi thật sự tò mò, chuyện này giải quyết vấn đề bằng cách nào. Tôi vẫn có thể tạo ra cả đống bài rác rồi ký tên và đăng chúng lên
  Ngay cả khi Apple hay Google cung cấp dịch vụ chứng thực người dùng, chẳng phải vẫn có thể tự động tạo và ký rác AI hay sao
- Nếu lối thoát là tính xác thực, thì có vẻ khá nhiều người theo thuyết Trái Đất phẳng cũng thực sự tin một cách chân thành vào điều đó
- Phần điên rồ nhất là Jaron Lanier đã nói điều này từ 20 năm trước, có lẽ còn sớm hơn thế
Nội dung do LLM tạo ra chỉ làm vấn đề cũ tăng tốc mà thôi. Google đã đi rất mạnh theo hướng tăng doanh thu quảng cáo và củng cố thế thống trị công nghệ quảng cáo, còn SEO thì tràn lan khắp kết quả tìm kiếm, nên LMGTFY đã chết
Dạo này chỉ với những truy vấn trơn tru thì khá khó để lấy được thông tin thực tế không thiên lệch, nên tôi thường tìm thông tin trên Reddit trước. Cái này cũng không phải thuốc chữa bách bệnh, và vài năm gần đây cũng đầy nội dung quảng bá trá hình, nhưng các thread cũ từ thời Reddit còn kém phổ biến và khó thao túng hơn, hoặc các thread trong những cộng đồng nhỏ, thường vẫn là lựa chọn ổn
- Sau khi thấy Google không thể tìm ra trang tài liệu của một lớp ThreeJS bằng bất kỳ từ khóa nào, tôi cuối cùng đã chuyển sang Kagi. Tôi phải dán chính URL của trang đó thì nó mới hiện lên đầu kết quả tìm kiếm
  Còn Kagi thì chỉ với tên lớp đã tìm ra ngay từ lần đầu. Tìm kiếm trả phí mới là lối đi, và động cơ quảng cáo xung đột với tìm kiếm. Tôi đã đặt Kagi làm tìm kiếm mặc định trên thanh địa chỉ và thấy rất tuyệt
- Điều luôn phải nhớ là Google Search không trả về kết quả tìm kiếm, mà tạo ra một trang tinh vi được điều chỉnh theo bong bóng của người dùng. Facebook và Twitter cũng vậy, chỉ khác thuật toán thôi
  Google Search không trả cùng một kết quả cho cùng một truy vấn giữa các người dùng. Điều này khác với các công cụ tìm kiếm lịch sử như AltaVista hay ElasticSearch, và là lý do hoàn toàn đủ để không coi nó là công cụ tìm kiếm nữa, dù nó vẫn được gọi như vậy. Nó gần giống một bức tường nhảm nhí dành cho quảng cáo cá nhân hóa hơn
- Ai lại nghĩ đám spammer giờ viết bài trên Reddit mà không dùng AI chứ
Tôi đã đủ già để nhớ thời Internet đầy phân bò hữu cơ
- Con người mới là máy tạo nhảm nhí nguyên bản. AI chỉ đang làm điều mà con người vốn luôn làm thôi
- Đã đến lúc bỏ Google và quay lại với webring
- Dạo này vẫn có những người bán nhảm nhí hữu cơ thủ công đầy tâm huyết, nhưng đắt
- Ý là mấy thứ spam câu trả lời được cào từ Stack Overflow à. Chuyện đó chẳng phải khoảng năm ngoái sao. Giờ tôi gần như không dùng Google nữa mà chỉ hỏi Bing chat
- Bài nhảm của con người ít ra còn vui
Rốt cuộc quảng cáo tồn tại để kiếm tiền, và cho đến khi bot có thẻ tín dụng thì số tiền đó vẫn đến từ con người. Nếu ở lĩnh vực nào đó đột nhiên “tương tác” hay lưu lượng tăng lên mà không chuyển thành chi tiêu của con người, thì các công ty như Google cũng sẽ nhận ra trong lãi lỗ
Google sẽ bắt đầu phản ứng khi vấn đề này xuất hiện đủ lớn trong ngân sách. Các đợt sa thải trong ngành công nghệ được nghe thấy ở nhiều công ty, cũng như câu chuyện về Google trong một thread HN khác hôm nay, có thể là tín hiệu cho thấy chiều gió đang đổi
- AI không tiêu thụ nội dung mà tạo ra nội dung. Nếu người ta dễ bị lừa mua hàng giả hay hàng dởm qua quảng cáo hoặc nội dung do AI tạo ra, thì điều đó sẽ tiếp tục đẩy doanh thu Google đi lên
  Lý do duy nhất Google ghét thao túng SEO là vì các site có thể chiếm không gian đầu trang tìm kiếm mà không cần khuyến mãi trả phí, chứ chất lượng sản phẩm thì không quan trọng
  Chỉ khi xảy ra sự sụp đổ niềm tin, tức là người ta bị quá nhiều sản phẩm tệ làm cho mất niềm tin vào các site hay kết quả tìm kiếm từng tin tưởng, thì nó mới thành vấn đề. Vì công việc nên tôi thấy rất nhiều quảng cáo thuốc thị trường xám trên Instagram; tôi bỏ qua vì biết chúng không được FDA kiểm chứng, và phần lớn là thuốc lừa đảo hoặc hóa chất nghiên cứu ngụy trang thành Amanita Muscaria hay Delta-8 THC
- Google có thể nhận ra, nhưng vì thứ mà con người ngừng tiêu tiền không phải là Google, nên họ không có động lực bỏ tiền để ngăn chuyện đó
  Các công ty quảng cáo trên Google có thể cảm nhận được ROI quảng cáo suy giảm, nhưng vì phần lớn cho rằng họ không có lựa chọn nào khác nên sẽ mất thời gian trước khi rời bỏ Google. Nếu phải đợi đến khi chuyện này chạm vào lãi lỗ của Google, tôi thấy sợ Internet sẽ thay đổi thế nào
- Có vẻ bạn đang nhìn quá thoáng với chi tiêu cho adtech. Những tay chơi lớn nhất đã trực tiếp làm chuyện đó rồi
- Góc nhìn thú vị đấy, nhưng Google sẽ không bị ảnh hưởng cho đến khi các nhà quảng cáo kết luận rằng họ đang lãng phí tiền cho quảng cáo trực tuyến
  Có những chủ đề lẽ ra đã phải khô cạn từ lâu, nhưng có lẽ lừa đảo đang nuôi sống cỗ máy quảng cáo trong những mảng đó. Các lĩnh vực như fitness hay giảm cân thì gần như không thể dùng Google. Khi sửa nhà tôi cũng nhận ra vật liệu xây dựng, đặc biệt là sơn, đã trở thành thứ không thể tìm kiếm được. Cuối cùng cách duy nhất để có thông tin và gợi ý đáng tin là đến cửa hàng và hỏi trực tiếp
  Google vẫn còn hoạt động ở nhiều lĩnh vực, nhưng thứ nó thật sự làm tốt là quảng cáo sản phẩm. Nếu bạn biết mình muốn mua gì thì công cụ quảng cáo của Google sẽ tìm ra, chỉ là bạn phải biết chính xác mình muốn gì
- Sao lại không dẫn đến chi tiêu của con người được. Nếu quảng cáo là thật và khách truy cập là thật, thì nội dung có thật hay không cũng chẳng quan trọng
  Thậm chí trang càng chung chung và càng tẻ nhạt thì người ta có thể càng dễ bấm vào quảng cáo hơn
Ngay cả trước khi bị “AI” chiếm lĩnh, nó vốn đã đầy nhảm nhí do con người tạo ra theo yêu cầu của SEO, nên thực ra vài năm qua chúng ta cũng không mất mát nhiều đến thế. Tôi đã ở trong ngành hơn 10 năm và nói điều này gần ngần ấy thời gian
- Nếu vậy thì kết luận sẽ là mọi tin tức và lịch sử của 10 năm qua cũng đều là nhảm nhí do con người tạo ra. Không hẳn là sai, nhưng phải theo đến cùng kết luận từ niềm tin đó
Không có khác biệt gì. Tìm kiếm web đã vô dụng hơn 15 năm rồi. Bây giờ chỉ tệ hơn trước một chút thôi, mà trước đây thì tình hình cũng chỉ là bạn đặt câu hỏi và kết quả đầu tiên đầy trang marketing, hoặc dẫn đến thứ rác marketing hời hợt dạng “blog”
Tôi không muốn giao việc trả lời câu hỏi kiểu cách cọ bồn cầu cho những người có nghề là “sản xuất nội dung” hay “blog kiếm tiền”. Khác biệt giữa ví dụ trong bài và kết quả của 10 năm trước chỉ là: cái đầu tiên thì sai lộ liễu, còn cái sau là loại nội dung mà nếu bạn không làm trong lĩnh vực đó thì có khi phải mất vài ngày mới phản bác nổi
Nếu đã đọc Anathem, thì với tư cách là Ita, việc lọc rác khỏi Reticulum vốn dĩ là việc của chúng ta. Giờ chỉ là đến lúc bắt tay làm thôi.
https://en.wikipedia.org/wiki/Anathem
https://anathem.fandom.com/wiki/Ita
https://anathem.fandom.com/wiki/Reticulum
- Điều này làm tôi nhớ đến đoạn trong Anathem nói rằng vào thời kỳ đầu của Reticulum, nó trở nên hỗn loạn vì đầy rẫy thông tin lỗi, cũ kỹ hoặc gây hiểu lầm một cách lộ liễu đến mức gần như vô dụng, nên lọc rác đã trở thành việc quan trọng.
  Các công ty cố tình đầu độc giếng nước để bán những sản phẩm lọc thứ rác đó; họ không tạo ra các chuỗi ký tự ngẫu nhiên mà là “rác được làm khéo”, tức những tài liệu trông rất ổn với 100 câu đúng có thể kiểm chứng và 1 câu sai một cách tinh vi. Ban đầu phải thuê người làm việc này, nhưng rồi quân đội chú ý đến và chương trình Artificial Inanity phát triển, sau đó lan sang lĩnh vực thương mại và các botnet.
  Tôi thích cách gọi Artificial Inanity như một cách mô tả LLM
- Tôi đã nghĩ đó sẽ là tương lai từ gần 25 năm trước. Xem #5: https://ymlibrary.com/download/Topics/Self/Work-School/Work-...

Internet, đống rác thông tin ngập tràn AI

Cách Google Search đưa câu trả lời sai lên trước

Các trường hợp nội dung AI chiếm lĩnh kết quả tìm kiếm

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News