6 điểm bởi GN⁺ 2024-01-12 | 1 bình luận | Chia sẻ qua WhatsApp

Internet giờ là không gian để máy móc trò chuyện với nhau

  • Internet đã thay đổi từ một nơi có cách dùng đơn giản, nơi con người hỏi và trả lời lẫn nhau, thành một không gian ngập tràn thông tin sai lệch do AI tạo ra.
  • Người dùng Google phát hiện Google đã đưa ra thông tin sai rằng trứng có thể tan chảy. Điều này là hệ quả của việc Google cung cấp ảnh chụp nhanh của trang dưới dạng menu thả xuống thay vì hiển thị trực tiếp website, khiến người dùng có thể đọc kết quả tìm kiếm mà không cần nhấp vào.
  • Gần đây, tính vô dụng của Google Search ngày càng tăng; chẳng hạn, có trường hợp tìm kiếm viêm xoang mãn tính lại trả về kết quả về dương vật bị viêm.

"Cướp" lưu lượng Internet và tranh cãi về các bài viết AI của Sports Illustrated

  • Hôm qua, một người dùng Twitter đã cáo buộc việc "cướp" lưu lượng Internet. Người này xem chỉ mục trang của website cạnh tranh, trích xuất URL bài viết rồi dùng AI để nhanh chóng viết bài.
  • Ngoài ra, cũng bị phát hiện rằng Sports Illustrated đã đăng các bài viết do AI viết và xuất bản chúng dưới tên những người thực tế không hề tồn tại. Sau khi có chất vấn về việc này, nội dung đó đã bị xóa.

Sự phá hủy căn bản của Internet

  • Internet không còn là nơi giao tiếp giữa con người với nhau nữa, mà đã biến chất thành không gian nơi máy móc trò chuyện với nhau.
  • Câu nói "hãy hỏi Google" giờ đã trở nên vô nghĩa. Khả năng nó trả về thông tin sai lệch hoặc hoàn toàn hư cấu ngày càng cao.
  • Các công ty như Sports Illustrated quan tâm đến việc cải thiện thứ hạng trên kết quả tìm kiếm Google và doanh thu quảng cáo hơn là phục vụ độc giả.

Ý kiến của GN⁺

  • Chất lượng thông tin trên Internet đang ngày càng suy giảm, gây ra sự bối rối và bất tiện cho người dùng.
  • Một trong những tác dụng phụ do sự phát triển của công nghệ AI mang lại là việc ngày càng khó tìm được thông tin đáng tin cậy vì thông tin sai do AI tạo ra.
  • Những thay đổi này buộc người dùng phải suy nghĩ lại về cách họ tiếp nhận thông tin trên Internet, đồng thời cho thấy cần có những cách tiếp cận mới để bảo đảm chất lượng thông tin.

1 bình luận

 
GN⁺ 2024-01-12
Ý kiến trên Hacker News
  • Một trong những vấn đề nảy sinh do sự phổ biến của các mô hình ngôn ngữ lớn (Large Language Models, LLMs) là trước đây từng có một heuristic hữu ích giúp nhanh chóng lọc bỏ các bài đăng vô giá trị thông qua lỗi chính tả hoặc ngữ pháp, nhưng giờ thì cách đó აღარ hiệu quả nữa vì nội dung do AI tạo ra có khả năng dùng ngôn ngữ quá hoàn hảo. Ví dụ, dự án curl từng gặp vấn đề vì các báo cáo lỗi giả do AI tạo ra. Dự kiến vấn đề này sẽ còn nghiêm trọng hơn trong tương lai.

  • Cũng có ý kiến đồng ý về sự thay đổi của internet, nhưng cho rằng internet trước thời GPT-4, 3, 2 cũng không khác nhiều. Những bài viết về các chủ đề phổ thông do thực tập sinh hoặc trợ lý ảo ở Ấn Độ viết ra phần lớn cũng tệ chẳng kém nội dung do AI tạo và rất khó phân biệt. Việc công cụ tìm kiếm xếp hạng dựa trên danh tiếng thay vì mức độ khớp giữa văn bản trang web và truy vấn cũng là một vấn đề. Giờ đây con người sống trong app nhiều hơn là trên web, chất lượng web đã xuống cấp từ lâu nhưng sớm sẽ không còn quan trọng nữa. Nếu internet còn tồn tại trong tương lai, hy vọng nó sẽ chuyển sang một lớp ẩn danh hóa mới và phát triển theo hướng thường xuyên yêu cầu trao đổi tiền tệ để giảm việc tạo ra nội dung chất lượng thấp.

  • Trong bối cảnh tình trạng hiện tại của clearnet rất nghiêm trọng, cũng có ý kiến cho rằng việc thông tin bị cô lập bên trong Discord trông không hẳn là điều tệ. Vì không bị công cụ tìm kiếm lập chỉ mục nên có thể tránh việc xuất hiện cùng rác AI hoặc bị dùng làm dữ liệu huấn luyện. Tương lai của internet phụ thuộc vào con người, còn máy móc thì giờ đây đã trở nên không đáng tin ngay cả với những tác vụ cơ bản.

  • Có chia sẻ kinh nghiệm từ dự án BeamMP về các báo cáo lỗi giả và PRs (pull request) do AI tạo ra. Những sản phẩm do AI tạo này có thể nhận ra khá dễ, với các đặc điểm như sửa những phần mã không liên quan hoặc đưa ra giải pháp thậm chí không biên dịch được. Con người thật thì lười nên không làm những việc không cần thiết, còn rác do AI tạo chỉ làm tốn thời gian nên sẽ không được merge.

  • Việc duy trì tính xác thực trên internet là rất quan trọng. Chỉ nội dung có chữ ký mới có thể đảm bảo tính xác thực. Trong bối cảnh AI có thể đăng ngày càng nhiều thứ hơn, cách lọc duy nhất là dựa vào niềm tin và tính xác thực để biết ai đã đăng gì và họ đang nói gì. Web of Trust từng được thử nghiệm nhưng không trở thành xu hướng chính, và có lẽ đã đến lúc thử lại.

  • Cũng có ý kiến cho rằng đây là một vấn đề cũ mà LLM chỉ làm tăng tốc. Khi Google nỗ lực gia tăng doanh thu quảng cáo và sự thống trị của công nghệ quảng cáo, SEO đã lan tràn trong kết quả tìm kiếm, khiến việc thu được thông tin khách quan trở nên khó khăn. Tìm thông tin trên Reddit trước có thể là một cách giải quyết, nhưng bản thân Reddit trong vài năm gần đây cũng đã đầy rẫy nội dung bị thao túng.

  • Cũng có ý kiến cho rằng internet vốn đã đầy rác do con người tạo ra vì SEO, nên thực ra sự xuất hiện của "AI" không khiến chúng ta mất đi quá nhiều thứ. Cũng có những người đã chỉ ra vấn đề này trong ngành từ rất lâu rồi.

  • Quảng cáo suy cho cùng là để kiếm tiền, và trừ khi bot có thẻ tín dụng, điều đó có nghĩa là tiền đến từ con người. Các công ty như Google dù có lượng truy cập tăng lên thì cũng sẽ cảm nhận tác động về mặt tài chính nếu nó không chuyển hóa thành chi tiêu của con người. Những đợt sa thải quy mô lớn gần đây trong lĩnh vực công nghệ có thể cho thấy việc ứng phó với vấn đề này đã bắt đầu.

  • Cũng có ý kiến nói rằng nếu đã đọc cuốn sách "Anathem", thì nhiệm vụ của chúng ta là lọc rác khỏi Reticulum.