2 điểm bởi GN⁺ 2025-10-22 | 3 bình luận | Chia sẻ qua WhatsApp
  • Wikipedia, một bách khoa trực tuyến, vừa thông báo rằng lượng truy cập trực tiếp đã giảm do tóm tắt tìm kiếm AI và video trên mạng xã hội
  • Wikimedia Foundation cho biết số lượng người dùng con người đã giảm 8% so với cùng kỳ năm trước, theo kết quả chỉ tính lưu lượng truy cập của con người thật sau khi cập nhật hệ thống phát hiện bot
  • Khi kết quả tìm kiếm do AI tạo ra cung cấp câu trả lời trực tiếp, nhấp vào website giảm đi, và giới trẻ đang có xu hướng sử dụng video TikTok và các nền tảng mạng xã hội để khám phá thông tin
  • Wikipedia đã tự dừng thử nghiệm tính năng tóm tắt AI của riêng mình và cho rằng các công ty AI và tìm kiếm cần chịu trách nhiệm về việc nêu rõ nguồn và kích thích người dùng truy cập trở lại trang web
  • Wikipedia nhấn mạnh rằng “gốc gác của kiến thức mà AI sử dụng vẫn là nội dung do con người tạo ra,” cũng như tầm quan trọng của việc xác minh nguồn đáng tin cậy và nhận thức về giá trị của kiến thức do con người kiểm duyệt

Hiện tượng giảm lưu lượng truy cập của Wikipedia

  • Wikipedia được nhắc đến thường xuyên như một trong những website đại diện đáng tin cậy cuối cùng trên Internet
  • Tuy nhiên, theo báo cáo mới đây của Wikimedia Foundation, lượt xem của người dùng con người đã giảm khoảng 8% so với cùng kỳ năm trước
  • Quỹ đã cải thiện hệ thống giám sát để phân biệt lưu lượng người và bot; mức tăng bất thường trong tháng 5–6 phần lớn được xác nhận là lưu lượng bot né tránh phát hiện
  • Marshall Miller của quỹ nói rằng đây là sự chuyển đổi mang tính cấu trúc do tóm tắt tìm kiếm AI và việc gia tăng tiêu dùng video trên mạng xã hội
    • Các công cụ tìm kiếm đang chuyển sang hiển thị câu trả lời do AI tạo ra trực tiếp thay vì liên kết đến trang web
    • Giới trẻ đang dùng các nền tảng video như TikTok, YouTube Shorts thay vì web mở để tìm kiếm thông tin
    • Google phản đối và cho rằng AI tìm kiếm không làm giảm lưu lượng truy cập

Quan điểm và phản hồi của Wikipedia

  • Miller cho biết “là điều tích cực khi con người tiếp nhận kiến thức theo những cách mới” và nhấn mạnh rằng kiến thức của Wikipedia vẫn được dùng trong tài liệu học tập và tóm tắt cho mô hình AI
  • Tuy vậy, giảm lượng truy cập cũng hàm chứa rủi ro thực tế có thể dẫn đến sự giảm sút của tình nguyện viên đóng góp và quản lý nội dung, cũng như giảm quyên góp
  • Thực tế, một số biên tập viên đã nêu vấn đề về chất lượng của bản tóm tắt do AI tạo ra,
    và quỹ đã tạm dừng chương trình thử nghiệm tóm tắt AI

Tái định hình quan hệ với các công ty AI

  • Miller cho rằng các nền tảng AI, công cụ tìm kiếm và mạng xã hội nếu sử dụng nội dung của Wikipedia thì phải đóng góp cho hệ sinh thái bằng cách chỉ rõ nguồn và khiến người dùng truy cập lại website
  • Wikipedia đang phát triển một khung ghi nguồn nội dung mới và đang vận hành 2 nhóm chuyên trách nhằm mở rộng tệp độc giả mới
  • Đồng thời, một chiến dịch nhằm mở rộng việc tham gia của tình nguyện viên cũng đang được triển khai

Tầm quan trọng của tri thức dựa trên lòng tin

  • Miller nhấn mạnh rằng “nền tảng của thông tin mà AI tóm tắt có sự đóng góp của lao động tri thức con người
    • Khi tìm kiếm, người dùng nên kiểm tra trích dẫn và truy cập trực tiếp nguồn gốc
    • Cần duy trì hệ sinh thái kiến thức do con người tuyển chọn và đáng tin cậy
  • Anh nhấn mạnh “sự minh bạch về nguồn tri thức và tính liên tục của sự tham gia của con người là giá trị cốt lõi trong kỷ nguyên AI”

3 bình luận

 
coremaker 2025-10-23

Nếu các model AI và các công ty tạo ra chúng không nỗ lực xây dựng niềm tin, thì về lâu dài có thể sẽ là cơ hội để Wikipedia phát triển hơn.

 
shakespeares 2025-10-23

Nó đã thành một trang web chỉ còn việc dữ liệu bị lấy mất thôi.

 
GN⁺ 2025-10-22
Ý kiến trên Hacker News
  • Tôi cho rằng Wikipedia rất cần thiết và việc lượng truy cập giảm tự nó không thành vấn đề. Tập bách khoa toàn thư in ấn đã bị thay thế bởi Wikipedia, nhưng AI không thể thay thế vai trò đó. AI chỉ là công cụ giúp truy cập dễ dàng hơn, còn mục đích tồn tại và giá trị của Wikipedia là một chuyện khác. Tôi luôn hoài nghi việc Wikimedia Foundation tích lũy tiền và chi phí vận hành hàng năm liên tục tăng. Tôi mong đây là lúc phải tiết kiệm và hướng tới tự chủ bằng đầu tư để kéo dài sự tồn tại đến 1000 năm. Wikipedia nên là một thực thể vì lợi ích công cộng và phải được vận hành theo hướng đó.

    • Tôi nghĩ Wikimedia Foundation khó có thể tồn tại đủ 1000 năm. Bởi vì hệ thống xã hội và kinh tế tự nó cũng khó kéo dài lâu như vậy. Mỹ đã có những động thái gây khó chịu đối với Wikimedia. Ngay cả khi chuyển sang nước khác, vẫn khó để nó kéo dài lâu như thế. Với độ mong manh của nền văn minh công nghệ và việc lưu trữ dữ liệu, không chắc Wikipedia có thể tồn tại lâu như vậy. Bài viết liên quan

    • Wikipedia cung cấp data dump công khai nên mình nghĩ phải có nhiều bản sao ngoại tuyến. Có lẽ Wikimedia nói về việc giảm lưu lượng không phải vì lý do thương mại liên quan đến doanh thu quảng cáo, mà vì cách người dùng web tìm kiếm thông tin đã thay đổi. Với một trang web không bán quyền tiếp cận người dùng cho quảng cáo, việc giảm truy cập không phải vấn đề. Điều đó không có nghĩa thông tin họ cung cấp kém giá trị hơn.

    • Tôi luôn băn khoăn về chiến lược tích lũy tiền và đầu tư để tồn tại lâu dài. Nếu tích lũy như vậy để khi nguồn thu bên ngoài gián đoạn vẫn vận hành được, có thể tập trung vào tầm nhìn gốc và việc đúng đắn thay vì bị cuốn vào chỉ số quý. Có thể kiếm tiền liên tục được, nhưng lý tưởng là suy nghĩ mô hình vận hành dài hạn mà vẫn giữ gìn bản chất.

    • Wikipedia thật sự xuất sắc. Bất kỳ ai trên thế giới đều có thể viết bài bất kỳ chủ đề nào họ muốn. Nó cho mình niềm tin rằng mình đang nhận được thông tin tốt nhất.

    • Tôi tò mò Wikimedia Foundation đang dùng tiền cho việc gì. Họ nói chi phí cứ tăng đều, nhưng chi ra cho đâu? Họ vẫn tiếp tục cố mở rộng sang các dự án khác chứ? Mình hiểu hosting của một trang web tầm toàn cầu tốn không ít chi phí, nhưng có thực sự tăng vọt như vậy hay không vẫn là câu hỏi.

  • Với tư cách tổ chức phi lợi nhuận 501(c)(3), nếu lưu lượng web không ảnh hưởng trực tiếp đến doanh thu thì có cần xem việc giảm lưu lượng là xấu không? Mình vẫn nghĩ áp lực tăng trưởng đột ngột trước đây chủ yếu thuộc về doanh nghiệp phụ thuộc VC hoặc quảng cáo.

    • Thực tế Wikipedia cũng phụ thuộc rất nhiều vào traffic web. Số người truy cập giảm, nhưng AI crawler lại kéo vào khối lượng dữ liệu khổng lồ khiến chi phí tăng.

    • Việc giảm traffic có thể dẫn tới giảm tình nguyện viên hoặc nhà tài trợ. Khi người truy cập trực tiếp giảm, lo ngại là ít người chỉnh sửa hoặc tài trợ nội dung hơn.

    • Đây là tín hiệu không chỉ doanh thu quảng cáo giảm, mà có thể là nguồn đóng góp cũng giảm. Hiện tại nhiều người sẵn sàng trả tiền cho các gói AI, nhưng lại không nhìn Wikipedia nữa. Nguồn gốc thứ cấp của thông tin đang bị tiêu thụ ở tầng trung gian. Gợi ý này giống tranh luận xâm phạm bản quyền trước đây, nhưng ở đây chủ thể là các công ty lớn vì lợi nhuận chứ không phải cá nhân.

  • Tôi cảm thấy LLM đã thay thế khoảng 90% thông tin mà trước đây tôi tra cứu trên Wikipedia. Bởi vì có thể tổng hợp từ nguồn rất đa dạng. Đồng thời tôi vẫn tiếp tục đóng góp (chỉnh sửa) cho Wikipedia. Thông tin tôi chỉnh sửa được tiêu thụ trên Wikipedia hoặc qua LLM, và điều quan trọng là cuối cùng nó giúp đỡ ai đó. Wikipedia sẽ không biến mất ngay cả khi mọi người không còn tiêu thụ thông tin trực tiếp trên site.

    • Wikipedia cung cấp tư liệu miễn phí cho tất cả mọi người. Các công ty LLM thì không như vậy. Google nữa vẫn hoạt động trong khi chịu lỗ. Khó mà nói họ "giúp đỡ con người", có lẽ ngược lại.
  • Thành thật mà nói, tôi nghĩ LLM cuối cùng sẽ hoàn toàn thay thế Wikipedia. Bỏ qua các vấn đề như chủ nghĩa quan liêu nghiêm khắc, bám víu biên tập, thiên kiến... Wikipedia vốn là một "động cơ tóm tắt trung tâm con người" tổng hợp nguồn thứ cấp để tạo ra điểm đồng thuận. Chính phần này lại là thứ mà LLM làm tốt nhất. Huấn luyện dựa trên sách chất lượng cao cũng có thể vượt qua chất lượng Wikipedia. Chỉ riêng câu đầu của bản tóm tắt AI đã thể hiện rõ chủ đề trọng tâm. Ngược lại, do các tranh cãi chính trị giữa biên tập viên, ngay cả câu đầu của Wikipedia cũng có xu hướng trở nên phức tạp không cần thiết.

    • Ngay cả nếu những ý trên đúng, LLM vẫn cần một kho lưu trữ tập hợp những bản tóm tắt nguồn thứ cấp như thế. LLM không thể đọc và tìm thấy theo thời gian thực hàng nghìn nguồn thứ cấp. Đã có rất nhiều tài liệu đã mất hoặc chưa số hóa. Trong tương lai, có thể hình dung các phòng thí nghiệm LLM đóng góp cho Wikipedia cùng lúc đề xuất biên tập và fact-check qua AI agent.

    • Với suy nghĩ rằng LLM sẽ thay thế Wikipedia, tôi vẫn mong Wikipedia tiếp tục tồn tại để góp phần giúp mọi người phát triển tư duy phê phán để không dễ bị lừa.

    • Tôi không đồng ý với lập luận "chỉ cần huấn luyện bằng sách tốt". Trong thực tế, nhiều chủ đề trên Wikipedia gần như không có sách tốt nào. Và câu hỏi là ai sẽ quyết định tiêu chuẩn của những cuốn sách "tốt" đó. Việc giảm traffic không chỉ là vấn đề riêng của Wikipedia, mà cả các website khác cũng vậy. AI đang làm mòn luôn cả nguồn gốc thông tin mà chính nó dựa vào. Đây mới đúng là thời kỳ hoàng kim của AI. Thời đại kế tiếp sẽ là ít nguồn gốc gốc chất lượng hơn, nhiều nội dung do AI tạo hơn, và sự xuất hiện của các trang web nhằm gây ảnh hưởng xấu đến LLM sẽ bùng phát. Thảo luận liên quan

  • Kiến thức không tồn tại như một thứ có sẵn; vấn đề là con người tổ chức nó ra sao. AI sẽ tiếp tục khai thác kiến thức hiện có để hiển thị tiện lợi hơn, nhưng nền tảng tổ chức thông tin và tri thức có lẽ không thay đổi nhiều. Tuy nhiên, AI có thể thay đổi cách tổ chức ở các lĩnh vực sau:

    1. Kiểm tra sự thật (fact-check) và xác minh nguồn
    2. Viết nháp mục mới
    3. Chỉnh sửa câu chữ, biên tập, v.v. Wikipedia đã có nhiều bot chạy ngầm rồi. Nếu để AI làm tất cả công việc này, phần việc còn lại cuối cùng vẫn là phạm vi phán xét của con người (hoặc một AI khác), chẳng hạn:
    • Khi có nhiều góc nhìn về cùng một sự kiện, nên trình bày cân bằng ra sao (nhắc lại vô số cuộc tranh luận của biên tập viên)

    • Trong kỷ nguyên smartphone/mạng xã hội, khi rất nhiều người bình thường ghi lại lịch sử, thì cách tóm tắt và tổng hợp ra sao

    • Làm thế nào thiết kế cơ chế khuyến khích đóng góp phù hợp cho cả con người và AI

    • Làm sao giữ được tính độc lập của Wikipedia (vấn đề địa chính trị) Nhân tiện, trước đây tôi từng phụ trách dịch vụ wiki của Trung Quốc. Điều khó chịu nhất là gần như không có ai nghiêm túc nghĩ về việc vì sao hình thức wiki cần thiết và cần duy trì, ngoài chuyện tìm kiếm thông tin.

    • Tôi thích ý tưởng dùng AI để làm Wikipedia tốt hơn. Nhiều tác vụ nhỏ có thể do AI agent đơn giản xử lý. Ví dụ, đi vào tất cả bài viết về các thành phố Tây Ban Nha trên Wikipedia tiếng Anh rồi so sánh dữ liệu như dân số, tên thị trưởng với Wikipedia tiếng Tây Ban Nha để chỉnh cho chính xác hơn. Nếu AI agent chỉ viết nháp và biên tập viên con người kiểm duyệt thì việc cập nhật chi tiết thông tin nhỏ có thể làm rất hiệu quả.

  • Việc Google đưa ra tóm tắt AI khiến hiện tượng tương tự xảy ra hầu như trên mọi website.

  • Ảnh hưởng của AI thì đương nhiên, nhưng tôi vẫn tò mò "social video" có ý nghĩa gì. Có phải mọi người giờ xem TikTok thay cho Wikipedia? Hay là họ đã ngừng hẳn hành vi tìm kiếm?

    • Thực tế thì search engine đang "hot" nhất hiện nay là YouTube và TikTok.

    • Với Gen Alpha, TikTok là phương tiện chính để tiếp cận tin tức và kiến thức.

  • Mong rằng hiện tượng tương tự cũng xảy ra với mọi website tích hợp SEO. Thảo luận liên quan

    • Nó áp dụng cho mọi site. Ngay cả website chất lượng không có quảng cáo, AI crawler vẫn tạo thêm traffic thừa. Điều này làm tăng gánh nặng chi phí vận hành. Hơn nữa, nhiều trang web được tạo ra chỉ với mục đích làm hại LLM sẽ mọc lên ồ ạt. Cuối cùng, chính LLM cũng sẽ tốn chi phí hơn hoặc chuyển sang chèn quảng cáo.
  • Xu hướng số đóng góp viên của Wikipedia giảm dần đã diễn ra liên tục. Nếu người đọc trực tiếp giảm, có thể khiến số đóng góp viên giảm nghiêm trọng hơn. Tôi mong được biết có đang có các thí nghiệm dùng LLM để bổ sung/cải thiện/kiểm chứng Wikipedia hay không. Trước mắt, các cuộc tranh luận hoặc chiến tranh biên tập cũ có thể chuyển thành hình thức đối đầu giữa các AI agent, vừa hợp tác vừa cạnh tranh.

    • Các loại công việc mà đóng góp viên làm cũng sẽ ngày càng có thể xử lý hiệu quả bởi AI agent. Trọng tâm sẽ là: a) sự tham gia và giám sát của con người, b) hệ thống lọc hành vi ác ý.

    • Cơ chế vận hành hiện tại có vấn đề. Khi đóng góp viên thêm nội dung mới, spammer sẽ bỏ link tài liệu hợp lệ rồi thay bằng link spam. Bot của Wikipedia sẽ xóa nội dung đó. Đóng góp viên rồi dần dần chán nản.

  • Wikipedia từng là một công cụ kỳ diệu đi trước thời đại, và giá trị như một "trung tâm tập trung thông tin hàng đầu" vẫn còn nguyên. Mình đoán rằng nó sẽ tiếp tục sống lâu dài như một tập hợp liên kết. Việc chọn lọc (curation) theo thời gian thực khi đọc rõ ràng tốt hơn, nhưng trước đây rất khó, giờ có thể làm rẻ hơn, vì thế Wikipedia vẫn sẽ là nguồn dữ liệu cho nhiều công cụ curation thời gian thực. Chỉ riêng việc có cơ sở dữ liệu nguồn như vậy cũng nâng cao hiệu quả của nhiều công cụ AI. Mình hiểu có nhiều tiếng nói phê phán góc nhìn đơn lẻ hoặc thiên vị của biên tập viên, nhưng điều đó vẫn dễ hiểu. Tuy nhiên nhờ giao diện chat của LLM, người dùng có thể tương tác để hiểu bối cảnh hoặc đi sâu hơn. Cá nhân mình, việc tham gia vào quá trình kiến tạo hạ tầng tri thức mở này rất thú vị. Mình thấy vui khi chỉ cần sửa một lỗi nhỏ trong bài viết wiki. Có rất nhiều phần dễ sửa như vậy. Thậm chí nội dung dởm do ai đó thêm vào cũng có thể phát hiện và sửa nhanh chóng. Ví dụ bài viết

    • Curation theo thời gian thực khi đọc rõ ràng tốt hơn, nhưng mang Wikipedia trên điện thoại để tra ngay lập tức thật sự rất rẻ. LLM cực kỳ nặng và phần lớn người dùng không thể chạy cục bộ. Thêm nữa, còn có mất mát dữ liệu (trong quá trình tóm tắt, v.v.). Nếu cả hai chạy được trên điện thoại thì tuyệt vời, nhưng mình lo lắng nhiều về vấn đề quyền sở hữu dữ liệu.