1 điểm bởi GN⁺ 2026-02-03 | 1 bình luận | Chia sẻ qua WhatsApp
  • Xikipedia là một ứng dụng web hiển thị các bài viết từ Simple Wikipedia dưới dạng feed mạng xã hội
  • Trình diễn một thuật toán có thể đề xuất nội dung tương tự dựa trên mẫu nhấp chuột của người dùng, ngay cả khi không dùng machine learning
  • Mọi phép xử lý đều được thực hiện cục bộ, và dữ liệu người dùng không bị thu thập hoặc chia sẻ
  • Khi làm mới trang hoặc đóng trang, dữ liệu đã lưu sẽ bị xóa ngay lập tức
  • Tái cấu trúc nội dung Wikipedia thành một cách khám phá mới, cho thấy khả năng tương tác trong việc tiêu thụ thông tin

Tổng quan về Xikipedia

  • Xikipedia là một website theo dạng feed giả mạng xã hội, dựa trên các bài viết của Simple Wikipedia

    • Người dùng có thể khám phá bằng cách cuộn qua các bài wiki được hiển thị ngẫu nhiên
    • Trang web dùng mô tả: “Wikipedia you can doomscroll”
  • Dự án này cho thấy rằng một thuật toán đơn giản vẫn có thể học được sở thích của người dùng mà không cần machine learning hay dữ liệu người dùng từ bên ngoài

    • Hệ thống phát hiện người dùng dừng lại lâu hơn hoặc nhấp vào mục nào để hiển thị nhiều hơn các bài viết về chủ đề tương tự
    • Thuật toán chỉ chạy trong môi trường cục bộ, nên dữ liệu không được gửi tới máy chủ bên ngoài

Xử lý dữ liệu và bảo vệ quyền riêng tư

  • Xikipedia không thu thập hoặc chia sẻ dữ liệu

    • Toàn bộ logic đề xuất được xử lý ngay trong trình duyệt
    • Khi đóng tab hoặc làm mới trang, mọi dữ liệu đều biến mất
  • Cấu trúc này hoạt động như một thử nghiệm về hệ thống gợi ý lấy bảo vệ quyền riêng tư làm trung tâm

Cách sử dụng và lưu ý

  • Khi bắt đầu, người dùng có thể chọn danh mục hoặc tự thêm danh mục
  • Nội dung và hình ảnh được hiển thị được lấy từ các bài viết Wikipedia ngẫu nhiên
    • Vì vậy có thể xuất hiện nội dung NSFW (người lớn), chỉ khuyến nghị người trưởng thành sử dụng

Mã nguồn mở và cộng đồng

  • Mã nguồn được công khai trên GitHub
  • Có thể thảo luận về dự án trên nhiều nền tảng như Fedi, Bluesky, Twitter

Ý nghĩa

  • Xikipedia là một dự án thử nghiệm cho thấy tiềm năng của gợi ý cá nhân hóa dựa trên thuật toán đơn giản
  • Gợi ý rằng vẫn có thể cung cấp trải nghiệm phù hợp với từng người dùng mà không cần thu thập dữ liệu
  • Bằng cách tái cấu trúc nội dung Wikipedia như một feed xã hội, dự án đề xuất một hình thức khám phá thông tin mới

1 bình luận

 
GN⁺ 2026-02-03
Ý kiến trên Hacker News
  • Cách dễ nhất để phá vỡ rào cản tâm lý do nội dung ngắn tạo ra là tự nhắc mình rằng “biết” không phải là điểm kết thúc, mà là tin tưởng vào kiến thức đó và truyền đạt lại
    Thông tin tôi chủ động tìm kiếm thì đáng tin, còn thông tin do thuật toán ném tới thì kém đáng tin hơn vì thiếu ngữ cảnh
    Dòng nội dung ngắn giống như một chiếc xe tải đổ ngẫu nhiên đồ vật xuống sân. Nếu phần lớn là thông tin vô dụng thì tôi nghĩ quên nó đi còn tốt hơn
    Những công cụ như thế này hữu ích với người muốn tiêu thụ nội dung ngắn một cách có chủ đích. Với tôi, chỉ đúng khi tôi muốn khám phá chủ đề mới
    Nhưng trên thực tế, nhiều khi tôi chỉ định xem bài đăng của bạn bè rồi lại vô thức cuộn mãi không dừng được

  • Vấn đề không nằm ở nội dung mà ở chính hành vi “vuốt” và chuyển ngữ cảnh liên tục, thứ làm suy giảm khả năng tập trung
    Ngay cả nội dung ngắn mang tính giáo dục cũng không thoát khỏi giới hạn này. Tôi vẫn nghi ngờ hiệu quả thực sự của nó
    Nghiên cứu liên quan: bài báo Cyberpsychology, nghiên cứu về chuyển ngữ cảnh

    • Suy nghĩ kiểu “biết đâu video tiếp theo sẽ hay hơn” là một mô thức điển hình của nghiện dopamine. Nên dừng lại
    • Nếu đằng nào việc vuốt và chuyển ngữ cảnh cũng làm giảm tập trung, thì thà bị kích thích bởi nội dung giáo dục còn hơn. Kiểu như miếng dán hỗ trợ cai thuốc lá
  • Bản thân ý tưởng thì rất tuyệt, nhưng đáng tiếc là phải tải 40MB dữ liệu trong 5 phút trước khi màn hình đầu tiên hiện ra
    Sẽ tốt hơn nếu có một tiêu chí xếp hạng để đẩy lên những bài viết hay, mang lại cảm giác “hôm nay mình học được điều mới”. Dù vậy, vẫn phải vỗ tay cho sự sáng tạo của nhà phát triển

    • Có lẽ 40MB không phải là dữ liệu Wikipedia mà là bundle JavaScript để biến feed thành trải nghiệm kiểu mạng xã hội. Nghĩ đến việc app Instagram nặng 468MB thì như vậy vẫn còn nhẹ
    • Cách triển khai hơi lạ nhưng ý tưởng rất hay. Tham khảo thêm, Wikitok.io cũng là một thử nghiệm tương tự
    • Có lẽ có thể xử lý bằng tải nền sau khi bắt đầu cuộn
    • Có vẻ như được làm theo phong cách vibe coded
  • Tôi phát hiện lỗi ngữ pháp trong một mục và đã thực sự chỉnh sửa trang Wikipedia, cảm giác khá tự hào. Giá mà mạng xã hội cũng có tính năng như vậy

    • Tôi cũng hay thấy lỗi chính tả trên các website khác và muốn bấm nút “chỉnh sửa”
    • Đó đúng là một trải nghiệm rất tuyệt
  • Nếu giải quyết được vấn đề tải thì tôi sẵn sàng quay lại
    Khi khởi tạo, không nhất thiết phải tải toàn bộ dữ liệu; sẽ tốt hơn nếu chỉ lazy loading một phần từ từng danh mục

    • Vấn đề tải hiện tại là hiện tượng hug of death do site bị quá tải. Có nhiều lượt truy cập mỗi giây nên cần băng thông hơn 1Gbps
      Lý do phải tải mọi dữ liệu cùng lúc là để ánh xạ mối liên kết giữa các bài đăng, và cách này cũng có lợi cho quyền riêng tư
  • Tổng hợp các site liên quan

    • WikiSpeedRuns
    • Six Degrees of Wikipedia
    • Wikitok.io
    • Cảm ơn vì đã giúp tôi biết đến chúng. WikiSpeedRuns thực sự là một site rất vui. Với link thứ hai, tôi còn có thể kiểm tra mình đã làm tốt đến đâu
  • Điều mới học được hôm nay (TIL):
    Quần đảo Virgin thuộc Mỹ ban đầu là lãnh thổ của Đan Mạch, và đã được bán cho Mỹ vào năm 1917 do lo ngại Đức chiếm đóng trong Thế chiến thứ nhất
    Xem bài viết liên quan

    • Gần đây báo chí lại nhắc đến việc trong thỏa thuận mua bán này, Mỹ đã tuyên bố từ bỏ quyền đối với Greenland
  • Tôi thực sự thích khái niệm này. Wikitok.io cũng có, nhưng việc kết hợp thêm thuật toán gợi ý ở đây là một điểm độc đáo
    Tôi tò mò theo thời gian thuật toán sẽ tìm cho tôi những bài wiki thú vị nào thay mình
    Tuy vậy, sẽ tốt hơn nếu có cả bản thường chứ không chỉ bản Simple English. Dù sao tôi vẫn hài lòng đến mức đã tạo lối tắt ứng dụng

    • Tôi bấm vào bài về vũ khí hạt nhân và ngạc nhiên vì chất lượng quá thấp. Sau đó mới biết đó là Simple English Wikipedia. Trước giờ tôi không biết có phiên bản như vậy
    • Ở màn hình đầu tiên tôi thấy bài về ung thư thực quản, khá thú vị
  • Tôi đã rời Facebook vì quá ghét trải nghiệm feed
    Gần đây tôi biết rằng nếu dùng địa chỉ https://www.facebook.com/?sk=h_chr cùng với tiện ích FB Purity, thì có thể xem feed theo trình tự thời gian của những người và nhóm mà tôi muốn
    Khi xem feed đã được sắp xếp như vậy, tôi có thể duy trì trạng thái cảm xúc bình yên hơn nhiều. Tôi nhận ra phần lớn cảm xúc tiêu cực đến từ những feed ngoài tầm kiểm soát của mình

  • Ý tưởng thì hay, nhưng thời gian tải ban đầu quá lâu, và việc phải tải lại toàn bộ dữ liệu mỗi lần truy cập lại là rất bất tiện