- Xikipedia là một ứng dụng web hiển thị các bài viết từ Simple Wikipedia dưới dạng feed mạng xã hội
- Trình diễn một thuật toán có thể đề xuất nội dung tương tự dựa trên mẫu nhấp chuột của người dùng, ngay cả khi không dùng machine learning
- Mọi phép xử lý đều được thực hiện cục bộ, và dữ liệu người dùng không bị thu thập hoặc chia sẻ
- Khi làm mới trang hoặc đóng trang, dữ liệu đã lưu sẽ bị xóa ngay lập tức
- Tái cấu trúc nội dung Wikipedia thành một cách khám phá mới, cho thấy khả năng tương tác trong việc tiêu thụ thông tin
Tổng quan về Xikipedia
-
Xikipedia là một website theo dạng feed giả mạng xã hội, dựa trên các bài viết của Simple Wikipedia
- Người dùng có thể khám phá bằng cách cuộn qua các bài wiki được hiển thị ngẫu nhiên
- Trang web dùng mô tả: “Wikipedia you can doomscroll”
-
Dự án này cho thấy rằng một thuật toán đơn giản vẫn có thể học được sở thích của người dùng mà không cần machine learning hay dữ liệu người dùng từ bên ngoài
- Hệ thống phát hiện người dùng dừng lại lâu hơn hoặc nhấp vào mục nào để hiển thị nhiều hơn các bài viết về chủ đề tương tự
- Thuật toán chỉ chạy trong môi trường cục bộ, nên dữ liệu không được gửi tới máy chủ bên ngoài
Xử lý dữ liệu và bảo vệ quyền riêng tư
-
Xikipedia không thu thập hoặc chia sẻ dữ liệu
- Toàn bộ logic đề xuất được xử lý ngay trong trình duyệt
- Khi đóng tab hoặc làm mới trang, mọi dữ liệu đều biến mất
-
Cấu trúc này hoạt động như một thử nghiệm về hệ thống gợi ý lấy bảo vệ quyền riêng tư làm trung tâm
Cách sử dụng và lưu ý
- Khi bắt đầu, người dùng có thể chọn danh mục hoặc tự thêm danh mục
- Nội dung và hình ảnh được hiển thị được lấy từ các bài viết Wikipedia ngẫu nhiên
- Vì vậy có thể xuất hiện nội dung NSFW (người lớn), chỉ khuyến nghị người trưởng thành sử dụng
Mã nguồn mở và cộng đồng
- Mã nguồn được công khai trên GitHub
- Có thể thảo luận về dự án trên nhiều nền tảng như Fedi, Bluesky, Twitter
Ý nghĩa
- Xikipedia là một dự án thử nghiệm cho thấy tiềm năng của gợi ý cá nhân hóa dựa trên thuật toán đơn giản
- Gợi ý rằng vẫn có thể cung cấp trải nghiệm phù hợp với từng người dùng mà không cần thu thập dữ liệu
- Bằng cách tái cấu trúc nội dung Wikipedia như một feed xã hội, dự án đề xuất một hình thức khám phá thông tin mới
1 bình luận
Ý kiến trên Hacker News
Cách dễ nhất để phá vỡ rào cản tâm lý do nội dung ngắn tạo ra là tự nhắc mình rằng “biết” không phải là điểm kết thúc, mà là tin tưởng vào kiến thức đó và truyền đạt lại
Thông tin tôi chủ động tìm kiếm thì đáng tin, còn thông tin do thuật toán ném tới thì kém đáng tin hơn vì thiếu ngữ cảnh
Dòng nội dung ngắn giống như một chiếc xe tải đổ ngẫu nhiên đồ vật xuống sân. Nếu phần lớn là thông tin vô dụng thì tôi nghĩ quên nó đi còn tốt hơn
Những công cụ như thế này hữu ích với người muốn tiêu thụ nội dung ngắn một cách có chủ đích. Với tôi, chỉ đúng khi tôi muốn khám phá chủ đề mới
Nhưng trên thực tế, nhiều khi tôi chỉ định xem bài đăng của bạn bè rồi lại vô thức cuộn mãi không dừng được
Vấn đề không nằm ở nội dung mà ở chính hành vi “vuốt” và chuyển ngữ cảnh liên tục, thứ làm suy giảm khả năng tập trung
Ngay cả nội dung ngắn mang tính giáo dục cũng không thoát khỏi giới hạn này. Tôi vẫn nghi ngờ hiệu quả thực sự của nó
Nghiên cứu liên quan: bài báo Cyberpsychology, nghiên cứu về chuyển ngữ cảnh
Bản thân ý tưởng thì rất tuyệt, nhưng đáng tiếc là phải tải 40MB dữ liệu trong 5 phút trước khi màn hình đầu tiên hiện ra
Sẽ tốt hơn nếu có một tiêu chí xếp hạng để đẩy lên những bài viết hay, mang lại cảm giác “hôm nay mình học được điều mới”. Dù vậy, vẫn phải vỗ tay cho sự sáng tạo của nhà phát triển
Tôi phát hiện lỗi ngữ pháp trong một mục và đã thực sự chỉnh sửa trang Wikipedia, cảm giác khá tự hào. Giá mà mạng xã hội cũng có tính năng như vậy
Nếu giải quyết được vấn đề tải thì tôi sẵn sàng quay lại
Khi khởi tạo, không nhất thiết phải tải toàn bộ dữ liệu; sẽ tốt hơn nếu chỉ lazy loading một phần từ từng danh mục
Lý do phải tải mọi dữ liệu cùng lúc là để ánh xạ mối liên kết giữa các bài đăng, và cách này cũng có lợi cho quyền riêng tư
Tổng hợp các site liên quan
Điều mới học được hôm nay (TIL):
Quần đảo Virgin thuộc Mỹ ban đầu là lãnh thổ của Đan Mạch, và đã được bán cho Mỹ vào năm 1917 do lo ngại Đức chiếm đóng trong Thế chiến thứ nhất
Xem bài viết liên quan
Tôi thực sự thích khái niệm này. Wikitok.io cũng có, nhưng việc kết hợp thêm thuật toán gợi ý ở đây là một điểm độc đáo
Tôi tò mò theo thời gian thuật toán sẽ tìm cho tôi những bài wiki thú vị nào thay mình
Tuy vậy, sẽ tốt hơn nếu có cả bản thường chứ không chỉ bản Simple English. Dù sao tôi vẫn hài lòng đến mức đã tạo lối tắt ứng dụng
Tôi đã rời Facebook vì quá ghét trải nghiệm feed
Gần đây tôi biết rằng nếu dùng địa chỉ https://www.facebook.com/?sk=h_chr cùng với tiện ích FB Purity, thì có thể xem feed theo trình tự thời gian của những người và nhóm mà tôi muốn
Khi xem feed đã được sắp xếp như vậy, tôi có thể duy trì trạng thái cảm xúc bình yên hơn nhiều. Tôi nhận ra phần lớn cảm xúc tiêu cực đến từ những feed ngoài tầm kiểm soát của mình
Ý tưởng thì hay, nhưng thời gian tải ban đầu quá lâu, và việc phải tải lại toàn bộ dữ liệu mỗi lần truy cập lại là rất bất tiện