- Bài viết khám phá các mục có số lượt xem thấp nhất trên Wikipedia
- Tác giả phân tích phân bố lượt xem bằng dữ liệu pageview năm 2021 từ một mẫu ngẫu nhiên gồm khoảng 32.000 bài viết trên Wikipedia
- Bài viết ở vị trí trung vị ghi nhận khoảng 1.000 lượt xem mỗi năm, còn trung bình là khoảng 13.000 lượt
- Các bài có ít lượt xem nhất trong mẫu phần lớn là trang định hướng, tức công cụ điều hướng dẫn đến các bài có tên tương tự
- Nếu loại trừ các trang định hướng, những bài có ít lượt xem nhất chủ yếu nói về các chủng loại hoặc địa điểm địa lý ít rõ ràng
- Tác giả đưa ra giả thuyết rằng nút "Bài viết ngẫu nhiên" của Wikipedia có thể chiếm phần lớn lượt xem của các bài kém phổ biến nhất
- Nút "Bài viết ngẫu nhiên" gán cho mỗi bài một số ngẫu nhiên từ 0 đến 1, và xác suất một bài được chọn bằng khoảng cách giữa số được gán cho bài đó và số thấp hơn liền kề
- Tác giả phát hiện rằng các bài có ít lượt xem nhất có xu hướng có khoảng cách rất nhỏ giữa số được gán và số thấp hơn liền kề, cho thấy chúng ít có khả năng được chọn bởi nút "Bài viết ngẫu nhiên" hơn
- Hai bài có ít lượt xem nhất trong năm 2021 là hai bài về các loài bướm, mỗi bài chỉ có 3 lượt xem
- Tác giả kết luận rằng các bài có ít lượt xem nhất trên Wikipedia không phải vì chúng nói về chủ đề hấp dẫn, mà vì khoảng cách giữa số được gán và số thấp hơn liền kề là cực nhỏ
- Tác giả cũng chỉ ra rằng các chính sách và thực tiễn của Wikipedia về độ nổi bật và xóa bài đã dẫn đến sự thiếu vắng các bài về những chủ đề mơ hồ có thể bị lợi dụng cho mục đích quảng bá hay xung đột lợi ích
- Tác giả cho rằng sự tồn tại của các bài viết cực kỳ mơ hồ và rất nhỏ không phải là điều có hại, mà có thể tạo nền tảng cho việc mở rộng trong tương lai
1 bình luận
Ý kiến trên Hacker News