1 điểm bởi GN⁺ 2023-10-21 | 1 bình luận | Chia sẻ qua WhatsApp
  • Bài viết khám phá các mục có số lượt xem thấp nhất trên Wikipedia
  • Tác giả phân tích phân bố lượt xem bằng dữ liệu pageview năm 2021 từ một mẫu ngẫu nhiên gồm khoảng 32.000 bài viết trên Wikipedia
  • Bài viết ở vị trí trung vị ghi nhận khoảng 1.000 lượt xem mỗi năm, còn trung bình là khoảng 13.000 lượt
  • Các bài có ít lượt xem nhất trong mẫu phần lớn là trang định hướng, tức công cụ điều hướng dẫn đến các bài có tên tương tự
  • Nếu loại trừ các trang định hướng, những bài có ít lượt xem nhất chủ yếu nói về các chủng loại hoặc địa điểm địa lý ít rõ ràng
  • Tác giả đưa ra giả thuyết rằng nút "Bài viết ngẫu nhiên" của Wikipedia có thể chiếm phần lớn lượt xem của các bài kém phổ biến nhất
  • Nút "Bài viết ngẫu nhiên" gán cho mỗi bài một số ngẫu nhiên từ 0 đến 1, và xác suất một bài được chọn bằng khoảng cách giữa số được gán cho bài đó và số thấp hơn liền kề
  • Tác giả phát hiện rằng các bài có ít lượt xem nhất có xu hướng có khoảng cách rất nhỏ giữa số được gán và số thấp hơn liền kề, cho thấy chúng ít có khả năng được chọn bởi nút "Bài viết ngẫu nhiên" hơn
  • Hai bài có ít lượt xem nhất trong năm 2021 là hai bài về các loài bướm, mỗi bài chỉ có 3 lượt xem
  • Tác giả kết luận rằng các bài có ít lượt xem nhất trên Wikipedia không phải vì chúng nói về chủ đề hấp dẫn, mà vì khoảng cách giữa số được gán và số thấp hơn liền kề là cực nhỏ
  • Tác giả cũng chỉ ra rằng các chính sách và thực tiễn của Wikipedia về độ nổi bật và xóa bài đã dẫn đến sự thiếu vắng các bài về những chủ đề mơ hồ có thể bị lợi dụng cho mục đích quảng bá hay xung đột lợi ích
  • Tác giả cho rằng sự tồn tại của các bài viết cực kỳ mơ hồ và rất nhỏ không phải là điều có hại, mà có thể tạo nền tảng cho việc mở rộng trong tương lai

1 bình luận

 
GN⁺ 2023-10-21
Ý kiến trên Hacker News
  • Bài viết nhấn mạnh cuộc thảo luận về các tiêu chí xóa bài trên Wikipedia, đặc biệt việc độ nổi bật xuất phát từ tính chất và chất lượng của các nguồn được trích dẫn là lý do xóa phổ biến nhất
  • Bài viết nhấn mạnh những thay đổi trong hướng dẫn về độ nổi bật của Wikipedia, khiến nhiều bài về các nữ cầu thủ bóng đá quốc tế bị xóa do thiếu đưa tin từ truyền thông dòng chính
  • Đề cập đến tính hữu ích của Navboxes trên Wikipedia, giúp cung cấp cái nhìn tổng thể về các chủ đề phức tạp và hỗ trợ hiểu cách các phần khớp với nhau trong những cấu trúc phân cấp phức tạp
  • Chỉ trích cách chọn một trang ngẫu nhiên trên Wikipedia, cho rằng điều này có thể tạo ra sự thiên lệch lâu dài trong quá trình ngẫu nhiên hóa
  • Khen ngợi phạm vi thông tin rất rộng có trên Wikipedia, từ những loài ít được chú ý đến các ngôi làng nhỏ, điều mà nếu không có Internet thì sẽ không thể làm được
  • Một gợi ý mang tính hài hước rằng không có bài nào trên Wikipedia là nhàm chán, vì ngay cả thứ kém thú vị nhất cũng trở nên thú vị chính vì trạng thái đó
  • Nhắc đến một loạt video YouTube của Network Rail tại Anh về những nhà ga ít được sử dụng nhất, như một sự so sánh với các bài viết ít được xem nhất trên Wikipedia
  • Chỉ ra rằng các quản trị viên Wikipedia thường xóa những bài bị đánh giá là không quan trọng, khiến danh sách các bài ít được xem nhất thay đổi thường xuyên
  • Ghi nhận rằng một trong những bài ít được xem nhất đã bị phá hoại ngay sau khi bài được đăng
  • Nhấn mạnh tranh cãi về sải cánh của loài bướm đêm Scrobipalpula crustaria, như một ví dụ về những quan điểm gây tranh luận đối với các chủ đề thoạt nhìn có vẻ không quan trọng
  • Cuối cùng, bài viết hài hước chỉ ra rằng nếu đăng tên bài Wikipedia ít được xem nhất thì lượt xem của nó sẽ tăng lên, làm vô hiệu mục đích của việc tìm kiếm đó