- Mục tiêu của dự án này là cố gắng hiểu kiểu điều tiết và quy mô điều tiết trên trang chủ Hacker News.
- Nhà phát triển của dự án đọc Hacker News hằng ngày và hiểu rằng việc điều tiết trang là một công việc khó khăn.
- Việc điều tiết mang tính "công khai" trên trang chủ được thực hiện bằng hai công cụ chính: thay đổi tiêu đề bài viết và gỡ trực tiếp bài viết.
- Nhà phát triển đã tạo một ứng dụng nhỏ để ghi lại các bài viết bị gỡ khỏi trang chủ và công khai nó.
- Một kết quả tích cực của dự án này có thể là HN tự cung cấp một danh sách tương tự, hoặc thông báo cho người dùng khi bài viết của họ bị xử lý trên trang chủ.
Tại sao?
- Một người bạn của nhà phát triển đã đăng hai bài viết liên quan đến OnnxStream lên Hacker News.
- Bài viết đầu tiên bị đổi tiêu đề và biến mất khỏi trang chủ.
- Bài viết thứ hai đơn giản là bị gỡ khỏi trang chủ.
- Nhà phát triển đã tạo một ứng dụng console nhỏ để xác định hiện tượng này xảy ra thường xuyên đến mức nào.
Cách hoạt động
- Sử dụng API chính thức của HN, dịch vụ này mỗi phút lấy 90 bài viết hàng đầu và so sánh chúng với 30 bài viết hàng đầu đã lấy ở phút trước.
- Các bài viết bị thiếu sẽ được ghi lại, và nếu một bài viết xuất hiện lại trên trang chủ thì nó sẽ bị xóa khỏi nhật ký.
- Tiêu đề và URL là của thời điểm bài viết lần đầu xuất hiện trong top 30, còn số điểm, số bình luận và thứ hạng là tại thời điểm bài viết bị gỡ khỏi trang chủ.
Ý kiến của GN⁺
- Dự án này có thể góp phần tăng tính minh bạch cho các cộng đồng trực tuyến.
- Nó có thể giúp người dùng hiểu vì sao bài đăng của họ bị gỡ.
- Nó cho thấy cách tận dụng kỹ năng lập trình để tạo tác động tích cực cho cộng đồng.
1 bình luận
Ý kiến trên Hacker News
Một người dùng Hacker News cho biết họ rất hài lòng với các điều phối viên sau khi xem danh sách những bài đã bị gỡ. Theo họ, phần lớn các bài này mang tính giật gân, quảng cáo, câu view hoặc lạc đề, và không có lấy một bài nào mà họ cho là không đáng bị gỡ.
Một người dùng khác bác bỏ giả định rằng một bài viết không thể rơi từ top 30 xuống ngoài top 90 chỉ trong vòng một phút. Họ giải thích rằng điều này có thể xảy ra do bộ phát hiện flamewar (phát hiện tranh luận quá nhiệt), cờ do người dùng gắn, và các cơ chế phần mềm khác. Họ cũng nói rằng cờ của người dùng ảnh hưởng đến thứ hạng của bài gửi từ rất lâu trước khi nhãn [flagged] xuất hiện.
Một điều phối viên cho biết cách Hacker News vận hành đã được giải thích đầy đủ và có thể bảo vệ được, nên họ không thấy vấn đề gì khi người dùng xây dựng các hệ thống như thế này. Tuy nhiên, họ khuyên rằng các hệ thống phức tạp khó tránh khỏi gây bối rối, nên nếu muốn hiểu chính xác thì cần có khả năng chịu đựng sự rối rắm ở mức cao. Họ cũng nhấn mạnh việc sửa lỗi là quan trọng và yêu cầu chỉnh sửa một đoạn văn bản cụ thể.
Một người dùng nói rằng họ khó tin nổi việc người dùng HN đã chán các tin tức liên quan đến LLM (mô hình ngôn ngữ lớn). Tuy nhiên, một người dùng khác thừa nhận rằng bản thân họ đúng là đã chán, nhưng không vì thế mà đi gắn cờ các nội dung đó.
Một người dùng khác cho biết họ đã tự làm website riêng để tìm đúng loại tin mình muốn đọc, đồng thời khuyên người khác cũng nên tự xây dựng và quản lý thứ họ muốn. Người này đánh giá Hacker News là một trong những cộng đồng được quản lý tốt nhất và tồn tại bền bỉ nhất.
Một người dùng cho rằng cộng đồng HN đã chán các bài viết liên quan đến LLM, và cộng đồng có quyền gắn cờ những bài mà họ xem là spam.
Một người dùng khác đặt câu hỏi vì sao lại khó đến vậy để thừa nhận rằng người dùng HN có thể đã chán tin tức liên quan đến LLM. Người này nói rằng bản thân họ cũng đã chán, nhưng không có quyền gắn cờ.
Một người dùng cho biết việc một bài tụt hạng rất nhanh chưa chắc đã là do kiểm duyệt. Trong số 13 bài được liệt kê vào thứ Hai, ngày 22 tháng 1 năm 2024, chỉ có 3 bài có vẻ đã bị gỡ khỏi HN, còn 10 bài kia vẫn tồn tại. Người này cho rằng HN đang làm tốt công việc kiểm duyệt.
Cuối cùng, một người dùng bình luận rằng ngay cả con người lạc quan và ngây thơ như họ cũng không thấy ngạc nhiên trước phản ứng cho rằng người dùng HN có thể đã chán các tin tức liên quan đến LLM.