- Trong nghiên cứu phân tích cảm xúc bài đăng trên Hacker News, khoảng 65% tổng số được phân loại là mang cảm xúc tiêu cực, và các bài đăng này nhìn chung ghi nhận điểm số cao hơn
- Điểm trung bình của các bài đăng tiêu cực là 35,6 điểm, trong khi mức trung bình toàn bộ là 28 điểm, cho thấy mức chênh hiệu suất khoảng 27%
- Phân tích được thực hiện trên 32.000 bài đăng và 340.000 bình luận, và 6 loại mô hình đều cho thấy xu hướng thiên lệch tiêu cực nhất quán
- Các mô hình được sử dụng gồm DistilBERT, BERT Multi, RoBERTa, Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B, và dashboard cuối cùng dùng kết quả của DistilBERT vì lý do hiệu quả
- Phần lớn là tính tiêu cực xoay quanh phê bình mang tính xây dựng như chỉ trích kỹ thuật, bất mãn với ngành, thất vọng về API, điều này gợi ý mối tương quan giữa mức độ tương tác và tính gây tranh luận
Kết quả phân tích cảm xúc trên Hacker News
- Điểm trung bình của bài đăng trên Hacker News là 28, còn các bài đăng mang cảm xúc tiêu cực đạt trung bình 35,6 điểm, cho thấy mức độ tương tác cao hơn
- Hiệu suất của các bài đăng tiêu cực cao hơn 27% so với mức trung bình toàn bộ
- Nghiên cứu xử lý động lực học của mức độ chú ý trên HN (Hacker News), bao gồm đường cong suy giảm, gắn kết ưu tiên, xác suất tồn tại, dự đoán tương tác ban đầu và hơn thế nữa
- Bài báo preprint liên quan đã được công bố trên SSRN
Dữ liệu và cấu hình mô hình
- Đối tượng phân tích gồm 32.000 bài đăng và 340.000 bình luận
- Khoảng 65% tổng số được phân loại là mang cảm xúc tiêu cực
- Nhà nghiên cứu có đề cập khả năng bộ phân loại bị thiên lệch theo hướng tiêu cực, nhưng cùng một xu hướng đã được xác nhận trên cả 6 mô hình
- Các mô hình được sử dụng là DistilBERT, BERT Multi, RoBERTa (dựa trên transformer) và Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B (dựa trên LLM)
- Phân bố cảm xúc khác nhau giữa các mô hình, nhưng xu hướng nghiêng về tiêu cực được duy trì nhất quán
- Dashboard cuối cùng sử dụng kết quả từ DistilBERT vận hành hiệu quả trên pipeline dựa trên Cloudflare
Định nghĩa và đặc điểm của cảm xúc tiêu cực
- Nội dung được phân loại là “tiêu cực” bao gồm chỉ trích kỹ thuật, hoài nghi với các công bố, bất mãn với thông lệ ngành, cảm giác thất vọng liên quan đến API
- Phần lớn tính tiêu cực này là phê bình thực chất chứ không phải công kích cá nhân
- Phê bình kỹ thuật có bản chất khác với tấn công cá nhân
- Nhà nghiên cứu thừa nhận cả hai khả năng: tính tiêu cực có thể thúc đẩy tương tác, hoặc nội dung gây tranh cãi đồng thời kéo theo cách diễn đạt tiêu cực và sự chú ý
Kế hoạch công bố sắp tới
- Nhà nghiên cứu dự kiến sẽ sớm công bố toàn bộ mã nguồn, bộ dữ liệu và dashboard dành cho kho lưu trữ HN
2 bình luận
Mọi người quan tâm đến chuyện tầm phào và nhiễu hơn. [bao gồm khái quát hóa vội vàng]
Ý kiến trên Hacker News
Tôi nghĩ bộ phân loại của OP đang đưa ra hai giả định ảnh hưởng đến kết quả
Tôi đang viết một bình luận mang tính phê bình ngay lúc này, nhưng điều đó không nhất thiết là “tiêu cực”. Đúng hơn, chính vì dữ liệu và kết luận của OP rõ ràng nên mới có thể phê bình được. Tôi nghĩ chính kiểu phê bình mang tính xây dựng này mới là bằng chứng của một cuộc thảo luận tốt
Việc thái độ hoài nghi bị phân loại là tiêu cực thì đúng một phần. Dữ liệu huấn luyện SST-2 xem các đánh giá mang tính phê bình là tiêu cực. Nhưng ở đây “tiêu cực” không có nghĩa là thù địch mà là mang tính đánh giá. Văn hóa phê bình của HN bị các mô hình như vậy đọc thành tiêu cực, nhưng đó là hiện tượng tự nhiên do đặc tính của diễn ngôn kỹ thuật.
Tính trung lập tồn tại dưới dạng điểm liên tục quanh mức 0.5. Người dùng HN có xu hướng đưa ra lập trường mạnh nên mới xuất hiện phân bố ở hai cực. Trong tương lai đáng để thử một mô hình phân loại 3 lớp.
Bình luận của bạn mang tính phê bình nhưng là diễn ngôn chất lượng cao. Tôi cho rằng tính tiêu cực trên HN không phải là thù địch mà là phê bình mang tính xây dựng thúc đẩy sự tham gia
Liên kết mô hình DistilBERT SST-2
Các bài đăng tiêu cực tôi đăng lên thường có phản hồi tốt hơn những bài trung lập hoặc tích cực.
Tiêu đề “Richard Stallman is Dead” cho tỷ lệ nhấp cao nhất, và một mô hình khác dự đoán xác suất tỷ lệ bình luận/bình chọn vượt quá 0,5. Các chủ đề clickbait, tranh cãi giới tính, và xe cộ đặc biệt mạnh.
Khó tin là điểm trung bình lại là 35. Trước đây trung bình chỉ khoảng 8, nên tôi tò mò về tiêu chí lấy mẫu
Có thể các bài đăng 0 điểm đã bị bỏ sót nên mức trung bình mới cao hơn. Cảm ơn phản hồi, tôi sẽ xem lại trước khi xuất bản bài báo. Bộ phân loại của bạn cũng rất thú vị
Tôi cũng thấy hiện tượng tương tự trong phần bình luận. Những bình luận ngắn và mỉa mai thường có phản hồi tốt hơn hẳn các bài phân tích dài.
Những bình luận dài được chăm chút thì bị phớt lờ, còn bình luận ngắn viết bộc phát lại nhiều khi “nổ tung”, điều đó khá khiến tôi thất vọng
HN không thích trò đùa, trừ khi có kèm giải thích
Nếu từng vận hành blog, có lẽ sẽ cảm nhận rõ hơn tiêu chuẩn của sự tương tác này
Nếu “tiêu cực” bao gồm phê bình kỹ thuật, bất mãn với ngành, hay sự thất vọng vì API, thì phần lớn thảo luận trên HN đều thuộc phạm vi đó.
Chỉ để lại “thích” dưới bài quảng bá OpenAI thì chẳng có ý nghĩa gì; chính phân tích mang tính phê bình mới là kiểu tham gia có giá trị.
Tôi thậm chí cho rằng những bài nổi tiếng mà không có bình luận lại là bằng chứng cho thấy site đang vận hành tốt
Chúng ta tự lọc để ưu tiên phản ứng tiêu cực. Nội dung tích cực thường trọn vẹn nên không kích thích phản hồi, còn nội dung tiêu cực thì khơi ra tương tác
Vì vậy chúng ta bị hút vào tin xấu hơn, còn tin tốt thì chỉ lướt qua. Đó là cốt lõi của nền kinh tế chú ý
Phê bình kỹ thuật khác với công kích cá nhân. Tính tiêu cực trên HN phần lớn là phê bình mang tính xây dựng.
Nếu sự mỉa mai đi quá xa thì kiểu gì cũng sẽ có “lời phàn nàn về những lời phàn nàn”.
Tôi nghĩ thà nghe người ta nói “răng bạn dính cái gì kìa” còn hơn là chỉ được khen
Việc kiểm duyệt của HN loại bỏ nội dung thù địch khá nhanh, nên phần còn lại đa số là phê bình có tính xây dựng.
Điều thú vị là kiểu “tiêu cực” này có liên quan tới tỷ lệ tương tác cao hơn 27%. Nói cách khác, cộng đồng kỹ thuật coi trọng phê bình hơn quảng bá.
Tôi dự định sẽ ghi rõ trong bài báo rằng “cảm xúc tiêu cực” ở đây là phê bình mang tính đánh giá theo mô hình SST-2, chứ không phải phát ngôn độc hại
Hồi trước khi Reddit API còn truy cập được, tôi từng thử dùng ứng dụng đọc rif để chặn các subreddit có cảm xúc tiêu cực.
Sau khi chặn vài trăm cái, thứ còn lại chỉ là nội dung tích cực về động vật và sở thích cá nhân. Tôi nhận ra Reddit lấy tính tiêu cực làm trung tâm đến mức nào, đồng thời khi bỏ nó đi thì lại trở nên khá buồn chán
Liên kết danh sách chặn
Những bài đó tạo cảm giác như bot đang nói chuyện với bot. Tôi nghi Reddit đang để mặc cấu trúc đó tồn tại nhằm tăng lượng hiển thị quảng cáo
Trên internet, khó có tổ hợp nào mạnh bằng than phiền hoặc sửa lưng ai đó.
Là người dùng ESL (English as a Second Language), thuật ngữ internet đầu tiên tôi học được là “flamewar”
Theo bài báo, bất bình đẳng về mức độ chú ý trên HN là cực kỳ nghiêm trọng. Hệ số Gini là 0,89, còn cao hơn Twitter
Điều này có thể là do cấu trúc phân phối hiển thị của HN. Bài mới bắt đầu ở /newest, và nếu không nhận được chút chú ý ban đầu từ một số ít người thì sẽ gần như biến mất.
Không giống Reddit có mức hiển thị mặc định, HN yêu cầu phải vượt qua cánh cổng ban đầu thì mới lên trang chính
Kỹ sư làm nghề giải quyết vấn đề nên tự nhiên sẽ có tư duy phản biện.
Ở các hội chợ triển lãm công nghiệp, kỹ sư thường khoanh tay và tiếp cận một cách lạnh lùng, trong khi cộng đồng maker lại tràn đầy năng lượng tích cực.
Cuối cùng thì đó chỉ là khác biệt giữa “ly nước vơi một nửa” và “ly nước đầy một nửa”