2 điểm bởi GN⁺ 2026-01-07 | 2 bình luận | Chia sẻ qua WhatsApp
  • Trong nghiên cứu phân tích cảm xúc bài đăng trên Hacker News, khoảng 65% tổng số được phân loại là mang cảm xúc tiêu cực, và các bài đăng này nhìn chung ghi nhận điểm số cao hơn
  • Điểm trung bình của các bài đăng tiêu cực là 35,6 điểm, trong khi mức trung bình toàn bộ là 28 điểm, cho thấy mức chênh hiệu suất khoảng 27%
  • Phân tích được thực hiện trên 32.000 bài đăng và 340.000 bình luận, và 6 loại mô hình đều cho thấy xu hướng thiên lệch tiêu cực nhất quán
  • Các mô hình được sử dụng gồm DistilBERT, BERT Multi, RoBERTa, Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B, và dashboard cuối cùng dùng kết quả của DistilBERT vì lý do hiệu quả
  • Phần lớn là tính tiêu cực xoay quanh phê bình mang tính xây dựng như chỉ trích kỹ thuật, bất mãn với ngành, thất vọng về API, điều này gợi ý mối tương quan giữa mức độ tương tác và tính gây tranh luận

Kết quả phân tích cảm xúc trên Hacker News

  • Điểm trung bình của bài đăng trên Hacker News là 28, còn các bài đăng mang cảm xúc tiêu cực đạt trung bình 35,6 điểm, cho thấy mức độ tương tác cao hơn
    • Hiệu suất của các bài đăng tiêu cực cao hơn 27% so với mức trung bình toàn bộ
  • Nghiên cứu xử lý động lực học của mức độ chú ý trên HN (Hacker News), bao gồm đường cong suy giảm, gắn kết ưu tiên, xác suất tồn tại, dự đoán tương tác ban đầu và hơn thế nữa
    • Bài báo preprint liên quan đã được công bố trên SSRN

Dữ liệu và cấu hình mô hình

  • Đối tượng phân tích gồm 32.000 bài đăng và 340.000 bình luận
  • Khoảng 65% tổng số được phân loại là mang cảm xúc tiêu cực
    • Nhà nghiên cứu có đề cập khả năng bộ phân loại bị thiên lệch theo hướng tiêu cực, nhưng cùng một xu hướng đã được xác nhận trên cả 6 mô hình
  • Các mô hình được sử dụng là DistilBERT, BERT Multi, RoBERTa (dựa trên transformer) và Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B (dựa trên LLM)
    • Phân bố cảm xúc khác nhau giữa các mô hình, nhưng xu hướng nghiêng về tiêu cực được duy trì nhất quán
    • Dashboard cuối cùng sử dụng kết quả từ DistilBERT vận hành hiệu quả trên pipeline dựa trên Cloudflare

Định nghĩa và đặc điểm của cảm xúc tiêu cực

  • Nội dung được phân loại là “tiêu cực” bao gồm chỉ trích kỹ thuật, hoài nghi với các công bố, bất mãn với thông lệ ngành, cảm giác thất vọng liên quan đến API
  • Phần lớn tính tiêu cực này là phê bình thực chất chứ không phải công kích cá nhân
    • Phê bình kỹ thuật có bản chất khác với tấn công cá nhân
  • Nhà nghiên cứu thừa nhận cả hai khả năng: tính tiêu cực có thể thúc đẩy tương tác, hoặc nội dung gây tranh cãi đồng thời kéo theo cách diễn đạt tiêu cực và sự chú ý

Kế hoạch công bố sắp tới

  • Nhà nghiên cứu dự kiến sẽ sớm công bố toàn bộ mã nguồn, bộ dữ liệu và dashboard dành cho kho lưu trữ HN

2 bình luận

 
shakespeares 2026-01-07

Mọi người quan tâm đến chuyện tầm phào và nhiễu hơn. [bao gồm khái quát hóa vội vàng]

 
GN⁺ 2026-01-07
Ý kiến trên Hacker News
  • Tôi nghĩ bộ phân loại của OP đang đưa ra hai giả định ảnh hưởng đến kết quả

    1. Gộp thái độ hoài nghi vào nhóm tiêu cực
    2. Không cho phép danh mục trung lập
      Tôi đang viết một bình luận mang tính phê bình ngay lúc này, nhưng điều đó không nhất thiết là “tiêu cực”. Đúng hơn, chính vì dữ liệu và kết luận của OP rõ ràng nên mới có thể phê bình được. Tôi nghĩ chính kiểu phê bình mang tính xây dựng này mới là bằng chứng của một cuộc thảo luận tốt
    • Tôi là OP đây :)
      Việc thái độ hoài nghi bị phân loại là tiêu cực thì đúng một phần. Dữ liệu huấn luyện SST-2 xem các đánh giá mang tính phê bình là tiêu cực. Nhưng ở đây “tiêu cực” không có nghĩa là thù địch mà là mang tính đánh giá. Văn hóa phê bình của HN bị các mô hình như vậy đọc thành tiêu cực, nhưng đó là hiện tượng tự nhiên do đặc tính của diễn ngôn kỹ thuật.
      Tính trung lập tồn tại dưới dạng điểm liên tục quanh mức 0.5. Người dùng HN có xu hướng đưa ra lập trường mạnh nên mới xuất hiện phân bố ở hai cực. Trong tương lai đáng để thử một mô hình phân loại 3 lớp.
      Bình luận của bạn mang tính phê bình nhưng là diễn ngôn chất lượng cao. Tôi cho rằng tính tiêu cực trên HN không phải là thù địch mà là phê bình mang tính xây dựng thúc đẩy sự tham gia
    • Tôi cũng định chỉ ra rằng thái độ hoài nghi đang bị gộp vào tiêu cực. Góc nhìn phê bình của HN thực ra lại là một đặc điểm tích cực, nhưng kiểu phân biệt sắc thái cảm xúc này về mặt kỹ thuật vẫn còn khó
    • Có nhiều phê bình chính đáng, nhưng cũng tồn tại kiểu bới lông tìm vết vô ích theo phong cách “reply guy” hoặc những lời than phiền lặp đi lặp lại về một công ty nào đó. Những thứ này rất khó phân loại, và so với Reddit thì tôi thấy HN vẫn tốt hơn nhiều
    • Không rõ có đúng là mô hình OP dùng hay không, nhưng nó phân loại bình luận của bạn là tích cực tới 99,9%
      Liên kết mô hình DistilBERT SST-2
    • Đúng vậy, vấn đề cốt lõi là tư duy phản biện bị phân loại thành tiêu cực
  • Các bài đăng tiêu cực tôi đăng lên thường có phản hồi tốt hơn những bài trung lập hoặc tích cực.
    Tiêu đề “Richard Stallman is Dead” cho tỷ lệ nhấp cao nhất, và một mô hình khác dự đoán xác suất tỷ lệ bình luận/bình chọn vượt quá 0,5. Các chủ đề clickbait, tranh cãi giới tính, và xe cộ đặc biệt mạnh.
    Khó tin là điểm trung bình lại là 35. Trước đây trung bình chỉ khoảng 8, nên tôi tò mò về tiêu chí lấy mẫu

    • Mẫu được thu thập từ tất cả bài đăng và bình luận trong 35 ngày qua bằng hn-archiver API.
      Có thể các bài đăng 0 điểm đã bị bỏ sót nên mức trung bình mới cao hơn. Cảm ơn phản hồi, tôi sẽ xem lại trước khi xuất bản bài báo. Bộ phân loại của bạn cũng rất thú vị
    • Ví dụ “Richard Stallman is Dead” buồn cười quá. Nó làm tôi nhớ đến tiêu đề báo cũ “Generalissimo Francisco Franco Is Still Dead”. Tất nhiên RMS vẫn còn sống
    • Một câu hỏi cá nhân thôi, bạn đăng bài báo khoa học cực kỳ thường xuyên. Tôi đã thấy hôm bạn đăng hơn 30 bài trong một ngày, chắc không thể đọc hết tất cả được, nên tôi tò mò về động lực và quy trình tuyển chọn tài liệu của bạn
  • Tôi cũng thấy hiện tượng tương tự trong phần bình luận. Những bình luận ngắn và mỉa mai thường có phản hồi tốt hơn hẳn các bài phân tích dài.
    Những bình luận dài được chăm chút thì bị phớt lờ, còn bình luận ngắn viết bộc phát lại nhiều khi “nổ tung”, điều đó khá khiến tôi thất vọng

    • Karma của tôi là 104.872. Các trang HN LeadersBest Comments khá thú vị.
      HN không thích trò đùa, trừ khi có kèm giải thích
    • Bài viết dài không phải lúc nào cũng tốt. Có cái đẹp của sự súc tích. Tạo tác động bằng 20 ký tự còn khó và đáng giá hơn 2.000 ký tự
    • Tôi cũng dùng hai tài khoản, và tài khoản dùng để đăng bình luận cảm tính hoặc bộc phát có hiệu suất karma cao gấp 4 lần tài khoản chính. Tuy nhiên mức trung bình thấp hơn và độ phân tán lớn hơn
    • Việc “nội dung tốt không được tưởng thưởng” có lẽ cũng có thể là vì chúng ta không tạo ra nội dung tốt như mình nghĩ.
      Nếu từng vận hành blog, có lẽ sẽ cảm nhận rõ hơn tiêu chuẩn của sự tương tác này
    • Tôi cũng định xem việc này như một lời nhắc để thay đổi thói quen upvote của mình. Tôi tò mò liệu upvote âm thầm trên HN có được xem là một biểu hiện của sự đồng tình hay không
  • Nếu “tiêu cực” bao gồm phê bình kỹ thuật, bất mãn với ngành, hay sự thất vọng vì API, thì phần lớn thảo luận trên HN đều thuộc phạm vi đó.
    Chỉ để lại “thích” dưới bài quảng bá OpenAI thì chẳng có ý nghĩa gì; chính phân tích mang tính phê bình mới là kiểu tham gia có giá trị.
    Tôi thậm chí cho rằng những bài nổi tiếng mà không có bình luận lại là bằng chứng cho thấy site đang vận hành tốt

    • Tôi thích việc bài viết chỉ đưa ra dữ liệu và để độc giả tự diễn giải
    • Tôi đồng ý rằng cần tách “tính tiêu cực” thành mang tính phê bình vs độc hại. Trộn lẫn hai khái niệm này là một sai lầm
  • Chúng ta tự lọc để ưu tiên phản ứng tiêu cực. Nội dung tích cực thường trọn vẹn nên không kích thích phản hồi, còn nội dung tiêu cực thì khơi ra tương tác

    • Xét theo cấu trúc của site, những bình luận tích cực đơn thuần đã được nút upvote thay thế
    • Bình luận chỉ viết “thích” bị xem là vô nghĩa, nên kết quả là có nhiều bình luận trung lập hoặc mang tính phê bình hơn
    • Con người về mặt tiến hóa nhạy với kích thích tiêu cực. Những cá thể phớt lờ nguy hiểm đã không sống sót.
      Vì vậy chúng ta bị hút vào tin xấu hơn, còn tin tốt thì chỉ lướt qua. Đó là cốt lõi của nền kinh tế chú ý
    • Tôi học được nhiều hơn từ những bình luận bổ sung thông tin so với các lời phê bình mang tính phá hoại. Những bài như vậy mới lạ và chuyên môn hơn
    • (nói đùa) “Đúng rồi! … à, khoan đã”
  • Phê bình kỹ thuật khác với công kích cá nhân. Tính tiêu cực trên HN phần lớn là phê bình mang tính xây dựng.
    Nếu sự mỉa mai đi quá xa thì kiểu gì cũng sẽ có “lời phàn nàn về những lời phàn nàn”.
    Tôi nghĩ thà nghe người ta nói “răng bạn dính cái gì kìa” còn hơn là chỉ được khen

    • Bài báo cần xử lý rõ hơn sự phân biệt này. Mô hình không phân biệt được giữa “thiết kế API này sai rồi” và “công ty này tệ hại”.
      Việc kiểm duyệt của HN loại bỏ nội dung thù địch khá nhanh, nên phần còn lại đa số là phê bình có tính xây dựng.
      Điều thú vị là kiểu “tiêu cực” này có liên quan tới tỷ lệ tương tác cao hơn 27%. Nói cách khác, cộng đồng kỹ thuật coi trọng phê bình hơn quảng bá.
      Tôi dự định sẽ ghi rõ trong bài báo rằng “cảm xúc tiêu cực” ở đây là phê bình mang tính đánh giá theo mô hình SST-2, chứ không phải phát ngôn độc hại
    • Mỉa mai không phải là một triết lý nói thật. Nói sự thật không phải là phê bình
  • Hồi trước khi Reddit API còn truy cập được, tôi từng thử dùng ứng dụng đọc rif để chặn các subreddit có cảm xúc tiêu cực.
    Sau khi chặn vài trăm cái, thứ còn lại chỉ là nội dung tích cực về động vật và sở thích cá nhân. Tôi nhận ra Reddit lấy tính tiêu cực làm trung tâm đến mức nào, đồng thời khi bỏ nó đi thì lại trở nên khá buồn chán
    Liên kết danh sách chặn

    • Bầu không khí mỉa mai của Reddit giống như một bệnh dịch. Những người bất hạnh tụ lại và củng cố tuyệt vọng của nhau. Phần lớn là nhóm trẻ và ít kinh nghiệm
    • Nội dung gây tranh cãi được thảo luận nhiều hơn là bản chất con người. Vấn đề tình cảm của bạn bè thì có thể nghe rất lâu, còn nếu họ đang sống tốt thì chẳng có gì để nói
    • Tôi cũng tránh chính trị hay nội dung kích động, chỉ xem các bài về sở thích hoặc sáng tạo. Reddit thực sự là một nơi rất pha tạp
    • Tôi nghĩ tỷ lệ tích cực/tiêu cực khoảng 45:65 là mức cân bằng thú vị nhất. Nếu là 50:50 thì nội dung sẽ trở nên tầm thường. Ở điểm này HN tốt hơn mạng xã hội
    • Tôi vẫn đang dùng rif. Tôi thay API key bằng Revanced để tiếp tục dùng. Các bài đăng dạng mồi nhử AI trên Reddit tăng lên nên tôi chặn các subreddit liên quan.
      Những bài đó tạo cảm giác như bot đang nói chuyện với bot. Tôi nghi Reddit đang để mặc cấu trúc đó tồn tại nhằm tăng lượng hiển thị quảng cáo
  • Trên internet, khó có tổ hợp nào mạnh bằng than phiền hoặc sửa lưng ai đó.
    Là người dùng ESL (English as a Second Language), thuật ngữ internet đầu tiên tôi học được là “flamewar”

    • Cũng có người hỏi ESL là gì
  • Theo bài báo, bất bình đẳng về mức độ chú ý trên HN là cực kỳ nghiêm trọng. Hệ số Gini là 0,89, còn cao hơn Twitter
    Điều này có thể là do cấu trúc phân phối hiển thị của HN. Bài mới bắt đầu ở /newest, và nếu không nhận được chút chú ý ban đầu từ một số ít người thì sẽ gần như biến mất.
    Không giống Reddit có mức hiển thị mặc định, HN yêu cầu phải vượt qua cánh cổng ban đầu thì mới lên trang chính

    • Chính nhờ cấu trúc này mà phản ứng ban đầu hoạt động như một chỉ báo dự đoán thành công
  • Kỹ sư làm nghề giải quyết vấn đề nên tự nhiên sẽ có tư duy phản biện.
    Ở các hội chợ triển lãm công nghiệp, kỹ sư thường khoanh tay và tiếp cận một cách lạnh lùng, trong khi cộng đồng maker lại tràn đầy năng lượng tích cực.
    Cuối cùng thì đó chỉ là khác biệt giữa “ly nước vơi một nửa” và “ly nước đầy một nửa”