1 điểm bởi GN⁺ 2026-01-04 | 2 bình luận | Chia sẻ qua WhatsApp
  • Trang truy vấn dữ liệu trực quan hóa sự thay đổi số lượng câu hỏi theo tháng trên StackOverflow
  • Từ giai đoạn đầu của dịch vụ vào năm 2008, bắt đầu ở mức vài nghìn đến khoảng 10 nghìn câu hỏi mỗi tháng; trong giai đoạn 2014~2018 có khoảng 150~200 nghìn câu hỏi được đăng mỗi tháng, và từ mốc năm 2019, số lượng câu hỏi theo tháng chuyển từ đỉnh sang xu hướng giảm
  • Trong giai đoạn 2023~2025, mức giảm còn lớn hơn, và đến năm 2025 số câu hỏi mỗi tháng đã giảm xuống còn khoảng 10 nghìn
  • Đây là mức giảm hơn khoảng 90% so với thời kỳ đỉnh cao

2 bình luận

 
kandk 2026-01-05

Tò mò về tương lai của StackOverflow

 
GN⁺ 2026-01-04
Ý kiến trên Hacker News
  • Trước đây tôi từng đăng lên Stack Overflow cách tìm khoảng cách ngắn nhất giữa một ellipse và một điểm
    Liên kết câu trả lời của tôi
    Đó là một thuật toán do tôi tự nghĩ ra, chỉ vài dòng code nhưng hội tụ rất nhanh. Tôi nghĩ đó là đoạn code đẹp nhất trong đời mình
    Trước đây còn có bài báo trích dẫn nó, và tôi nghe nói nó cũng được dùng trong plugin va chạm của Unity. Giờ thì chẳng còn ai liên hệ nữa
    Dạo này tôi thậm chí không biết nên đăng thứ này ở đâu. Viết thành bài báo thì hơi lưng chừng, còn trước đây SO là nơi rất phù hợp để đăng những thứ như vậy, nhưng giờ cảm giác như cái kho lưu trữ tập trung đó đã biến mất

    • Có thể viết thành paper rồi đưa lên arXiv, hoặc viết thành bài blog
      Trước đây tôi cũng từng đăng trên SO một mẹo để ngăn EKF rơi vào trạng thái singular, và có giáo sư nói rằng ông ấy nhận ra tôi nhờ bài đó. Những cộng đồng như vậy rất khó thay thế
    • Tôi thực sự khuyên bạn nên bắt đầu blog. Với bộ đôi Hugo + GitHub Pages thì rất đơn giản
      Dù số bài không nhiều đi nữa, thế giới vẫn trở nên phong phú hơn khi được lấp đầy bởi những blog cá nhân như thế
    • Nhưng cốt lõi không phải là ‘đăng ở đâu’, mà là giờ đây chúng ta đang sống trong thời đại mà bản thân các câu hỏi kỹ thuật không còn được đưa ra công khai nữa
      Vậy thì kỹ sư sẽ tìm những bài toán để phát huy sự sáng tạo ở đâu, đó mới là điều khiến tôi băn khoăn
    • Dù sao thì gửi chính thức cho tạp chí cũng là một cách. Tôi nghĩ vẫn tốt hơn là chỉ tồn tại một cách không chính thức
    • Tôi cũng hoạt động rất nhiều trên SO vào khoảng năm 2012. Bây giờ mỗi khi tìm trên Google tôi vẫn thấy những câu trả lời mình từng viết ở top đầu, rồi lại ngạc nhiên kiểu ‘Ồ, cái này là mình viết à’
  • Tôi thực sự sốc khi nhìn biểu đồ này. Tôi không ngờ SO lại suy tàn nhanh đến như vậy
    Tốc độ này còn nhanh hơn cả việc Britannica ngừng bản in giấy chỉ 9 năm sau khi Wikipedia xuất hiện
    Tôi không cho rằng vấn đề của SO là do ‘điều hành thô bạo’. Về căn bản, đó là vì mọi người đã có những con đường khác để nhận câu trả lời nhanh hơn
    Từ khoảng năm 2016, Reddit bắt đầu thường xuyên xuất hiện trong kết quả tìm kiếm, và hỏi trên Discord cũng có thể nhận được câu trả lời
    Đòn kết liễu cuối cùng là LLM. Giờ người ta có thể nhận ngay những câu trả lời ở mức SO
    Vậy thì sau này LLM sẽ học từ đâu? Liệu chúng sẽ tiếp tục tái chế dữ liệu SO giai đoạn 2014~2020 hay sao?

    • Nếu tài liệu được tổ chức tốt và cung cấp ở định dạng thân thiện với LLM, thì phần lớn câu hỏi đều có thể được LLM giải quyết
      Ví dụ, dù tài liệu API không đề cập hết các tình huống chi tiết, LLM vẫn có thể ghép nhiều tài liệu lại để tạo ra câu trả lời
    • Trong tương lai, phần lớn câu trả lời sẽ đến từ các cuộc trò chuyện với LLM
      Tuy vậy, những hệ sinh thái chuyên biệt như Salesforce hay Workday thì forum vẫn hữu ích hơn
    • Nội dung của SO đến từ kinh nghiệm thực chiến và quá trình thử-sai của các lập trình viên
      Sau này LLM sẽ đảm nhận vai trò thu thập và phân phối lại những kinh nghiệm đó ở quy mô lớn
    • Thật tiếc là SO đã không tự xây dựng được một LLM chất lượng cao
    • Có thể thấy hiện tượng ‘internet chết’: tương tác giữa con người giảm đi, LLM học từ lượng dữ liệu đó, rồi các cuộc trò chuyện giữa người với người lại càng giảm thêm
  • Sự xuất hiện của LLM đã phơi bày những vấn đề của SO
    Câu hỏi bị đóng một cách bất công, câu trả lời cũ không được cập nhật, và văn hóa độc đoán của những người trả lời top đầu rất nặng nề
    Tôi thấy LLM tốt hơn nhiều ở những điểm đó

    • Tôi cũng đã ngừng hoạt động trên SO từ trước cả thời LLM. Cách điều hành độc đoán quá mức
    • Mỗi lần đặt câu hỏi lại có rất nhiều lời lên lớp không cần thiết kiểu “đừng làm như thế”
    • Tôi nghĩ GitHub Discussions cũng có ảnh hưởng phần nào đến đà đi xuống của SO
      Sau khi ra mắt public beta (2020), tôi dùng nó ngày càng nhiều hơn
    • Thực ra số lượng câu hỏi đã bắt đầu giảm từ giai đoạn 2014~2016
    • Cũng có thời điểm Google không còn ưu tiên hiển thị câu trả lời từ SO ở vị trí cao nữa
  • Trong 2 tuần gần đây tôi khổ sở với một vấn đề về transform trong Spark, và các câu trả lời Gemini cùng Claude đưa ra đều nghe có vẻ hợp lý nhưng sai hoàn toàn
    Cuối cùng tôi tìm được câu trả lời trên SO và giải quyết xong, nhờ đó còn lần tới đúng phần chính xác trong tài liệu Spark
    LLM thì thân thiện, nhưng giống như một người bạn tự tin nói sai
    Còn SO thì thiếu thân thiện, nhưng lại thực sự giúp giải quyết vấn đề

    • Điểm mạnh của SO là cấu trúc thảo luận. Nhiều người trao đổi ý kiến qua lại, và câu trả lời tốt nhất được đẩy lên trên
      LLM không thể thay thế chiều sâu của những tranh luận và kinh nghiệm giữa con người với nhau
    • Trên SO có nhiều câu trả lời tuyệt vời không chỉ đưa đáp án đơn thuần mà còn giải thích ‘tại sao’
    • Nhưng rốt cuộc LLM cũng học từ đầu vào của con người, và những kinh nghiệm đó sẽ được hấp thụ vào mô hình
      Theo thời gian nó sẽ ngày càng chính xác hơn
    • Tất nhiên SO cũng không phải lúc nào cũng đưa ra đáp án đúng. Với các vấn đề khó thì nhiều khi không có câu trả lời hoặc câu trả lời sai
      Trong trường hợp của tôi, LLM lại cho tỷ lệ đúng cao hơn
    • Dù vậy, văn hóa Q&A sẽ không biến mất. Vẫn có những lựa chọn thay thế như GitHub Discussions
  • Trong lập trình, LLM vẫn nhanh áp đảo và phản hồi tức thì
    Nếu cung cấp thêm thông tin thì nó sửa ngay, và lặp lại cho tới khi hiểu hoàn toàn vấn đề
    Hơn nữa cũng không có ai mỉa mai mình

  • Mọi người sẽ đổ lỗi sự suy giảm này cho AI, nhưng thực tế đó là vấn đề của độc tính trong cộng đồng và định hướng của chính trang web
    Liên kết bình luận trùng lặp

    • Các thread trên Stack Exchange thực sự rất cay nghiệt.
      Nhưng đến một thời điểm nào đó thì hầu hết câu hỏi đã có câu trả lời, và Google dẫn thẳng tới những câu trả lời ấy
      LLM chỉ là ‘mảnh ghép cuối cùng’ cưỡi lên trên nền đó thôi
    • Quan trọng hơn độc tính là tình trạng bão hòa. Những câu hỏi cơ bản đã được trả lời hết rồi, còn câu hỏi mới thì bị đóng là trùng lặp
    • Theo thời gian, câu hỏi trùng lặp ngày càng nhiều, và vì chúng không được tính vào thống kê nên mức giảm có thể trông còn lớn hơn thực tế
      Thay CEO năm 2020 và thành lập hội đồng moderator
    • Mức giảm thực sự bắt đầu vào khoảng năm 2017, rồi bật tăng tạm thời vào đầu thời kỳ COVID
  • Tôi đồng ý rằng SO từng có độc tính, nhưng dù vậy nó vẫn là một thành tựu vĩ đại của tri thức mở trên internet
    Tác động của nó trong việc mở lập trình ra cho đại chúng vẫn cực kỳ to lớn

    • Nhưng cũng có người cho rằng đó là “kết cục của việc phản bội cộng đồng và chọn tiền bạc”
  • Nếu nhìn từ góc độ nhà phân tích dữ liệu, việc số câu hỏi giảm là hiện tượng tự nhiên
    Những câu hỏi dễ đã xuất hiện hết rồi, còn câu hỏi mới thì ngày càng khó hơn
    Biểu đồ này không bao gồm các bài đã bị xóa nên trông thấp hơn thực tế
    Biểu đồ dữ liệu thực tế
    Thậm chí đó có thể là điều tốt. Có tới 20% là câu hỏi trùng lặp, và nhiều thứ chỉ cần tìm kiếm cho tốt là giải quyết được
    Tuy nhiên, việc chuyển sang những nơi như Discord thì không tốt. Vì tri thức bị tư hữu hóa và không thể tìm kiếm được
    Dù vậy, dữ liệu của SO vẫn được công khai hoàn toàn, nên kể cả công ty biến mất thì vẫn có thể phục hồi lại

  • Tôi từng hoạt động rất tích cực ở giai đoạn đầu của SO vào khoảng 2009~2010, nhưng đã rời đi vì sự can thiệp quá mức của những người điều hành cộng đồng
    Có hiện tượng những người không thể đóng góp lại dùng luật lệ như vũ khí để gây ảnh hưởng
    Chuyện này lặp đi lặp lại ở mọi cộng đồng kỹ thuật nổi tiếng. Trên HN cũng thấy chút ít

  • SO đã trở thành một môi trường thù địch đến mức ngay cả việc đăng câu hỏi cũng rất khó
    Tôi có 6k reputation và nhiều huy hiệu vàng, nhưng vẫn thường xuyên gặp chuyện những câu hỏi chính đáng bị chặn

    • Tôi cũng có khoảng 2k reputation, nhưng để bỏ phiếu mở lại câu hỏi thì cần 3k
      Có rất nhiều câu hỏi bị đóng nhầm là trùng lặp, và rồi tôi nghĩ ‘thôi cứ để nó chết luôn vậy’
    • Ngay cả khi muốn trả lời, cũng có quá nhiều người đổ xô vào nên cạnh tranh rất gắt, và niềm vui đóng góp biến mất
    • Tôi có 25k reputation, nhưng cứ mỗi lần viết câu trả lời là câu hỏi lại bị đóng ngay, nên cuối cùng tôi bỏ cuộc
      SO không phải là ‘nơi giúp đỡ người khác’ mà là nơi ưu tiên ‘chuẩn hóa dữ liệu’ hơn
      Cuối cùng chính sự xung đột văn hóa đó đã khiến tôi rời đi