- Trang truy vấn dữ liệu trực quan hóa sự thay đổi số lượng câu hỏi theo tháng trên StackOverflow
- Từ giai đoạn đầu của dịch vụ vào năm 2008, bắt đầu ở mức vài nghìn đến khoảng 10 nghìn câu hỏi mỗi tháng; trong giai đoạn 2014~2018 có khoảng 150~200 nghìn câu hỏi được đăng mỗi tháng, và từ mốc năm 2019, số lượng câu hỏi theo tháng chuyển từ đỉnh sang xu hướng giảm
- Trong giai đoạn 2023~2025, mức giảm còn lớn hơn, và đến năm 2025 số câu hỏi mỗi tháng đã giảm xuống còn khoảng 10 nghìn
- Đây là mức giảm hơn khoảng 90% so với thời kỳ đỉnh cao
2 bình luận
Tò mò về tương lai của StackOverflow
Ý kiến trên Hacker News
Trước đây tôi từng đăng lên Stack Overflow cách tìm khoảng cách ngắn nhất giữa một ellipse và một điểm
Liên kết câu trả lời của tôi
Đó là một thuật toán do tôi tự nghĩ ra, chỉ vài dòng code nhưng hội tụ rất nhanh. Tôi nghĩ đó là đoạn code đẹp nhất trong đời mình
Trước đây còn có bài báo trích dẫn nó, và tôi nghe nói nó cũng được dùng trong plugin va chạm của Unity. Giờ thì chẳng còn ai liên hệ nữa
Dạo này tôi thậm chí không biết nên đăng thứ này ở đâu. Viết thành bài báo thì hơi lưng chừng, còn trước đây SO là nơi rất phù hợp để đăng những thứ như vậy, nhưng giờ cảm giác như cái kho lưu trữ tập trung đó đã biến mất
Trước đây tôi cũng từng đăng trên SO một mẹo để ngăn EKF rơi vào trạng thái singular, và có giáo sư nói rằng ông ấy nhận ra tôi nhờ bài đó. Những cộng đồng như vậy rất khó thay thế
Dù số bài không nhiều đi nữa, thế giới vẫn trở nên phong phú hơn khi được lấp đầy bởi những blog cá nhân như thế
Vậy thì kỹ sư sẽ tìm những bài toán để phát huy sự sáng tạo ở đâu, đó mới là điều khiến tôi băn khoăn
Tôi thực sự sốc khi nhìn biểu đồ này. Tôi không ngờ SO lại suy tàn nhanh đến như vậy
Tốc độ này còn nhanh hơn cả việc Britannica ngừng bản in giấy chỉ 9 năm sau khi Wikipedia xuất hiện
Tôi không cho rằng vấn đề của SO là do ‘điều hành thô bạo’. Về căn bản, đó là vì mọi người đã có những con đường khác để nhận câu trả lời nhanh hơn
Từ khoảng năm 2016, Reddit bắt đầu thường xuyên xuất hiện trong kết quả tìm kiếm, và hỏi trên Discord cũng có thể nhận được câu trả lời
Đòn kết liễu cuối cùng là LLM. Giờ người ta có thể nhận ngay những câu trả lời ở mức SO
Vậy thì sau này LLM sẽ học từ đâu? Liệu chúng sẽ tiếp tục tái chế dữ liệu SO giai đoạn 2014~2020 hay sao?
Ví dụ, dù tài liệu API không đề cập hết các tình huống chi tiết, LLM vẫn có thể ghép nhiều tài liệu lại để tạo ra câu trả lời
Tuy vậy, những hệ sinh thái chuyên biệt như Salesforce hay Workday thì forum vẫn hữu ích hơn
Sau này LLM sẽ đảm nhận vai trò thu thập và phân phối lại những kinh nghiệm đó ở quy mô lớn
Sự xuất hiện của LLM đã phơi bày những vấn đề của SO
Câu hỏi bị đóng một cách bất công, câu trả lời cũ không được cập nhật, và văn hóa độc đoán của những người trả lời top đầu rất nặng nề
Tôi thấy LLM tốt hơn nhiều ở những điểm đó
Sau khi ra mắt public beta (2020), tôi dùng nó ngày càng nhiều hơn
Trong 2 tuần gần đây tôi khổ sở với một vấn đề về transform trong Spark, và các câu trả lời Gemini cùng Claude đưa ra đều nghe có vẻ hợp lý nhưng sai hoàn toàn
Cuối cùng tôi tìm được câu trả lời trên SO và giải quyết xong, nhờ đó còn lần tới đúng phần chính xác trong tài liệu Spark
LLM thì thân thiện, nhưng giống như một người bạn tự tin nói sai
Còn SO thì thiếu thân thiện, nhưng lại thực sự giúp giải quyết vấn đề
LLM không thể thay thế chiều sâu của những tranh luận và kinh nghiệm giữa con người với nhau
Theo thời gian nó sẽ ngày càng chính xác hơn
Trong trường hợp của tôi, LLM lại cho tỷ lệ đúng cao hơn
Trong lập trình, LLM vẫn nhanh áp đảo và phản hồi tức thì
Nếu cung cấp thêm thông tin thì nó sửa ngay, và lặp lại cho tới khi hiểu hoàn toàn vấn đề
Hơn nữa cũng không có ai mỉa mai mình
Mọi người sẽ đổ lỗi sự suy giảm này cho AI, nhưng thực tế đó là vấn đề của độc tính trong cộng đồng và định hướng của chính trang web
Liên kết bình luận trùng lặp
Nhưng đến một thời điểm nào đó thì hầu hết câu hỏi đã có câu trả lời, và Google dẫn thẳng tới những câu trả lời ấy
LLM chỉ là ‘mảnh ghép cuối cùng’ cưỡi lên trên nền đó thôi
Thay CEO năm 2020 và thành lập hội đồng moderator
Tôi đồng ý rằng SO từng có độc tính, nhưng dù vậy nó vẫn là một thành tựu vĩ đại của tri thức mở trên internet
Tác động của nó trong việc mở lập trình ra cho đại chúng vẫn cực kỳ to lớn
Nếu nhìn từ góc độ nhà phân tích dữ liệu, việc số câu hỏi giảm là hiện tượng tự nhiên
Những câu hỏi dễ đã xuất hiện hết rồi, còn câu hỏi mới thì ngày càng khó hơn
Biểu đồ này không bao gồm các bài đã bị xóa nên trông thấp hơn thực tế
Biểu đồ dữ liệu thực tế
Thậm chí đó có thể là điều tốt. Có tới 20% là câu hỏi trùng lặp, và nhiều thứ chỉ cần tìm kiếm cho tốt là giải quyết được
Tuy nhiên, việc chuyển sang những nơi như Discord thì không tốt. Vì tri thức bị tư hữu hóa và không thể tìm kiếm được
Dù vậy, dữ liệu của SO vẫn được công khai hoàn toàn, nên kể cả công ty biến mất thì vẫn có thể phục hồi lại
Tôi từng hoạt động rất tích cực ở giai đoạn đầu của SO vào khoảng 2009~2010, nhưng đã rời đi vì sự can thiệp quá mức của những người điều hành cộng đồng
Có hiện tượng những người không thể đóng góp lại dùng luật lệ như vũ khí để gây ảnh hưởng
Chuyện này lặp đi lặp lại ở mọi cộng đồng kỹ thuật nổi tiếng. Trên HN cũng thấy chút ít
SO đã trở thành một môi trường thù địch đến mức ngay cả việc đăng câu hỏi cũng rất khó
Tôi có 6k reputation và nhiều huy hiệu vàng, nhưng vẫn thường xuyên gặp chuyện những câu hỏi chính đáng bị chặn
Có rất nhiều câu hỏi bị đóng nhầm là trùng lặp, và rồi tôi nghĩ ‘thôi cứ để nó chết luôn vậy’
SO không phải là ‘nơi giúp đỡ người khác’ mà là nơi ưu tiên ‘chuẩn hóa dữ liệu’ hơn
Cuối cùng chính sự xung đột văn hóa đó đã khiến tôi rời đi