18 năm thay đổi xu hướng công nghệ qua dữ liệu Hacker News
(hackernewstrends.com)- Hacker Trends là dịch vụ phân tích khoảng 45 triệu bài đăng và bình luận tích lũy trên Hacker News để hiển thị theo chuỗi thời gian sự thay đổi về số lần được nhắc đến của các công nghệ, sản phẩm, công ty và nhân vật cụ thể.
- Có thể hiển thị nhiều từ khóa trên cùng một biểu đồ để so sánh mức độ cạnh tranh giữa các công nghệ, sự thay thế thế hệ trên thị trường và các đợt tăng vọt quan tâm do sự kiện gây ra.
- Xu hướng công nghệ nhìn chung tăng mạnh đột ngột xoay quanh các sự kiện cụ thể như ra mắt sản phẩm mới, mua lại doanh nghiệp, thay đổi giấy phép, sự cố bảo mật và thay đổi môi trường ngành.
- Nếu nhìn dữ liệu dài hạn, công cụ và nền tảng phát triển không bị thay thế cùng lúc mà thường thay đổi theo dạng mức quan tâm đến công nghệ cũ giảm dần rồi công nghệ mới tiếp nhận vị trí đó.
- Tuy nhiên, số lần được nhắc đến trên Hacker News chỉ phản ánh mức độ quan tâm của cộng đồng lập trình viên, không trực tiếp chứng minh thị phần thực tế hay ưu thế kỹ thuật.
Giới thiệu
Theo dõi sự thay đổi trong diễn ngôn của lập trình viên bằng dữ liệu
- Hacker Trends cung cấp biểu đồ histogram theo tháng về mức độ một từ cụ thể được nhắc đến thường xuyên ra sao trên Hacker News trong suốt 18 năm.
- Người dùng có thể nhập đồng thời nhiều từ khóa để so sánh sự thay đổi về mức độ quan tâm đối với công nghệ và doanh nghiệp.
- Khi chọn một tháng hoặc một khoảng thời gian cụ thể, có thể xem các bài đăng và bình luận thực tế tại thời điểm đó.
- Upstash Redis Search được sử dụng cho việc tìm kiếm và tổng hợp dữ liệu, với quy mô khoảng 45 triệu bản ghi.
- Dịch vụ không chỉ dừng ở biểu đồ lượng tìm kiếm đơn thuần mà còn được thiết kế để có thể cùng xem các bài đăng và sự kiện đã khiến mức độ quan tâm tăng lên.
Nội dung chính
Công nghệ thay đổi theo kiểu chuyển giao thế hệ
-
Sự thay đổi của công cụ phát triển và nền tảng thường không diễn ra theo kiểu công nghệ cũ biến mất ngay lập tức, mà theo cách công nghệ mới dần thu hút sự quan tâm.
-
Các ví dụ tiêu biểu gồm có:
- Sau khi mức quan tâm tới CoffeeScript giảm xuống, TypeScript đã nổi lên thành lựa chọn chủ đạo trong nhóm ngôn ngữ mở rộng của JavaScript.
- Môi trường CI lấy Jenkins làm trung tâm đã chuyển sang GitHub Actions kể từ sau năm 2021.
- Môi trường build lấy Webpack làm trung tâm đã chuyển sự chú ý sang Vite kể từ sau năm 2022.
- Trong hệ sinh thái trình soạn thảo xoay quanh Vim, Neovim đã tăng trưởng nhanh từ sau năm 2021.
- Các thảo luận về cơ sở dữ liệu vốn tập trung vào MySQL đã chuyển sang PostgreSQL vào giai đoạn khoảng 2017–2020.
-
Có thể xem những thay đổi này không chỉ là trào lưu nhất thời mà là kết quả tích lũy của sự tiện lợi khi phát triển, hiệu năng, hỗ trợ hệ sinh thái và thay đổi trong cách triển khai.
Công nghệ AI tăng trưởng nhờ các cú hích ra mắt liên tiếp
-
Lĩnh vực AI tạo sinh cho thấy đặc điểm là số lần được nhắc đến tăng theo từng nấc mỗi khi mô hình hoặc dịch vụ mới được công bố.
-
Các đối tượng được quan tâm chính bao gồm ChatGPT, GPT-4, Claude, Gemini, Llama, Mistral, DeepSeek.
-
Các công cụ lập trình AI cho thấy xu hướng sự chú ý dịch chuyển lần lượt từ Cursor sang Claude Code rồi đến Codex.
- Cursor nhận được mức quan tâm cao vào nửa cuối năm 2024.
- Claude Code nổi lên nhanh chóng vào giữa năm 2025.
- Codex bắt đầu tăng mức độ quan tâm từ đầu năm 2026.
-
Trong mảng mô hình mở, Llama đã mở rộng thị trường trong năm 2023, sau đó Mistral và Qwen hình thành thế cạnh tranh.
-
Mức độ quan tâm trong lĩnh vực AI chịu tác động lớn không chỉ từ cải thiện hiệu năng mà còn từ các sự kiện như công bố mô hình, chính sách mã nguồn mở, cạnh tranh giữa các công ty và hoạt động mua bán sáp nhập.
Công nghệ hạ tầng dịch chuyển quyền dẫn dắt theo từng vai trò
-
Trong đám mây và hạ tầng phát triển, quyền dẫn dắt liên tục dịch chuyển giữa các công nghệ cung cấp cùng chức năng.
-
Các ví dụ chính gồm có:
- Sau khi Docker phổ biến hóa công nghệ container trong giai đoạn 2014–2015, Kubernetes đã nổi lên thành trung tâm của orchestration.
- Heroku dẫn dắt thị trường triển khai đơn giản ở giai đoạn đầu, sau đó Netlify và Vercel lần lượt phát triển dựa trên hệ sinh thái JAMstack và Next.js.
- Môi trường máy chủ web từng xoay quanh Apache đã dịch chuyển sang nginx, sau đó Caddy được chú ý nhờ cung cấp HTTPS tự động.
- Thị trường quản lý cấu hình máy chủ từng do Chef và Puppet dẫn dắt đã chuyển sang Ansible, giải pháp không cần agent.
- Trong mảng observability, Prometheus, Grafana và Datadog lần lượt mở rộng sự quan tâm quanh các vai trò thu thập dữ liệu, trực quan hóa và SaaS tích hợp.
-
Điều này cho thấy tiêu chí chọn công nghệ đã mở rộng từ chức năng của một sản phẩm đơn lẻ sang tự động hóa triển khai, tính thuận tiện trong quản lý, khả năng tích hợp và mức độ phù hợp với đám mây.
Những sự kiện cụ thể có thể khuếch đại mức độ quan tâm trong thời gian ngắn
-
Số lần công nghệ được nhắc đến trên Hacker News không chỉ thể hiện tăng trưởng dài hạn mà còn cho thấy các đợt tăng vọt tạm thời do những sự kiện cụ thể gây ra.
-
Các sự kiện tiêu biểu gồm có:
- Khi Unity công bố chính sách phí runtime vào năm 2023, số lần được nhắc đến của không chỉ Unity mà cả Unreal và Godot cũng cùng tăng.
- Khi Heroku chấm dứt gói miễn phí vào năm 2022, các thảo luận liên quan lại tăng vọt.
- Mastodon được quan tâm nhiều hơn trong quá trình người dùng rời bỏ Twitter sau thương vụ mua lại năm 2022.
- Bluesky nổi lên như một lựa chọn nền tảng xã hội mới trong giai đoạn 2024–2025.
- Zoom và Microsoft Teams chứng kiến số lần được nhắc đến tăng mạnh vào năm 2020 do COVID-19 lan rộng và sự chuyển dịch sang làm việc từ xa.
-
Mức độ quan tâm tăng lên ở các công nghệ cạnh tranh có thể xuất phát không chỉ từ đổi mới của chính chúng mà còn từ thất bại chính sách của doanh nghiệp hiện hữu hoặc cú sốc thị trường.
Sự cố bảo mật xuất hiện dưới dạng các đợt tăng vọt rõ ràng theo thời điểm
- Lĩnh vực bảo mật có đặc điểm là số lần được nhắc đến tập trung vào thời điểm xảy ra lỗ hổng lớn hoặc sự cố, hơn là thay đổi quan tâm dài hạn.
- Các đối tượng phân tích chính bao gồm Heartbleed, Log4j, XZ Utils, Spectre, SolarWinds, WannaCry, CrowdStrike.
- Vì các sự kiện này có thời điểm thiệt hại rõ ràng như công bố lỗ hổng, tấn công chuỗi cung ứng hay gián đoạn dịch vụ, nên chúng cũng hiện lên thành các đợt tăng vọt rõ nét trên biểu đồ.
- Dữ liệu liên quan đến bảo mật có thể được dùng để so sánh tác động của từng sự kiện cụ thể đối với lựa chọn công nghệ của lập trình viên và doanh nghiệp.
Chính sách giấy phép đang tái cấu trúc hệ sinh thái mã nguồn mở
-
Việc thay đổi giấy phép của các dự án mã nguồn mở dẫn đến phản ứng mạnh từ cộng đồng lập trình viên và sự xuất hiện của các dự án fork mới.
-
Các ví dụ tiêu biểu gồm có:
- MongoDB chuyển sang SSPL
- Elastic thay đổi giấy phép
- Terraform của HashiCorp thay đổi giấy phép và sự nổi lên của OpenTofu
- Redis thay đổi giấy phép và sự xuất hiện của Valkey
-
Thay đổi giấy phép không chỉ dừng ở việc sửa điều kiện pháp lý mà còn ảnh hưởng đến niềm tin của cộng đồng lập trình viên, các nhà cung cấp đám mây và tính bền vững của dự án.
-
Mức độ quan tâm đối với một công nghệ không chỉ được quyết định bởi tính năng và hiệu năng mà còn bởi chính sách và mô hình quản trị của đơn vị vận hành.
Môi trường ngành và tranh luận xã hội cũng làm thay đổi diễn ngôn công nghệ
- Hacker Trends không chỉ đề cập đến ngôn ngữ lập trình và sản phẩm mà còn bao quát cả những thay đổi trong môi trường ngành và văn hóa phát triển.
- Các chủ đề liên quan đến ngành bao gồm sa thải, suy thoái kinh tế, bong bóng AI, quay lại làm việc tại văn phòng, kiệt sức, công đoàn và tuần làm việc 4 ngày.
- Các chủ đề liên quan đến văn hóa phát triển bao gồm technical debt, code review, agile, scrum, microservices, serverless và monorepo.
- Những chủ đề này cho thấy xu hướng công nghệ không chỉ gắn với sự phát triển của bản thân công nghệ mà còn liên hệ với môi trường việc làm, cách vận hành tổ chức, quy định và các tranh luận xã hội.
Việc diễn giải kết quả tìm kiếm có những giới hạn nhất định
- Người dùng Hacker News có tỷ lệ lập trình viên, nhà sáng lập và người làm công nghệ cao hơn công chúng phổ thông, nên kết quả không đại diện cho mức độ quan tâm của toàn xã hội.
- Việc số lần được nhắc đến của một từ tăng lên có thể không chỉ do đánh giá tích cực mà còn vì chỉ trích, sự cố, tai nạn bảo mật hoặc tranh cãi chính sách.
- Cũng có khả năng các kết quả tìm kiếm bao gồm công nghệ trùng tên hoặc danh từ thông thường.
- Chỉ dựa vào lượng tìm kiếm thì khó đánh giá số lượng người dùng thực tế, doanh thu, thị phần hay hiệu năng kỹ thuật.
- Vì vậy, Hacker Trends phù hợp hơn để dùng như tài liệu tham khảo bổ trợ nhằm khám phá sự thay đổi quan tâm của cộng đồng công nghệ và các sự kiện chính, thay vì làm căn cứ cuối cùng cho phân tích thị trường.
Kết luận
Có thể cùng lúc khám phá dòng chảy thay đổi công nghệ và nguyên nhân của nó
- Hacker Trends là dịch vụ so sánh trực quan sự tăng giảm mức độ quan tâm đối với công nghệ và doanh nghiệp dựa trên dữ liệu dài hạn từ Hacker News.
- Kết quả phân tích xác nhận sự chuyển giao thế hệ lặp đi lặp lại trong nhiều lĩnh vực như trình soạn thảo, ngôn ngữ lập trình, nền tảng đám mây, cơ sở dữ liệu và mô hình AI.
- Các đợt tăng vọt quan tâm chủ yếu gắn với ra mắt sản phẩm, mua lại doanh nghiệp, thay đổi giấy phép, sự cố bảo mật, thất bại chính sách và thay đổi môi trường xã hội.
- Vì cung cấp kèm các bài đăng và bình luận thực tế, dịch vụ cho phép theo dõi không chỉ số lần được nhắc đến mà cả cách các lập trình viên đánh giá công nghệ ở thời điểm đó.
- Tuy nhiên, vì đây là dữ liệu thể hiện mức độ quan tâm bên trong Hacker News, nên cần diễn giải kết hợp với thị phần, thống kê người dùng và dữ liệu doanh thu.
3 bình luận
Nhìn thế này mới thấy hồi tháng 2 năm nay có rất nhiều bài Show HN thật. Có phải mọi người đều làm vào cuối năm rồi dồn đăng vào tháng 2 không nhỉ.
Có lẽ đó là thời điểm Opus 4.6 ra mắt, rồi những thứ được tạo bằng Claude Code bắt đầu lan rộng và các kết quả đầu tiên đổ ra.
Show GN cũng đang có xu hướng tăng dần. Ở Hàn Quốc nữa, có vẻ những thứ được làm với sự trợ giúp của AI cũng ngày càng nhiều hơn
Ý kiến trên Hacker News
Tôi đang vận hành một cơ sở dữ liệu ClickHouse công khai chứa dữ liệu Hacker News, nên có thể truy vấn ngay tại https://play.clickhouse.com/play?user=play#U0VMRUNUICogRlJPT...
Có thể tạo một dịch vụ tương tự chỉ với một truy vấn SQL và một trang HTML, và tôi cũng đã mở một data lake công khai có thể truy vấn từ bất cứ đâu: https://github.com/ClickHouse/ClickHouse/issues/29693#issuec...
Dữ liệu cũng được cập nhật theo thời gian thực
Google Trends là để xem lượng tìm kiếm, còn cái này là xem văn bản đã được đăng, nên khác nhau
Nó gần với việc Google Trends đếm số lần từ xuất hiện trên trang web hơn, hoặc Google Ngrams đếm trang web thay vì sách
Mọi người tìm “burger” mỗi khi muốn gọi burger giao tận nơi, nhưng lại không viết nhiều về những thứ ít giá trị tin tức, nên hai bộ dữ liệu này khó dùng theo cùng một cách
Điều đó không có nghĩa là bản thân sản phẩm này không hay, chỉ là khi dùng thì nên nhớ sự khác biệt này
Tôi kéo xuống các ví dụ rồi mới nhận ra vì sao thấy lạ; đây không phải dữ liệu về thứ mà người trên HN thực sự đi tìm, mà là dữ liệu cho thấy họ đang viết về điều gì
Công cụ này tổng hợp cả bài viết lẫn bình luận, nên dưới góc nhìn “mọi người muốn biết thêm và muốn thảo luận về điều gì”, bài viết và bình luận HN khá giống với tìm kiếm
Bài nào phổ biến thì có nhiều bình luận hơn nên các thuật ngữ liên quan tăng lên, còn chủ đề không nổi thì ít bình luận liên quan nên sẽ thấp hơn
Thực tế, nếu so sánh blockchain và OpenAI, sẽ ra kết quả khá dễ đoán: blockchain nổi bật đến cuối những năm 2010, rồi sau khi ChatGPT ra mắt thì OpenAI vượt lên; đồ thị Google Trends cũng khá giống
Có vẻ như bị hug of death
/api/hn -> 504 An error occurred with your deployment FUNCTION_INVOCATION_TIMEOUT cle1::c8vgv-1782399959042-aeba3cae05ff/api/hn -> 502 {"error":"Your database has been temporarily rate-limited, please contact support@upstash.com for further details."}/api/hn -> 502 {"error":"Search entry should have an initialized schema, command was: [\"SEARCH.AGGREGATE\",\"hn\",\"{\\\"$or\\\":[{\\\"title\\\":{\\\"$eq\\\":\\\"anthropic\\\",\\\"$boost\\\":5}},{\\\"text\\\":{\\\"$eq\\\":\\\"anthropic\\\"}}]}\",\"{\\\"by_month\\\":{\\\"$dateHistogram\\\":{\\\"field\\\":\\\"time\\\",\\\"fixedInterval\\\":\\\"30d\\\"}},\\\"top_authors\\\":{\\\"$terms\\\":{\\\"field\\\":\\\"by\\\",\\\"size\\\":6}},\\\"by_type\\\":{\\\"$terms\\\":{\\\"field\\\":\\\"type\\\",\\\"size\\\":4}}}\"]"}/api/hn -> 504 An error occurred with your deployment FUNCTION_INVOCATION_TIMEOUT cle1::48fnt-1782412720840-4855b2b75b5aTôi gặp
/api/hn -> 502 {"error":"Your database has been temporarily rate-limited, please contact support@upstash.com for further details."}Hay đấy. Có vẻ có lỗi ở đây: https://hackernewstrends.com/?q=vim&q=emacs&q=zed
Không rõ vì sao kết quả bị cắt ở 2018-10, trong khi phần xem trước “Popular Comparisons” vẫn hiển thị cả đoạn sau đó
Làm tôi nhớ đến một side project tôi đang làm
https://gitlab/here_forawhile/torum
Đây là một bản sao HN đồng bộ với HN, cho phép thảo luận trong các cộng đồng riêng tư nhỏ hơn dựa trên nội dung đã lên HN mà không cần ở trực tiếp trên HN
Nó cũng lập chỉ mục cơ sở dữ liệu và hỗ trợ tìm kiếm, nên khá hữu ích để tìm các bài khiến tôi quan tâm
‘peak’ thường chỉ đỉnh của một thứ gì đó, như đỉnh núi
Sẽ hữu ích nếu chuẩn hóa theo tổng lượng, để có thể thấy sự thay đổi của từng mục thay vì chỉ là tăng trưởng chung của site
Hiện giờ phải vẽ thêm một từ phổ biến để so sánh trên biểu đồ, nhưng nếu chọn sai thì việc diễn giải còn dễ rối hơn
Nếu không thì phần lớn kết quả tìm kiếm trong giai đoạn site tăng trưởng sẽ trông như một biến thể của https://xkcd.com/1138/
Trong mảng khoa học và công nghệ frontier, việc lk-99 tăng vọt khá thú vị
Ý tưởng này hay đấy, và sẽ tốt hơn nếu tính được cảm xúc tích cực/tiêu cực cho từng bình luận nhắc đến một từ khóa nhất định
Ví dụ có thể tách xu hướng
cloudflare (positive)vàcloudflare (negative), trong đó vế đầu chỉ đếm bình luận có độ tin cậy cảm xúc lớn hơn 0.6, còn vế sau chỉ đếm bình luận có điểm cảm xúc nhỏ hơn 0.4Dự án thú vị và làm rất tốt. Sẽ hay hơn nếu có tùy chọn hiệu chỉnh theo quy mô tương đối
Ví dụ, kết quả tìm “iPhone” đi xuống vào khoảng năm 2025, nhưng khó biết là do mức quan tâm thực sự giảm hay vì số bình luận trên Hacker News trong năm đó giảm
Nếu thử tìm những từ thông dụng như “the” hay “is”, có vẻ khả năng thứ hai lớn hơn
Có lẽ nên cẩn thận với các ký tự không phải chữ và số
Ví dụ C# trên biểu đồ dường như thực ra đang khớp với C, nhưng trong tiêu đề bài viết ví dụ thì chỉ C# được tô sáng