14 điểm bởi GN⁺ 28 ngày trước | 4 bình luận | Chia sẻ qua WhatsApp
  • Trái với những tuyên bố rằng công cụ lập trình AI đã nâng mạnh năng suất, không quan sát thấy hiện tượng bùng nổ số lượng phần mềm mới
  • Kết quả phân tích dữ liệu PyPI cho thấy, ngay cả sau ChatGPT, tốc độ tạo package tổng thể cũng không thay đổi
  • Chỉ ở các package AI phổ biến thì tần suất cập nhật mới tăng hơn gấp đôi, còn các package không phải AI vẫn giữ xu hướng cũ
  • Hiện tượng tập trung này được diễn giải là hiệu ứng của sự tập trung vốn và sự chú ý hơn là mức tăng năng suất trên diện rộng do công nghệ AI mang lại
  • Kết quả là, tác động của AI tạo sinh thể hiện không phải ở sự mở rộng của toàn bộ hệ sinh thái phát triển, mà ở sự dồn hoạt động vào bên trong lĩnh vực AI

Phân tích năng suất phần mềm trong thời đại AI

  • Dù có những tuyên bố rằng công cụ lập trình AI đã nâng năng suất lên hàng chục lần, trên thực tế không quan sát thấy sự bùng nổ của phần mềm mới
  • Phân tích xu hướng tạo package và cập nhật sau khi AI được phổ biến rộng rãi thông qua dữ liệu từ kho package Python PyPI
  • Kết quả cho thấy chỉ các package AI phổ biến mới có tần suất cập nhật tăng mạnh, còn toàn bộ hệ sinh thái thì không có thay đổi rõ rệt
  • Hiện tượng này dường như là kết quả của sự tập trung vốn và sự chú ý hơn là sự cải thiện năng suất do chính công nghệ AI tạo ra

Phân tích số lượng package

  • Tổng số package trên PyPI cho thấy mức tăng trưởng theo hàm mũ liên tục, nhưng không có thay đổi rõ rệt vào thời điểm ChatGPT ra mắt
    • Số package mới theo tháng dao động trong khoảng 5.000 đến 15.000
    • Một số đợt tăng vọt sau năm 2020 là do spam và mã độc tràn vào
  • Nếu AI thực sự làm tăng năng suất của lập trình viên, thì phải quan sát thấy số lượng package tăng đột biến, nhưng dữ liệu không cho thấy điều đó

Phân tích tần suất cập nhật package

  • So với việc chỉ tạo package mới, tần suất cập nhật của các package được duy trì được xem là chỉ số có ý nghĩa hơn
    • Phân tích 15.000 package được tải nhiều nhất tính đến tháng 12 năm 2025
    • Gom các package theo năm tạo và theo dõi tần suất cập nhật trung vị của từng cohort theo năm
  • Các package được tạo sau ChatGPT có trung bình 13 lần cập nhật trong năm đầu tiên, cao hơn mức 6 lần của các package tạo năm 2014
    • Tuy nhiên, xu hướng này đã tăng từ năm 2019, có thể do sự phổ biến của các công cụ CI như GitHub Actions
  • Ở mọi cohort, tần suất cập nhật giảm khi vòng đời package dài hơn
    • Việc dùng công cụ AI không làm tăng tần suất bảo trì đối với các package cũ

Hiện tượng đặc biệt ở các package liên quan đến AI

  • Khi phân loại có liên quan đến AI hay không dựa trên mô tả package, chỉ các package liên quan đến AI mới cho thấy thay đổi rõ rệt
    • Các package liên quan đến AI được tạo trong năm 2023 có trung vị 20 lần cập nhật trong năm đầu tiên, xấp xỉ gấp đôi package không phải AI
  • Các package không liên quan đến AI vẫn duy trì mức tăng nhẹ tương tự trước đây
    • Vì vậy có thể xác nhận rằng mức tăng hoạt động tập trung chỉ xuất hiện ở các dự án liên quan đến AI

Mối quan hệ với yếu tố độ phổ biến

  • Để kiểm chứng liệu tần suất cập nhật cao của package AI có chỉ là hiệu ứng do mức độ phổ biến,
    tác giả chia 15.000 package hàng đầu thành 7.500 package dẫn đầu và 7.500 package phía sau theo số lượt tải
  • Kết quả là, tần suất cập nhật chỉ tăng vọt ở các package AI phổ biến
    • Sau ChatGPT, các package AI phổ biến có 21–26 lần cập nhật mỗi năm, trong khi các package phổ biến không phải AI vẫn giữ ở mức khoảng 10 lần
    • Mức này cũng cao hơn nhiều so với các package AI ít phổ biến hơn

Quan sát tổng hợp

  1. Tốc độ tạo package không tăng rõ rệt ngay cả sau ChatGPT
  2. Tần suất cập nhật toàn cục có tăng nhẹ, nhưng đây là xu hướng đã kéo dài từ trước thời AI
  3. Chỉ ở các package phổ biến liên quan đến AI mới quan sát thấy tần suất cập nhật tăng hơn 2 lần

Diễn giải và giả thuyết

  • Không có bằng chứng cho thấy AI đã làm bùng nổ năng suất của lập trình viên trên diện rộng

    • Nhìn tổng thể không có hiện tượng tăng đột biến về package mới hay cập nhật
    • Có thể một số lập trình viên đang dùng AI để phát triển nhanh hơn, nhưng quy mô và hiệu quả đó vẫn còn hạn chế
    • Việc phát triển chính phần mềm sử dụng AI thì thực sự đang diễn ra sôi động
    • Đặc biệt, hoạt động tập trung xuất hiện rõ ở các package AI phổ biến

Hai giả thuyết

  • Vấn đề kỹ năng AI: Những người làm ra công cụ AI cũng chính là những người biết cách tận dụng AI hiệu quả nhất, nên mức tăng năng suất xuất hiện rõ hơn ở package AI. Tuy vậy, chỉ yếu tố kỹ năng thì khó giải thích được vì sao hiện tượng này chỉ tập trung ở các package AI phổ biến
  • Vốn và làn sóng hype: Một lượng đầu tư và sự quan tâm khổng lồ đổ vào lĩnh vực AI khiến nhiều nhân lực hơn thực hiện nhiều công việc hơn, từ đó làm tăng việc tạo và cập nhật package
    • Thay đổi về quy mô cohort củng cố giả thuyết này: tỷ lệ non-AI so với AI ở cohort năm 2021 là 6:1 (1.211 vs 185), nhưng đến năm 2024 đã thay đổi xuống dưới 2:1 (727 vs 423)
    • Không phải lập trình viên đã trở thành siêu nhân, mà là sự quan tâm quá nóng dành cho AI đã chuyển hóa thành nguồn vốn, làm tăng tốc độ tạo và lặp lại của các package AI
  • Chỉ với dữ liệu hiện có thì không thể xác định hiệu ứng nào trong hai hiệu ứng này lớn hơn

Kết luận

  • Hiệu ứng có thể nhìn thấy của cuộc cách mạng AI tạo sinh không phải là sự bùng nổ năng suất phần mềm nói chung,
    mà là sự gia tăng hoạt động tập trung bên trong hệ sinh thái AI
  • Nếu xét theo dữ liệu PyPI, AI không phải đã biến mọi lập trình viên thành siêu nhân,
    mà cho thấy kết quả của việc vốn và nỗ lực được tập trung vào các dự án liên quan đến AI

4 bình luận

 

Hiện tại, có vẻ đổi mới lớn nhất là rào cản gia nhập phát triển đã được hạ thấp.

 

Lập luận này thật kỳ lạ.. ha. Từ sau ChatGPT, tôi đã dùng AI rất nhiều cho việc phát triển ở các domain khác nhau... Những việc trước đây là bất khả thi, hoặc phải cần khoảng 10 người có kinh nghiệm mới làm được, giờ tôi làm một mình... Đây chẳng phải là đổi mới sao?

 
summerpicnic 21 ngày trước

Không phải là ghét kiểu đổi mới đó sao? Có vẻ như họ đang tung ra gần như ở mức thông cáo báo chí, có lẽ là vì có liên quan đến lợi ích.

 
Ý kiến trên Hacker News
  • Dạo này việc biến ý tưởng thành giai đoạn nguyên mẫu thực sự đã dễ hơn rất nhiều
    Nhưng để đưa ra thành dịch vụ thực tế thì vẫn cần kỹ thuật phần mềm nhàm chán
    Tôi đã thấy nhiều người chạy theo xu hướng “tự mình viết code để tạo ra doanh nghiệp”, nhưng chưa thấy trường hợp nào thực sự ra mắt thành công
    Cuối cùng, chính bước cuối này là phần ngốn phần lớn thời gian và công sức

    • Đúng vậy. Nhưng trong đa số trường hợp, như thế là đủ rồi
      Ứng dụng không nhất thiết phải công khai cho số đông mới có ích
      Nếu mục tiêu là giải quyết vấn đề cho bản thân tôi, những người xung quanh, hoặc cả nhóm, thì “bước cuối” đó là sự lãng phí không cần thiết
      Sản phẩm trên thị trường không phải là lời giải cho vấn đề mà là công cụ để kiếm tiền
      AI đã làm giảm mạnh chi phí của việc “giải quyết vấn đề”, nhưng giảm ít hơn đối với chi phí “sản phẩm hóa”
      Vì vậy, không thể nói rằng thiếu sản phẩm đồng nghĩa với thiếu giải pháp cho vấn đề
    • Tôi đã làm việc với khá nhiều phần mềm tạo bằng AI code, và ngày càng cảm thấy trực giác debug của mình yếu đi
      Điều này rất nguy hiểm. Vì năng lực tìm ra nguyên nhân gốc rễ của vấn đề đang thoái hóa
      AI giúp làm nhanh 80% đầu tiên, nhưng chất lượng thì đáng nghi
      Cuối cùng nó khuyến khích kiểu phát triển bằng thử sai, và các lập trình viên nhiều kinh nghiệm thường ghét cách tiếp cận này
    • Tôi cũng cảm thấy y như vậy trong các dự án cá nhân
      Khi bảo Claude thiết kế tính năng thì nó cho ra một bản spec rất đẹp, và coding agent xử lý khá tốt đến 80%
      Nhưng 20% cuối lại mất nhiều thời gian hơn hẳn
      Trong lúc đó các ý tưởng tính năng mới cứ chồng lên, tạo ra backlog vô tận và cảm giác bất an
      Thực ra chẳng ai yêu cầu tôi phải làm vậy cả, chỉ là tôi tự tạo áp lực cho mình
    • Kỹ thuật phần mềm không chỉ đơn giản là viết code
      Đó là một quy trình dài từ thu thập yêu cầu, thiết kế, phê duyệt, dựng hạ tầng, viết code, kiểm thử, triển khai cho đến giám sát
      AI có thể tăng tốc 4~5 bước trong đó, tức phần hạ tầng và viết code
      Nhưng phần còn lại vẫn là lãnh địa của con người
    • Dạo này còn có câu đùa rằng “90% đầu tiên chiếm 90% thời gian, còn 10% cuối chiếm 90,000,000% thời gian còn lại”
  • Đo tác động của AI bằng 15.000 gói đứng đầu trên PyPI là không phù hợp
    Thống kê số app iOS đăng ký mới tăng 24% còn có ý nghĩa hơn
    Theo Appfigures Explorer, số app mới trong năm 2025 là 557.000, lần đầu tiên tăng mạnh kể từ năm 2016
    Kể từ thời điểm AI đủ thực dụng để dùng (tháng 12/2025, khi Opus 4.5 và Codex ra mắt), năng suất phát triển đã tăng vọt

    • Đương nhiên ứng dụng di động ngắn hạn sẽ hưởng lợi từ AI nhiều hơn so với các gói Python trưởng thành
      Giờ là thời đại hỏi LLM thay vì hỏi Stack Overflow
      LLM có thể truy cập tài liệu thì trả lời được 95% câu hỏi
      Có lẽ Stack Overflow sẽ khó mà trụ nổi trước thay đổi này
    • Các gói PyPI không phù hợp để đo ảnh hưởng của AI
      Coding với AI thường được dùng để giảm bớt utility, hoặc để làm công cụ nội bộ không phát hành dưới dạng package
    • Việc app vô dụng trên app store tăng lên thì không có nhiều ý nghĩa
      Gần như không có ứng dụng hữu ích nào thực sự đóng góp cho năng suất kinh tế
      AI tiêu tốn năng lượng và vốn nhưng lợi ích thực tế lại rất nhỏ
      Xét từ góc độ kinh tế, cơn sốt AI gần với một bong bóng bị thổi phồng quá mức
  • Dạo này nhan nhản các dự án kiểu “YoloSwag”
    Tự nhận là bản triển khai PyTorch 1:1 bằng Rust, khoe giảm 80% CPU, tăng tốc 300%, nhưng thực tế thì crash ngay lập tức
    Test thì toàn cho qua bằng mock giả, code thì một nửa là binding PyTorch, nửa còn lại là những API lạc quẻ, thành ra một con quái vật đúng nghĩa
    Nhà phát triển lại là một cựu binh crypto tự nhận đã thành chuyên gia điện toán lượng tử chỉ sau 6 tuần

    • Đến mức còn có câu đùa “crash ngay thì chẳng phải đó mới là Memory Safe thật sao”
    • Cần phải lọc công khai những kiểu người này thì văn hóa phát triển mới lành mạnh
      Họ không dùng AI để tự học, mà chỉ dùng để phô trương bản thân
      Nếu văn hóa này không thay đổi, chúng ta sẽ còn tiếp tục thấy những dự án kiểu “YoloSwag” như vậy
  • Tôi đã xóa VSCode và làm một bảng điều khiển siêu cá nhân hóa của riêng mình
    Feed tin tức, quản lý issue, trình soạn thảo Markdown, lịch, nút AI... mọi thứ đều xử lý trên một màn hình
    Nhưng nó quá cá nhân hóa nên chẳng có lý do gì để chia sẻ

    • Người thiên về kỹ thuật thì làm các app cá nhân kiểu này, nhưng app đại chúng chất lượng cao vẫn còn thiếu
      Phần lớn dịch vụ mới vẫn chỉ dừng ở dạng wrapper cho LLM hoặc công cụ AI
    • Nhờ AI mà tôi cũng dễ dàng làm ra những “app chỉ mình tôi dùng” hơn
      Ví dụ tôi đã hoàn thành một app đi chợ phù hợp với thói quen mua sắm của mình chỉ trong 20 phút
      Phần mềm siêu cá nhân hóa như vậy chính là bước tiếp theo
    • Tôi cũng đang quản lý nhiều dự án xoay quanh VSCode + Claude Code, và giao diện ngày càng phức tạp
      Nếu bạn chia sẻ thiết lập của mình, có lẽ sẽ mang lại cảm hứng cho rất nhiều builder
    • Dù workflow khác nhau, những thiết lập cá nhân hóa như vậy vẫn là ví dụ truyền cảm hứng
  • Lý do những thứ làm bằng AI không được công khai rất đơn giản
    Đa số là được tùy biến cho từng cá nhân, nên không cần công khai
    Hơn nữa bây giờ ý tưởng tự thân đã trở thành lợi thế cạnh tranh hơn là năng lực thực thi, nên người ta cũng không muốn chia sẻ
    Trong thời đại ai cũng có năng lực tương tự nhau, mỗi người có thể tự làm thứ mình cần một cách nhanh và rẻ
    Vì vậy có rất nhiều sản phẩm tạo bằng AI, nhưng thứ được công bố ra thế giới lại ngày càng ít đi

    • Nhưng lập luận rằng AI đã thay đổi bản chất của kỹ thuật phần mềm vẫn có giá trị
      Điều cần có không phải ví dụ từ dự án cá nhân, mà là bằng chứng cho thấy sự thay đổi trên toàn ngành
    • Trong mã nguồn mở đang hình thành một bầu không khí ý thức hệ kỳ lạ kiểu “cái gì AI làm ra cũng là rác”
      Vì thế ngay cả những đóng góp thật sự cũng bị chùn bước
      Dĩ nhiên code AI chất lượng thấp là vấn đề, nhưng lấy đó làm lý do để bài xích tất cả thì không phải giải pháp
      Văn hóa không review và test tử tế mới là vấn đề lớn hơn
  • AI giúp làm dễ 90% đầu của ứng dụng, nhưng lại khiến 10% cuối khó hơn rất nhiều
    Codebase thì đã phình ra nhưng cảm giác quen thuộc lại biến mất, nên đa số bỏ cuộc ở đây

    • Tôi cũng đã thử nghiệm một app greenfield bằng AI, và gặp bốn vấn đề
      1. Tiến độ quá nhanh nên kế hoạch bị vỡ
      2. Có rất nhiều lỗi chi tiết
      3. Có nhiều vấn đề bảo mật runtime và các giả định sai
      4. Sai lầm về cấu trúc khiến việc refactor trở nên khó khăn
        Cuối cùng, dù AI tạo ra rất nhanh nhưng vẫn có nhiều cái bẫy về chất lượng và bảo mật
    • Câu đùa “90% đầu tiên chiếm 90% thời gian, còn 10% cuối chiếm 90% thời gian còn lại” vẫn còn nguyên giá trị
    • Giống như khái niệm Comprehension Debt, khoản nợ do code mà mình không hiểu cứ ngày càng lớn
    • 10% cuối vốn dĩ đã khó, nhưng nhờ AI mà nó càng dễ khiến người ta kiệt sức về tinh thần hơn
    • Khi AI viết code thay người thì cũng có xu hướng phạm vi tính năng cứ tiếp tục phình ra
  • Cơn sốt AI hiện nay gợi nhớ đến bong bóng dot-com
    Cũng như đầu những năm 2000, có rất nhiều công ty đang đốt tiền trong ảo tưởng rằng “chỉ cần dùng AI là được”
    Trong khi đó cũng có những doanh nghiệp âm thầm áp dụng AI để nâng cao hiệu quả công việc

    • Nó giống thời người ta làm website bằng FrontPage hay DreamWeaver trước đây
      Cuối cùng phần lớn vẫn sẽ chỉ là công cụ hỗ trợ, còn ứng dụng tự động hóa hoàn toàn sẽ chỉ là số ít
  • Dùng số lượng package PyPI để đo tác động của AI là một cách tiếp cận sai
    Sự gia tăng năng suất thực tế diễn ra ở repo riêng tư, công cụ nội bộ, và các app đơn mục đích
    Bản thân tôi cũng đã dùng AI để làm một web app có hỗ trợ offline, thanh toán Stripe và cả trang SEO chỉ trong 6 tuần
    Nếu là trước đây thì việc đó phải mất 6 tháng
    Những kết quả như vậy không xuất hiện trong dataset, nhưng mức tăng năng suất là có thật

    • Đến mức còn có câu đùa “bình luận này cũng do AI viết à, hay là vì dùng nhiều quá nên giọng văn bắt đầu giống nhau rồi”
  • Gần đây tôi cũng ít dùng library hơn
    Vì nhờ AI mà tự xử lý gọi API trực tiếp lại đơn giản hơn
    Việc phát hành package thực chất gần như là vận hành một dự án mã nguồn mở, mà đó là công việc cực kỳ mệt mỏi
    Gánh nặng bảo trì và sự mất cân bằng giữa công sức với phần thưởng khiến ai cũng ngại
    Thế giới đã có quá nhiều library rồi, và xu hướng hội tụ vào những cái thực sự tốt cũng không hẳn là xấu
    Giờ nhiều lập trình viên dùng AI không còn theo “đơn vị dự án” mà theo đơn vị commit

  • Đo hiệu quả của AI bằng PyPI là quá thiển cận
    Thay vào đó, nếu nhìn vào báo cáo GitHub Octoverse 2025 thì sẽ thấy
    số người dùng và đóng góp mã nguồn mở đang đi lên một cách rõ ràng
    Tính đến năm 2025, 81,5% tổng số đóng góp diễn ra trong repo riêng tư, còn repo công khai chỉ chiếm 63%

    • Nhưng phản biện kiểu “Claude Code ra mắt vào tháng 5/2025 mà bây giờ mới tháng 3 thôi” chỉ là di chuyển khung tiêu chuẩn
      Trước đó đã có Cursor, Copilot và nhiều công cụ khác, tất cả đều được gọi là đột phá
      Nếu AI thực sự giúp triển khai code nhanh gấp 10 lần, thì kết quả bùng nổ đã phải hiện ra từ trước rồi