1 điểm bởi GN⁺ 4 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Microsoft đang cắt giảm chi phí cho các công cụ AI nội bộ bằng cách hủy phần lớn giấy phép trực tiếp Claude Code và chuyển các kỹ sư sang GitHub Copilot CLI
  • Claude Code từng được cung cấp cho hàng nghìn nhân viên để thử nghiệm lập trình và nhanh chóng trở nên phổ biến, nhưng khi quy mô sử dụng tăng lên thì gánh nặng chi phí cũng lớn hơn
  • Uber đã dùng hết toàn bộ ngân sách cho công cụ lập trình AI của năm 2026 chỉ trong 4 tháng và khuyến khích các nhóm dùng công cụ AI bằng bảng xếp hạng nội bộ
  • Khi các doanh nghiệp tăng mức sử dụng token để nâng cao năng suất, tổng hóa đơn có thể còn tăng ngay cả khi đơn giá token giảm
  • Goldman Sachs cho rằng AI dạng agent có thể làm mức tiêu thụ token tăng gấp 24 lần vào năm 2030, và Gartner cũng nhận định mức tiêu thụ tăng có thể vượt tốc độ giảm đơn giá

Mở rộng sử dụng AI nội bộ trong doanh nghiệp và gánh nặng chi phí

  • Microsoft bắt đầu hủy phần lớn giấy phép trực tiếp Claude Code sau bài đưa tin của The Verge, đồng thời chuyển các kỹ sư sang GitHub Copilot CLI
  • Quyền truy cập Claude Code được cấp từ 6 tháng trước cho hàng nghìn nhân viên như lập trình viên, quản lý dự án và nhà thiết kế để thử nghiệm lập trình, và nhanh chóng được ưa chuộng, nhưng khi quy mô sử dụng tăng lên thì vấn đề chi phí cũng nổi bật hơn
  • Việc hủy giấy phép Claude Code không ảnh hưởng đến thỏa thuận Foundry của Microsoft
    • Thỏa thuận này bao gồm khoản đầu tư tối đa 5 tỷ USD vào Anthropic, quyền truy cập các mô hình Claude cho khách hàng Foundry và cam kết mua 30 tỷ USD năng lực tính toán Azure của Anthropic
  • CTO của Uber, Praveen Neppalli Naga, nói với The Information rằng Uber đã tiêu hết toàn bộ ngân sách cho công cụ lập trình AI của năm 2026 chỉ trong 4 tháng
  • Uber tích cực thúc đẩy việc áp dụng bằng bảng xếp hạng nội bộ xếp hạng mức sử dụng công cụ AI của từng nhóm
  • Bryan Catanzaro, Phó chủ tịch deep learning ứng dụng của Nvidia, nói trong một cuộc phỏng vấn với Axios rằng: “Trong đội của tôi, chi phí compute vượt xa chi phí nhân sự”
  • Anthropic không phản hồi ngay lập tức yêu cầu bình luận từ Fortune, và Microsoft cũng không đưa ra bình luận

Cách token rẻ hơn lại dẫn đến hóa đơn lớn hơn

  • Các doanh nghiệp đang thúc đẩy mở rộng sử dụng AI của nhân viên để nâng cao năng suất, nhưng với mô hình tính phí theo token, mức sử dụng càng tăng thì tổng chi phí cũng càng lớn
  • Một nhân viên của Meta đã tạo bảng xếp hạng “Claudeonomics” lấy tên từ mô hình Anthropic để theo dõi mức sử dụng AI của từng nhân viên
  • Amazon đang khuyến khích nhân viên “tokenmaxxing”, tức là sử dụng càng nhiều token càng tốt, vốn là đơn vị cấu thành cơ bản của AI compute
  • Goldman Sachs dự báo rằng việc người tiêu dùng và doanh nghiệp áp dụng AI agent sẽ khiến AI dạng agent làm mức tiêu thụ token tăng gấp 24 lần vào năm 2030, đạt 120 nghìn tỷ tỷ token mỗi tháng
  • Gartner cho rằng đến năm 2030, chi phí suy luận của LLM 1 nghìn tỷ tham số sẽ thấp hơn gần 90% so với năm 2025, nhưng dự đoán rằng token rẻ hơn sẽ không tự động dẫn đến việc cắt giảm chi phí AI của doanh nghiệp
    • Mô hình dạng agent cần nhiều token hơn rất nhiều cho mỗi tác vụ so với mô hình tiêu chuẩn
    • Mức tiêu thụ tăng có thể vượt tốc độ giảm đơn giá
    • Nhà cung cấp AI có thể không chuyển hoàn toàn phần chi phí giảm xuống cho khách hàng
  • Will Sommer, nhà phân tích giám đốc cấp cao của Gartner, cảnh báo rằng: “Các CPO không nên nhầm lẫn giảm phát của token phổ dụng với sự dân chủ hóa suy luận frontier”
  • CEO của Nvidia, Jensen Huang, từng nói rằng một ngày nào đó 100 AI agent sẽ làm việc cùng mỗi nhân viên, nhưng nếu mức tiêu thụ token tăng nhanh hơn tốc độ giảm đơn giá thì tương lai agent này có thể đi kèm chi phí nặng nề hơn nhiều so với dự đoán của giới lãnh đạo

1 bình luận

 
Ý kiến trên Hacker News
  • Thảo luận sôi nổi dựa trên bài gốc ở đây: https://news.ycombinator.com/item?id=48238896
    Bài báo có viết rằng “The Verge đưa tin Microsoft đã bắt đầu hủy phần lớn giấy phép trực tiếp của Claude Code.”

    • Bài này có vẻ được viết khá cẩu thả
      1. Không có trích dẫn nào cho thấy Microsoft nói rằng AI đắt hơn nhân viên
      2. Đội deep learning của Nvidia chi nhiều tiền cho AI hơn cho nhân viên, nhưng điều đó hợp lý vì mục tiêu của đội đó không phải là coding kiểu agent mà là sử dụng AI chuyên sâu và nặng đô
        Đoạn “với cách tính phí theo token, càng dùng nhiều và hiệu quả càng cao thì càng đắt” cũng kỳ lạ. Tôi không hiểu vì sao hiệu quả tốt hơn lại làm chi phí tăng lên
  • Tiêu đề có vẻ dễ gây hiểu lầm, và đọc bài báo thì lý do còn rõ hơn. Các công ty này có những OKR và mục tiêu vô lý kiểu phải đốt càng nhiều token càng tốt
    Nếu biến lượng token sử dụng thành chỉ số thì đương nhiên kết quả sẽ cực kỳ tốn kém
    Bản thân chi phí suy luận vẫn ở mức chịu được, và để dùng công nghệ này một cách hữu ích cũng không nhất thiết phải cần các mô hình độc quyền mới nhất. Các kỹ sư con người chắc chắn còn cần thiết trong khá lâu nữa, nhưng tôi không đồng ý với ý rằng “một phần con người + LLM” sẽ đắt hơn chỉ tuyển thêm người, hoặc sẽ tiếp tục đắt hơn mãi

    • Có lẽ chỉ cần nói thế này là đủ: công ty áp dụng OKR buộc bộ phận IT phải chi hơn 1000 USD mỗi ngày cho mỗi lập trình viên. Công ty ngạc nhiên khi chi phí IT tăng vọt so với trước. Rồi họ nâng mức đó lên 1500 USD mỗi ngày cho mỗi lập trình viên với lý do sẽ xây hệ thống để tìm ra vì sao chuyện này xảy ra
      Lúc này có vẻ vấn đề không phải vibe coding mà là vibe leadership, và vibe leadership về bản chất chẳng liên quan gì đến AI. Đó là những người bám lấy một trực giác mơ hồ rồi ép nó đi tới các kết luận phi lý, bất kể chi phí hay kết quả
    • Chỉ nhìn bài báo thì có vẻ họ không từ bỏ “AI” mà chỉ đổi LLM từ Claude Code sang GitHub Copilot
    • Luật Goodhart: khi một chỉ số trở thành mục tiêu, nó sẽ không còn là chỉ số tốt nữa
    • Tôi nghi các con số doanh thu khiến nhà đầu tư phấn khích chính là dựa trên thế giới lấy token làm chỉ số đó. Không thể vừa là một mảng kinh doanh tăng trưởng bùng nổ, vừa phải siết chi tiêu mạnh hơn thì mới có lợi tức đầu tư
    • Có vẻ truyền thông đang quyết tâm thiêu rụi AI. Bảng tin toàn là bài về cái ác của data center, sự vô dụng của AI, và chuyện ai cũng ghét AI
  • Tiền đề của bài này là sai. Việc Microsoft hủy sử dụng Claude Code nội bộ không phải vì chi phí AI quá đắt, mà vì họ có sản phẩm cạnh tranh là GitHub Copilot và muốn nhân viên dùng sản phẩm của chính mình
    Việc Teams được chú ý nhiều trong thời kỳ phong tỏa cũng vì lý do tương tự

    • Đúng vậy. Bài báo đã trộn hành động của Microsoft vào vấn đề chi phí, trong khi thực tế không phải vì chi phí. Rồi còn ghép thêm một câu trích dẫn tùy tiện từ “phó chủ tịch deep learning ứng dụng của Nvidia”, nói rằng trong đội của ông ấy chi phí tính toán lớn hơn chi phí nhân sự
      Nhưng đội đó không dùng LLM cho phát triển phần mềm, mà đúng nghĩa là đội deep learning, kiểu đội đốt compute theo cách làm deep learning
      Chỉ cần tính sơ cũng thấy Microsoft không thể trả nhiều tiền cho AI hơn cho lập trình viên. Họ có khoảng 80.000 nhân viên khối phát triển sản phẩm, và tổng chi phí cho mỗi lập trình viên senior có lẽ vào khoảng 400.000 USD
      Microsoft có một hóa đơn Claude trị giá 32 tỷ USD sao? Chắc là không
    • Cả hai điều đều có thể đúng. Claude có thể quá đắt, đồng thời họ cũng muốn chuyển nhân viên sang Copilot. Vì là sản phẩm nội bộ nên chi phí sẽ giảm, và nhờ đó họ có thể kỳ vọng tăng mức sử dụng lẫn phản hồi
      Tuy vậy, tôi không thật sự hiểu ví dụ Teams thời phong tỏa song song với lập luận phía trên ở điểm nào
  • Không có chỗ nào trong bài viết nói Microsoft đã báo cáo rằng AI đắt hơn nhân viên con người

    • Trời… Fortune bị làm sao vậy? Tôi cứ nghĩ đây là một tờ báo tốt hơn nhiều so với kiểu giật tít câu click này
    • Có lẽ tiêu đề bài đăng bị thiếu một từ. Nó nên là “Microsoft reports show AI is more expensive…”
      Dù Microsoft không nói rõ, bản thân chuyện AI đắt hơn vẫn được thể hiện ra
  • Mốt tokenmaxxing có lẽ là một trong những ý tưởng ngu ngốc nhất xuất hiện từ làn sóng AI lần này. Nó đi ngược hoàn toàn với tối đa hóa hiệu suất và năng suất, vậy mà vẫn được chấp nhận rộng rãi

  • http://archive.today/l3EEo

  • Microsoft hủy Claude vì Copilot không tốt, nên họ phải tự dùng Copilot. Đây là chuyện đã được thừa nhận nội bộ và không phải bí mật
    Hiện tại token của Anthropic có thể còn đắt hơn đối với Microsoft vì trước đây chúng được trợ giá

  • Muốn phân tích chi phí dùng AI thì phải nhìn vào ngữ cảnh sử dụng
    Nhiều người đang dùng AI để trau chuốt tài liệu, hội thoại Slack, email, hoặc tạo ra những tài liệu dài không cần thiết từ các prompt ngắn. Không có lý do gì mà việc gửi tin nhắn Slack hay email trong công ty lại cần đến AI. Đó là kiểu lãng phí tài nguyên và thời gian chỉ để làm cho mọi thứ trông thuyết phục hơn mà không thay đổi nhiều về ý nghĩa

    • Những trường hợp đó thực ra có chi phí khá thấp
  • Đốt token thì dễ chẳng khác gì ném tiền vào lò
    Mức sử dụng token không phải là chỉ số tốt cho năng suất. Vấn đề là vẫn chưa ai thực sự tìm ra cách đo lường việc sử dụng AI có tính tạo năng suất như thế nào. Rất khó phân biệt giữa việc lập trình viên đang tối đa hóa năng suất, chỉ đang đốt token, hay đang chống lại thay đổi

    • Phiên bản mới của chỉ số số dòng code
  • AI không đắt hơn việc trả lương cho nhân viên con người. Hiện tại AI vẫn chưa thể thay thế nhân viên con người, nên tiền đề của tiêu đề này là sai