- Uber đã dùng hết toàn bộ ngân sách AI năm 2026 chỉ trong 4 tháng do mở rộng sử dụng Claude Code và Cursor, và các thử nghiệm về năng suất nhanh chóng dẫn tới việc phải xem xét lại ngân sách
- CTO của Uber cho biết chi phí API hàng tháng trên mỗi kỹ sư ở mức 500~2.000 USD, và 95% kỹ sư đang sử dụng công cụ AI mỗi tháng
- 70% mã được commit tại Uber có nguồn gốc từ AI, cho thấy công cụ lập trình AI đã đi vào luồng công việc cốt lõi của kỹ thuật
- Claude Code được triển khai cho đội ngũ kỹ thuật vào tháng 12/2025, sau khi năng lực xử lý tác vụ nhiều bước được xác nhận thì mức sử dụng đã tăng gấp đôi tới tháng 2/2026, và đến tháng 4 đã dùng hết toàn bộ ngân sách năm
- Trong khi mức sử dụng Cursor tăng trưởng chững lại, Claude Code trở thành công cụ thống trị, khiến Uber phải tính toán lại chi phí công cụ lập trình AI trong tổng chi tiêu R&D hằng năm 3,4 tỷ USD
Mở rộng triển khai và xem xét lại ngân sách
- Khi việc sử dụng Claude Code và Cursor tăng nhanh, Uber nhận thấy các kỹ sư đánh giá rất cao giá trị của hai công cụ này, đến mức khó có thể ngừng sử dụng dù chi phí tăng mạnh
- Tháng 12/2025, quyền truy cập Claude Code được triển khai cho đội ngũ kỹ thuật, và sau khi năng lực xử lý tác vụ nhiều bước được xác nhận, mức sử dụng đã tăng gấp đôi tới tháng 2/2026
- Đến tháng 4/2026, chi phí đã tiêu hết toàn bộ ngân sách AI cả năm, khiến ban lãnh đạo phải đưa ra những quyết định ngoài dự kiến
- CTO của Uber cho biết công ty đã phải đưa việc lập ngân sách AI “back to the drawing board”
Thay đổi mức sử dụng theo từng công cụ
- Cursor là một công cụ lớn khác trong cuộc đua giành mức độ chấp nhận, nhưng tăng trưởng sử dụng đã chững lại
- Claude Code đã trở thành công cụ chi phối trong quy trình làm việc kỹ thuật
- Việc triển khai ban đầu như một thử nghiệm năng suất đã nhanh chóng mở rộng, khiến việc sử dụng công cụ AI trong công việc kỹ thuật nội bộ của công ty trở nên toàn diện
Ý nghĩa của áp lực chi phí
- Việc Uber tiêu hết ngân sách ngoài dự kiến cho thấy công cụ AI được nhìn nhận có giá trị lớn thế nào đối với năng suất kỹ thuật
- Vai trò của công cụ AI đã lớn đến mức việc hạn chế quyền truy cập còn bị xem là phản tác dụng
- Khi ngày càng nhiều nhà phát triển áp dụng Claude Code, các công ty khác cũng có thể đang gặp tác động tương tự
- Các công ty phần mềm sẽ chịu áp lực phải kiểm soát chi phí trong khi vẫn duy trì tốc độ phát triển
- Nếu công cụ năng suất cho nhà phát triển có giá trị đến mức các kỹ sư tiêu hết toàn bộ ngân sách chỉ trong 4 tháng, thì kết luận là vấn đề không nằm ở bản thân công cụ, mà ở chỗ ngân sách đã được lập quá sớm để có thể dự đoán đường cong chấp nhận
2 bình luận
Niềm vui đốt tiền
Ý kiến trên Hacker News
Nếu thỉnh thoảng xem chi tiêu của công ty mỗi tháng, sẽ thấy ngày càng nhiều người tiêu $1k chi phí token mỗi tháng, và thật sự khó hiểu là làm sao có thể tiêu tới mức đó
Ngay cả khi dùng LLM hằng ngày, dùng cả model đắt nhất kèm chế độ suy nghĩ sâu, thì thường trần cũng chỉ khoảng $200~$400. Không phải tôi là kiểu Luddite phản đối việc sử dụng, mà là rất khó hiểu làm sao có thể đốt từng ấy tiền một cách có trách nhiệm. Tôi muốn thấy ai đó tiêu $5k~$10k/tháng và chỉ ra nó chuyển thành giá trị $50k~$100k như thế nào. Từ góc nhìn công ty, thay vì biện minh cho mức chi token $100k/năm, có lẽ tuyển một kỹ sư junior tiêu $100~$200/tháng nhưng vẫn tạo ra năng suất sẽ hợp lý hơn
Người mức trung bình thì biết những pattern kiểu “khởi chạy 5 sub-agent để phân tích lời giải từ các góc khác nhau rồi tóm tắt lại”, rồi rất dễ nghiện cách đó. Bản thân nó không hẳn là thói quen xấu, nhưng nếu không cẩn thận thì sẽ vượt tín dụng rất xa. Người thành thạo thì cho chạy song song liên tục 10 cây công việc, chuyển qua lại giữa các phản hồi của agent và multitask cực độ, khiến chi phí có thể tăng theo cấp số nhân
Codebase lớn hoặc vấn đề phức tạp cũng là yếu tố lớn. Nếu mới vào nhóm và còn nhiều chỗ chưa biết, khi nhận việc thì sẽ để Claude tìm code liên quan, hiểu luồng hiện có rồi mới thử sửa. Chuyên môn tích lũy được ít hơn, nhưng với Claude thì việc mất 5 ngày có thể xong trong 1 ngày, và nếu ai cũng làm vậy thì mình không thể tụt lại. Vì thế tôi chọn con đường ở giữa: xong trong 2~3 ngày thay vì 1 ngày, đồng thời vẫn cố xem code một chút. Đặc biệt là vì AI làm tốc độ thay đổi code tăng khủng khiếp, nên tôi còn làm cả công cụ để LLM giải thích sâu các pull request. Không phải để review mà để theo kịp công việc của nhóm. Tôi còn chưa suy nghĩ nhiều thêm về cách tận dụng LLM, và nếu đã quen codebase thì có lẽ còn dùng nhiều hơn nữa. Nút thắt vẫn là kiểm thử và review cho đúng cách. Với code nội bộ ít quan trọng hơn hay code cá nhân, có vẻ tôi gần như giao hết cho AI, và nếu dùng kỹ năng “superpowers” thì ngay cả chức năng cơ bản cũng đốt rất nhiều token. Thường bắt đầu ở 20~40K token và tới lúc xong thì lên 80~90K token, nghĩa là nhiều yêu cầu ngay trước khi hoàn tất gần như đang gửi 80K token. Lãng phí đấy, nhưng nếu người khác trả thì sẽ thành vậy
Ban đầu vẫn ổn, nhưng rồi một agent ghi hàng trăm nghìn dòng vào output của cell, tạo ra file
ipynb500MB, và Claude cố đọc nó nhiều lần, cuối cùng ngốn sạch giới hạn ngữ cảnh. Cách giải quyết là thiết kế cấu trúc công việc tốt hơn bằng script phân tích CLI và thư mục lưu kết quả nghiên cứu, nhưng người vận hành là tôi phải tự làm phần kế hoạch và thiết kế. Những người tiêu $10k token mỗi tháng khó mà không bị xem là đang lười biếng dùng Claude Code như một cái búa đắt tiền để xử lý mọi vấn đề. Ví dụ như ngày nào cũng để Claude đọc toàn bộ email, trong khi cách thông minh hơn là trước tiên loại bỏ nhiễu khỏi HTML phần thân emailNgược lại, nếu repo nhỏ hoặc dùng framework phổ biến mà model đã học, thì vẫn làm được nhiều việc với cửa sổ ngữ cảnh nhỏ hơn và mức dùng token cũng thấp hơn nhiều
Từ khi bắt đầu dùng coding agent, lần duy nhất tôi tiến gần giới hạn là khi làm cross-platform development cùng lúc trên 3 máy tính trong cùng điều kiện, mà khi đó cũng chỉ gần chạm giới hạn tuần. Bình thường tôi xuống khoảng 20% quota là cùng, gần như không bao giờ thấp hơn. Tôi còn hay ném rất nhiều prompt và truy vấn cho vui, nhưng vẫn không hiểu phải làm gì mới tiêu hơn nữa
Tôi biết hiện tại mình đang trả lời cho AI, nhưng câu “xác định xem công ty có thể gánh mức năng suất này ở quy mô lớn hay không” nghe rất kỳ. Nếu thực sự có năng suất thì doanh thu sẽ tăng, và chuyện có gánh nổi hay không sẽ không còn là vấn đề
Việc “95% kỹ sư của Uber giờ dùng công cụ AI mỗi tháng, và 70% code đã commit đến từ AI” là điều dễ đoán. Nếu việc dùng công cụ AI được đưa vào đánh giá hiệu suất, thì sẽ thành ra như vậy
Tôi không hiểu đoạn “xác định xem công ty có thể gánh mức năng suất này ở quy mô lớn hay không”. Họ đã tiêu ngân sách, đã có 4 tháng dữ liệu, nên câu hỏi cốt lõi là có kết quả gì để cho thấy
Tôi không ghét AI cũng không phải Luddite, tôi đang dùng gói Max $200. Nhưng có phải ý họ là Uber mở công cụ này ra, khuyến khích mọi người dùng, nó hoạt động tốt, rồi giờ họ lại bối rối trước điều xảy ra tiếp theo? Việc kết luận AI không đủ năng suất so với chi phí là chuyện khác. Tôi thậm chí còn tự hỏi có phải họ đã hết thứ để xây tiếp rồi không
Ngay ở Salesforce tôi cũng thấy những thay đổi khiến công việc từng mất vài tuần giờ có vẻ chỉ còn vài ngày. Chưa chuyển thành tiền ngay, nhưng nó làm tăng tiềm năng kiếm tiền
Phải hỏi vì sao cần dùng nhiều token đến vậy, và đổi lại thu được gì. Nếu đây là AWS thì mọi người đã chỉ tay nói “có xem chi tiêu hằng tháng không vậy” rồi
Mỗi lần có bài như thế này lại thú vị ở chỗ đột nhiên nhiều người nghĩ việc đo năng suất phát triển là đơn giản. Đúng là năng suất dẫn tới doanh thu hoặc cắt giảm chi phí, và doanh thu thì đo được, nhưng không hề đơn giản như vậy
Ta chi tiền hôm nay để làm tính năng tạo ra doanh thu tương lai, nên dù chi phí hôm nay tăng vọt thì vẫn chưa có doanh thu nào để đo. Việc dùng AI hoàn thành tính năng hôm nay không có nghĩa là có thể lập tức kết luận AI có năng suất/không có năng suất; còn phải ước lượng nếu không có AI thì đã làm được bao nhiêu và doanh thu khi đó sẽ là gì. Kinh doanh thường là một cuộc đua Nữ hoàng Đỏ, nên nếu không cải thiện thì có thể bị đối thủ vượt qua và mất doanh thu. Việc dùng AI rất có thể trộn lẫn giữa các công việc quan trọng và kiểu “giờ dễ rồi nên cứ ném thêm đủ thứ vào”, và nếu muốn đo cải thiện năng suất thật sự thì phải biết giữ cái trước và tránh cái sau. Không phải ủng hộ hay phản đối AI, mà là đừng lười biếng nói rằng “nếu có năng suất thì ắt đo được”
Tôi không biết ý nghĩ rằng năng suất của con người không phải công nhân nhà máy là thứ dễ đo đến từ đâu nữa
Tôi đồng ý rằng điều đó cực kỳ khó đo. Nhưng với mức chi phí này thì nhất định phải trả lời được, và hệ số tăng năng suất cũng phải đủ để biện minh cho chi phí
Theo [1], tổ chức kỹ thuật của Uber có khoảng 5.500 người. Lấy trung vị phạm vi chi tiêu là $1.250 thì chi phí AI cho khối kỹ thuật vào khoảng $6.8M, với phạm vi $2.75M~$12M. Bài viết nêu chi tiêu R&D là $3.4B
Chi phí AI không phải phần lớn trong chi tiêu R&D. Trong 4 tháng chỉ khoảng 0,3%, quy đổi năm là khoảng 1%. Nếu không lên kế hoạch trước thì cũng không phải tiền lẻ trong ngân sách, nhưng xét theo bối cảnh thì không quá lớn. Câu hỏi thật sự là họ nhận được gì từ số tiền đó. Bài viết nói 70% code commit là do AI tạo ra, vậy có lẽ đã qua review và test. Điều quan trọng là số lượng tính năng có tăng tốc không, vấn đề chất lượng có giảm không, hay có lợi ích nào khác không. Đáng tiếc là bài không nói tới kết quả nào ngoài việc chi tiêu tăng lên. 4 tháng có lẽ còn quá sớm để đánh giá lợi ích. Mặt khác, trong thế giới agile thì có thể khác. [1] https://www.unifygtm.com/insights-headcount/uber
Ngoài ra còn nói rằng “công ty không tiết lộ con số chính xác cho ngân sách phần mềm hay mức chi cho công cụ coding AI”
Với người đang bootstrap như tôi, đôi khi rất ghen tị với kỹ sư ở công ty lớn, nhưng cũng lo rằng incentive đã bị hỏng
Nếu tôi là kỹ sư Uber, chẳng có lý do gì để không viết
gpt 5.5 pro @ very high thinking + fast modevào prompt ngay cả cho thay đổi nhỏ. Không có động lực nào để không dùng model mạnh nhất và vì thế đắt nhất. Tôi từng thử một prompt như vậy cho bài test chuyển ảnh → HTML, và chỉ một prompt đã tốn $40. Nếu tự bỏ tiền túi thì gần như chắc chắn sẽ không bao giờ dùng cấu hình đó, nhưng ở công ty lớn, khi người khác trả tiền, thì sẽ chạy thường xuyên. Kết quả đầu ra chắc chắn tốt hơn. Kỹ sư được đánh giá theo những gì họ bàn giao, chứ không phải chi phí của quá trình. Có cách làm rẻ hơn, nhưng kỹ sư không có động lực để làm vậyTôi vẫn chưa chắc ngoài thực tế có đúng như vậy không, nhưng về mặt lý thuyết là thế. Việc cố giảm chi phí LLM cũng là con dao hai lưỡi. Tiền LLM mà developer tiết kiệm được phải lớn hơn chi phí đang trả cho người đó. Nếu bỏ ra cả ngày để giảm $1 cho mỗi lần gọi thì gần như phải mất 2 năm mới thu hồi được chi phí lương. Chưa kể LLM thay đổi quá nhanh, khó mà tin rằng giải pháp đó sẽ không lỗi thời trong 2 năm. Sau 2 năm liệu còn gọi công cụ đó nữa không, liệu chế độ reasoning còn tồn tại không, ngay cả nhà cung cấp tiên phong cũng chưa chắc biết
Càng ngày càng phổ biến chuyện lãnh đạo nghĩ rằng có thể thay kỹ sư phần mềm bằng agent, nên tôi tự hỏi liệu họ có đang ra quyết định dựa trên nhận thức phi thực tế về kỹ sư phần mềm trung bình hay không
Một mặt thì đúng là bỏ vào gì sẽ ra cái đó. CTO giỏi có thể cực kỳ hào hứng với những gì agent làm được, rồi lầm tưởng rằng mọi kỹ sư cũng làm được điều tương tự. Trong thực tế, kỹ sư trung bình của tổ chức có khi còn không đủ sáng tạo để nghĩ ra chỗ nào có thể cắt giảm công việc. Vì vậy, nếu bắt buộc dùng agent thì năng suất có thể không tăng mà chỉ làm chi phí AI tăng. Mặt khác, khi dùng AI thì hai khoảng cách lại hiện ra rõ hơn: ai sẽ là người nói cho agent phải làm gì, và sẽ gánh chu kỳ QA/review như thế nào. Ở nhiều tổ chức, người phụ trách sản phẩm không đủ kỹ thuật để tạo ra đặc tả hay kế hoạch chi tiết mà LLM có thể sử dụng, còn các developer kiểu bánh răng máy móc thì không ở vị trí tạo đặc tả mà chỉ muốn triển khai. Nếu kỳ vọng developer dùng agent sẽ làm cả phần triển khai, thì có khi lại khiến số người nhàn rỗi chỉ ngồi chờ việc tăng lên. Tôi ủng hộ việc áp dụng LLM có chọn lọc để tăng tốc độ và chất lượng của developer hiện tại, nhưng xu hướng “hãy tái cấu trúc tổ chức” thì khá nguy hiểm, đặc biệt với công ty quy mô vừa và nhỏ
Có thể tôi thiên vị vì bản thân mình có product mindset mạnh hơn các developer khác, nhưng tôi nghĩ những người như vậy ở vị trí năng suất hơn khi dùng agent. Họ biết đủ kỹ thuật để triển khai bằng agent, và cũng hiểu sản phẩm đủ để biết nên triển khai cái gì. Tôi đoán các công ty khác cũng sẽ đi theo hướng đó
Tôi không rõ Uber còn đang phát triển cái gì. Họ có app và backend phân công xe, cả hai đều hoạt động khá ổn. Tôi không hiểu vì sao lại tiêu nhiều đến vậy
Họ đã từ bỏ xe tự lái, nên chắc không phải cái đó
Với token API, nhất là khi dùng ngữ cảnh 1M, nếu không cẩn thận xóa bớt ngữ cảnh cũ thì rất dễ đốt vài trăm đô chỉ trong một phiên
Trong khi đó, gói thuê bao lại cho phép mức sử dụng tương tự chỉ với vài trăm đô mỗi tháng. Có vẻ Anthropic либо đang tính giá cực đắt với người dùng API, hoặc đang trợ giá rất mạnh cho thuê bao, hoặc là cả hai
“Cursor năm ngoái ước tính gói Claude Code $200/tháng có thể dùng lượng compute trị giá tới $2.000, cho thấy Anthropic trợ giá đáng kể. Hiện tại mức trợ giá có vẻ còn mạnh tay hơn, với gói $200 có thể tiêu thụ khoảng $5.000 compute”
Kiểu khiến người ta nghiện token rẻ rồi thu tiền lại khi đã mở rộng quy mô. Uber chắc sẽ được giảm giá so với niêm yết, nhưng sẽ không thể gần mức thuê bao cho công ty 150 người trở xuống
Có thể đặt trần theo từng người dùng, nhưng nếu không có trần lũy tiến theo tháng thì sẽ rơi vào cảnh phải nói với đồng đội rằng “phần còn lại của tháng này sẽ không có AI”. Với cấu trúc hiện tại, tôi thấy đây là một thỏa thuận khá rủi ro