1 điểm bởi GN⁺ 2026-05-02 | 2 bình luận | Chia sẻ qua WhatsApp
  • Uber đã dùng hết toàn bộ ngân sách AI năm 2026 chỉ trong 4 tháng do mở rộng sử dụng Claude CodeCursor, và các thử nghiệm về năng suất nhanh chóng dẫn tới việc phải xem xét lại ngân sách
  • CTO của Uber cho biết chi phí API hàng tháng trên mỗi kỹ sư ở mức 500~2.000 USD, và 95% kỹ sư đang sử dụng công cụ AI mỗi tháng
  • 70% mã được commit tại Uber có nguồn gốc từ AI, cho thấy công cụ lập trình AI đã đi vào luồng công việc cốt lõi của kỹ thuật
  • Claude Code được triển khai cho đội ngũ kỹ thuật vào tháng 12/2025, sau khi năng lực xử lý tác vụ nhiều bước được xác nhận thì mức sử dụng đã tăng gấp đôi tới tháng 2/2026, và đến tháng 4 đã dùng hết toàn bộ ngân sách năm
  • Trong khi mức sử dụng Cursor tăng trưởng chững lại, Claude Code trở thành công cụ thống trị, khiến Uber phải tính toán lại chi phí công cụ lập trình AI trong tổng chi tiêu R&D hằng năm 3,4 tỷ USD

Mở rộng triển khai và xem xét lại ngân sách

  • Khi việc sử dụng Claude CodeCursor tăng nhanh, Uber nhận thấy các kỹ sư đánh giá rất cao giá trị của hai công cụ này, đến mức khó có thể ngừng sử dụng dù chi phí tăng mạnh
  • Tháng 12/2025, quyền truy cập Claude Code được triển khai cho đội ngũ kỹ thuật, và sau khi năng lực xử lý tác vụ nhiều bước được xác nhận, mức sử dụng đã tăng gấp đôi tới tháng 2/2026
  • Đến tháng 4/2026, chi phí đã tiêu hết toàn bộ ngân sách AI cả năm, khiến ban lãnh đạo phải đưa ra những quyết định ngoài dự kiến
  • CTO của Uber cho biết công ty đã phải đưa việc lập ngân sách AI “back to the drawing board”

Thay đổi mức sử dụng theo từng công cụ

  • Cursor là một công cụ lớn khác trong cuộc đua giành mức độ chấp nhận, nhưng tăng trưởng sử dụng đã chững lại
  • Claude Code đã trở thành công cụ chi phối trong quy trình làm việc kỹ thuật
  • Việc triển khai ban đầu như một thử nghiệm năng suất đã nhanh chóng mở rộng, khiến việc sử dụng công cụ AI trong công việc kỹ thuật nội bộ của công ty trở nên toàn diện

Ý nghĩa của áp lực chi phí

  • Việc Uber tiêu hết ngân sách ngoài dự kiến cho thấy công cụ AI được nhìn nhận có giá trị lớn thế nào đối với năng suất kỹ thuật
  • Vai trò của công cụ AI đã lớn đến mức việc hạn chế quyền truy cập còn bị xem là phản tác dụng
  • Khi ngày càng nhiều nhà phát triển áp dụng Claude Code, các công ty khác cũng có thể đang gặp tác động tương tự
  • Các công ty phần mềm sẽ chịu áp lực phải kiểm soát chi phí trong khi vẫn duy trì tốc độ phát triển
  • Nếu công cụ năng suất cho nhà phát triển có giá trị đến mức các kỹ sư tiêu hết toàn bộ ngân sách chỉ trong 4 tháng, thì kết luận là vấn đề không nằm ở bản thân công cụ, mà ở chỗ ngân sách đã được lập quá sớm để có thể dự đoán đường cong chấp nhận

2 bình luận

 
picopress 2026-05-03

Niềm vui đốt tiền

 
GN⁺ 2026-05-02
Ý kiến trên Hacker News
  • Nếu thỉnh thoảng xem chi tiêu của công ty mỗi tháng, sẽ thấy ngày càng nhiều người tiêu $1k chi phí token mỗi tháng, và thật sự khó hiểu là làm sao có thể tiêu tới mức đó
    Ngay cả khi dùng LLM hằng ngày, dùng cả model đắt nhất kèm chế độ suy nghĩ sâu, thì thường trần cũng chỉ khoảng $200~$400. Không phải tôi là kiểu Luddite phản đối việc sử dụng, mà là rất khó hiểu làm sao có thể đốt từng ấy tiền một cách có trách nhiệm. Tôi muốn thấy ai đó tiêu $5k~$10k/tháng và chỉ ra nó chuyển thành giá trị $50k~$100k như thế nào. Từ góc nhìn công ty, thay vì biện minh cho mức chi token $100k/năm, có lẽ tuyển một kỹ sư junior tiêu $100~$200/tháng nhưng vẫn tạo ra năng suất sẽ hợp lý hơn

    • Có vẻ chỉ có ba kiểu thường dẫn tới việc đốt tiền như vậy một cách “có trách nhiệm”. Người mới thường tái sử dụng cuộc trò chuyện dài, không tạo checkpoint nén ngữ cảnh hay tóm tắt, và cứ kéo dài một cuộc hội thoại khổng lồ duy nhất vì cảm thấy agent đã được “huấn luyện”
      Người mức trung bình thì biết những pattern kiểu “khởi chạy 5 sub-agent để phân tích lời giải từ các góc khác nhau rồi tóm tắt lại”, rồi rất dễ nghiện cách đó. Bản thân nó không hẳn là thói quen xấu, nhưng nếu không cẩn thận thì sẽ vượt tín dụng rất xa. Người thành thạo thì cho chạy song song liên tục 10 cây công việc, chuyển qua lại giữa các phản hồi của agent và multitask cực độ, khiến chi phí có thể tăng theo cấp số nhân
    • Trước hết là lý do quá quen thuộc: “công ty cho phép thì sẽ lãng phí”. Cả chuyện không thường xuyên xóa hay nén ngữ cảnh cũng nằm trong đó. Cửa sổ ngữ cảnh 1M của Opus giờ đã có, và chất lượng tới 200K cũng khá ổn, nên trước khi dọn ngữ cảnh thì mỗi truy vấn đều đốt rất nhiều token
      Codebase lớn hoặc vấn đề phức tạp cũng là yếu tố lớn. Nếu mới vào nhóm và còn nhiều chỗ chưa biết, khi nhận việc thì sẽ để Claude tìm code liên quan, hiểu luồng hiện có rồi mới thử sửa. Chuyên môn tích lũy được ít hơn, nhưng với Claude thì việc mất 5 ngày có thể xong trong 1 ngày, và nếu ai cũng làm vậy thì mình không thể tụt lại. Vì thế tôi chọn con đường ở giữa: xong trong 2~3 ngày thay vì 1 ngày, đồng thời vẫn cố xem code một chút. Đặc biệt là vì AI làm tốc độ thay đổi code tăng khủng khiếp, nên tôi còn làm cả công cụ để LLM giải thích sâu các pull request. Không phải để review mà để theo kịp công việc của nhóm. Tôi còn chưa suy nghĩ nhiều thêm về cách tận dụng LLM, và nếu đã quen codebase thì có lẽ còn dùng nhiều hơn nữa. Nút thắt vẫn là kiểm thử và review cho đúng cách. Với code nội bộ ít quan trọng hơn hay code cá nhân, có vẻ tôi gần như giao hết cho AI, và nếu dùng kỹ năng “superpowers” thì ngay cả chức năng cơ bản cũng đốt rất nhiều token. Thường bắt đầu ở 20~40K token và tới lúc xong thì lên 80~90K token, nghĩa là nhiều yêu cầu ngay trước khi hoàn tất gần như đang gửi 80K token. Lãng phí đấy, nhưng nếu người khác trả thì sẽ thành vậy
    • Tôi từng thấy Claude Code chọn cách giải cực kỳ kém hiệu quả về token cho một vấn đề. Tôi chia một bài toán machine learning/dự báo phức tạp cho nhiều agent, và mỗi agent dùng, chạy rồi đọc Jupyter notebook
      Ban đầu vẫn ổn, nhưng rồi một agent ghi hàng trăm nghìn dòng vào output của cell, tạo ra file ipynb 500MB, và Claude cố đọc nó nhiều lần, cuối cùng ngốn sạch giới hạn ngữ cảnh. Cách giải quyết là thiết kế cấu trúc công việc tốt hơn bằng script phân tích CLI và thư mục lưu kết quả nghiên cứu, nhưng người vận hành là tôi phải tự làm phần kế hoạch và thiết kế. Những người tiêu $10k token mỗi tháng khó mà không bị xem là đang lười biếng dùng Claude Code như một cái búa đắt tiền để xử lý mọi vấn đề. Ví dụ như ngày nào cũng để Claude đọc toàn bộ email, trong khi cách thông minh hơn là trước tiên loại bỏ nhiễu khỏi HTML phần thân email
    • Nó thực sự phụ thuộc vào repository đang làm. Nếu repo rất lớn, đặc biệt là phải tham chiếu framework tùy biến và tài liệu API có nhiều công cụ, thì sẽ cần cửa sổ ngữ cảnh lớn và token bị tiêu nhanh hơn nhiều
      Ngược lại, nếu repo nhỏ hoặc dùng framework phổ biến mà model đã học, thì vẫn làm được nhiều việc với cửa sổ ngữ cảnh nhỏ hơn và mức dùng token cũng thấp hơn nhiều
    • Không chỉ về chi phí, tôi còn khó hiểu ở phía quota nữa. Tôi dùng gói ChatGPT 200 euro nên chắc là quota cao nhất, nhưng kể cả khi dùng model đắt nhất, suy luận mạnh nhất, chế độ nhanh nhất, rồi gần như chỉ làm agent programming cả ngày, tôi vẫn không tiến sát giới hạn
      Từ khi bắt đầu dùng coding agent, lần duy nhất tôi tiến gần giới hạn là khi làm cross-platform development cùng lúc trên 3 máy tính trong cùng điều kiện, mà khi đó cũng chỉ gần chạm giới hạn tuần. Bình thường tôi xuống khoảng 20% quota là cùng, gần như không bao giờ thấp hơn. Tôi còn hay ném rất nhiều prompt và truy vấn cho vui, nhưng vẫn không hiểu phải làm gì mới tiêu hơn nữa
  • Tôi biết hiện tại mình đang trả lời cho AI, nhưng câu “xác định xem công ty có thể gánh mức năng suất này ở quy mô lớn hay không” nghe rất kỳ. Nếu thực sự có năng suất thì doanh thu sẽ tăng, và chuyện có gánh nổi hay không sẽ không còn là vấn đề

    • Đúng vậy. Năng suất theo định nghĩa là tạo ra một thứ gì đó, tốt nhất là thứ có giá trị. Điều cần xem là chi phí tăng thêm cho chatbot có tạo ra giá trị tương xứng hay không. Tôi nghi ngờ không biết Uber có thực sự trở nên hiệu quả và hiệu lực hơn đáng kể nhờ vượt ngân sách khổng lồ này, hay chỉ đơn giản đưa cho mọi người một cách hào nhoáng và đắt đỏ để làm lại cùng một việc
    • Doanh thu đã tăng. Nhìn kết quả kinh doanh gần đây của Meta thì ngay trong bối cảnh kinh tế này họ vẫn doanh thu +33%. Khả năng chi trả không phải vấn đề, và có lý do vì sao một công ty như Meta không bận tâm nếu kỹ sư tiêu $1k/ngày vào token. So với số tiền mỗi nhân viên tạo ra thì con số đó không lớn lắm
    • Không phải mọi thay đổi mà developer tạo ra đều làm tăng doanh thu, và kể cả các thay đổi làm tăng doanh thu thì thường cũng có độ trễ thời gian
    • Nếu thiện chí nhất với lập luận phía kia, thì một phản ví dụ có thể là đối thủ cũng dùng cùng công cụ và đạt cùng mức tăng năng suất
    • Nếu dùng đúng cách thì nó thực sự cực kỳ năng suất. Tôi còn lo năm sau các model AI kiểu này sẽ thông minh tới mức nào
  • Việc “95% kỹ sư của Uber giờ dùng công cụ AI mỗi tháng, và 70% code đã commit đến từ AI” là điều dễ đoán. Nếu việc dùng công cụ AI được đưa vào đánh giá hiệu suất, thì sẽ thành ra như vậy

    • Thật đáng ngạc nhiên khi người ta đánh giá thấp mức độ dễ bị game hóa của KPI mỗi khi người không phải developer áp KPI lên developer. AI hay đếm pull request/số dòng code cũng thế thôi
    • Ngay khoảnh khắc KPI không còn là “đã phát hành cái gì” mà là “đã dùng AI bao nhiêu”, thì bùng nổ ngân sách là hệ quả tự nhiên. Mọi người sẽ cố đạt con số đó
    • Nếu manager và phó chủ tịch đều nói “không dùng AI thì không làm việc ở đây được”, thì đương nhiên mọi người sẽ dùng
    • Tôi không hiểu lắm lời chỉ trích này. Chẳng phải vốn dĩ người ta được trả tiền để làm điều công ty muốn và điều công ty nghĩ là có năng suất sao? Và tôi cũng tự hỏi liệu bạn có đang cho rằng toàn bộ code do AI tạo ra đều vô dụng không
  • Tôi không hiểu đoạn “xác định xem công ty có thể gánh mức năng suất này ở quy mô lớn hay không”. Họ đã tiêu ngân sách, đã có 4 tháng dữ liệu, nên câu hỏi cốt lõi là có kết quả gì để cho thấy
    Tôi không ghét AI cũng không phải Luddite, tôi đang dùng gói Max $200. Nhưng có phải ý họ là Uber mở công cụ này ra, khuyến khích mọi người dùng, nó hoạt động tốt, rồi giờ họ lại bối rối trước điều xảy ra tiếp theo? Việc kết luận AI không đủ năng suất so với chi phí là chuyện khác. Tôi thậm chí còn tự hỏi có phải họ đã hết thứ để xây tiếp rồi không

    • Gói Max cá nhân và Teams thật sự là món hời đáng kinh ngạc nếu so với chi phí API tính theo mức sử dụng của Enterprise. Chắc họ cần các tính năng Enterprise. Nếu không thì chỉ cần cho người dùng thanh toán gói Max $200 như chi phí công tác là được. Doanh nghiệp rốt cuộc vẫn hành xử như doanh nghiệp
    • Có thể là hiện giờ chưa thấy gì cả. Những thay đổi lớn lộ ra với người dùng bên ngoài thường mất lâu hơn nhiều mới được triển khai rộng. Nội bộ thì có lẽ nhiều tính năng đã tiến nhanh hơn
      Ngay ở Salesforce tôi cũng thấy những thay đổi khiến công việc từng mất vài tuần giờ có vẻ chỉ còn vài ngày. Chưa chuyển thành tiền ngay, nhưng nó làm tăng tiềm năng kiếm tiền
    • Cũng đáng hỏi Uber còn gì để xây tiếp. Họ đã có nền tảng gọi xe và nó hoạt động. Họ cũng đã mở rộng sang giao đồ ăn, tạp hóa, và “bất cứ thứ gì nhét được vào xe”. Tôi không biết trong phạm vi thứ gì đó có người lái xe thì còn lại điều gì nữa
    • Họ có công cụ kiểm soát chi tiêu khá tốt, nên tôi không hiểu sao lại không đặt trần. Họ hoàn toàn có thể yêu cầu kỹ sư biện minh cho khoản chi đó
      Phải hỏi vì sao cần dùng nhiều token đến vậy, và đổi lại thu được gì. Nếu đây là AWS thì mọi người đã chỉ tay nói “có xem chi tiêu hằng tháng không vậy” rồi
    • Có vẻ thảo luận về AI giờ đã đi tới mức mà muốn phê bình điều gì đó mà không bị xem là dị giáo thì trước tiên phải nói “tôi cũng là người trong giáo phái này chứ không phải kẻ vô thần đâu”
  • Mỗi lần có bài như thế này lại thú vị ở chỗ đột nhiên nhiều người nghĩ việc đo năng suất phát triển là đơn giản. Đúng là năng suất dẫn tới doanh thu hoặc cắt giảm chi phí, và doanh thu thì đo được, nhưng không hề đơn giản như vậy
    Ta chi tiền hôm nay để làm tính năng tạo ra doanh thu tương lai, nên dù chi phí hôm nay tăng vọt thì vẫn chưa có doanh thu nào để đo. Việc dùng AI hoàn thành tính năng hôm nay không có nghĩa là có thể lập tức kết luận AI có năng suất/không có năng suất; còn phải ước lượng nếu không có AI thì đã làm được bao nhiêu và doanh thu khi đó sẽ là gì. Kinh doanh thường là một cuộc đua Nữ hoàng Đỏ, nên nếu không cải thiện thì có thể bị đối thủ vượt qua và mất doanh thu. Việc dùng AI rất có thể trộn lẫn giữa các công việc quan trọng và kiểu “giờ dễ rồi nên cứ ném thêm đủ thứ vào”, và nếu muốn đo cải thiện năng suất thật sự thì phải biết giữ cái trước và tránh cái sau. Không phải ủng hộ hay phản đối AI, mà là đừng lười biếng nói rằng “nếu có năng suất thì ắt đo được”

    • Tôi nghĩ đồng thuận chính lại là đo năng suất developer cực kỳ khó. Mỗi lần cố đo, thước đo đó lại trở thành mục tiêu, nên kể cả ban đầu là thước đo vững thì cũng mất nghĩa
      Tôi không biết ý nghĩ rằng năng suất của con người không phải công nhân nhà máy là thứ dễ đo đến từ đâu nữa
    • Tính năng mới hay phần mềm tốt hơn có lẽ sẽ không làm doanh thu/lợi nhuận của Uber tăng mạnh đến thế
    • Lựa chọn không chỉ là năng suất bằng 0 hay có chút năng suất; còn có thể là năng suất âm. Theo trải nghiệm dùng Claude Code của tôi, việc đổ từng ấy token vào một tổ chức không chỉ là thiếu năng suất mà còn có thể chủ động gây hại, nên tôi nghi ngờ điều đó
    • Thay đổi năng suất nhỏ thì khó đo, nhưng một cú nhảy lớn hẳn phải nhìn ra rõ. Nếu AI có tác động tới năng suất thì có lẽ cũng chỉ ở mức nhỏ
    • Nếu là năng suất gấp 10 lần thì chắc chắn đã đo được, dù chỉ gián tiếp, thậm chí khó mà tránh việc đo được. Những tuyên bố ban đầu rõ ràng là sai, và câu hỏi nghiên cứu thực sự là nó có lớn hơn 1.0x hay không
      Tôi đồng ý rằng điều đó cực kỳ khó đo. Nhưng với mức chi phí này thì nhất định phải trả lời được, và hệ số tăng năng suất cũng phải đủ để biện minh cho chi phí
  • Theo [1], tổ chức kỹ thuật của Uber có khoảng 5.500 người. Lấy trung vị phạm vi chi tiêu là $1.250 thì chi phí AI cho khối kỹ thuật vào khoảng $6.8M, với phạm vi $2.75M~$12M. Bài viết nêu chi tiêu R&D là $3.4B
    Chi phí AI không phải phần lớn trong chi tiêu R&D. Trong 4 tháng chỉ khoảng 0,3%, quy đổi năm là khoảng 1%. Nếu không lên kế hoạch trước thì cũng không phải tiền lẻ trong ngân sách, nhưng xét theo bối cảnh thì không quá lớn. Câu hỏi thật sự là họ nhận được gì từ số tiền đó. Bài viết nói 70% code commit là do AI tạo ra, vậy có lẽ đã qua review và test. Điều quan trọng là số lượng tính năng có tăng tốc không, vấn đề chất lượng có giảm không, hay có lợi ích nào khác không. Đáng tiếc là bài không nói tới kết quả nào ngoài việc chi tiêu tăng lên. 4 tháng có lẽ còn quá sớm để đánh giá lợi ích. Mặt khác, trong thế giới agile thì có thể khác. [1] https://www.unifygtm.com/insights-headcount/uber

    • Nguồn thực tế https://www.theinformation.com/newsletters/applied-ai/uber-c... nói rằng “khoảng 11% cập nhật code production thực tế trong các hệ thống backend đang được viết chủ yếu bởi AI agent tạo bằng Claude Code, tăng từ mức chỉ là một phần nhỏ dưới 1% cách đây 3 tháng”
      Ngoài ra còn nói rằng “công ty không tiết lộ con số chính xác cho ngân sách phần mềm hay mức chi cho công cụ coding AI”
    • Mọi thứ trong bài này trông hoàn toàn như bịa đặt. Các con số không khớp, không phù hợp với thông tin được đưa tin, và đơn giản là hư cấu
  • Với người đang bootstrap như tôi, đôi khi rất ghen tị với kỹ sư ở công ty lớn, nhưng cũng lo rằng incentive đã bị hỏng
    Nếu tôi là kỹ sư Uber, chẳng có lý do gì để không viết gpt 5.5 pro @ very high thinking + fast mode vào prompt ngay cả cho thay đổi nhỏ. Không có động lực nào để không dùng model mạnh nhất và vì thế đắt nhất. Tôi từng thử một prompt như vậy cho bài test chuyển ảnh → HTML, và chỉ một prompt đã tốn $40. Nếu tự bỏ tiền túi thì gần như chắc chắn sẽ không bao giờ dùng cấu hình đó, nhưng ở công ty lớn, khi người khác trả tiền, thì sẽ chạy thường xuyên. Kết quả đầu ra chắc chắn tốt hơn. Kỹ sư được đánh giá theo những gì họ bàn giao, chứ không phải chi phí của quá trình. Có cách làm rẻ hơn, nhưng kỹ sư không có động lực để làm vậy

    • Kỹ sư phần mềm vốn đã đắt. Mức lương trung vị là $133k, chưa tính bảo hiểm y tế, thuế lương, v.v. Nếu $40 tín dụng LLM giúp tiết kiệm 1 giờ phát triển, thì tính ra vẫn rẻ hơn $26.50 so với việc không dùng
      Tôi vẫn chưa chắc ngoài thực tế có đúng như vậy không, nhưng về mặt lý thuyết là thế. Việc cố giảm chi phí LLM cũng là con dao hai lưỡi. Tiền LLM mà developer tiết kiệm được phải lớn hơn chi phí đang trả cho người đó. Nếu bỏ ra cả ngày để giảm $1 cho mỗi lần gọi thì gần như phải mất 2 năm mới thu hồi được chi phí lương. Chưa kể LLM thay đổi quá nhanh, khó mà tin rằng giải pháp đó sẽ không lỗi thời trong 2 năm. Sau 2 năm liệu còn gọi công cụ đó nữa không, liệu chế độ reasoning còn tồn tại không, ngay cả nhà cung cấp tiên phong cũng chưa chắc biết
    • Công ty có thể muốn trước tiên xem họ có thể mở rộng tốc độ thực hiện công việc tới đâu, rồi sau đó mới cắt giảm để tối ưu hiệu quả
    • Ảnh → HTML là một công việc khá phức tạp. Thực chất đó là việc của frontend developer, và $40 còn chưa mua nổi 1 giờ của họ
  • Càng ngày càng phổ biến chuyện lãnh đạo nghĩ rằng có thể thay kỹ sư phần mềm bằng agent, nên tôi tự hỏi liệu họ có đang ra quyết định dựa trên nhận thức phi thực tế về kỹ sư phần mềm trung bình hay không
    Một mặt thì đúng là bỏ vào gì sẽ ra cái đó. CTO giỏi có thể cực kỳ hào hứng với những gì agent làm được, rồi lầm tưởng rằng mọi kỹ sư cũng làm được điều tương tự. Trong thực tế, kỹ sư trung bình của tổ chức có khi còn không đủ sáng tạo để nghĩ ra chỗ nào có thể cắt giảm công việc. Vì vậy, nếu bắt buộc dùng agent thì năng suất có thể không tăng mà chỉ làm chi phí AI tăng. Mặt khác, khi dùng AI thì hai khoảng cách lại hiện ra rõ hơn: ai sẽ là người nói cho agent phải làm gì, và sẽ gánh chu kỳ QA/review như thế nào. Ở nhiều tổ chức, người phụ trách sản phẩm không đủ kỹ thuật để tạo ra đặc tả hay kế hoạch chi tiết mà LLM có thể sử dụng, còn các developer kiểu bánh răng máy móc thì không ở vị trí tạo đặc tả mà chỉ muốn triển khai. Nếu kỳ vọng developer dùng agent sẽ làm cả phần triển khai, thì có khi lại khiến số người nhàn rỗi chỉ ngồi chờ việc tăng lên. Tôi ủng hộ việc áp dụng LLM có chọn lọc để tăng tốc độ và chất lượng của developer hiện tại, nhưng xu hướng “hãy tái cấu trúc tổ chức” thì khá nguy hiểm, đặc biệt với công ty quy mô vừa và nhỏ

    • Hơn thế nữa, AI là bộ khuếch đại sức mạnh, và nó không quan tâm sức mạnh đó là dương hay âm. Một người có nguyên tắc kỹ nghệ phần mềm tệ mà dùng AI có thể tạo ra một đống hỗn loạn hoàn chỉnh chỉ trong chớp mắt
    • Liên quan tới điểm số 2, công ty chúng tôi đang thúc rất mạnh để developer có product mindset và bớt làm những bánh răng đơn thuần
      Có thể tôi thiên vị vì bản thân mình có product mindset mạnh hơn các developer khác, nhưng tôi nghĩ những người như vậy ở vị trí năng suất hơn khi dùng agent. Họ biết đủ kỹ thuật để triển khai bằng agent, và cũng hiểu sản phẩm đủ để biết nên triển khai cái gì. Tôi đoán các công ty khác cũng sẽ đi theo hướng đó
    • Cuối cùng thì đây cũng chỉ là đang nói tới cắt giảm nhân sự quy mô lớn
  • Tôi không rõ Uber còn đang phát triển cái gì. Họ có app và backend phân công xe, cả hai đều hoạt động khá ổn. Tôi không hiểu vì sao lại tiêu nhiều đến vậy
    Họ đã từ bỏ xe tự lái, nên chắc không phải cái đó

    • Đây thực sự là câu hỏi bị đánh giá thấp. Nó cho thấy rất rõ các công ty công nghệ hiện đại đang làm gì với từng ấy tài nguyên. Elon đã cắt phần lớn đội Twitter, và sau những va vấp khủng khiếp lúc đầu, chẳng phải cuối cùng nó vẫn chạy gần như ổn với ít hơn 80% nhân sự sao
    • Giá mà “cả hai đều hoạt động khá ổn” là đúng, nhưng không phải vậy. Trải nghiệm người dùng tệ đến mức do tối ưu thuật toán ghép cặp mà giờ tôi thường xuyên dùng Lyft
    • Kiểu bình luận “X chỉ là Y thôi, sao lại phức tạp thế” là thứ nhàm chán nhất trên HN. Viết vậy dưới mọi bài về tập đoàn lớn mà mình ghét thì vừa lười vừa chán đọc
  • Với token API, nhất là khi dùng ngữ cảnh 1M, nếu không cẩn thận xóa bớt ngữ cảnh cũ thì rất dễ đốt vài trăm đô chỉ trong một phiên
    Trong khi đó, gói thuê bao lại cho phép mức sử dụng tương tự chỉ với vài trăm đô mỗi tháng. Có vẻ Anthropic либо đang tính giá cực đắt với người dùng API, hoặc đang trợ giá rất mạnh cho thuê bao, hoặc là cả hai

    • https://www.forbes.com/sites/annatong/2026/03/05/cursor-goes...
      “Cursor năm ngoái ước tính gói Claude Code $200/tháng có thể dùng lượng compute trị giá tới $2.000, cho thấy Anthropic trợ giá đáng kể. Hiện tại mức trợ giá có vẻ còn mạnh tay hơn, với gói $200 có thể tiêu thụ khoảng $5.000 compute”
    • Anthropic có một mô hình kinh doanh khá “thú vị”. Khi công ty có 150 nhân viên trở xuống thì trả giá thuê bao, nhưng vừa sang 151 người thì toàn bộ nhân viên qua một đêm phải trả giá API và tổng hóa đơn lập tức tăng lên nhiều lần
      Kiểu khiến người ta nghiện token rẻ rồi thu tiền lại khi đã mở rộng quy mô. Uber chắc sẽ được giảm giá so với niêm yết, nhưng sẽ không thể gần mức thuê bao cho công ty 150 người trở xuống
    • Tôi đã xem xét giá nhưng không thể biện minh việc nhảy từ Team lên Enterprise. Một khi lên Enterprise thì thuê bao tháng biến mất hoàn toàn và bạn mất khả năng kiểm soát chi phí
      Có thể đặt trần theo từng người dùng, nhưng nếu không có trần lũy tiến theo tháng thì sẽ rơi vào cảnh phải nói với đồng đội rằng “phần còn lại của tháng này sẽ không có AI”. Với cấu trúc hiện tại, tôi thấy đây là một thỏa thuận khá rủi ro