AI đang chậm lại

(wheresyoured.at)

22 điểm bởi GN⁺ 2026-06-09 | 11 bình luận | Chia sẻ qua WhatsApp

Hạ tầng AI tạo sinh cần tạo ra hơn 2 nghìn tỷ USD doanh thu compute AI mỗi năm vào năm 2030 để biện minh cho đầu tư trung tâm dữ liệu và các cam kết compute
190GW trung tâm dữ liệu theo kế hoạch, áp dụng mức chi phí 80–100 tỷ USD cho mỗi GW, tương đương quy mô 9,5–15 nghìn tỷ USD, và để hiện thực hóa sẽ cần phát hành nợ trung tâm dữ liệu ở mức 500 tỷ–1 nghìn tỷ USD mỗi năm
OpenAI được dự báo sẽ đốt ít nhất 852 tỷ USD vào cuối năm 2030, còn Anthropic phải đạt mục tiêu doanh thu 174 tỷ USD/năm vào năm 2029 mới có thể gánh được các cam kết compute
Sau khi chuyển sang tính phí theo token, các doanh nghiệp gặp khó trong việc quan sát chi tiêu AI và đo lường ROI; Uber, T-Mobile và Brex đặt giới hạn chi tiêu token cho từng nhân viên
Hiện 89% doanh thu của các startup AI tập trung vào OpenAI và Anthropic, nên để biện minh cho quy mô compute đang được xây dựng sẽ còn cần thêm ít nhất 250 tỷ USD nhu cầu compute AI mỗi năm

AI không có chỗ để chậm lại — cần hơn 3 nghìn tỷ USD doanh thu vào cuối năm 2030

Nếu áp nguyên dữ liệu của Sightline Climate, công suất trung tâm dữ liệu theo kế hoạch là 190GW, và nếu áp phát biểu của Jensen Huang về 80–100 tỷ USD mỗi GW thì chi phí được tính ra là 9,5–15 nghìn tỷ USD
Cách Bloomberg mô tả việc xây dựng trung tâm dữ liệu trị giá 3 nghìn tỷ USD không khớp với phép tính trên, và số vốn cần thiết sẽ phải được huy động từ đâu đó
Bài viết của Financial Times cho rằng các ngân hàng có thể không gánh nổi nợ trung tâm dữ liệu; mức phát hành hiện khoảng 250 tỷ USD mỗi năm sẽ phải tăng lên 500 tỷ–1 nghìn tỷ USD/năm để triển khai thực tế
NVIDIA dự kiến đạt doanh thu 1 nghìn tỷ USD vào cuối năm 2027, và 54% doanh thu đến từ ba khách hàng, nên doanh thu tương lai phụ thuộc vào một số ít khách hàng và khả năng huy động nợ của các đối tác giao dịch
Việc Google bán 85 tỷ USD cổ phần và kế hoạch bán cổ phần trị giá hàng chục tỷ USD của Meta có liên hệ với bối cảnh các hyperscaler ngày càng khó huy động nợ

Cam kết compute của OpenAI và Anthropic

Các cam kết compute và chip của Anthropic đã lên tới 330 tỷ USD giữa Google, Amazon và Microsoft, thêm 30 tỷ USD với CoreWeave và 15 tỷ USD với SpaceX
Anthropic phải đạt mục tiêu doanh thu 174 tỷ USD/năm vào năm 2029 mới có thể gánh được chi phí compute này
Anthropic đã huy động 95 tỷ USD trong các vòng tháng 2, tháng 4 và tháng 5, nhưng chỉ riêng số tiền này cùng dòng tiền hiện có vẫn không đủ để trang trải chi phí, nên sang năm sẽ cần huy động thêm ít nhất 200 tỷ USD
OpenAI được dự báo sẽ đốt ít nhất 852 tỷ USD vào cuối năm 2030, đồng thời đã ký các cam kết compute trị giá hơn 770 tỷ USD với Microsoft, Amazon, CoreWeave, Cerebras và Oracle
Khoản huy động 122 tỷ USD của OpenAI trong tháng 3 không đủ để bù chi phí, và công ty sẽ cần thêm ít nhất 250 tỷ USD vốn nữa trước cuối năm

Tính toán doanh thu trung tâm dữ liệu và rủi ro với Oracle

AI tạo sinh và compute AI phải tạo ra hơn 2 nghìn tỷ USD doanh thu mỗi năm vào năm 2030; nếu không, chi tiêu vốn cho trung tâm dữ liệu và các khoản thanh toán cam kết của Anthropic và OpenAI sẽ không thể đứng vững
Áp dụng PUE 1,35 cho 190GW trung tâm dữ liệu thì tải IT cốt lõi vào khoảng 140GW, và với mức tính phí 12,5 triệu USD mỗi MW sẽ cần doanh thu 1,75 nghìn tỷ USD mỗi năm
Ngay cả khi chỉ xây được một nửa công suất kế hoạch, trung tâm dữ liệu vẫn cần doanh thu 875 tỷ USD mỗi năm để không rơi vào thiếu vốn
OpenAI và Anthropic lần lượt dự báo doanh thu 184 tỷ USD và 174 tỷ USD vào năm 2029, cộng lại chỉ đạt 358 tỷ USD
Nếu OpenAI không thể hoặc không muốn gánh compute của Oracle, Oracle có thể cạn tiền; Oracle đang chi 340–700 tỷ USD cho các trung tâm dữ liệu 7,1GW dành cho OpenAI

Chi tiêu AI hiện tại là chưa đủ

Kế hoạch chi 300 triệu USD cho Anthropic của Salesforce trong năm 2026 còn cách rất xa quy mô cần thiết
Tổng nhu cầu compute hiện tại của toàn bộ các công ty AI trên thế giới còn chưa đạt 100 tỷ USD, trong khi đến năm 2030 sẽ cần gấp 10 lần con số đó
Theo bài viết của The Information, mức độ tập trung doanh thu startup AI vào OpenAI và Anthropic đạt 89% như {p:89}
Mức run rate AI 37 tỷ USD mỗi năm của Microsoft chủ yếu cấu thành từ compute cho OpenAI, và CEO Microsoft AI Mustafa Suleyman nói rằng các mô hình của Anthropic quá đắt và muốn giảm mức sử dụng của Microsoft về 0
Ngay cả khi Anthropic và OpenAI tiêu thụ 500 tỷ USD compute mỗi năm, vẫn sẽ cần thêm hơn 250 tỷ USD doanh thu compute mỗi năm để biện minh cho việc xây dựng trung tâm dữ liệu

Tính phí token và sự bất định của ROI

Không thể đo được chi phí và lợi tức đầu tư của từng tác vụ AI cụ thể, nhưng các doanh nghiệp vẫn mở rộng áp dụng AI mà không đo đầu ra
Anthropic và OpenAI đã chuyển khách hàng sang tính phí theo token trong quý 1 năm 2026, và chỉ sau 2–3 tháng, sự bất định về chi phí AI và ROI đã trở thành chủ đề lặp đi lặp lại trên các phương tiện truyền thông kinh doanh lớn
Trong khảo sát của KPMG được Wall Street Journal trích dẫn, khả năng quan sát chi phí AI được chia thành tổng thể 26%, một phần 50%, và không có hoặc chỉ biết sau khi bị tính phí 22% như {b:26,50,22}
Có một công ty không đặt kiểm soát chi tiêu nên đã tiêu 500 triệu USD cho mô hình Anthropic chỉ trong một tháng, còn Uber thì đốt sạch ngân sách token cả năm chỉ trong một quý
Uber giới hạn 1.500 USD mỗi người dùng mỗi tháng, T-Mobile tạm thời là 2.000 USD mỗi người dùng mỗi tháng, còn Brex giới hạn 500 USD mỗi tuần cho kỹ sư và 5 USD mỗi tuần cho nhân viên không phải kỹ sư

Agent lập trình, vòng lặp và vấn đề đầu ra

Boris Cherny, người phụ trách Claude Code, và Peter Steinberger, nhà truyền bá của OpenClaw thuộc sở hữu OpenAI, yêu cầu người dùng tự thiết kế vòng lặp cho agent
Vòng lặp là cách để LLM tiếp tục hành động trong khoảng thời gian mong muốn mà người dùng không cần thêm prompt mới
Với các gói thuê bao trợ giá, chi phí lỗi của mô hình bị che khuất sau mức 20 USD, 100 USD hay 200 USD mỗi tháng; nhưng khi người dùng phải trả chi phí thực, cái giá của thất bại hiện ra nguyên vẹn
Điều này liên hệ với các nghiên cứu cho thấy LLM càng suy luận nhiều thì ảo giác càng tăng, trong khi cách tiếp cận agent lại để LLM tự lập kế hoạch
Notion đã chặn quyền truy cập Anthropic trong vài giờ sau sự cố dịch vụ của Anthropic, và phần lớn ứng dụng do công cụ AI coding tạo ra chỉ là slopware vô dụng và không an toàn

Ẩn dụ con nhện kim loại khổng lồ

Con nhện kim loại khổng lồ là một thiết bị trị giá 1 triệu USD, và mỗi lần sử dụng tốn 40.000 USD tiền nhiên liệu, nhưng nó có thể nhặt đồ hoặc làm bữa tối
Cùng một thiết bị đó có thể lấy chính xác một lon Diet Coke từ tủ lạnh hoặc chọc thủng tủ lạnh, và người dùng vẫn phải trả 40.000 USD bất kể kết quả ra sao
Nhờ trợ giá, người dùng phổ thông chỉ thỉnh thoảng trải nghiệm các hành vi phá hoại, nhưng doanh nghiệp phải gánh chi phí thực, còn nhà sản xuất thì mất hàng tỷ USD mỗi năm cho huấn luyện và bảo trì
Tính năng mới mở rộng phạm vi những việc mà người ta tuyên bố là có thể làm, nhưng mỗi lần bổ sung tính năng lại tốn hàng trăm triệu USD, và đôi khi không rõ liệu có thực sự học thêm điều gì mới hay không
Dù có nghiên cứu cho thấy năng lực hoàn thành 50% các tác vụ ở một độ dài nhất định đã tăng lên, con nhện trong phép ẩn dụ vẫn không thể biết khi nào nó sẽ làm sai, và cũng có thể thực hiện cả những hành động người dùng không yêu cầu

Kinh tế tuần hoàn AI và nhu cầu sản phẩm thực tế

AI tạo sinh có chi phí vận hành dịch vụ cao, các phòng thí nghiệm AI lớn không có con đường đi tới lợi nhuận, và chi phí cũng như ROI của các tác vụ dựa trên LLM vẫn không thể đo lường
Các dự án AI có thể làm tăng chi phí vận hành từ 10% đến 100%, và trái với lời hứa rằng chi phí sẽ giảm cho cả nhà vận hành dịch vụ AI lẫn khách hàng, chi phí thực tế vẫn tăng lên
Chi phí cao duy trì một cấu trúc trong đó các phòng thí nghiệm AI chuyển tiền cho các đối tác compute hyperscaler, rồi dòng tiền đó lại quay trở lại các phòng thí nghiệm và nhu cầu GPU NVIDIA
Nếu OpenAI hoặc Anthropic theo đuổi lợi nhuận hay tính bền vững, nhu cầu compute AI sẽ giảm, đồng thời nhu cầu đối với Azure, Google Cloud, Amazon Web Services, CoreWeave, Oracle Cloud Infrastructure và GPU NVIDIA cũng giảm theo
Để khớp với các cam kết và dự báo hiện tại, toàn bộ stack AI phải tăng quy mô gấp 10 lần, đồng thời cần thêm 250 tỷ USD nhu cầu compute AI mỗi năm và ít nhất hai công ty có quy mô ngang OpenAI hoặc Anthropic

11 bình luận

geek12356 2026-06-09

Có ai cảm thấy khi nâng cấp từ opus 4.6 lên 4.7, 4.8 thì hiệu năng theo cảm nhận lại kém đi không?

savvykang 2026-06-09

Dạo này tôi cảm nhận rõ là bản dịch tiếng Hàn trở nên kỳ quặc hơn, thậm chí còn dịch pain point thành “giá trị đau đớn” nữa.

tazuya 29 ngày trước

Ôi... có vẻ công ty đang gặp vấn đề rồi. Bản dịch tệ đến mức ngay cả Google Dịch cũng không làm kiểu này.

comnwav 2026-06-09

Có vẻ như nó đã trở thành rác phẩm...

geek12356 2026-06-09

Đúng vậy chứ?? Tự nhiên lại không làm được những việc trước đó vẫn làm tốt.........

comnwav 2026-06-09

Trước đây trả lời câu hỏi thì ngắn gọn và giải quyết công việc dễ dàng, nhưng giờ lại giải thích càng dài dòng càng tốt và tiếp cận mọi thứ một cách khó khăn hơn.

onestone 2026-06-09

Hoàn toàn đồng ý. Cái kiểu “tự hiểu ý rồi làm gọn ghẽ” đã biến mất.

mammal 2026-06-09

API chưa bao giờ không tính phí theo token cả...

shm3215 2026-06-09

Có vẻ như điều bài viết đang nói tới là việc Anthropic gần đây đã chuyển gói Enterprise từ mô hình đăng ký sang tính phí theo mức sử dụng. So với gói đăng ký, mô hình tính theo mức sử dụng có chi phí trên mỗi token đắt hơn tối đa khoảng ~10 lần, và Anthropic đang dùng chiến lược bán gói đăng ký cá nhân như một sản phẩm mồi để khóa chân các nhà phát triển, rồi khiến doanh nghiệp phải trả mức phí Enterprise tính theo mức sử dụng rất đắt.
Từ góc nhìn của các doanh nghiệp, điều đó có nghĩa là chi phí tính phí dựa trên token quá cao, nên ROI trở nên không chắc chắn.