6 điểm bởi GN⁺ 4 giờ trước | 2 bình luận | Chia sẻ qua WhatsApp
Quảng cáo
  • Hạ tầng AI tạo sinh cần tạo ra hơn 2 nghìn tỷ USD doanh thu compute AI mỗi năm vào năm 2030 để biện minh cho đầu tư trung tâm dữ liệu và các cam kết compute
  • 190GW trung tâm dữ liệu theo kế hoạch, áp dụng mức chi phí 80–100 tỷ USD cho mỗi GW, tương đương quy mô 9,5–15 nghìn tỷ USD, và để hiện thực hóa sẽ cần phát hành nợ trung tâm dữ liệu ở mức 500 tỷ–1 nghìn tỷ USD mỗi năm
  • OpenAI được dự báo sẽ đốt ít nhất 852 tỷ USD vào cuối năm 2030, còn Anthropic phải đạt mục tiêu doanh thu 174 tỷ USD/năm vào năm 2029 mới có thể gánh được các cam kết compute
  • Sau khi chuyển sang tính phí theo token, các doanh nghiệp gặp khó trong việc quan sát chi tiêu AI và đo lường ROI; Uber, T-Mobile và Brex đặt giới hạn chi tiêu token cho từng nhân viên
  • Hiện 89% doanh thu của các startup AI tập trung vào OpenAI và Anthropic, nên để biện minh cho quy mô compute đang được xây dựng sẽ còn cần thêm ít nhất 250 tỷ USD nhu cầu compute AI mỗi năm

AI không có chỗ để chậm lại — cần hơn 3 nghìn tỷ USD doanh thu vào cuối năm 2030

  • Nếu áp nguyên dữ liệu của Sightline Climate, công suất trung tâm dữ liệu theo kế hoạch là 190GW, và nếu áp phát biểu của Jensen Huang về 80–100 tỷ USD mỗi GW thì chi phí được tính ra là 9,5–15 nghìn tỷ USD
  • Cách Bloomberg mô tả việc xây dựng trung tâm dữ liệu trị giá 3 nghìn tỷ USD không khớp với phép tính trên, và số vốn cần thiết sẽ phải được huy động từ đâu đó
  • Bài viết của Financial Times cho rằng các ngân hàng có thể không gánh nổi nợ trung tâm dữ liệu; mức phát hành hiện khoảng 250 tỷ USD mỗi năm sẽ phải tăng lên 500 tỷ–1 nghìn tỷ USD/năm để triển khai thực tế
  • NVIDIA dự kiến đạt doanh thu 1 nghìn tỷ USD vào cuối năm 2027, và 54% doanh thu đến từ ba khách hàng, nên doanh thu tương lai phụ thuộc vào một số ít khách hàng và khả năng huy động nợ của các đối tác giao dịch
  • Việc Google bán 85 tỷ USD cổ phần và kế hoạch bán cổ phần trị giá hàng chục tỷ USD của Meta có liên hệ với bối cảnh các hyperscaler ngày càng khó huy động nợ

Cam kết compute của OpenAI và Anthropic

  • Các cam kết compute và chip của Anthropic đã lên tới 330 tỷ USD giữa Google, Amazon và Microsoft, thêm 30 tỷ USD với CoreWeave và 15 tỷ USD với SpaceX
  • Anthropic phải đạt mục tiêu doanh thu 174 tỷ USD/năm vào năm 2029 mới có thể gánh được chi phí compute này
  • Anthropic đã huy động 95 tỷ USD trong các vòng tháng 2, tháng 4 và tháng 5, nhưng chỉ riêng số tiền này cùng dòng tiền hiện có vẫn không đủ để trang trải chi phí, nên sang năm sẽ cần huy động thêm ít nhất 200 tỷ USD
  • OpenAI được dự báo sẽ đốt ít nhất 852 tỷ USD vào cuối năm 2030, đồng thời đã ký các cam kết compute trị giá hơn 770 tỷ USD với Microsoft, Amazon, CoreWeave, Cerebras và Oracle
  • Khoản huy động 122 tỷ USD của OpenAI trong tháng 3 không đủ để bù chi phí, và công ty sẽ cần thêm ít nhất 250 tỷ USD vốn nữa trước cuối năm

Tính toán doanh thu trung tâm dữ liệu và rủi ro với Oracle

  • AI tạo sinh và compute AI phải tạo ra hơn 2 nghìn tỷ USD doanh thu mỗi năm vào năm 2030; nếu không, chi tiêu vốn cho trung tâm dữ liệu và các khoản thanh toán cam kết của Anthropic và OpenAI sẽ không thể đứng vững
  • Áp dụng PUE 1,35 cho 190GW trung tâm dữ liệu thì tải IT cốt lõi vào khoảng 140GW, và với mức tính phí 12,5 triệu USD mỗi MW sẽ cần doanh thu 1,75 nghìn tỷ USD mỗi năm
  • Ngay cả khi chỉ xây được một nửa công suất kế hoạch, trung tâm dữ liệu vẫn cần doanh thu 875 tỷ USD mỗi năm để không rơi vào thiếu vốn
  • OpenAI và Anthropic lần lượt dự báo doanh thu 184 tỷ USD và 174 tỷ USD vào năm 2029, cộng lại chỉ đạt 358 tỷ USD
  • Nếu OpenAI không thể hoặc không muốn gánh compute của Oracle, Oracle có thể cạn tiền; Oracle đang chi 340–700 tỷ USD cho các trung tâm dữ liệu 7,1GW dành cho OpenAI
Quảng cáo

Chi tiêu AI hiện tại là chưa đủ

  • Kế hoạch chi 300 triệu USD cho Anthropic của Salesforce trong năm 2026 còn cách rất xa quy mô cần thiết
  • Tổng nhu cầu compute hiện tại của toàn bộ các công ty AI trên thế giới còn chưa đạt 100 tỷ USD, trong khi đến năm 2030 sẽ cần gấp 10 lần con số đó
  • Theo bài viết của The Information, mức độ tập trung doanh thu startup AI vào OpenAI và Anthropic đạt 89% như {p:89}
  • Mức run rate AI 37 tỷ USD mỗi năm của Microsoft chủ yếu cấu thành từ compute cho OpenAI, và CEO Microsoft AI Mustafa Suleyman nói rằng các mô hình của Anthropic quá đắt và muốn giảm mức sử dụng của Microsoft về 0
  • Ngay cả khi Anthropic và OpenAI tiêu thụ 500 tỷ USD compute mỗi năm, vẫn sẽ cần thêm hơn 250 tỷ USD doanh thu compute mỗi năm để biện minh cho việc xây dựng trung tâm dữ liệu

Tính phí token và sự bất định của ROI

  • Không thể đo được chi phí và lợi tức đầu tư của từng tác vụ AI cụ thể, nhưng các doanh nghiệp vẫn mở rộng áp dụng AI mà không đo đầu ra
  • Anthropic và OpenAI đã chuyển khách hàng sang tính phí theo token trong quý 1 năm 2026, và chỉ sau 2–3 tháng, sự bất định về chi phí AI và ROI đã trở thành chủ đề lặp đi lặp lại trên các phương tiện truyền thông kinh doanh lớn
  • Trong khảo sát của KPMG được Wall Street Journal trích dẫn, khả năng quan sát chi phí AI được chia thành tổng thể 26%, một phần 50%, và không có hoặc chỉ biết sau khi bị tính phí 22% như {b:26,50,22}
  • Có một công ty không đặt kiểm soát chi tiêu nên đã tiêu 500 triệu USD cho mô hình Anthropic chỉ trong một tháng, còn Uber thì đốt sạch ngân sách token cả năm chỉ trong một quý
  • Uber giới hạn 1.500 USD mỗi người dùng mỗi tháng, T-Mobile tạm thời là 2.000 USD mỗi người dùng mỗi tháng, còn Brex giới hạn 500 USD mỗi tuần cho kỹ sư và 5 USD mỗi tuần cho nhân viên không phải kỹ sư

Agent lập trình, vòng lặp và vấn đề đầu ra

  • Boris Cherny, người phụ trách Claude Code, và Peter Steinberger, nhà truyền bá của OpenClaw thuộc sở hữu OpenAI, yêu cầu người dùng tự thiết kế vòng lặp cho agent
  • Vòng lặp là cách để LLM tiếp tục hành động trong khoảng thời gian mong muốn mà người dùng không cần thêm prompt mới
  • Với các gói thuê bao trợ giá, chi phí lỗi của mô hình bị che khuất sau mức 20 USD, 100 USD hay 200 USD mỗi tháng; nhưng khi người dùng phải trả chi phí thực, cái giá của thất bại hiện ra nguyên vẹn
  • Điều này liên hệ với các nghiên cứu cho thấy LLM càng suy luận nhiều thì ảo giác càng tăng, trong khi cách tiếp cận agent lại để LLM tự lập kế hoạch
  • Notion đã chặn quyền truy cập Anthropic trong vài giờ sau sự cố dịch vụ của Anthropic, và phần lớn ứng dụng do công cụ AI coding tạo ra chỉ là slopware vô dụng và không an toàn

Ẩn dụ con nhện kim loại khổng lồ

  • Con nhện kim loại khổng lồ là một thiết bị trị giá 1 triệu USD, và mỗi lần sử dụng tốn 40.000 USD tiền nhiên liệu, nhưng nó có thể nhặt đồ hoặc làm bữa tối
  • Cùng một thiết bị đó có thể lấy chính xác một lon Diet Coke từ tủ lạnh hoặc chọc thủng tủ lạnh, và người dùng vẫn phải trả 40.000 USD bất kể kết quả ra sao
  • Nhờ trợ giá, người dùng phổ thông chỉ thỉnh thoảng trải nghiệm các hành vi phá hoại, nhưng doanh nghiệp phải gánh chi phí thực, còn nhà sản xuất thì mất hàng tỷ USD mỗi năm cho huấn luyện và bảo trì
  • Tính năng mới mở rộng phạm vi những việc mà người ta tuyên bố là có thể làm, nhưng mỗi lần bổ sung tính năng lại tốn hàng trăm triệu USD, và đôi khi không rõ liệu có thực sự học thêm điều gì mới hay không
  • Dù có nghiên cứu cho thấy năng lực hoàn thành 50% các tác vụ ở một độ dài nhất định đã tăng lên, con nhện trong phép ẩn dụ vẫn không thể biết khi nào nó sẽ làm sai, và cũng có thể thực hiện cả những hành động người dùng không yêu cầu

Kinh tế tuần hoàn AI và nhu cầu sản phẩm thực tế

  • AI tạo sinh có chi phí vận hành dịch vụ cao, các phòng thí nghiệm AI lớn không có con đường đi tới lợi nhuận, và chi phí cũng như ROI của các tác vụ dựa trên LLM vẫn không thể đo lường
  • Các dự án AI có thể làm tăng chi phí vận hành từ 10% đến 100%, và trái với lời hứa rằng chi phí sẽ giảm cho cả nhà vận hành dịch vụ AI lẫn khách hàng, chi phí thực tế vẫn tăng lên
  • Chi phí cao duy trì một cấu trúc trong đó các phòng thí nghiệm AI chuyển tiền cho các đối tác compute hyperscaler, rồi dòng tiền đó lại quay trở lại các phòng thí nghiệm và nhu cầu GPU NVIDIA
  • Nếu OpenAI hoặc Anthropic theo đuổi lợi nhuận hay tính bền vững, nhu cầu compute AI sẽ giảm, đồng thời nhu cầu đối với Azure, Google Cloud, Amazon Web Services, CoreWeave, Oracle Cloud Infrastructure và GPU NVIDIA cũng giảm theo
  • Để khớp với các cam kết và dự báo hiện tại, toàn bộ stack AI phải tăng quy mô gấp 10 lần, đồng thời cần thêm 250 tỷ USD nhu cầu compute AI mỗi năm và ít nhất hai công ty có quy mô ngang OpenAI hoặc Anthropic
Quảng cáo

2 bình luận

 

API chưa bao giờ không tính phí theo token cả...

 
Ý kiến trên Hacker News
  • Hôm nay Apple đã đưa ra các tính năng AI được làm mới, và theo nhiều bài báo thì Apple dường như chỉ trả cho Google khoảng 1 tỷ USD mỗi năm để vận hành
    Về thực chất đây gần như chỉ là cấp phép sở hữu trí tuệ, và có vẻ Google thấy ổn khi nhượng quyền vận hành/chưng cất mô hình của mình với mức tiền đó
    Dù doanh thu từ người tiêu dùng chỉ là một phần của toàn bộ bức tranh, vẫn khó hiểu vì sao người dùng Mac hay iPhone lại cần trả tiền cho ChatGPT nếu AI mới của Apple đã đáp ứng được nhu cầu của họ
    Google cũng sẽ đưa các công cụ tương tự lên điện thoại và tiếp tục cung cấp tính năng AI trong tìm kiếm, nên tôi không rõ bằng chứng nào cho thấy AI tiêu dùng có giá trị lớn hơn rất nhiều so với 1 tỷ USD/năm đối với Anthropic hay OpenAI sau khi công nghệ của Apple đã xuất hiện
    Ngay cả nếu OpenAI ký được thỏa thuận lên điện thoại Samsung và Samsung tuyệt vọng hơn Apple gấp 10 lần thì cũng chỉ khoảng 10 tỷ USD/năm, và nếu dự báo doanh thu tiêu dùng năm 2026 của OpenAI là 14~15 tỷ USD thì ngay cả khi đạt được mức đó, cũng có vẻ khó duy trì sau khi người dùng iPhone có các tính năng tích hợp hữu ích
    Ed Zitron giống một tay kích động ồn ào kiểu Anh hơn, nhưng nhìn chung có vẻ nói đúng

    • Có lẽ cũng giống lý do vì sao ứng dụng Gemini đã được cài sẵn mặc định trên điện thoại Android trên toàn thế giới mà vẫn thua rất xa ChatGPT về mức sử dụng và độ chấp nhận của người dùng
      Dù Windows giờ còn có cả nút Copilot, mọi người vẫn dùng GPT; Microsoft Edge cũng không phải trình duyệt phổ biến nhất trên Windows; và Instagram Threads cũng không giáng đòn mạnh vào TikTok, tất cả đều cùng một logic
      Câu hỏi đang bị đặt ngược. Mọi người có xu hướng dùng thứ họ thích và tiếp tục dùng nó
      Không nhất thiết phải có một con hào cực lớn; vấn đề chỉ xuất hiện khi người dùng liên tục không hài lòng với sản phẩm, hoặc khi có một đối thủ tốt hơn hẳn như mọi người vẫn nói đến
      Nếu tính năng của Apple không mang lại lợi thế đáng kể so với việc dùng thẳng GPT thì khó mà mong chờ phép màu
    • Tôi đang dùng Kagi Assistant cho nhu cầu AI, và đến mùa thu thì Siri có thể sẽ thay thế nó
      Câu hỏi còn lại là liệu tôi có tiếp tục dùng Kagi vì tìm kiếm hay không, hay Siri mới có thể đưa tôi đến mọi thứ tôi cần nói chung. Có lẽ tôi nên chú ý hơn xem mình thực sự xem kết quả tìm kiếm thường xuyên đến mức nào, hay chỉ xem phần tóm tắt AI
      Cũng có những phần tôi không thấy trong công bố của Apple. Ví dụ với việc code cơ bản, họ có nhắc đến LLM trong Xcode, ứng dụng Shortcuts và Safari Extensions, nhưng tôi vừa yêu cầu Kagi tạo một trang web để hiển thị dữ liệu nhận từ Kagi, và Gemini cũng làm được
      Không rõ Siri có làm được không, còn phải chờ xem, và trải nghiệm cũng rất quan trọng. ChatGPT xử lý quá trình viết mã tốt hơn nhiều với một giao diện lập trình có trình soạn thảo trực tiếp, trong khi Kagi lại cho cảm giác như ChatGPT vài năm trước: nhả ra nguyên cả khối mã rồi mỗi lần chỉnh sửa lại đẩy ra một đống mã mới
      Chuyển hẳn sang Xcode có thể là quá mức còn Siri thì có thể chưa đủ, nên vẫn có thể tồn tại một khoảng trống cho nhu cầu AI của nhóm prosumer mà Apple không lấp đầy được
    • Tôi sẵn sàng cược ở phía ngược lại với cùng mức ăn chia trước nhận định rằng ngay cả khi OpenAI đạt doanh thu tiêu dùng 14~15 tỷ USD vào năm 2026 thì đó cũng sẽ là năm cuối cùng
      Có vẻ Anthropic không quá quan tâm đến AI tiêu dùng, và nhóm khách hàng tiêu dùng nhiều khả năng là nhóm có lợi nhuận thấp nhất
      Apple có lẽ gần với việc mở rộng mức sử dụng AI của người tiêu dùng nói chung hơn, khá giống Instagram từng thêm Stories. Điều đó có thể chặn tăng trưởng của Snapchat, nhưng tôi vẫn thận trọng trước kết luận rằng nó cũng sẽ lấy đi nhiều người dùng của OpenAI
      Nếu hiện tại bạn đang trả tiền cho ChatGPT, khả năng cao là bạn dùng nó cho code như một sở thích, cho dự án hoặc tạo ảnh; còn những người trả nhiều tiền hơn thì gần như chắc chắn dùng cho các dự án lập trình cá nhân
      Những người đăng ký trên 100 USD/tháng sẽ không rời đi vì lý do này, và tôi cũng rất khó tin rằng ngay cả nhóm 20 USD/tháng sẽ rời bỏ một cách đáng kể
    • Con đường rõ ràng để các phòng thí nghiệm AI có được khách hàng là GPU đám mây
      Phần lớn người dùng trên thế giới dùng điện thoại giá rẻ với CPU yếu và ít RAM, nên không thể chạy mô hình đủ dùng ở chế độ cục bộ
      Trong thỏa thuận Google-Apple, không rõ Google có bán cả quyền truy cập năng lực tính toán đám mây với giá 1 tỷ USD đó hay chỉ chia sẻ trọng số và sở hữu trí tuệ
      Apple cũng nói sẽ có giới hạn sử dụng và nâng cấp thuê bao để dùng nhiều hơn, nên coi như đã hình thành một mặt trận cạnh tranh trực tiếp với các phòng thí nghiệm AI. Dù có mặc định sẵn, vẫn có các đối thủ thành công như Safari và Chrome, nên cạnh tranh kiểu này là khả thi
      Google cũng có thể cung cấp mô hình với mức giá thấp hơn giá trị thực để làm mất động cơ kinh tế khiến một đối thủ chính có nhiều tiền mặt tham gia cuộc chạy đua vũ trang huấn luyện mô hình nền tảng
      Những người dùng muốn tính năng nghiêm túc hơn ngoài tóm tắt và chỉnh sửa văn phong có thể vẫn thấy giá trị ở một gói thuê bao hợp lý hoặc gói có quảng cáo của các mô hình chất lượng cao hơn, ngay cả khi họ chỉ dùng thỉnh thoảng
      Apple cũng có thể cung cấp điều đó, nhưng khi bắt đầu so sánh tính năng thì với nhiều người, Gemini, Claude và ChatGPT có thể phù hợp hơn
      Ngoài ra cũng có rủi ro hoàn toàn thực tế là Apple lại hứa hẹn quá mức một lần nữa, rồi chất lượng mô hình khi phát hành thực tế lại thấp, khiến người dùng càng bị đẩy sang các dịch vụ thuê bao hơn
    • Người dùng ChatGPT đã đưa vào đó một lượng dữ liệu khổng lồ về cuộc sống và mối quan tâm của chính họ
      Bao gồm đời sống cá nhân, sở thích, kế hoạch, công việc kinh doanh, thông tin gia đình, nên nếu chuyển sang ứng dụng AI khác thì phải bắt đầu lại từ đầu, điều này khá đau đớn
  • Một trong những dấu hiệu để nhận ra kẻ kích động vớ vẩn là họ nói với giọng điệu đầy kích động kiểu “sao mọi người lại không hiểu chuyện này nhỉ?” nhưng thực tế thì lập luận không hề nối tiếp được
    Nếu lập luận của Zitron thực sự vững như chính ông ấy nói, thì người đọc phải có thể hiểu và thấy nó vững đến mức nào
    Nếu ông ấy bắt đầu từ số liệu thống kê về nhu cầu AI rồi cẩn thận tiếp tục tính sang bước kế tiếp, như doanh thu cần thiết để các công ty AI có lãi, thì người ta còn có thể theo dõi được, nhưng ông ấy cứ nhảy cóc, lao vọt đi rồi lại quay lại
    Nếu tình hình thực sự rõ ràng đến mức “sao không nhìn ra được chứ” thì cách giải thích cũng phải rõ ràng, nhưng không phải vậy. Lý do nó không rõ ràng là vì bản thân tình hình cũng không rõ ràng đến thế

    • Tôi luôn hơi thấy lạ khi mọi người tập trung quá nhiều vào văn phong của Ed hơn là thông điệp của ông ấy
      Nếu nhìn rộng ra, thông điệp của ông ấy là ngành công nghệ đã mục ruỗng về mặt đạo đức ở mức rất sâu. Đây là điều khó mà nói ra một cách bình thản, nhưng cảm giác đọc nó không giống kiểu cường điệu vô căn cứ, mà gần hơn với sự không thể tin nổi kiểu “vì sao người ta vẫn đầu tư và làm việc cho Meta dù đã có quá nhiều bằng chứng áp đảo rằng đây là một công ty làm những điều khủng khiếp với con người”
    • Việc nói rằng ông ấy cần bắt đầu từ thống kê rồi tiếp tục tính sang doanh thu cần thiết chẳng phải chính là điều phần đầu tiên có tiêu đề đang làm sao?
    • Tôi không đọc Ed Zitron ngoài những lúc bài của ông ấy được đưa lên Hacker News, và tôi có thể đồng ý rằng giọng điệu của ông ấy hơi quá
      Dù vậy, điều tôi hiểu từ lập luận của ông ấy là các công ty AI đã cam kết mua lượng compute ở mức X, các data center đang được xây để đáp ứng nhu cầu đó, các data center thì phải thu về mức Y, nhưng các công ty AI lại không có đủ doanh thu để trả mức Y đó
      Cá nhân tôi không thấy quá ngạc nhiên. Những ứng dụng AI thực tế mà tôi từng thấy chủ yếu là sinh mã hoặc các cuộc gọi bán hàng tự động/lừa đảo tự động, và chúng không có vẻ là những thị trường đủ lớn để gánh nổi số tiền khổng lồ đang được đổ vào lúc này
      Tôi tò mò vì sao mọi người lại cho rằng Ed đã sai lệch nghiêm trọng đến vậy. Với tôi thì có vẻ như một đợt điều chỉnh lớn đang đến với toàn bộ AI
    • Tôi muốn biết trong các hyperlink được cung cấp ban đầu, cái nào trông có vẻ như sẽ có thứ bạn muốn, và sau khi bấm vào thì nó đã gây thất vọng thế nào
      Đó không phải loại thông tin mà người ta có lý do để mong nó sẽ được sao chép lặp lại trong từng bài blog định kỳ
      Dù giọng điệu này có hơi mỉa mai, nhưng nếu bạn thực sự đã bấm vào thì tôi thật lòng muốn biết câu trả lời
    • Những cách nói như “các nhà báo hiện đang ám ảnh với OpenAI và Anthropic” chắc chắn gây phản cảm
      Đây là một nỗ lực bắt chước kiểu báo chí phanh phui hiện đại khá kém, cố tỏ ra sắc sảo nhưng lại ít substance
  • Dù đã có rất nhiều người nói điều này rồi, Ed Zitron là người khó đáng tin
    Theo tôi, ông ấy đã nhiều lần thiên lệch và sai ngay cả ở những thứ rất hiển nhiên và nhỏ nhặt, nên khó mà chấp nhận nguyên vẹn các phân tích phức tạp có số liệu và xu hướng
    Ví dụ, tôi nhớ mấy tháng trước có một tweet chế giễu những người nói về agent và coding kiểu agent. Đại loại là “Agent à? Agent gì? Họ có biết mình đang nói gì không?” và trong phần trả lời có hàng trăm người giải thích rằng họ thực sự đang dùng agent
    Ông ấy có đối tượng khán giả và mục tiêu tương tác, và mục đích không phải là truyền đạt thông tin mà là kiếm click

    • Điều thú vị là các con số của ông ấy dựa trên những nguồn mà chính ông ấy nói là mình không tin
      Có thể hướng đi thì đúng. Chẳng hạn, theo kiểu doanh thu cần thiết để bù chi phí trông có vẻ phi lý đến mức rất cao thì có thể là đúng, nhưng ông ấy có vẻ đang trộn các con số để dựng lên một kịch bản tệ nhất không nhất thiết khớp với thực tế
      Cộng thêm việc ông ấy không hề tỏ ra cởi mở với bất kỳ thứ gì dù chỉ hơi liên quan đến AI, nên rất khó để xem đó là quan điểm nghiêm túc
      Các ấn phẩm thích những bài diễn giải dài dòng, u ám và đậm chất tận thế, nên có cảm giác như ông ấy đã xây dựng sự nghiệp bằng các bài viết phản AI đầy tính cuồng loạn. Điều đó không có nghĩa là ông ấy đúng
    • Bài này có rất nhiều phân tích định lượng, nên nếu đưa ra một hai ví dụ về việc các con số này sai ở đâu thì lập luận có lẽ sẽ mạnh hơn
      Phần thuyết phục nhất của bài là chỉ nhìn vào các con số thôi cũng thấy quy mô đầu tư cần thiết có vẻ không bền vững nếu xét bằng số dollar thuần túy
      Ngay cả khi không đồng ý với tác giả, bạn vẫn có thể thấy mạch triển khai: OpenAI, SpaceX và Anthropic phải IPO trong năm nay nếu muốn tránh cạn tiền, và nguồn vốn tư nhân không còn đủ nữa. IPO là vòng gọi vốn cuối cùng
      AI có thể rất hữu ích và mang tính biến đổi lớn, các công ty cũng có thể tăng trưởng nhanh, nhưng có thể sẽ không có đủ tiền để nuôi mức tăng trưởng đó
      Đoạn nói về một công ty AI phá sản đã hủy hợp đồng với Oracle khiến tôi liên tưởng Oracle như kiểu Nortel. Nếu một mảng lớn khách hàng đột ngột biến mất, họ có thể phải ghi giảm giá trị ở quy mô hàng trăm tỷ USD
    • Ông ấy gọi tất cả mọi người là kẻ lừa đảo, nhưng bản thân ông ấy cũng trông giống như vậy
      Tôi rất hoài nghi về các lãnh chúa AI, nhưng cứ khăng khăng rằng chẳng có gì ở đó cả thì không phải là điều trung thực
  • Zitron giờ gần như ở mức cầu xin sự sụp đổ.
    Đúng là ông ấy đã chỉ ra những rủi ro tài chính vĩ mô rất lớn, nhưng vì sự bi quan không ngừng đó mà ông ấy hoàn toàn bỏ lỡ tính hữu dụng tại hiện trường của mức tăng năng suất khổng lồ mà nhiều người trên HN đang cảm nhận mỗi ngày.
    Lúc này tôi muốn tin rằng đang tồn tại một vùng trung gian nơi sự mở rộng năng lực cá nhân này dẫn tới những khám phá lớn.

    • Nếu loại bỏ các cổ phiếu liên quan đến AI khỏi bất kỳ chỉ số chứng khoán nào thì sẽ thấy gì? Chẳng có gì cả.
      Vậy thì toàn bộ năng suất đó đang đi đâu, giá trị nằm ở đâu, các thống kê thất nghiệp quy mô lớn hay hàng triệu startup mới kiếm được rất nhiều tiền đang ở đâu, tôi không rõ.
    • Ít nhất với tôi, ông ấy đã liên tục cho thấy mình không hiểu rõ về mặt kỹ thuật cách suy luận hoạt động như thế nào, nên luận điểm cốt lõi rằng sự sụp đổ phải xảy ra trở nên yếu đi.
      Trong một chu kỳ cường điệu hóa quá nóng thì vẫn cần những phê phán cân bằng, nên bản thân tiếng nói phản biện là có giá trị, nhưng lập luận của ông ấy không vững ngay cả khi chấp nhận các tiền đề của ông ấy.
      Bất mãn lớn nhất của tôi với phép tính ước lượng của ông ấy là ông ấy coi tổng biên lợi nhuận của suy luận như một thứ mới không thể so sánh với biên lợi nhuận SaaS thông thường.
      Điều đó đúng một phần. Vòng quay R&D không ngừng nghỉ gồm huấn luyện mô hình, xây dựng hạ tầng liên quan và các chi phí xung quanh để duy trì năng lực cạnh tranh quả thực có làm thay đổi phần nào phân tích.
      Nhưng nói rằng điều này về mặt cấu trúc khác với biên lợi nhuận SaaS thông thường thì là đi quá xa. Mô hình kinh doanh này không giống Dropbox, nhưng lại khá giống AWS thời kỳ đầu, CDN và các nhà mạng viễn thông.
      Về phía viễn thông, đây là lĩnh vực mà tôi đã dành hơn nửa sự nghiệp của mình với tư cách kỹ sư và nhà sáng lập, nên tôi có thể nói rằng những doanh nghiệp hạ tầng cực kỳ thâm dụng vốn, nơi lợi nhuận phụ thuộc vào mức sử dụng, bán vượt mức, lập kế hoạch công suất đỉnh, phân khúc và thu hồi vốn đầu tư, hoàn toàn có thể tồn tại.
      Khi phân tách tác vụ một cách rõ ràng để giảm chi phí bắt đầu xuất hiện, phép tính của ông ấy lại càng đáng nghi hơn. Các tổ chức đi đầu đang nhận ra rằng không phải tác vụ nào cũng cần dùng mô hình tốt nhất và đắt nhất.
      Có thể định tuyến các tác vụ dễ sang mô hình rẻ, dùng caching, xử lý theo lô với các tác vụ không gấp, và chỉ giữ lại các mô hình tuyến đầu cho một số tác vụ thật sự cần năng lực trí tuệ tuyến đầu. Điều này xung đột trực diện với lập luận rằng nhà cung cấp phải luôn theo đuổi trí tuệ tuyến đầu nếu muốn duy trì nhu cầu, mức sử dụng và đường cong giá hiện tại.
    • Năng suất không phải là giá trị.
      Bạn có thể cảm nhận được năng suất tăng lên mà vẫn không tạo ra giá trị thực, và tôi nghĩ đó chính là điều mà dữ liệu vững chắc nhất đang cho thấy.
      https://unessays.substack.com/p/talk-is-cheap
    • Nếu đó là điều không thể phủ nhận như vậy thì tôi thắc mắc vì sao lại hoàn toàn không có bằng chứng khoa học.
      Có nghiên cứu bình duyệt quy mô lớn hay nghiên cứu tổng hợp nào xác nhận khẳng định đó không?
    • Từ năm 2024, ông ấy đã liên tục dự đoán rằng sự sụp đổ đã cận kề, tiến bộ đang chậm lại, và thị trường suy luận không tồn tại.
      Chỉ riêng việc ông ấy chưa từng nhìn lại những thất bại rõ ràng trong phân tích của chính mình cũng đã nói lên điều cần biết về tính trung thực trí tuệ.
      Một phần những gì ông ấy nói về rủi ro tài chính là đúng, nhưng nếu không thể thừa nhận cả khả năng tăng trưởng thì cũng không thể đánh giá rủi ro một cách đúng đắn.
      Vì vậy tôi khó có thể xem ông ấy một cách nghiêm túc.
  • Có nhiều bình luận gạt phắt đi trong chuỗi này, nhưng hiếm khi chúng đụng tới nội dung thực chất của bài viết.
    Mấu chốt là liệu câu “AI không có chỗ để chậm lại — để duy trì sự tồn tại, nó cần doanh thu hơn 3 nghìn tỷ USD vào cuối năm 2030” có đúng hay không.
    Nếu tổng tiền lương năm 2024 là 11,7 nghìn tỷ USD [0], và việc làm phi nông nghiệp cùng năm là 158,000 [1], thì phép tính nháp của tôi cho thấy để AI đạt điểm hòa vốn, nó phải giành hoặc tạo ra ít nhất 1 trong mỗi 20 việc làm, và con số đó còn lớn hơn 1 bậc độ lớn.
    [0] https://fred.stlouisfed.org/series/BA06RC1A027NBEA
    [1] https://fred.stlouisfed.org/series/PAYEMS

    • Nếu bạn nghĩ có một nhóm bí mật nhỏ thực sự đang điều hành nền kinh tế thế giới thì điều đó gần như là tiểu thuyết.
      Trong 2008 và 2020~2023, một lượng tiền khổng lồ đã chảy vào nền kinh tế và người giàu đã trở nên giàu đến mức phi lý. Khối tài sản đó giờ bị trói vào phiên bản đường sắt/cáp quang của thập niên 2020, và về cơ bản chúng ta đang cố xóa sổ hàng nghìn tỷ USD khỏi kinh tế toàn cầu để thiết lập lại.
      Thực ra thì việc thiết lập lại là cần thiết.
  • Trước khi bỏ ra 20 phút để đọc bài này, cần biết rằng tác giả này hơn 2 năm qua đã liên tục đăng những quan điểm tuy phổ biến nhưng sai đều đặn theo kiểu AI đang thất bại, là lãng phí tiền bạc, tệ hại và sẽ không bao giờ hoạt động.
    Ví dụ như bài tháng 3/2024 này: https://www.wheresyoured.at/peakai/

    • Tôi không nhớ đã nghe ở đâu, nhưng điều này làm tôi nghĩ đến những người dự đoán sớm vụ sụp đổ dot-com vào khoảng năm 1998.
      Trong 2 năm họ trông rõ ràng như kẻ điên và bỏ lỡ cú tăng mạnh của thị trường chứng khoán, nhưng cuối cùng họ đã đúng. Tất nhiên, sau đó cổ phiếu công nghệ cũng dần hồi phục.
      Việc dự đoán thời điểm của những chuyện như thế này nổi tiếng là rất khó, nên việc sai thời điểm từ 2 năm trước không có nghĩa là sẽ không có điều chỉnh.
    • Bạn có thể chỉ ra những phần cụ thể trong bài đó mà có thể gọi là liên tục sai không? Không phải là tôi không đồng ý, nhưng khi đọc lướt thì không thấy điều gì nổi bật ngay.
    • Chất lượng của phe bi quan về AI ngang ngửa với chất lượng của phe lạc quan về AI.
      Ed có phần thú vị như một cái nhiệt kế, nhưng tôi thấy khó mà xem nghiêm túc những gì ông ấy viết.
    • Tôi rất khuyến nghị đọc bài chân dung của Wired: https://www.wired.com/story/ai-pr-ed-zitron-profile/
      Tim Lee cũng chỉ ra rằng có khá nhiều điểm kỳ lạ khi Ed đăng chi tiết của một số phân tích: https://x.com/binarybits/status/2034377838883700953
    • Lúc này, nội dung phản AI có vẻ hơi mang lại cảm giác an ủi nên dễ muốn bấm vào, nhưng ông ấy cứ tiếp tục sai và thường đẩy theo hướng “các doanh nghiệp này thậm chí còn không có lãi”.
      Ngay khi hiện ra popup đăng ký newsletter là tôi đóng tab ngay.
  • Ed là một nhân vật thú vị
    Phân tích tài chính của ông ấy về ngành AI nghe có lý về mặt logic, nhưng tôi không đủ hiểu biết để biết liệu nó có thực sự đúng hay không
    Dù vậy, có vẻ ông ấy quá bực bội với AI nói chung nên bỏ qua những lĩnh vực rõ ràng mà LLM thực sự đang thay đổi trình độ tiên tiến nhất
    Lập trình có vẻ là một trong những ứng dụng cốt lõi của LLM, như Simon Willison gần đây đã chỉ ra, và ngay cả nếu đó là ứng dụng thực sự duy nhất thì nó vẫn cực kỳ hữu ích
    Tính hữu ích và khả năng sinh lời là hai chuyện khác nhau, và tôi nghĩ Ed đã chỉ ra một điểm quan trọng ở đó. Các công ty này không thể có lãi cho đến khi suy luận rẻ hơn rất nhiều, và một vài tay chơi siêu lớn sẽ trả mức giá token API đó, nhưng phần lớn thì không

    • Tôi không nghĩ việc LLM có thực sự thay đổi trình độ tiên tiến nhất hay không có liên quan đến điều ông ấy viết
      Nếu các công ty AI cần doanh thu hàng chục tỷ đô la để trụ vững, thì việc 0,5%, 5% hay 50% doanh thu đó đến từ chuyện thay đổi trình độ tiên tiến nhất là hoàn toàn không liên quan
      Điều quan trọng không phải là có tính biến đổi hay không, mà là các công ty này sẽ không có doanh thu để thanh toán hóa đơn, và nếu họ không trả nổi thì rất nhiều công ty khác cũng vậy
      Vì thế, dù có biến đổi hay không, nó vẫn là một ngôi nhà bằng lá bài đang chờ sụp đổ. Để thay đổi điều đó, cần không phải nhiều “biến đổi” hơn mà là một bộ tính năng có thể nhân cơ sở người dùng hiện tại lên nhiều lần hoặc tăng mức phí lên nhiều lần
    • Có thể ông ấy có người đăng ký theo dõi và đã nhận ra thái độ đó rất hợp với họ
      Ở một khía cạnh nào đó, điều đó khá mới mẻ. Nhiều người chỉ trích mặt này mặt kia của AI nhưng rồi luôn thêm câu miễn trừ ở cuối kiểu “dù vậy thực ra tôi rất thích AI và dùng nó hằng ngày”
      Có lẽ họ muốn tránh cảnh những người xây dựng thực dụng tràn vào phần bình luận để bình tĩnh giao nuance, nói theo cách ngày nay là tránh bị đám chiến binh bàn phím giận dữ với con chip trên vai lao vào, và việc phải đọc xuyên qua kiểu cả hai phe đều thế này thật mệt mỏi
      Với Zitron thì khó mà đưa ra kiểu phê bình đó. Dù nói gì đi nữa, ông ấy không sợ bị xem là đang đứng về một phe
    • Có vẻ một số kiểu người không thể tách bạch ba điều sau: 1) ghét AI như một công nghệ, 2) ghét những người và công ty kiếm tiền từ AI, 3) cho rằng AI vô dụng
      Ba lập trường này hoàn toàn tách biệt. Bạn có thể nghĩ AI rất hữu ích nhưng vẫn ghét nó vì nó có thể làm giảm địa vị xã hội của bạn, hoặc có thể thích công nghệ này nhưng nghĩ Sam Altman không trung thực
      Thế mà nhiều cây bút chống AI dường như kỳ lạ ở chỗ cảm thấy phải đưa ra cả ba lập luận cùng lúc
      Còn buồn cười hơn là nếu nó thực sự vô dụng thì chẳng cần bận tâm làm gì. Thị trường cuối cùng sẽ nhận ra sự vô dụng đó, mọi thứ sẽ trở lại bình thường, và những người bạn ghét sẽ mất tiền
      Tất nhiên tôi không nghĩ họ thật sự tin nó vô dụng. Tôi nghĩ đúng hơn là họ lo nó sẽ ảnh hưởng thế nào tới uy tín của mình, và tha thiết mong một ngày nào đó mọi người sẽ “tỉnh ngộ” và cùng chia sẻ niềm tin rằng LLM chỉ là những con vẹt xác suất không có ích lợi gì. Nhưng mọi người đang dùng chúng mỗi ngày và chứng kiến chúng cải thiện theo thời gian thực
    • Chi phí suy luận rất có thể sẽ rẻ đi đáng kể
      Lập luận của ông ấy là để các công ty này có lãi thì cần xảy ra những điều rất lớn chưa từng có trước năm 2022. Nhìn chung tôi đồng ý, nhưng tôi cho rằng những điều như vậy đã diễn ra suốt vài năm nay nên sẽ còn tiếp tục diễn ra
    • Câu nói rằng suy luận đắt đỏ được lặp lại rất nhiều nhưng phần lớn xuất phát từ sự thiếu hiểu biết
      Không có cơ sở nào để tin rằng suy luận đắt đỏ ngoài bầu không khí cảm tính. Nếu nhìn vào dữ liệu và trực giác thì biên lợi nhuận là cao
      Cách nghĩ này càng củng cố niềm tin của tôi rằng mọi người không thực sự biết rõ nhưng vẫn dùng câu “AI không có lãi và quá đắt” như một kiểu catharsis để phản ứng trước những tiến bộ khổng lồ
  • Zitron là người làm kinh doanh sản xuất nội dung, chứ không phải người thành công nhờ dự đoán
    Với ông ấy và những người tương tự, không quan trọng họ đã nói ngày tàn đến bao nhiêu lần; chỉ cần đúng một lần là được
    Tuy vậy, ở thời điểm hiện tại ông ấy chắc chắn đúng ở một phần về tính kinh tế. Vẫn chưa có cách nào để thu hồi khoản đầu tư khổng lồ này

    • Nếu mục đích là sản xuất nội dung thì thậm chí chẳng cần đúng lấy một lần
  • Theo tôi, AI sẽ thay đổi thế giới một cách mạnh mẽ
    Có thể theo hướng xấu hơn, tốt hơn, hoặc pha trộn cả hai, nhưng bản thân điều đó thì tôi không nghi ngờ
    Bước nhảy mang tên LLM mới chỉ bắt đầu được khoảng 5~6 năm. Để tham chiếu, sóng vô tuyến được phát hiện vào năm 1886 và Marconi đã dùng nó cho liên lạc vào năm 1895; điện thoại và radio đã cùng tồn tại trong nhiều thập kỷ, nhưng điện thoại di động và công nghệ không dây chỉ thực sự bùng nổ vào năm 1995
    Lý do mất nhiều thời gian không phải vì vật lý sóng vô tuyến cần thời gian để trưởng thành, mà vì mọi thứ khác cần thiết để kiếm tiền từ nó đều cần thời gian
    Với tôi, LLM gần với một khối xây dựng hơn là AI. Nó có thể tương ứng với sóng vô tuyến hoặc transistor
    Chúng ta đã thấy rằng hoàn toàn có thể kết nối các LLM để tạo thành agent. Hiện tại, giá thành là yếu tố hạn chế rất nghiêm ngặt đối với coding và agent
    Nếu chỉ muốn Claude Code hay Codex thì còn tạm ổn, nhưng có rất nhiều tổ hợp LLM mà phần lớn mọi người còn không dám thử nghiệm. Ví dụ, việc vận hành hội thoại NPC và cơ chế thế giới trong game bằng LLM vẫn chưa khả thi về mặt công việc vì chi phí
    Nếu giá phần cứng suy luận giảm xuống và các thuật toán suy luận tiếp tục được cải thiện, tôi vừa tin chắc vừa cảm thấy sợ rằng chúng ta sẽ thấy những thứ mà ngày nay khó có thể tưởng tượng nổi

    • Thực ra tôi đang làm đúng bài toán đó
      Chi phí không phải vấn đề. Các phản hồi và kịch bản nhất quán theo ngữ cảnh có số lượng hữu hạn, nên trong game không cần LLM tạo văn bản theo thời gian thực
      Thay vào đó, có thể dùng LLM để tạo ra một kho ngữ liệu khổng lồ gồm các “nguyên tử” như tin nhắn hội thoại, mảnh ghép, manh mối, rồi nối chúng lại một cách tất định tùy theo đầu vào của người chơi. Cũng có thể rà soát trước và kiểm thử đa dạng trước khi triển khai
      Với người chơi đang tương tác trong game, một hệ thống như vậy trong phạm vi các tương tác đã được thiết kế sẽ khó mà phân biệt được về mặt chức năng với văn bản sinh ra
      Ưu điểm cũng rất lớn. Nếu người chơi phá vai và cố tình chọc ngoáy thì có thể lộ ra các đường nối, nhưng sẽ không bị khai thác theo kiểu của LLM
    • Câu nói “AI có thể khiến thế giới tốt hơn, xấu hơn, hoặc cả hai” là một phát biểu vô giá trị
      Thật là một nhận định sắc bén khi nghi ngờ rằng một thứ gì đó có thể làm mọi việc tốt hơn, xấu hơn, hoặc cả hai
      Câu “chúng ta vẫn còn quá sớm” cũng rất kỳ lạ. Họ đã chạy nhiều quảng cáo Super Bowl, và các công ty gần như thống trị tin tức công nghệ đã khiến phóng viên chỉ việc lặp lại những lời lố bịch của CEO, trong khi khi họ nói định giá doanh nghiệp vượt 1 nghìn tỷ USD thì những người có thẩm quyền phản biện về tài chính dường như cũng chỉ gật đầu đồng ý
      Họ đã xây các trung tâm dữ liệu rộng hàng trăm mẫu Anh, ký cả những hợp đồng trung tâm dữ liệu sẽ không thành hiện thực, và đòi hàng tỷ USD mỗi tháng
      Họ đang nuốt chửng silicon đến mức mọi người tận mắt thấy giá phần cứng tăng gấp đôi, gấp ba hoặc hơn
      Các nơi làm việc từng ép nhân viên dùng AI, rồi khi trợ cấp biến mất và chi phí lộ ra thì thấy không còn vui nữa nên rút lui
      Thế mà họ vẫn nói cần thêm thời gian, thêm sự chú ý, thêm người xem hơn nữa. Tôi không biết trong lịch sử sóng vô tuyến đã từng có chuyện như vậy ở đâu
    • So với hội thoại NPC chạy bằng LLM, tôi quan tâm hơn nhiều đến hội thoại và nhân vật do biên kịch tạo ra
      Mô phỏng thì chán
  • Căn cứ để Ed cho rằng “AI đang chậm lại” là trần chi tiêu của các công ty, đặc biệt là mức giới hạn 1.500 USD mỗi tháng cho mỗi công cụ trên mỗi kỹ sư của Uber
    Tôi diễn giải chính bằng chứng đó theo hướng hoàn toàn ngược lại. Chỉ một năm trước thôi, ý tưởng một công ty chi 1.500 USD mỗi tháng cho AI trên mỗi nhân viên là điều vô lý, và người ta sẽ tự hỏi rốt cuộc dùng AI để làm gì mà tốn đến vậy
    Nhưng khi các coding agent và những agent ngày càng mang tính đa dụng xuất hiện, nhu cầu của nhân viên đã tăng cao đến mức các công ty phải áp hạn mức
    Tổng thị trường tiềm năng của các công ty AI này đã nhảy vọt lên mức 1.500 USD mỗi tháng cho mỗi lao động tri thức, nên tôi không hiểu điều đó thì chậm lại ở chỗ nào

    • Điều đó có thể đúng ở một số bang nơi Big Tech Mỹ trả lương vô lý cho kỹ sư
      Nhưng để đạt được lợi tức đầu tư thì họ phải chi ở mức đó hoặc cao hơn trên quy mô toàn cầu, mà về dài hạn những ngân sách như vậy sẽ không thể được phê duyệt
      Công ty thích cắt giảm chi phí, và ngay khi họ kết luận có một con đường khác mang lại cùng giá trị hoặc giá trị tốt hơn, giống như cách họ tùy ý cắt giảm nhân sự, thì những ngân sách đó cũng sẽ nhanh chóng biến mất
      Hoặc đơn giản là sẽ biến mất vì yêu cầu giá trị ngắn hạn từ cổ đông
    • Thực ra không phải 1.500 USD mỗi tháng cho mỗi kỹ sư, mà là 1.500 USD mỗi tháng cho mỗi công cụ trên mỗi kỹ sư
      Nghĩa là chỉ cần dùng Claude Code và Cursor thôi cũng dễ dàng thành 3.000 USD mỗi tháng, và nếu Codex cũng là một lựa chọn thì có thể lên 4.500 USD
      Và như bạn đã viết trên blog, đó là một soft cap có thể vượt qua nếu biện minh được