2 điểm bởi GN⁺ 4 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Trong vài tuần gần đây, xAI liên tiếp ký các hợp đồng cho Anthropic và Google thuê năng lực GPU quy mô lớn, cho thấy công ty đang chuyển mình theo hướng gần với một doanh nghiệp cho thuê hạ tầng hơn là một nhà phát triển mô hình
  • Tháng 2, xAI sáp nhập với SpaceX, tạo ra cấu trúc mà doanh thu cho thuê sẽ chảy trực tiếp vào pháp nhân chuẩn bị niêm yết
  • Với Anthropic, quy mô đạt $1.25bn/tháng cho 300MW (khoảng 220.000 GPU); với Google là $920mn/tháng cho 110.000 GPU. Nếu kéo dài 18 tháng, có thể hoàn vốn toàn bộ khoảng $40bn chi phí xây dựng
  • Tình trạng thiếu hụt GPU cực độ cùng năng lực xây dựng trung tâm dữ liệu rất nhanh của SpaceX/xAI là lợi thế cạnh tranh thực chất đằng sau các hợp đồng này
  • Khi năng lực vốn dành cho mô hình nội bộ Grok lại được cho các đối thủ trực tiếp thuê, khả năng xAI lùi bước trong cuộc đua phòng thí nghiệm frontier đang gắn chặt với thành bại của đợt IPO lớn nhất lịch sử Bắc Mỹ

Cấu trúc hợp đồng và bối cảnh sáp nhập với SpaceX

  • Gần đây xAI đã ký các quan hệ đối tác cung cấp năng lực GPU quy mô lớn với Anthropic và Google
  • Tháng 2, xAI sáp nhập với SpaceX, vì vậy doanh thu từ các hợp đồng này sẽ chảy trực tiếp vào pháp nhân đang hướng tới niêm yết
  • Có ý kiến cho rằng đây là một dạng kỹ thuật tài chính (financial engineering) trước thềm IPO của SpaceX, nhưng câu chuyện có nhiều khía cạnh hơn là chỉ thủ thuật kế toán đơn thuần

Vấn đề thiếu năng lực của Anthropic

  • Sản phẩm Claude gặp tình trạng thiếu năng lực nghiêm trọng, đặc biệt vào đầu giờ chiều ở châu Âu và buổi sáng tại Mỹ
    • Đây là khung giờ người dùng châu Âu và châu Mỹ cùng làm việc, nên cạnh tranh năng lực là gay gắt nhất
  • Anthropic đã áp dụng giới hạn giờ cao điểm cho gói thuê bao
    • Lượng sử dụng trong khung 5:00–11:00 sáng theo PT / 1:00–7:00 chiều theo GMT sẽ tiêu tốn hạn mức nhiều hơn
    • Mục tiêu là làm phẳng nhu cầu giữa giờ cao điểm và ngoài cao điểm
  • Trong bối cảnh nhu cầu tăng rất nhanh, chỉ dịch chuyển nhu cầu là chưa đủ, nên việc siết thêm giới hạn sử dụng gần như không thể tránh khỏi
    • Đây là tình huống không mong muốn khi Google và OpenAI đang gây áp lực mạnh trong cuộc đua giành khách hàng
    Quảng cáo

Hợp đồng cung cấp năng lực của xAI

  • Đầu tháng 5, xAI công bố cho Anthropic quyền truy cập vào trung tâm dữ liệu Colossus 1 đời cũ tại Memphis
    • Nhờ đó, Anthropic đã rút lại các giới hạn sử dụng thuê bao; độ ổn định dịch vụ vẫn chưa thực sự tốt nhưng tình trạng thiếu hụt vào giờ cao điểm đã tạm thời giảm bớt
  • Quy mô hợp đồng với Anthropic đã tăng lên $1.25bn/tháng cho 300MW năng lực, tương đương khoảng 220.000 GPU
  • Tuần trước, Google cũng công bố một quan hệ đối tác tương tự, ở mức $920mn/tháng cho 110.000 GPU
  • Cả hai hợp đồng đều có điều khoản hủy bỏ
    • Sau giai đoạn lock-in ban đầu, cả hai bên đều có thể hủy với thông báo trước 90 ngày

Phân tích lợi nhuận

  • Nếu nhìn theo mệnh giá hợp đồng, đây là các thỏa thuận có biên lợi nhuận rất cao cho xAI
    • Nếu kéo dài 18 tháng, xAI có thể thu hồi toàn bộ khoảng $40bn capex xây dựng, đồng thời vẫn giữ trong tay số GPU hàng trăm MW
    • Tuy nhiên, con số này chưa tính opex và khấu hao
    Quảng cáo
  • Trong trung hạn, tình trạng thiếu năng lực tính toán nhiều khả năng vẫn kéo dài, nên ngay cả H100 đời cũ sau 18 tháng nữa vẫn có thể rất hữu dụng
  • Ước tính chi phí điện (opex)

    • Nếu chạy đủ tải 300MW, mức tiêu thụ điện hàng năm vào khoảng 2,6 tỷ kWh
    • Nếu mua từ lưới điện theo giá điện công nghiệp rẻ của Tennessee (khoảng 6 cent/kWh), chi phí hàng năm vào khoảng $160mn
    • Colossus chủ yếu vận hành bằng turbine khí tại chỗ; với hiệu suất nhiệt chu trình đơn khoảng 10.000 Btu/kWh và giá khí Henry Hub khoảng $3.50/MMBtu, chi phí nhiên liệu chỉ khoảng $90mn/năm, còn rẻ hơn
    • So với việc Anthropic trả khoảng $15bn/năm cho 300MW, điện chỉ chiếm khoảng 1% doanh thu

Các phản biện và dấu hiệu đáng ngờ (red flags)

  • Elon Musk và OpenAI đang trong một cuộc chiến pháp lý gay gắt, nên có khả năng hợp đồng với Anthropic nhằm gây áp lực lên OpenAI nhiều hơn là vì hiệu quả thương mại thuần túy
  • Google là cổ đông lớn của SpaceX, nên có động cơ nâng định giá IPO
  • Tuy vậy, điều quan trọng là GPU thực sự đang thiếu hụt ở quy mô rất lớn
    • Phía sau làn sóng bùng nổ capex trung tâm dữ liệu là thực tế rằng mọi bên đều đang chậm tiến độ đáng kể
    • Ngay cả trung tâm dữ liệu chủ lực Stargate UAE của OpenAI cũng đang bị đe dọa trực tiếp bởi xung đột Iran hiện tại; drone Iran đã tấn công các trung tâm dữ liệu khác tại UAE

Lợi thế cạnh tranh trong xây dựng của SpaceX/xAI

  • SpaceX/xAI đặc biệt giỏi trong việc xây dựng trung tâm dữ liệu đúng hạn
    • Colossus 1 ban đầu được xây chỉ trong 122 ngày
    Quảng cáo
  • Hệ sinh thái công ty của Musk có thế mạnh lớn trong việc lập kế hoạch, xây dựng và triển khai nhanh các dự án hạ tầng quy mô lớn
  • Các hyperscaler cũng có kinh nghiệm, nhưng thường xây trong môi trường ít cấp bách hơn, và các dự án thông thường mất nhiều năm để hoàn thành
    • Capex chỉ mới thực sự tăng tốc trong vài năm gần đây, nên nhiều dự án vẫn còn vài năm nữa mới xong
  • Đây là một lợi thế cạnh tranh lớn của xAI mà không thể xem nhẹ

Vị thế của Grok

  • Một phần đáng kể năng lực trung tâm dữ liệu vốn dự kiến dành cho huấn luyện và suy luận của Grok hiện lại được cho các đối thủ trực tiếp thuê, khiến vị thế của Grok trở nên khá mơ hồ
  • Có những dấu hiệu cho thấy đây là một bước lùi rõ ràng trong cuộc đua phòng thí nghiệm cấp frontier
    • Tuy nhiên, cũng có thể xAI đã ước tính dư thừa năng lực trung tâm dữ liệu, hoặc nhu cầu suy luận cho mô hình Grok thấp hơn rất nhiều so với dự báo, nên công ty chọn cách kiếm tiền từ phần công suất dư
    • Hợp đồng giữa xAI và Cursor càng khiến tình hình thêm phức tạp
  • Kỹ thuật tài chính, tình trạng thiếu compute nghiêm trọng và lợi thế cạnh tranh trong xây dựng trung tâm dữ liệu cả ba yếu tố này đều đúng ở một mức độ nào đó
    • Quy mô tác động của từng yếu tố sẽ quyết định thành bại của đợt IPO lớn nhất lịch sử Bắc Mỹ
  • Tổng thể mà nói, xAI trông không giống một phòng thí nghiệm frontier có gắn thêm mảng trung tâm dữ liệu, mà gần với một REIT trung tâm dữ liệu có gắn thêm một phòng thí nghiệm frontier hơn

1 bình luận

 
Ý kiến trên Hacker News
  • Google đang nắm 5~6% cổ phần của SpaceX. Nếu SpaceX nhắm tới mức định giá 1,77 nghìn tỷ USD thì phần sở hữu của Google sẽ trị giá 88,5~106,2 tỷ USD
    Tôi không hẳn hoài nghi về AI/LLM, nhưng những giao dịch vòng tròn kiểu này rất đáng ngờ, và tôi lo chuyện gì sẽ xảy ra khi nhạc ngừng lại

    • Cũng có khả năng khác. Hiện tại đang thiếu năng lực tính toán, và xAI có thể đang sở hữu tài nguyên tính toán đồng thời vận hành chúng khá tốt
      Không có GPU nào bị để không, và ở các phòng thí nghiệm AI tuyến đầu, năng lực tính toán gần như đổi thẳng ra tiền. Đúng là có một phần giao dịch vòng tròn đáng ngờ, nhưng tôi không nghĩ vụ này thuộc loại đó
    • Nếu những giao dịch này được chống đỡ bởi các chủ thể đầu cơ thì đã có nguy cơ nhạc ngừng lại, nhưng AI có giá trị và doanh thu thực
      Đây không phải món hàng đầu cơ kiểu mua token rồi bán lại, mà token được tiêu thụ ngay tại thời điểm suy luận
    • Nghe như bạn đang nói rằng có giao dịch này thì phần sở hữu SpaceX của Google trị giá 88 tỷ USD, còn không có thì vô giá trị
      Thực tế rất khó biết giao dịch này làm tăng vốn hóa SpaceX lên bao nhiêu, và trừ khi Google sắp bán phần sở hữu SpaceX, nếu gọi đây là giao dịch vòng tròn thì cũng không hợp lý lắm
    • Chẳng phải luôn là có ai đó được cứu và chu kỳ lại bắt đầu sao. Tôi cứ nghĩ vốn dĩ nó vẫn vận hành như vậy
    • Google cũng vừa công bố đợt huy động vốn cổ phần mới trị giá 80 tỷ USD
      Tôi không rõ việc làm bằng vốn cổ phần thay vì nợ có phải nhằm hút bớt sự sôi động của thị trường IPO từ Anthropic và OpenAI hay không, nhưng sẽ rất thú vị khi xem thị trường đón nhận lượng cổ phần mới này như thế nào. Sẽ có bên nào đó không đạt được mục tiêu huy động, và bên IPO muộn hơn có thể phải gánh áp lực
  • Chẳng phải cho đến gần đây người ta vẫn nói định giá của SpaceX dựa vào một phần lợi nhuận Starlink và rất nhiều đầu cơ sao
    Thế nhưng khi biết rằng có thêm 2,2 tỷ USD mỗi tháng, tức 26 tỷ USD doanh thu mới mỗi năm, từ Google và Anthropic, thì cuộc thảo luận lại không chuyển theo hướng đó mà đổi sang kiểu “công nghệ xAI không ra gì”, “cấu trúc Google/SpaceX có hại cho nền kinh tế”
    Đây là kiểu suy luận đồng bộ hóa. Khi có thông tin mới thì phải cập nhật kết luận cũ, nhưng thay vào đó người ta chỉ đang tìm con đường khác để phản ứng tiêu cực. Những người ghét Elon/SpaceX đang làm ô nhiễm hoàn toàn câu chuyện

    • Tôi nghĩ điểm cốt lõi là xAI đúng là đang kiếm tiền từ GPU/trung tâm dữ liệu, nhưng họ đang kiếm theo bội số kiểu REIT/kinh doanh cho thuê chứ không phải bội số của phòng thí nghiệm tuyến đầu
      Có vẻ xAI đã kết luận rằng đây là cách tốt nhất để rút giá trị từ tài sản của mình. Và rõ ràng Google cùng Anthropic cũng cho rằng họ có thể tận dụng tài sản đó để tạo ra giá trị lớn hơn số tiền thuê họ trả cho SpaceX
    • Hai điều đó hoàn toàn có thể cùng đúng. Ban đầu người ta phải dùng vốn để biện minh cho mức giá đầu cơ, nhưng thay vào đó họ đang dùng vốn để đổi lấy tỷ suất lợi nhuận đầu tư vừa phải
      Vì thế nó vừa vô hiệu hóa lập luận đầu cơ, vừa cho thấy phía công nghệ vốn là trung tâm của sự đầu cơ đó đang có vấn đề
    • Những lo ngại đó đủ khác nhau để việc các nhóm người khác nhau nêu ra chúng nghe cũng khá hợp lý
      Nếu dùng cả Grok lẫn các mô hình cạnh tranh thì rất khó bác bỏ điểm cơ bản rằng Grok không tốt bằng các mô hình cạnh tranh. Điều này có thể quan trọng hoặc không quan trọng từ góc độ kinh doanh
    • Tôi không đồng ý mạnh với điều đó. Thứ làm ô nhiễm câu chuyện là toàn bộ thái độ ủng hộ hay phản đối Elon, Tesla với mức định giá vô lý cũng vậy
      Nhưng trong trường hợp này, mô hình kinh doanh đã xoay trục làm thay đổi căn bản đề xuất giá trị. Tôi không hiểu vì sao câu chuyện “một công ty không gian kiếm tiền từ mảng không gian giờ lại đóng vai người bán lại năng lực tính toán, và như vậy là tốt” lại được coi là đáng mong muốn hơn
      Và tôi cũng không thích kiểu nhắm bắn vòng vo vào một “câu chuyện” nào đó mà không phản bác trực tiếp. “Chúng ta” ở đây là ai cũng không rõ, và cách nói này tạo cảm giác như đang dựng lên một sự đồng thuận vốn không tồn tại
  • Vậy là đã biết họ cho thuê các GPU này với giá bao nhiêu. Giờ tôi thật sự tò mò về chi phí đầu vào của việc sản xuất điện
    Liệu trong các giao dịch này xAI có thực sự còn lại biên lợi nhuận đủ để gánh chi phí khấu hao không
    Xem chú thích thì Colossus phần lớn chạy bằng tuabin khí tại chỗ, với hiệu suất nhiệt chu trình đơn khoảng 10.000 Btu/kWh và giá khí Henry Hub ở mức $3.50/MMBtu, chi phí nhiên liệu vào khoảng 90 triệu USD mỗi năm
    Rẻ đến mức vô lý. Tôi cũng muốn biết làm sao để tham gia vào mảng cho hyperscaler thuê GPU

    • Phần khó là kiếm được GPU. Trước hết là khó mua được, rồi sau đó lại khó mua được với mức giá hợp lý
  • Đây không phải REIT trung tâm dữ liệu. REIT trung tâm dữ liệu không bán năng lực tính toán mà bán không gian, điện và làm mát để đặt năng lực tính toán vào đó
    Tôi hiểu ý tác giả muốn nói gì. Có lẽ là tài sản giá trị nhất của SpaceX là năng lực tính toán, nhưng phép so sánh này không thật chính xác
    Hiện tại SpaceX thực chất gần giống một công ty holding chứa gần như mọi thứ của Elon ngoài Tesla. Nếu đặt cược vào SpaceX, thì là đang đặt cược vào một tập đoàn đa ngành

  • Việc đã phát triển LLM thì đúng là một phòng thí nghiệm AI, nhưng nhìn vào chất lượng mô hình thì chưa đến mức có thể gọi là tuyến đầu

    • Tôi đang dùng cả ChatGPT, Claude, Gemini và Grok bằng tài khoản trả phí
      Mỗi cái đều có ưu nhược điểm riêng, và cá nhân tôi vẫn thấy ChatGPT là tốt nhất, sau đó là Gemini/Claude, rồi đến Grok
      Trong sử dụng thông thường, Grok thường cho cảm giác chậm hơn các mô hình cạnh tranh 1–2 thế hệ, nhưng có ba điểm tôi thích ở nó. Thứ nhất, khả năng hiểu các sự kiện mới nhất có vẻ là tốt nhất. Không rõ là do tích hợp với X hay do tối ưu việc gọi công cụ ở backend, nhưng khi hỏi về những việc đang diễn ra hiện tại thì các mô hình khác thường có thông tin cũ hoặc câu trả lời không hay
      Thứ hai, với các vấn đề cá nhân thì nhìn chung nó ít nịnh nọt nhất. Anthropic cũng đang đi theo hướng này, còn ChatGPT và Gemini cũng đang cải thiện, nhưng các mô hình trước đây gần như không bao giờ nói điều tiêu cực về việc tôi đang làm. Khi cần lời khuyên nghề nghiệp hay lời khuyên cá nhân, tôi thích giọng điệu phản hồi của Grok
      Thứ ba, trong công việc có những chủ đề mà các mô hình khác từ chối xử lý. Ở công ty trước của tôi có rất nhiều người dùng pháp lý, và khi cần tóm tắt một chủ đề cụ thể từ bản ghi lời khai thì hầu hết các mô hình đều từ chối, còn Grok thì không. Tôi hiểu sự cần thiết của an toàn và không trách các nhà cung cấp khác, nhưng cũng có những công việc chuyên môn thực sự cần một mô hình có thể xử lý các chủ đề nhạy cảm
    • Benchmark có vẻ nói khác, nhưng khi cần tìm một số thông tin cụ thể không dễ kiếm bằng tìm kiếm web, tôi dùng cả ChatGPT, Gemini và Grok
      Trong những trường hợp như “hãy tìm cho tôi kho GitHub từng làm $vague_thing vào năm 2017”, Grok thường tìm ra thứ tôi muốn hơn
    • Mô hình đó có thể chỉ là chi phí marketing để vốn hóa mô hình trung tâm dữ liệu
      Không có nghĩa là họ cố tình làm vậy, nhưng trên thực tế nó đã tạo ra hiệu ứng đó
    • Nếu tin lời Elon, thì xAI còn có kế hoạch xây lại LLM từ đầu
      Để làm vậy thì họ không cần trung tâm dữ liệu cho suy luận mà cần một trung tâm dữ liệu huấn luyện khổng lồ
    • Grok không đứng đầu tuyệt đối trong nhóm tuyến đầu, nhưng chắc chắn vẫn nằm trong nhóm đó
  • Viết cho những ai chưa quen: REIT là real estate investment trust, tức quỹ tín thác đầu tư bất động sản

  • Bài này có phải là bản viết lại từ bình luận[1] của người dùng HN runako cách đây hai ngày không
    Hoàn toàn có khả năng nhiều người cùng lúc nảy ra một ý tưởng giống nhau, nhưng nếu đây là bài do chính tác giả đăng thì việc không nhắc tới có vẻ hơi bất lịch sự
    [1] https://news.ycombinator.com/threads?id=runako#48426082

  • Ý tưởng tương tự cũng đã xuất hiện trong phần bình luận ở đây hai ngày trước: https://news.ycombinator.com/item?id=48426082

    • Nói thêm là cũng đã có ý kiến rằng xAI có vẻ đang rời khỏi cuộc đua AGI: https://news.ycombinator.com/item?id=48214042
      Bây giờ việc bắt kịp OpenAI và Anthropic là cực kỳ khó. Vòng tuần hoàn tích cực gồm tạo doanh thu, dùng doanh thu đó mua thêm compute, rồi dùng lượng compute lớn hơn để huấn luyện các mô hình thông minh hơn đã khiến cạnh tranh trở nên khó khăn
      Nếu không còn có thể cạnh tranh ở LLM tiên tiến nhất, thì từ góc nhìn của SpaceXAI, chuyển sang phía cung cấp compute sẽ hợp lý hơn
  • Elon rất giỏi về phần cứng, nhưng ở xAI ông ấy đã sa thải hàng loạt theo kiểu PayPal Mafia, rồi như lúc mua Twitter lại sớm cố tuyển lại, nhưng đã thất bại trong việc thu hút kỹ sư phần mềm với quy mô lớn
    Các thương vụ trung tâm dữ liệu xuất hiện sau đó. Thế mà người từng hứa bảo vệ tự do ngôn luận cho thế giới và xây dựng hệ thống AI “thân thiện với con người” giờ lại bán cho đối thủ, đồng thời giảm giới hạn sử dụng ứng dụng hằng ngày của chính Grok xuống còn mức bội số một chữ số
    Nếu giao dịch với người giàu nhất thế giới, thì bất chấp những lời lẽ khác, có thể dự đoán rằng tiền cuối cùng sẽ được ưu tiên hơn các cân nhắc khác. Dù vậy đây vẫn là một chiến lược thú vị
    Nói công bằng thì trong một cuộc phỏng vấn năm ngoái, họ có nói rằng phần cứng là “nút thắt cổ chai”. Nhưng tôi tin chắc rằng họ đã đánh giá thấp vấn đề phần mềm. Ứng dụng đã có nhiều vấn đề, và bây giờ vẫn vậy

    • Tôi không rõ chính xác câu “Elon rất giỏi về phần cứng” có nghĩa là gì
  • xAI là một công ty tích hợp theo chiều dọc, và họ đã làm rất tốt ở mảng compute. Mô hình tốt nhất của họ dao động từ nhóm dẫn đầu đến chậm hơn nhóm dẫn đầu 1–2 thế hệ, và trên giấy tờ thì cũng từng có một lần tạm thời đứng đầu
    Nếu ngày mai họ lại vươn lên dẫn đầu, họ có know-how để mở rộng quy mô. Nếu Google hay Anthropic đồng ý, họ thậm chí có thể mua lại tài nguyên đã cho thuê