- OpenAI đã dừng kế hoạch mở rộng trung tâm dữ liệu Stargate tại Abilene, Texas và tập trung vào cơ sở mới sử dụng chip Nvidia thế hệ tiếp theo
- Oracle đang mở rộng hạ tầng AI bằng đầu tư dựa trên nợ trên 100 tỷ USD, trong khi dòng tiền tự do đã chuyển sang âm
- Tốc độ xây dựng trung tâm dữ liệu không theo kịp chu kỳ thay thế thế hệ chip, tạo rủi ro lỗi thời công nghệ cho toàn bộ đầu tư hạ tầng
- Nvidia đang ra mắt GPU mới mỗi năm, và chip Vera Rubin mới mang lại hiệu năng suy luận gấp 5 lần so với thế hệ trước
- Oracle là nhà siêu quy mô duy nhất đang sở hữu hơn 100 tỷ USD nợ, với dòng tiền thặng dư đang âm
- Cổ phiếu Oracle đã giảm 23% trong năm nay, làm gia tăng lo ngại của thị trường về tính bền vững đầu tư hạ tầng AI
Dừng hợp tác giữa OpenAI và Oracle
- OpenAI đã rút kế hoạch mở rộng trung tâm dữ liệu Stargate của Oracle và chuyển sang mở rộng quy mô lớn ở khu vực khác với GPU Nvidia thế hệ tiếp theo
- Cơ sở tại Abilene dự kiến sẽ sử dụng bộ xử lý Nvidia Blackwell, nhưng nguồn cung cấp điện chỉ dự kiến hoạt động sau 1 năm
- OpenAI kỳ vọng sẽ tiếp cận chip Nvidia tiên tiến hơn vào thời điểm đó để mở rộng ở địa điểm khác
- Oracle đã tiến hành sẵn việc giành đất, đặt hàng phần cứng và đầu tư xây dựng và nhân sự quy mô hàng tỷ đô la
- Bloomberg là nơi đầu tiên đưa tin, và Oracle phủ nhận trên X đây là “tin thất thiệt”, nhưng chỉ xác nhận việc tiếp tục dự án hiện tại mà không nhắc đến kế hoạch mở rộng
Tốc độ thay thế chip và sự mất cân đối trong xây dựng hạ tầng
- Chu kỳ nâng cấp chip AI đang tiến nhanh hơn tốc độ xây dựng trung tâm dữ liệu
- Nvidia trước đây tung ra sản phẩm mới mỗi 2 năm, nhưng hiện nay là ra mắt GPU mới hằng năm
- Chip Vera Rubin mới có hiệu năng suy luận gấp 5 lần so với Blackwell
- Các doanh nghiệp phát triển mô hình AI ưu tiên chip mới nhất vì khoảng cách hiệu năng ảnh hưởng trực tiếp đến benchmark, mức sử dụng, doanh thu và giá trị doanh nghiệp
- Các công ty hạ tầng cần tối thiểu 12–24 tháng cho thuê đất, kết nối điện và hoàn thiện cơ sở, nên khoảng cách thế hệ công nghệ gần như không thể tránh
- Tuy nhiên khách hàng vẫn muốn chip mới được nâng cấp mỗi năm, nên có rủi ro rằng lúc xây xong cơ sở, phần cứng đã đã thành chip thế hệ trước
- Mọi hợp đồng hạ tầng ký kết hôm nay có thể đã là khoản đầu tư vào phần cứng lạc hậu trước cả khi kết nối điện hoàn tất
Cơ cấu mở rộng dựa trên nợ của Oracle
- Oracle là nhà cung cấp hạ tầng siêu quy mô duy nhất hiện nay mở rộng AI bằng nợ
- Tổng nợ trên 100 tỷ USD, và dòng tiền tự do đã chuyển sang âm
- Google, Amazon, Microsoft đang đầu tư bằng sức tạo tiền mặt nội bộ
- Đối tác Blue Owl từ chối hỗ trợ tài chính thêm cho cơ sở mới và công bố kế hoạch giảm tối đa 30.000 nhân sự
- Oracle đang bước tới khi tới ngày công bố kết quả quý III, và nhà đầu tư quan tâm liệu kế hoạch chi tiêu vốn 50 tỷ USD và khả năng duy trì huy động vốn có khả thi hay không
Phản ứng thị trường và diễn biến cổ phiếu
- Cổ phiếu Oracle giảm 23% trong năm nay, giảm hơn một nửa so với đỉnh tháng 9/2025
- Các nhà đầu tư đang chú ý đến tính bền vững của đầu tư hạ tầng AI và gánh nặng nợ
Rủi ro khấu hao GPU và rủi ro trong toàn thị trường AI
- Rủi ro khấu hao GPU có thể là rủi ro lan tỏa ra toàn bộ thị trường hạ tầng AI, không chỉ riêng Oracle
- Bất khớp giữa tốc độ tăng nhanh hiệu năng chip và thời gian xây dựng trung tâm dữ liệu là yếu tố rủi ro cốt lõi của đầu tư hạ tầng AI toàn ngành
- Vấn đề mang tính cấu trúc này có thể tác động đến hiệu quả và tỷ lệ thu hồi vốn của toàn bộ hệ sinh thái AI
1 bình luận
Ý kiến trên Hacker News
Tôi đang vận hành một công ty suy luận LLM mã nguồn mở nhỏ là Synthetic.new
Tôi cho rằng việc CNBC đưa tin là không chính xác. Oracle không đang xây Blackwell DC thay cho một trung tâm dữ liệu của hôm qua. Vấn đề là họ sẽ hoàn thiện một DC “ngày hôm nay” vào “ngày mai”. Đến thời điểm đó, Vera Rubin sẽ ra mắt và hiệu quả có thể tăng 5 lần, nên khả năng Oracle hạ giá 5 lần là thấp
Các máy rack-scale của Nvidia (GB200-NVL72, GB300-NVL72) là dạng rack hoàn chỉnh, chỉ cần cắm nguồn và mạng là xong. Nếu Oracle chỉ cần mua rack Vera Rubin và đưa vào DC mới, họ sẽ có DC “ngày mai” vào ngay “ngày mai”
Tuy nhiên, Oracle có thể đã ký hợp đồng nhận Blackwell vào ngày mai rồi, hoặc việc xây DC bị chậm khiến GPU đang nhàn rỗi. Chỉ dựa vào bài của CNBC thì chưa thể thấy rõ mức độ nghiêm trọng thực sự của tình hình
Việc tăng hiệu quả 5 lần trong một thế hệ nghe có vẻ quá mức. Nhờ quá trình thu nhỏ, mức cải thiện gần đây đang giảm dần
Benchmark hiệu năng/tiêu thụ điện GPU này cho thấy khoảng cách giữa 1080 Ti (cách đây 9 năm) và 5090 chỉ vào khoảng 2,56 lần. Trong workload thực tế, khả năng giữ được con số này là thấp
GPU DC cũ vẫn đang được dùng rất tốt
Có vẻ đây là chiến lược nhắm cho môi trường quốc phòng và bí mật. Ở các môi trường như vậy, chỉ sau khi đã xác minh firmware, chứng nhận mã hóa... thì sau khi ra mắt thương mại 18–36 tháng mới được chấp thuận
Blackwell đã triển khai vẫn tiếp tục là sản phẩm cho dân sự, còn nhà nước phải mua phần cứng mới riêng. Oracle có thể đang tận dụng chu kỳ chậm của thị trường bảo mật này
Ngoài ra, vì chính phủ gần như chưa từng vận hành hạ tầng GPU quy mô lớn, nên Oracle có thể hấp thụ nhu cầu này sau đó
Deirdre Bosa của CNBC cũng nói gần như vậy. Dường như trong nội bộ, nhiều người cũng không hiểu rõ mức độ nghiêm trọng của vấn đề
Oracle mang trong mình rủi ro nợ dài hạn nên quyết định này có thể là tín hiệu cảnh báo đầu tiên
Một bài khác cho rằng thực tế là chậm tiến độ xây dựng là đúng. Khu Stargate vẫn đang trong giai đoạn dọn dẹp, và việc lắp GPU mới dự kiến tới năm 2026
Việc Nvidia ký hợp đồng Blackwell hàng tỷ USD với các doanh nghiệp khác cũng có vẻ như động thái giữ cho dây chuyền sản xuất chạy. Người ta nói chip đã giao hàng có thể đang chất đầy trong kho
Tôi không hiểu cách tiếp cận cho rằng DC bị khóa vào một thế hệ GPU cụ thể nào đó. AWS cũng không xây lại tòa nhà mới mỗi khi xuất hiện Xeon mới
Cốt lõi của dự án Stargate là “kinh tế suy luận”
Khoảng cách chi phí giữa hạ tầng của hyper-scaler và neo cloud chuyên biệt xấp xỉ 75%. Khoảng cách này làm cho các công ty như OpenAI khó đưa ra quyết định giữa xây dựng nội bộ và mua ngoài Trên a7om.com tôi theo dõi giá suy luận của hơn 40 nhà cung cấp, và dữ liệu kiểu này cho thấy đầu tư DC 500 tỷ USD tiềm ẩn rủi ro bao nhiêu
Tôi không đồng ý rằng Stargate là “trung tâm dữ liệu của hôm qua”
Oracle nắm rõ lộ trình Nvidia và đang xây theo từng giai đoạn để chuẩn bị cho mật độ điện 200 kW/rack. Ở giai đoạn tiếp theo, thế hệ Rubin và Feynman đều có thể tiếp nhận thoải mái
Tôi tò mò về số phận GPU DC cũ. Có phải có thị trường thứ cấp, hay Nvidia nhúng điều khoản cấm tái bán?
GPU đắt, và không rõ định luật Moore có áp dụng nguyên vẹn trong mảng này hay không. Nếu hiệu năng không tăng mạnh, chu kỳ thay thế sẽ kéo dài
OpenAI lâu nay đã gặp vấn đề với tất cả đối tác compute của họ. Vụ này cũng có phần bị phóng đại. Thực tế gần như không có đối tác nào có thể cung cấp chip thế hệ mới nhanh hơn
Cấu trúc tài chính và khả năng thâu tóm của Oracle mới là đề tài thú vị hơn
Ngành nhà nước, tài chính và các ngành cốt lõi khác vẫn dùng Oracle DB, nhưng áp lực trả nợ sẽ khiến giá tiếp tục tăng. Kết quả cuối cùng có thể là khách hàng bỏ đi nhanh hơn, và thâu tóm thù địch trở thành lựa chọn thực tế
Tôi không hiểu vì sao Oracle mua một lượng lớn GPU cũ. Thiết bị điện tử thường khấu hao nhanh, việc mua chip theo giá niêm yết ngay bây giờ cho nhu cầu sau 2 năm nghe khá phi lý
Có câu hỏi về khả năng DC thay GPU mỗi năm hay không