1 điểm bởi GN⁺ 2025-10-06 | 1 bình luận | Chia sẻ qua WhatsApp
  • Khi Nvidia rót khoản đầu tư quy mô 110 tỷ USD vào hạ tầng AI như OpenAI, đã xuất hiện tranh luận rằng một cấu trúc tài trợ nhà cung cấp mang tính tuần hoàn tương tự bong bóng viễn thông trong quá khứ đang tái diễn
  • Trong năm 2025, các công ty CNTT hàng đầu của Mỹ báo hiệu sẽ đầu tư 300~400 tỷ USD vào hạ tầng AI, làm gia tăng rủi ro như tập trung tệp khách hàng và các khoản vay thế chấp bằng GPU
  • Khác với lịch sử thất bại của Lucent, Nvidia có sự khác biệt về dòng tiền, mức tín nhiệm của khách hàng và tính minh bạch kế toán, nhưng sự tập trung khách hàng, định giá tài sản và sự lan rộng của custom silicon vẫn được chỉ ra là những yếu tố cần cảnh giác
  • Bài viết nhấn mạnh sự cần thiết của việc theo dõi liên tục để xác định nhu cầu AI có phải là nhu cầu thực, có trở thành hạ tầng thiết yếu như cloud hay chỉ là bong bóng
  • Cần theo dõi chặt chẽ giá trị tài sản, mô hình doanh thu và rủi ro nợ của Nvidia cũng như toàn ngành để tránh lặp lại những rủi ro cấu trúc trong quá khứ như vụ gian lận kế toán của Lucent

Mở đầu: Nvidia, tài chính tuần hoàn và cái bóng của bong bóng viễn thông

  • Năm 2025, Nvidia triển khai 110 tỷ USD vendor financing cho OpenAI và các bên khác, làm nổi bật sự tương đồng với cấu trúc tài chính tuần hoàn quy mô lớn trong thời kỳ bong bóng viễn thông
  • Các Big Tech của Mỹ dự báo mức đầu tư hạ tầng AI lớn chưa từng có, khoảng 300~400 tỷ USD trong năm 2025
  • Quy mô đầu tư này vượt xa các kỷ lục đầu tư hạ tầng doanh nghiệp trong một năm trước đây

Chiến lược của Lucent: Bài học từ tài chính tuần hoàn

  • Năm 1999, Lucent Technologies đạt doanh thu 37,9 tỷ USD ở đỉnh bong bóng dot-com, nhưng chỉ trong 3 năm sau đó đã lao dốc 69% và cuối cùng đi đến sáp nhập với Alcatel
  • Khi đó, các nhà cung cấp thiết bị như Lucent, Nortel và Cisco đã trực tiếp cung cấp vốn mua thiết bị cho các công ty viễn thông khách hàng thông qua vendor financing trị giá hàng tỷ USD
    • Lucent cam kết cho vay 8,1 tỷ USD, Nortel 3,1 tỷ USD, Cisco 2,4 tỷ USD
  • Ban đầu chiến lược này có vẻ có lợi cho tất cả các bên, nhưng khi thị trường bão hòa và dòng vốn thắt chặt, phần lớn khách hàng (47 CLEC) phá sản, 33~80% khoản vay không thể thu hồi, và giá trị thiết bị lao dốc, dẫn đến hậu quả nghiêm trọng
  • Trên thực tế, các mạng cáp quang chỉ sử dụng 0,002% công suất khả dụng, cho thấy thời điểm đầu tư đã đi quá nhanh so với nhu cầu

Chiến lược của Nvidia: Cấu trúc tài chính tuần hoàn khác biệt

  • Tính đến năm 2025, Nvidia vận hành 110 tỷ USD đầu tư trực tiếp (85% doanh thu) và hơn 15 tỷ USD các khoản vay thế chấp bằng GPU
    • Với OpenAI, công ty có cam kết cụ thể 100 tỷ USD (10 đợt giải ngân, chi trả theo từng giai đoạn xây dựng hạ tầng, dòng tiền thực tế được đưa vào dưới dạng thuê GPU)
    • Công ty cũng mở rộng đầu tư bổ sung và thị trường vay thế chấp bằng GPU sang CoreWeave, NVentures và các bên khác
  • Riêng CoreWeave đang nắm 10,45 tỷ USD nợ thế chấp bằng GPU, còn các startup AI khác như Lambda Labs cũng dùng GPU làm tài sản thế chấp cho khoản vay

So sánh số liệu: Lucent vs Nvidia (quy đổi USD năm 2024)

Hạng mục Lucent (năm 2000) Nvidia (năm 2025)
Vendor financing 15 tỷ USD 110 tỷ USD
Dòng tiền hoạt động 300 triệu USD 15,4 tỷ USD (Q2 năm tài chính 22)
Doanh thu năm 34 tỷ USD 130 tỷ USD
Tỷ trọng 2 khách hàng lớn nhất 23% 39%

Điểm cần lưu ý: Cấu trúc rủi ro thị trường mới

1. Tệp khách hàng AI tập trung hơn

  • 46% doanh thu của Nvidia tập trung vào nhóm 2~4 khách hàng hàng đầu, mức tập trung khách hàng gấp đôi so với Lucent
  • 88% doanh thu đến từ data center

2. Mở rộng vay thế chấp bằng GPU và rủi ro tồn kho

  • GPU đang được dùng cho các khoản vay lãi suất cao 14% với giả định giữ giá trị trong 4~6 năm (gấp khoảng 3 lần trái phiếu doanh nghiệp hạng đầu tư)
  • Tuy nhiên, tuổi thọ sử dụng thực tế của GPU được cho là chỉ khoảng 1~3 năm (theo ví dụ thực tế từ kỹ sư Google và Meta)
Doanh nghiệp Trước 2020 2020 2022~2023 2024~2025 Mức thay đổi
Amazon 3 năm 4→5 năm 5 năm 6→5 năm Lần đầu rút ngắn
Microsoft khoảng 3 năm 4 năm 6 năm 6 năm +100%
Google khoảng 3 năm 4 năm 6 năm 6 năm +100%
Meta khoảng 3 năm 4 năm 4.5→5 năm 5.5 năm +83%
CoreWeave N/A N/A 4→6 năm 6 năm +50% (GPU)
Nebius N/A N/A 4 năm 4 năm Chuẩn ngành
  • Amazon đã điều chỉnh thời gian khấu hao từ 6 năm xuống 5 năm trong năm 2025, trở thành trường hợp đầu tiên áp dụng cách hạch toán thận trọng hơn

  • CPU thường được sử dụng 5~10 năm, nhưng GPU trong data center AI thường xuyên bị thay thế chỉ sau 1~3 năm trong thực tế (Meta Llama 3: tỷ lệ hỏng 9% mỗi năm → dự báo 27% lỗi trong 3 năm)

  • Các tổ chức tài chính lớn (ví dụ: Cerno Capital) đặt câu hỏi liệu "các chính sách khấu hao này có thực sự phản ánh thực tế kinh tế và công nghệ hay chỉ là một chiến lược 'đánh lừa thị giác' để phân tán sự chú ý của nhà đầu tư"

4. Sử dụng cấu trúc SPV (pháp nhân mục đích đặc biệt)

  • Các công ty công nghệ lớn huy động vốn xây data center thông qua liên doanh SPV với các quỹ đầu tư tư nhân như Apollo

    • SPV sở hữu và vận hành data center, sau đó cung cấp lại cho công ty công nghệ theo hợp đồng thuê dài hạn
    • Nợ của SPV không được phản ánh trên báo cáo tài chính của công ty công nghệ (xử lý off-balance-sheet)
    • Cấu trúc phổ biến là 10~30% vốn chủ sở hữu và 70~90% nợ
  • Cấu trúc này có lợi thế như bảo vệ xếp hạng tín dụng và giảm mức độ lộ ra của chi phí đầu tư, nhưng nếu tỷ lệ sử dụng data center giảm hoặc giá trị GPU giảm, tổn thất sẽ xuất hiện trước tiên ở tầng vốn mỏng (equity holder)

  • Hiện tài sản data center đã chiếm 10~22% trong danh mục của các REIT lớn, tăng mạnh từ mức ‘0’ chỉ 2 năm trước

5. Rủi ro cạnh tranh từ custom silicon

  • Việc sử dụng các bộ tăng tốc AI do chính công ty phát triển đang lan rộng, như Microsoft (Maia), Google (TPU), Amazon (Trainium/Inferentia), Meta (MTIA)
  • Nếu khách hàng chuyển sang chip tự phát triển, giá trị tài sản thế chấp bằng GPU của CoreWeave và các bên tương tự có thể giảm, đồng thời khuếch đại rủi ro vendor financing của Nvidia

Khác biệt cốt lõi giữa Nvidia và Lucent

  • Lucent: thao túng doanh thu 1,1 tỷ USD, 10 lãnh đạo bị SEC truy tố, báo cáo tài chính mất độ tin cậy
  • Nvidia: được PwC kiểm toán, nâng hạng tín dụng, tạo ra hơn 50 tỷ USD tiền mặt mỗi năm và duy trì 46,2 tỷ USD tiền mặt ròng (2024)
  • Lucent: phần lớn khách hàng dùng đòn bẩy nợ quá mức và đang thua lỗ
  • Nvidia: các khách hàng lớn như Microsoft, Alphabet, Amazon và Meta có nền tảng cơ bản vững hơn, với 451 tỷ USD dòng tiền hoạt động trong năm 2024
  • Lucent đầu tư vào hạ tầng mà mức sử dụng chỉ đạt 0,002%, trong khi các khách hàng lớn của Nvidia đang báo cáo tình trạng thiếu hụt hạ tầng AI (bị giới hạn về nguồn cung)

Các chỉ số cần theo dõi

  1. Tỷ lệ sử dụng GPU: cần theo dõi liên tục xem GPU trong data center có được sử dụng đủ hay chỉ là tích trữ tồn kho
  2. Khả năng sinh lời của OpenAI: cần xác nhận việc xây dựng hạ tầng quy mô lớn có chuyển hóa thành doanh thu đủ mạnh hay không
  3. Dấu hiệu nợ xấu: cần kiểm tra dấu hiệu mất khả năng thanh toán trong thị trường vay thế chấp bằng GPU quy mô 15 tỷ USD
  4. Xu hướng quản lý AR (Accounts Receivable): tỷ lệ AR đang cải thiện (68%→30%), nhưng vẫn cần cảnh giác với khả năng xấu đi thêm
  5. Đa dạng hóa khách hàng: cần tiếp tục theo dõi việc mở rộng sang tệp khách hàng mới và mức độ phụ thuộc vào một số ít khách hàng lớn
  6. Vấn đề custom silicon: nếu hyperscaler chuyển sang chip tự phát triển, rủi ro phơi bày tài chính của Nvidia sẽ tăng lên
  7. Xu hướng hợp nhất nhà cung cấp: sau khi thị trường thử nghiệm nhiều phương án thay thế, nhu cầu cuối cùng có thể tập trung vào một số vendor nhất định
  • Tỷ lệ sử dụng AI thực tế tại Mỹ đã tăng mạnh từ 20% năm 2023 lên 40% năm 2025
  • Tuy nhiên, theo nghiên cứu của MIT, 95% các pilot triển khai AI vẫn chưa tạo ra kết quả tài chính thực chất, cho thấy vấn đề tích hợp vẫn tồn tại
  • Dù vậy, cũng có những tín hiệu tích cực như lương của lao động AI tăng gấp đôi và năng suất người dùng cải thiện tới 40%
  • OpenAI ghi nhận doanh thu 4,3 tỷ USD trong nửa đầu năm 2025 nhưng lỗ 4,7 tỷ USD (một nửa là bồi thường bằng cổ phiếu), nên vẫn đang trong tình trạng thua lỗ
  • Khác với quá khứ, các khách hàng lớn hiện nay duy trì lượng tiền mặt dồi dào, quản trị theo hiệu quả và có nhu cầu hạ tầng thực tế

Kết luận: Rủi ro cấu trúc của tài chính tuần hoàn và thị trường AI năm 2025

  • Chiến lược vendor financing quy mô lớn của Nvidia rõ ràng đang tận dụng tăng trưởng và nhu cầu công nghệ, nhưng vẫn chứa đựng các rủi ro như tập trung khách hàng, biến động giá trị tài sản và việc áp dụng custom silicon
  • Giống như trường hợp Lucent, nếu xảy ra định giá tài sản quá cao, nợ xấu hoặc suy giảm tính minh bạch kế toán, rủi ro có thể nhanh chóng trở thành hiện thực; vì vậy cần giám sát nghiêm ngặt các chỉ số chủ chốt và xu hướng thị trường

Phụ lục: Gian lận kế toán của Lucent và khủng hoảng tài chính tuần hoàn

  • Lucent bị SEC điều tra vì gian lận kế toán năm 2000 (thao túng 1,15 tỷ USD doanh thu và 470 triệu USD lợi nhuận trước thuế)
    • ‘Channel stuffing’: đẩy trước sản phẩm chưa bán được cho nhà phân phối rồi ghi nhận toàn bộ là doanh thu
    • ‘Side agreement’: ngoài hợp đồng phân phối còn cấp quyền trả hàng và ưu đãi đặc biệt nhưng vẫn ghi nhận doanh thu
    • ‘Thao túng khoản dự phòng’: giảm biến động kết quả kinh doanh bằng cách trích lập và hoàn nhập dự phòng tổn thất quá mức
  • Lucent bị phạt 250 triệu USD và 10 lãnh đạo bị truy tố
  • Trường hợp tiêu biểu là Lucent cấp 2 tỷ USD tài chính cho WinStar, sau đó WinStar phá sản và Lucent ghi nhận khoản lỗ 700 triệu USD
  • Theo mô hình này, trong giai đoạn 2001~2002 Lucent đã phải trích lập 3,5 tỷ USD dự phòng nợ xấu, trở thành ví dụ điển hình cho việc rủi ro tín dụng thực chất bộc lộ ra ngoài

1 bình luận

 
GN⁺ 2025-10-06
Ý kiến trên Hacker News
  • Tôi từng làm ở một ISP nhỏ trong khu phố vào thập niên 90, khi đó Lucent đi đầu trong lĩnh vực thiết bị internet, chúng tôi dùng Portmaster 3 để xử lý kết nối dial-up và cũng đã xem xét công nghệ không dây đời đầu của Lucent
    Nhờ Đạo luật Viễn thông năm 1996 (Telecommunications Act 1996), các công ty viễn thông buộc phải cho bên khác thuê hạ tầng, khiến giá thuê T1 của các ISP giảm mạnh (T1 từ 1.800 USD/tháng năm 96 xuống còn 600 USD vào năm 99), sau đó các công ty viễn thông kiện FCC và đến năm 2003 thì đạo luật này trên thực tế bị vô hiệu hóa
    Giải thích trên Wiki về competitive local exchange carrier

    • Giá cả chênh lệch rất lớn tùy khu vực, ISP nhỏ nơi tôi làm từng trả cho T1 từ 1.500 USD/tháng xuống 500 USD, sau đó T1 loop đến khách hàng là 100 USD/tháng, còn vòng OC12 SONET để backhaul toàn bộ tuyến về datacenter thì tốn vài nghìn USD
      Nguyên nhân cốt lõi của toàn bộ biến động giá này là nghĩa vụ của ILEC phải bán tách riêng các thành phần thiết bị mạng theo luật viễn thông
      Phần lớn CLEC cũng rốt cuộc vẫn dùng hạ tầng vật lý của ILEC trong khu vực nên thay đổi về cấu trúc là rất lớn
      Điều thú vị là vào cuối thập niên 90, khi dial-up vẫn là chủ đạo, T1 PRI thoại (250 USD/tháng) lại rẻ hơn T1 dữ liệu (500 USD/tháng) nên được tận dụng rất nhiều
      Ngay cả sau khi đạo luật bị vô hiệu hóa, ILEC vẫn tiếp tục bán dịch vụ wholesale/unbundled, có vẻ họ đã nhận ra đây là một mảng lợi nhuận cao

    • Tôi từng làm ở một startup trong thời kỳ bùng nổ viễn thông
      Khi đó những công ty như Cisco còn mua cả các startup chưa có sản phẩm, IPO là lối thoát duy nhất, còn kỹ sư thì bị khóa 6 tháng
      Người may mắn thì kịp thoát ra qua IPO hoặc bán công ty trước khi thị trường lao dốc, còn sau khi bong bóng vỡ thì vốn cạn sạch và gần như mọi startup đều chết
      Sau nhiều năm trì trệ, các công ty IT mới mới bắt đầu hình thành trở lại

    • Nghe như chỉ 4 năm quy định thôi mà đã làm thay đổi cán cân quyền lực giữa các tập đoàn viễn thông và ISP nhỏ, điều này thực sự đáng chú ý
      Lập luận rằng một quy định cụ thể đã châm ngòi cho sự phát triển của internet lại trái ngược với dự đoán quen thuộc trước đây kiểu “không có tự do thì sẽ thất bại”
      Tôi chưa từng nghe lập luận rằng chỉ một đạo luật áp dụng ngắn ngủi như vậy lại là đủ

    • Việc bóp chết cạnh tranh trong viễn thông và cho phép độc quyền là một vấn đề lớn của hệ thống tư pháp
      Luật thì rất rõ ràng, nhưng tòa án trên thực tế đã phớt lờ ý chí lập pháp bằng lập luận kiểu “triển khai cáp quang quá đắt”
      Về giá cả thì dù các đường truyền như T1 hay OCx vẫn được dùng nhiều, giai đoạn 96-99 DSL đã xuất hiện và tạo áp lực kéo giá xuống rất mạnh

    • Những thay đổi về lập pháp có thể đã ảnh hưởng đến thời điểm diễn ra cuộc chiến giá và bong bóng viễn thông
      Nhưng bản thân cuộc chiến giá gần như là điều không thể tránh khỏi, và bong bóng cũng là hiện tượng rất dễ xảy ra
      Đầu tư hạ tầng viễn thông là phản ứng trước việc giá cổ phiếu dot-com tăng điên cuồng

  • Mạng quang khi đó chỉ sử dụng chưa tới 0,002% công suất tối đa và vẫn còn dư địa tăng tốc độ tới 60.000 lần, chỉ là quá sớm so với thời điểm
    Tôi không nghĩ GPU cũng sẽ bị dư thừa theo cách đó
    Nếu có thể dùng theo kiểu “hãy suy nghĩ suốt đêm về codebase này, tìm cách refactor tốt hơn rồi ngày mai đề xuất”, thì nhu cầu GPU sẽ còn lớn hơn rất nhiều so với bây giờ
    Nếu 1 phút GPU giá 0,1 USD thì chạy qua đêm là 48 USD, có vẻ rất đáng tiền (dù là cải thiện code, thiết kế ô tô, bìa sách hay kế hoạch kinh doanh)

    • Tôi cũng không nghĩ GPU sẽ mãi dư thừa, nhưng tôi lại cho rằng cuối cùng chắc chắn sẽ dư
      Doanh nghiệp cứ tiếp tục mua GPU như thể nguồn cung đổ ra bao nhiêu cũng sẽ có nhu cầu hấp thụ vô hạn
      Trong khi đó sự mệt mỏi với LLM đang đến, mô hình ngày càng nhỏ hơn và phần cứng tiêu dùng cũng đang tiến bộ
      Kết cục là sẽ có rất nhiều GPU nhàn rỗi

    • Lập luận rằng cải thiện code sẽ cần GPU thực ra còn là chuyện nhỏ
      Chẳng bao lâu nữa generative AI sẽ được dùng để tạo phim siêu độ phân giải, thậm chí cả HDR và 120 khung hình/giây
      Những tác vụ như vậy sẽ tiêu tốn 100-1000 USD mỗi phút và cần lượng GPU khổng lồ
      Quân đội Mỹ cũng đã lên kế hoạch dùng generative AI cho trực quan hóa chiến trường, việc này còn cần tính toán dày đặc hơn cả video độ phân giải cao

    • Ý tưởng AI có thể “cải thiện” codebase nghe khá thú vị
      Tôi chưa từng thấy nó thực sự cải thiện được trong thực tế, nên phải tận mắt thấy thì tôi mới tin

    • Với các cải tiến về thuật toán và kỹ thuật, phần cứng cũ vẫn có thể tiếp tục hữu ích

    • Hình dung kiểu “hãy suy nghĩ về codebase qua đêm...” về cơ bản là một tiền đề sai
      LLM hiện tại không thể tự mình giải quyết các vấn đề thực chất một cách độc lập
      Nhiều người hy vọng một ngày nào đó sẽ làm được, nhưng tôi thuộc phe cho rằng hiện tại đã gần với giới hạn năng lực của LLM
      Bong bóng AI mới nhất là hệ quả của việc diễn giải quá mức giai đoạn đầu của đường cong S công nghệ
      Tính đến hôm nay thì vẫn chưa đủ

  • Lịch sử các bong bóng trước đây cũng có giá trị tham khảo phần nào, nhưng không quá có ý nghĩa
    Bong bóng dot-com, bong bóng đường sắt, mỗi thời điểm đều khác
    Cốt lõi là tính khả thi kinh doanh và ROI
    Ngay cả khi dòng tiền nhìn có vẻ lành mạnh, nếu lợi nhuận kinh tế không mang tính lịch sử thì cuối cùng vẫn có nguy cơ sụp đổ
    Ai cũng đang đuổi theo con ngỗng đẻ trứng vàng

    • Việc Bezos nhắc đến kế hoạch xây các datacenter hơn 10GW trong không gian khiến tôi nghĩ rằng mục tiêu ở đây có thể không phải ROI mà là cấu trúc quyền lực tương lai, tức xây dựng một thế giới nơi giới siêu giàu không còn cần lao động nữa
      HN comment liên quan
      Bài báo về phát biểu datacenter ngoài không gian của Bezos

    • Nếu cứ ám ảnh với các cơ chế trong quá khứ thì ta sẽ tự giới hạn quá mức không gian khả năng của tương lai
      Vì ngay cả bong bóng dot-com cũng chỉ diễn ra theo một trong rất nhiều “con đường có thể xảy ra”
      Nhìn theo cách đó, ta cũng có thể bỏ lỡ cách bong bóng tiếp theo sẽ hiện thực hóa

    • Tôi lo rằng khác biệt trong cách hạch toán giữa Lucent và Nvidia, Microsoft, OpenAI, Google thực ra chỉ là “nghệ thuật nói dối tinh vi hơn và phóng đại nhiều hơn thực tế” đã phát triển hơn mà thôi
      Phải đến khi bong bóng nổ thì các con số thật mới lộ ra

    • Lần này lại còn có tiền pháp định và sự chống lưng của chính phủ, nên lại càng khác quá khứ

  • Tôi đã ở ngay giữa vụ sụp đổ dot-com và viễn thông, đặc biệt viễn thông còn nghiêm trọng hơn nhiều
    Cáp quang thì không gỉ, nhưng đã bị lắp đặt dư thừa đến mức khổng lồ, và 10 năm sau nhờ công nghệ DWDM, trong 8 sợi thì thực tế chỉ cần dùng 2 sợi (với số bước sóng áp dụng đa dạng hơn rất nhiều trước đây)
    Tôi tò mò giá trị đồ cũ của GPU sau 10 năm sẽ ra sao, và liệu với số GPU bị đầu tư quá mức có xuất hiện một “giải pháp kiểu DWDM” nào chen vào hay không
    Chúng ta đang sống trong một thời điểm cực kỳ thú vị

  • Vấn đề lớn nhất của Nvidia là doanh thu của họ không có tính vĩnh viễn, nhưng thị trường lại định giá nó như doanh thu lặp lại, trong khi thực tế đây là CAPEX chỉ kéo dài khoảng 1-2 năm
    Tôi đơn giản là không thấy cấu trúc này có thể kéo dài mãi được

    • Cổ phiếu NVDA không hề đắt đến mức cực đoan, P/E chỉ khoảng 25 lần EPS
      Doanh thu đang tăng rất nhanh và trước mắt là cuộc chuyển đổi công nghệ quan trọng nhất lịch sử
      Thị trường cũng đã phần nào phản ánh khả năng tăng trưởng chậm lại vào giá cổ phiếu rồi

    • Những công ty như Zoom hay Peloton từng được chú ý trong thời COVID cũng tương tự, thị trường đã giả định tương lai đó sẽ kéo dài mãi
      Cấu trúc thị trường luôn lặp lại kiểu mẫu này, gần đây hơn thì 3D printing và thịt thay thế cũng vậy
      Đầu tư vào OpenAI có thể được hiểu như một khoản hedge trước việc CAPEX chậm lại

    • Nvidia cứ mỗi lần công bố là card đồ họa lại cháy hàng ngay
      Biên lợi nhuận cực cao nhưng họ vẫn không đáp ứng hết được nhu cầu

    • Rốt cuộc đây chỉ là logic kinh tế đơn giản
      Chỉ cần nhu cầu hụt nhịp một lần thôi là GPU cũ sẽ tràn ngập thị trường, và không ai còn cần mua hàng mới nữa
      Khi đó Nvidia sẽ không thể duy trì doanh thu hiện tại được

    • TSLA cũng vậy
      Thị trường chứng khoán về cơ bản là ngân hàng cho người giàu, được gói lại dưới dạng các khoản vay và tín dụng
      Thực chất là bong bóng, nhưng đó là chuyện chỉ giới giàu mới thật sự bận tâm
      Những người bình thường như chúng ta chỉ là cá con mà thôi

  • Khi làm việc tại “telecom của mọi telecom”, chúng tôi phải đến tận năm 2015 mới thực sự thắp sáng đám dark fiber được lắp từ 15 năm trước nhờ nhu cầu dữ liệu di động
    Quy mô lắp đặt dư thừa thực sự khổng lồ
    Cáp quang thì lúc nào cũng hữu ích, còn GPU có dùng được lâu như thế không thì tôi nghi ngờ
    Tôi nói từ trải nghiệm cá nhân

    • Cáp quang mới không thực sự hiệu quả năng lượng hơn bao nhiêu
      Nhưng hiệu suất của chiếc máy xúc đào đất thì cũng chẳng thay đổi chút nào

    • Với câu hỏi “mấy cái card này có dùng lâu được không?”, theo ví dụ nêu trong bài thì chúng có thể chỉ thọ 1-2 năm do chịu tải quá nặng

    • Vào năm 2005, nhờ cước gọi đường dài mà telecom là một con bò sữa tiền mặt, và nơi nào vẫn còn tổng đài cơ khí đã khấu hao xong thì gần như in tiền (quy định bảo đảm lợi nhuận)
      Nhưng cấu trúc đó cũng không kéo dài được lâu, nên ở nhiều khu vực họ bắt đầu mở rộng sang managed services để tìm “doanh thu phi điều tiết” (ví dụ như các giải pháp kiểu DataDog)
      Bản chất của kinh doanh là vậy, sự lạc quan phi lý lúc nào cũng có thể đánh sập doanh nghiệp

    • Bản thân con chip có thể không sống lâu, nhưng R&D bên trong nó thì vẫn còn giá trị
      Vấn đề là thu hồi được bao nhiêu giá trị đó

    • Tôi cho rằng các datacenter mật độ cao đang được xây để phục vụ hyperscaler về cơ bản rất giống với việc lắp dư dark fiber
      Khi họ thắp sáng các tuyến cáp vào năm 2015, chắc hẳn họ không còn dùng nguyên line card mua từ năm 1998 nữa

  • Về căn bản, tôi nghĩ vấn đề lớn nhất là sự bất định quanh việc đạt được AGI
    90% khoản đầu tư top-line hiện nay đang dồn vào giả định rằng điều đó sẽ đạt được trong vòng 2-5 năm
    Nếu nó không đến đủ nhanh thì nguy cơ sự quan tâm của nhà đầu tư sụt mạnh là rất lớn
    Hiện vẫn đang duy trì hứng thú bằng tăng trưởng benchmark, nhưng tôi dự đoán 6-12 tháng nữa thì các cột mốc mới cũng sẽ cạn
    Bước tiếp theo thực sự là phải cho thấy kết quả thật trong phát triển phần mềm, nghiên cứu ung thư, robotics và các lĩnh vực tương tự
    Với cấu trúc hiện tại, tôi không nghĩ làm được

    • Tôi cho rằng AGI còn xa
      Cơ hội lớn nhất nằm ở những lĩnh vực như luật và y khoa, nơi cơ sở tri thức quá đồ sộ đến mức con người phải học sau đại học mới nắm được
      Việc lập trình đặc biệt sẽ hưởng lợi nhiều từ LLM
      Vấn đề là sau khi xử lý xong đống việc tồn như refactor những đoạn mã khó chịu, thì chỉ riêng việc sinh code mới sẽ không bao giờ đủ để duy trì bong bóng nhu cầu phần cứng như hiện nay

    • Ngay cả các hyperscaler cũng còn chưa dùng đến một nửa dòng tiền hoạt động cho CAPEX AI
      Nếu thực sự đang cược vào việc đạt AGI thì quy mô phải còn lớn hơn rất nhiều

    • “Sự hoài nghi hiện tại của anh cũng có thể vô căn cứ không kém kiểu hoài nghi 5 năm trước rằng ‘máy biết suy nghĩ là bất khả thi’, vì giờ LLM đã xuất hiện rồi”

    • Tôi không hiểu vì sao mọi người lại downvote
      Chỉ cần nói chuyện với các nhà nghiên cứu AI là sẽ có được mức kỳ vọng thực tế hơn
      Nhưng càng là người làm kinh doanh, không hiểu công nghệ, thì lại càng ôm kỳ vọng quá mức
      Họ tính theo kiểu “20 USD/tháng cho ChatGPT là sẽ làm hết việc”, rồi đã bắt đầu cắt nhân sự và điều chỉnh ngân sách, kế hoạch, tuyển dụng dựa trên giả định đó
      Một năm nữa nếu rõ ràng không hiệu quả, thái độ với AI sẽ lập tức đảo chiều hoàn toàn (giận dữ, né tránh, mất niềm tin vào sản phẩm mới...)
      Nếu thất bại tích lũy nhiều lên, tốc độ tăng trưởng sẽ chậm lại, rồi kéo theo lo lắng của nhà đầu tư, giá cổ phiếu lao dốc và định giá giảm mạnh

  • Điều tôi không hiểu là sự lạc quan rằng nhu cầu GPU cho “training” sẽ còn tiếp tục tăng mạnh như bây giờ
    Tôi hiểu nhu cầu inference, nhưng đã có rất nhiều mô hình miễn phí rất tốt, lại còn chạy ổn trên thiết bị tiêu dùng như Apple M4 hay AMD Max APU
    Trong bối cảnh đó, tôi nghi ngờ liệu nhu cầu đầu tư thêm vào GPU có thực sự còn lớn đến vậy không

    • Tôi cho rằng Reinforcement Learning sẽ là chiến trường GPU mới
      Ví dụ: o1, o3, GPT-5, Sonnet 3.7, 4, 4.5 và các thay đổi liên quan
      Một khi ai cũng có thể chạy inference trên B200 thì mô hình có thể lại phình to hơn, nhưng hiện tại cơn khát GPU lớn nhất nằm ở ngân sách huấn luyện RL

    • Nhưng cũng có ý kiến cho rằng mục tiêu tối hậu rốt cuộc vẫn là cuộc đua vô hạn nhằm chạy nhiều GPU hơn để tiến gần hơn một bước tới AGI

    • Tôi đoán các kiến trúc Continuous Learning sẽ là yếu tố tiếp theo thúc đẩy nhu cầu GPU

    • Xét về chi phí, inference cuối cùng sẽ rẻ nhất nếu đi theo mô hình chia sẻ trên cloud
      Phần lớn use case B2B rồi sẽ chuyển sang hạ tầng datacenter như AWS
      Một số trường hợp đặc thù (CERN hay Apple Siri) có thể dùng phần cứng chuyên dụng như FPGA hoặc ASIC công suất thấp, còn ngoài ra thì “cloud-based” sẽ ngày càng trở thành tiêu chuẩn

  • Trong bong bóng dot-com, quảng cáo đã tạo ra hiệu ứng tuần hoàn
    VC rót tiền vào startup, rồi startup dùng số tiền đó mua quảng cáo trên Yahoo và các nền tảng tương tự
    Doanh thu Yahoo tăng vọt làm giá cổ phiếu đi lên, điều này trở thành tín hiệu rằng internet đang kiếm ra tiền, từ đó mở rộng thị trường IPO cho các startup khác
    Tiền càng quay vòng thì chu trình quảng cáo → doanh thu → vốn hóa → thêm đầu tư VC → thêm quảng cáo lại càng tiếp diễn

  • Trong tài liệu tham khảo số 14 có nói OpenAI sẽ không mua đứt GPU của Nvidia mà sẽ dùng theo hình thức thuê (lease),
    Nên tôi thấy khó hiểu khi Nvidia lại diễn đạt rằng họ đã “đầu tư vào đây”
    Nếu là thuê thì chỉ đơn giản là thu tiền thuê thôi, sao lại gọi là đầu tư? Nvidia đã “đầu tư” cái gì ở đây?

    • Nvidia phải bỏ vốn trước khi sản xuất và cung cấp GPU từ ban đầu, và nếu việc phân bổ tài sản này cuối cùng không thể quyết toán trọn vẹn được (ví dụ khách hàng phá sản) thì họ sẽ phải gánh rủi ro
      Đổi lại cho việc chấp nhận rủi ro đó, họ kỳ vọng có phần thưởng bổ sung, nên bản thân cấu trúc này mang tính chất của một khoản đầu tư

    • Tôi không phải chuyên gia kế toán, nhưng tôi nghĩ khi hợp đồng lease kết thúc thì Nvidia chỉ còn nắm trong tay tài sản đã khấu hao với giá trị thấp
      Không giống lease xe, thị trường đồ cũ cho GPU có lẽ không quá lớn
      Nói cách khác, Nvidia đang cung cấp GPU theo kiểu “trả góp” chứ không thu đủ tiền ngay từ đầu
      Tôi cũng tò mò tổng số tiền lease có tương đương với giá vốn hay không