1 điểm bởi GN⁺ 2026-01-07 | 1 bình luận | Chia sẻ qua WhatsApp
  • AWS đã tăng khoảng 15% giá GPU cho EC2 Capacity Blocks for ML, với mức giá theo giờ của các instance p5e.48xlarge và p5en.48xlarge tại hầu hết khu vực lần lượt tăng từ $34.61→$39.80$36.18→$41.61
  • Tại khu vực US West (Northern California), mức tăng còn lớn hơn, từ $43.26→$49.75
  • AWS giải thích qua email rằng “điều chỉnh lần này phản ánh các mô hình cung và cầu
  • Đợt tăng này diễn ra sau khi trước đó công bố giảm tối đa 45% giá instance GPU (7 tháng trước), và là một trường hợp hiếm hoi AWS trực tiếp tăng giá
  • Đây là một sự kiện cho thấy quy tắc bất thành văn về việc giá cloud chỉ giảm đang bị phá vỡ, và có thể ảnh hưởng tới các dịch vụ tài nguyên khác trong tương lai

Tổng quan về đợt tăng giá GPU của AWS

  • AWS đã tăng khoảng 15% giá EC2 Capacity Blocks for ML vào thứ Bảy cuối tuần
    • Instance p5e.48xlarge tăng từ $34.61 lên $39.80 mỗi giờ, còn p5en.48xlarge tăng từ $36.18 lên $41.61
    • Ở khu vực US West (Northern California), giá tăng từ $43.26 lên $49.75, biên độ tăng lớn hơn
  • Trên trang giá chính thức của AWS có dòng “giá sẽ được cập nhật vào tháng 1/2026”, nhưng không nêu rõ là sẽ tăng
  • AWS cho biết qua email rằng “giá biến động theo các mô hình cung và cầu, và điều chỉnh lần này phản ánh mô hình dự kiến của quý đó”

Bản chất của Capacity Blocks và nhóm người dùng

  • Capacity Blocks là hình thức đặt trước và được đảm bảo tài nguyên GPU vào một thời điểm cụ thể, nhằm vận hành ổn định các tác vụ huấn luyện ML
    • Có thể đặt trước instance GPU cho một khoảng thời gian xác định, từ một ngày đến vài tuần sau, và trả trước theo mức giá cố định
  • Khách hàng sử dụng dịch vụ này phần lớn là các nhóm doanh nghiệp thực hiện dự án ML quy mô lớn, với ngân sách ở mức hàng triệu USD
  • AWS từng giảm tối đa 45% giá on-demand và Savings Plans cho instance GPU cách đây 7 tháng, nhưng lần tăng này chỉ áp dụng cho Capacity Blocks

Tác động tới ngành và khách hàng

  • AWS trước đây cũng từng điều chỉnh giá, nhưng việc tăng trực tiếp từng hạng mục giá (line-item increase) là trường hợp hiếm
    • Trước đó, cách làm phổ biến là thay đổi cấu trúc giá hoặc quảng bá rằng “đa số khách hàng thực tế được giảm giá”
  • Đợt tăng này tạo ra một điểm so sánh có lợi cho Azure và GCP
    • Hai đối thủ này đang tích cực thu hút workload ML, và việc “AWS tăng giá GPU 15%” có thể trở thành vũ khí bán hàng
  • Với các khách hàng doanh nghiệp dùng Enterprise Discount Program (EDP), dù tỷ lệ chiết khấu được giữ nguyên thì chi phí thực tế vẫn tăng do giá cơ sở đã cao hơn

Tình hình thị trường và triển vọng sắp tới

  • Trong bối cảnh nguồn cung GPU toàn cầu vẫn bị hạn chế, đợt tăng này được xem là tín hiệu của mất cân bằng cung cầu
  • Trong 20 năm, AWS đã tạo ra nhận thức rằng “giá luôn đi xuống”, nhưng động thái lần này khiến tiền đề đó sụp đổ
  • Một khi đã tăng giá một lần và phản ứng thị trường không lớn, khả năng tăng thêm trong tương lai sẽ cao hơn
  • Bài viết cũng đề cập khả năng những điều chỉnh tương tự có thể xuất hiện ở các dịch vụ khác như instance Graviton hay chi phí truyền dữ liệu
  • Bài báo mô tả rằng “niềm tin cho rằng giá cloud chỉ đi theo một hướng đã biến mất vào một ngày thứ Bảy của tháng 1/2026

Kết luận

  • Đợt tăng giá GPU lần này được xem là bước ngoặt trong chính sách giá của AWS
  • Đây cũng là dấu mốc làm lung lay niềm tin vào sự ổn định chi phí trên thị trường cloud,
    đồng thời làm dấy lên khả năng sẽ còn thêm các đợt tăng giá với những nguồn lực đang bị hạn chế về cung

1 bình luận

 
GN⁺ 2026-01-07
Ý kiến trên Hacker News
  • Nhìn cảnh giá GPU, RAM và ổ cứng đều tăng, người ta dễ hình dung ra một tương lai nơi máy tính gia đình bị thay bằng thin client và mọi tác vụ tính toán đều chuyển sang dịch vụ thuê bao
    Những khẩu hiệu kiểu “không cần dung lượng lưu trữ, hãy dùng thuê bao đám mây”, “không cần hiệu năng xử lý, hãy stream game” có thể sẽ trở thành hiện thực
    Các hãng game đã bắt đầu xem xét mô hình tính phí theo giờ, nên cấu trúc của những game như Call of Duty hay GTA có thể thay đổi hoàn toàn
    Vật liệu lưu trữ vật lý biến mất, dung lượng iPhone cũng giảm đi và mọi thứ có thể bị ép đưa lên iCloud
    Điều đó cũng gợi ra một xã hội nơi thay vì sở hữu ô tô thì dùng xe tự lái chia sẻ, còn cửa hàng bán lẻ ngoại tuyến đóng cửa để nhường chỗ cho giao hàng bằng drone

    • Giá dịch vụ thuê bao cũng đang tăng theo. Ai đã mua máy tính rồi thì còn cầm cự được vài năm, nhưng người dùng thuê đang bị ảnh hưởng ngay lập tức
    • Chiếc đồng hồ báo thức (Hatch.co) được tặng vào dịp Giáng sinh không hoạt động nếu không có thuê bao 50 USD/năm. Người tiêu dùng cần hiểu rõ hơn về tổng chi phí sở hữu (TCO). Có lẽ chính phủ nên bắt buộc dán nhãn chi phí hằng năm như với đồ gia dụng
    • Chuỗi cung ứng quá mong manh, và khi TSMC nắm 60% thị phần, nếu Trung Quốc xâm lược Đài Loan thì hơn một nửa sản lượng CPU và GPU toàn cầu có thể biến mất. Khi đó iPhone có thể ngừng bán hoàn toàn, còn một chiếc PC có thể lên tới 5.000 USD
    • MMORPG từ lâu đã dùng mô hình thuê bao theo tháng. Nhưng phần lớn game nếu chuyển sang tính phí theo giờ thì có lẽ doanh thu còn giảm, vì người ta mua rất nhiều game nhưng thực tế lại chơi rất ít
    • Xu hướng này đã được lý thuyết hóa bằng khái niệm Technofeudalism (chế độ phong kiến công nghệ) (liên kết Wikipedia)
  • Cụm “hopes you weren't paying attention” trong tiêu đề bài báo nghe có vẻ giật gân quá mức
    Có vẻ đây chỉ là quy luật thị trường đơn giản khi nhu cầu GPU và RAM vượt cung

    • Đây đúng kiểu tiêu đề giật gân đặc trưng của The Register. Có ý đồ kéo nhấp chuột, nhưng lần này rõ ràng đã hiệu quả
    • Nguồn cung GPU và RAM không thể thay đổi đột ngột chỉ trong một cuối tuần. Không có lý do gì đặc biệt để tăng giá vào thứ Bảy
    • Việc công bố tăng giá vào thứ Bảy, khi khách hàng không làm việc, là điều khó hiểu
    • Chỉ cần kiến thức kinh tế phổ thông bậc trung học cũng đủ để chỉ ra rằng các công ty như vậy từ trước đến nay chỉ tạo ra nợ nần và năng suất yếu kém
  • Về bài viết nói AWS tăng giá, cách ghi “sắp cập nhật” mà không nói rõ là tăng hay giảm khiến mọi thứ trở nên khó hiểu
    Những người đã là khách hàng không kiểm tra trang giá mỗi ngày, nên kiểu thông báo này thực chất là giao tiếp thiếu minh bạch

    • Có bình luận còn châm biếm cách thông báo của AWS bằng câu đùa trong The Hitchhiker’s Guide to the Galaxy rằng “tấm biển được để trong ngăn kéo phòng vệ sinh đang khóa lại”
  • Có ý kiến chỉ trích việc kéo dài thời gian khấu hao GPU từ 3 năm lên 5 năm, nhưng lần tăng giá này dường như lại cho thấy vòng đời giá trị của GPU đang dài ra

    • Tôi không phải chuyên gia, nhưng giá tăng cũng có thể là tín hiệu cho thấy tuổi thọ thực tế đang ngắn lại. Cả giảm cung lẫn tăng cầu đều có thể xảy ra. Cũng có thể nhu cầu GPU đang trở nên ít co giãn, khiến giá còn tăng thêm
    • Còn tùy NVIDIA đã thổi phồng mức tăng hiệu năng đến đâu. Nếu các cải tiến cấu trúc như thêm tính năng RL, tách prefill/decode, hay nvfp4 thực sự nâng hiệu quả, thì chip cũ vẫn còn rất hữu dụng
    • GPU cao cấp thực tế có thể dùng hơn 6 năm. Nếu làm mát tốt thì gần 10 năm cũng được. Đặc biệt các mẫu có từ 80GB VRAM trở lên có giá trị dài hạn cao
  • AI trên đám mây với phần lớn doanh nghiệp chỉ là thuế tiện lợi (convenience tax)
    Tài liệu, dự báo, giám sát, hỗ trợ, hệ thống điều khiển... đều có thể xử lý đủ tốt bằng mô hình cục bộ. Nếu tính đến data gravity, độ trễ và quyền riêng tư thì sở hữu phần cứng edge còn hợp lý hơn

    • Tôi cũng đang thử nghiệm LLM cho nhiều mục đích, nhưng vấn đề lớn hơn chi phí lại là độ tin cậy. Chênh lệch giữa 99,95% và 99% có thể gây tổn thất lớn hơn cả chi phí nhân công. Trong những lĩnh vực tính toán được kiểu này, tôi vẫn nghĩ con người tốt hơn
  • Có vẻ toàn bộ ngành AI sắp phải đối mặt với cú sốc giá

    • Nhóm của chúng tôi hoàn toàn không có kế hoạch nào cho trường hợp chi phí API và hạ tầng tăng vọt. Hiện tại vẫn đang nhét các tính năng AI gần như miễn phí vào để marketing, nhưng nếu chi phí thật sự xuất hiện thì có lẽ sẽ phải gỡ hết ra
    • Cuối cùng có lẽ nhiều nhu cầu sẽ chuyển sang mô hình open-weight của Trung Quốc. Trừ các mô hình cao cấp nhất, với đa số trường hợp sử dụng thì mức “good enough” đã là đủ
    • Cú sốc này sẽ không chỉ ảnh hưởng tới ngành AI mà tới mọi ngành
    • Là người dùng Claude, tôi cũng lo về kiểu tăng giá này
  • AI đang hút hết tài nguyên và làm nghẹt thở các ngành khác

    • Philip K. Dick và Frank Herbert từ lâu đã dự báo rất chính xác cấu trúc bất biến của chủ nghĩa tư bản như thế này
  • Không biết có dịch vụ nào theo dõi biến động giá GPU theo từng giờ không

    • Tôi đã phát triển computeprices.com như một side project suốt 1 năm qua cho đúng mục đích đó
    • AWS tăng giá một số instance cụ thể là chuyện hiếm. Nhưng vấn đề lớn hơn là sự thiếu minh bạch khi tăng giá mà không báo trước. Với khách hàng, đây là cách làm làm xói mòn niềm tin
  • Thấy Corey Quinn xuất hiện trên The Register thì khá vui

  • Chi tiêu vốn tăng mạnh do mua GPU số lượng lớn đang đẩy nhu cầu lên cả với những linh kiện khác như bộ nhớ
    Nhưng vẫn phải đặt câu hỏi liệu số GPU đó thực sự đang được sử dụng đến mức nào. Không khỏi nghĩ rằng phải chăng chúng ta đang trả tiền cho hàng tồn kho nhàn rỗi