- AWS đã tăng khoảng 15% giá GPU cho EC2 Capacity Blocks for ML, với mức giá theo giờ của các instance p5e.48xlarge và p5en.48xlarge tại hầu hết khu vực lần lượt tăng từ $34.61→$39.80 và $36.18→$41.61
- Tại khu vực US West (Northern California), mức tăng còn lớn hơn, từ $43.26→$49.75
- AWS giải thích qua email rằng “điều chỉnh lần này phản ánh các mô hình cung và cầu”
- Đợt tăng này diễn ra sau khi trước đó công bố giảm tối đa 45% giá instance GPU (7 tháng trước), và là một trường hợp hiếm hoi AWS trực tiếp tăng giá
- Đây là một sự kiện cho thấy quy tắc bất thành văn về việc giá cloud chỉ giảm đang bị phá vỡ, và có thể ảnh hưởng tới các dịch vụ tài nguyên khác trong tương lai
Tổng quan về đợt tăng giá GPU của AWS
- AWS đã tăng khoảng 15% giá EC2 Capacity Blocks for ML vào thứ Bảy cuối tuần
- Instance p5e.48xlarge tăng từ $34.61 lên $39.80 mỗi giờ, còn p5en.48xlarge tăng từ $36.18 lên $41.61
- Ở khu vực US West (Northern California), giá tăng từ $43.26 lên $49.75, biên độ tăng lớn hơn
- Trên trang giá chính thức của AWS có dòng “giá sẽ được cập nhật vào tháng 1/2026”, nhưng không nêu rõ là sẽ tăng
- AWS cho biết qua email rằng “giá biến động theo các mô hình cung và cầu, và điều chỉnh lần này phản ánh mô hình dự kiến của quý đó”
Bản chất của Capacity Blocks và nhóm người dùng
- Capacity Blocks là hình thức đặt trước và được đảm bảo tài nguyên GPU vào một thời điểm cụ thể, nhằm vận hành ổn định các tác vụ huấn luyện ML
- Có thể đặt trước instance GPU cho một khoảng thời gian xác định, từ một ngày đến vài tuần sau, và trả trước theo mức giá cố định
- Khách hàng sử dụng dịch vụ này phần lớn là các nhóm doanh nghiệp thực hiện dự án ML quy mô lớn, với ngân sách ở mức hàng triệu USD
- AWS từng giảm tối đa 45% giá on-demand và Savings Plans cho instance GPU cách đây 7 tháng, nhưng lần tăng này chỉ áp dụng cho Capacity Blocks
Tác động tới ngành và khách hàng
- AWS trước đây cũng từng điều chỉnh giá, nhưng việc tăng trực tiếp từng hạng mục giá (line-item increase) là trường hợp hiếm
- Trước đó, cách làm phổ biến là thay đổi cấu trúc giá hoặc quảng bá rằng “đa số khách hàng thực tế được giảm giá”
- Đợt tăng này tạo ra một điểm so sánh có lợi cho Azure và GCP
- Hai đối thủ này đang tích cực thu hút workload ML, và việc “AWS tăng giá GPU 15%” có thể trở thành vũ khí bán hàng
- Với các khách hàng doanh nghiệp dùng Enterprise Discount Program (EDP), dù tỷ lệ chiết khấu được giữ nguyên thì chi phí thực tế vẫn tăng do giá cơ sở đã cao hơn
Tình hình thị trường và triển vọng sắp tới
- Trong bối cảnh nguồn cung GPU toàn cầu vẫn bị hạn chế, đợt tăng này được xem là tín hiệu của mất cân bằng cung cầu
- Trong 20 năm, AWS đã tạo ra nhận thức rằng “giá luôn đi xuống”, nhưng động thái lần này khiến tiền đề đó sụp đổ
- Một khi đã tăng giá một lần và phản ứng thị trường không lớn, khả năng tăng thêm trong tương lai sẽ cao hơn
- Bài viết cũng đề cập khả năng những điều chỉnh tương tự có thể xuất hiện ở các dịch vụ khác như instance Graviton hay chi phí truyền dữ liệu
- Bài báo mô tả rằng “niềm tin cho rằng giá cloud chỉ đi theo một hướng đã biến mất vào một ngày thứ Bảy của tháng 1/2026”
Kết luận
- Đợt tăng giá GPU lần này được xem là bước ngoặt trong chính sách giá của AWS
- Đây cũng là dấu mốc làm lung lay niềm tin vào sự ổn định chi phí trên thị trường cloud,
đồng thời làm dấy lên khả năng sẽ còn thêm các đợt tăng giá với những nguồn lực đang bị hạn chế về cung
1 bình luận
Ý kiến trên Hacker News
Nhìn cảnh giá GPU, RAM và ổ cứng đều tăng, người ta dễ hình dung ra một tương lai nơi máy tính gia đình bị thay bằng thin client và mọi tác vụ tính toán đều chuyển sang dịch vụ thuê bao
Những khẩu hiệu kiểu “không cần dung lượng lưu trữ, hãy dùng thuê bao đám mây”, “không cần hiệu năng xử lý, hãy stream game” có thể sẽ trở thành hiện thực
Các hãng game đã bắt đầu xem xét mô hình tính phí theo giờ, nên cấu trúc của những game như Call of Duty hay GTA có thể thay đổi hoàn toàn
Vật liệu lưu trữ vật lý biến mất, dung lượng iPhone cũng giảm đi và mọi thứ có thể bị ép đưa lên iCloud
Điều đó cũng gợi ra một xã hội nơi thay vì sở hữu ô tô thì dùng xe tự lái chia sẻ, còn cửa hàng bán lẻ ngoại tuyến đóng cửa để nhường chỗ cho giao hàng bằng drone
Cụm “hopes you weren't paying attention” trong tiêu đề bài báo nghe có vẻ giật gân quá mức
Có vẻ đây chỉ là quy luật thị trường đơn giản khi nhu cầu GPU và RAM vượt cung
Về bài viết nói AWS tăng giá, cách ghi “sắp cập nhật” mà không nói rõ là tăng hay giảm khiến mọi thứ trở nên khó hiểu
Những người đã là khách hàng không kiểm tra trang giá mỗi ngày, nên kiểu thông báo này thực chất là giao tiếp thiếu minh bạch
Có ý kiến chỉ trích việc kéo dài thời gian khấu hao GPU từ 3 năm lên 5 năm, nhưng lần tăng giá này dường như lại cho thấy vòng đời giá trị của GPU đang dài ra
AI trên đám mây với phần lớn doanh nghiệp chỉ là thuế tiện lợi (convenience tax)
Tài liệu, dự báo, giám sát, hỗ trợ, hệ thống điều khiển... đều có thể xử lý đủ tốt bằng mô hình cục bộ. Nếu tính đến data gravity, độ trễ và quyền riêng tư thì sở hữu phần cứng edge còn hợp lý hơn
Có vẻ toàn bộ ngành AI sắp phải đối mặt với cú sốc giá
AI đang hút hết tài nguyên và làm nghẹt thở các ngành khác
Không biết có dịch vụ nào theo dõi biến động giá GPU theo từng giờ không
Thấy Corey Quinn xuất hiện trên The Register thì khá vui
Chi tiêu vốn tăng mạnh do mua GPU số lượng lớn đang đẩy nhu cầu lên cả với những linh kiện khác như bộ nhớ
Nhưng vẫn phải đặt câu hỏi liệu số GPU đó thực sự đang được sử dụng đến mức nào. Không khỏi nghĩ rằng phải chăng chúng ta đang trả tiền cho hàng tồn kho nhàn rỗi