Anthropic mở rộng gấp đôi hạn mức sử dụng Claude nhờ thỏa thuận năng lực tính toán với SpaceX

(anthropic.com)

2 điểm bởi GN⁺ 2026-05-07 | 5 bình luận | Chia sẻ qua WhatsApp

Anthropic thông báo sẽ mở rộng hạn mức sử dụng của Claude Code và Claude API thông qua quan hệ đối tác với SpaceX và nhiều thỏa thuận năng lực tính toán được ký gần đây
Giới hạn sử dụng trong 5 giờ của Claude Code được tăng gấp đôi (áp dụng cho các gói Pro, Max, Team và Enterprise theo số ghế), đồng thời loại bỏ việc cắt giảm hạn mức vào giờ cao điểm đối với tài khoản Pro và Max
API rate limits của mô hình Claude Opus đã được nâng lên đáng kể, và dung lượng bổ sung này trực tiếp cải thiện mức sử dụng khả dụng cho người đăng ký Claude Pro và Claude Max
Anthropic đã ký hợp đồng sử dụng toàn bộ năng lực tính toán của trung tâm dữ liệu Colossus 1 của SpaceX, qua đó có thể tiếp cận hơn 300MW công suất mới và hơn 220.000 GPU NVIDIA trong vòng một tháng
Việc mở rộng năng lực tính toán của Anthropic được thực hiện bên cạnh các thỏa thuận với Amazon, Google và Broadcom, Microsoft và NVIDIA, cùng Fluidstack; đồng thời cũng cân nhắc hạ tầng nội địa, gánh nặng chi phí điện và đầu tư cho cộng đồng địa phương

Mở rộng hạn mức sử dụng Claude

Anthropic tăng hạn mức sử dụng của Claude Code và Claude API thông qua quan hệ đối tác với SpaceX và nhiều thỏa thuận năng lực tính toán được ký gần đây
Cả 3 thay đổi đều có hiệu lực ngay trong ngày công bố
Giới hạn sử dụng trong 5 giờ của Claude Code được tăng gấp đôi cho các gói Pro, Max, Team và Enterprise theo số ghế
Đối với tài khoản Pro và Max, việc cắt giảm hạn mức vào giờ cao điểm của Claude Code đã được loại bỏ
API rate limits của mô hình Claude Opus cũng được nâng lên đáng kể

Quan hệ đối tác năng lực tính toán mới với SpaceX

Anthropic đã ký hợp đồng sử dụng toàn bộ năng lực tính toán của trung tâm dữ liệu Colossus 1 của SpaceX
Nhờ thỏa thuận này, công ty có thể tiếp cận hơn 300MW công suất mới và hơn 220.000 GPU NVIDIA trong vòng một tháng
Dung lượng bổ sung này trực tiếp cải thiện mức sử dụng khả dụng cho người đăng ký Claude Pro và Claude Max
Thỏa thuận lần này được bổ sung bên cạnh các công bố mở rộng năng lực tính toán lớn hiện có của Anthropic
- Thỏa thuận với Amazon lên tới 5GW: bao gồm khoảng 1GW công suất mới vào cuối năm 2026
- Thỏa thuận 5GW với Google và Broadcom: dự kiến bắt đầu vận hành từ năm 2027
- Quan hệ đối tác chiến lược với Microsoft và NVIDIA: bao gồm năng lực Azure trị giá 30 tỷ USD
- Khoản đầu tư 50 tỷ USD vào hạ tầng AI tại Mỹ cùng với Fluidstack
Quảng cáo
Quá trình huấn luyện và vận hành Claude sử dụng nhiều loại phần cứng AI như AWS Trainium, Google TPUs và NVIDIA GPUs
Anthropic cho biết sẽ tiếp tục tìm kiếm cơ hội để đưa thêm dung lượng lên trực tuyến
Trong khuôn khổ thỏa thuận với SpaceX, công ty cũng bày tỏ quan tâm đến việc hợp tác với SpaceX để phát triển năng lực tính toán AI trên quỹ đạo ở quy mô nhiều GW

Mở rộng quốc tế và hạ tầng nội địa

Khách hàng doanh nghiệp trong các ngành có mức độ quản lý nghiêm ngặt như dịch vụ tài chính, y tế và chính phủ ngày càng cần hạ tầng nội địa để đáp ứng yêu cầu về tuân thủ và lưu trú dữ liệu
Theo đó, một phần việc mở rộng năng lực của Anthropic đang được triển khai trên phạm vi quốc tế
Hợp tác được công bố gần đây với Amazon bao gồm thêm năng lực suy luận tại châu Á và châu Âu
Các khu vực được bổ sung công suất sẽ được lựa chọn cẩn trọng, với ưu tiên hợp tác cùng các quốc gia dân chủ có khung pháp lý và quy định đủ khả năng hỗ trợ đầu tư quy mô lớn
Việc bảo đảm chuỗi cung ứng an toàn cho phần cứng, mạng lưới và cơ sở vật chất cần cho năng lực tính toán cũng là một tiêu chí quan trọng

Chi phí điện và đầu tư cho cộng đồng địa phương

Anthropic gần đây đã công bố cam kết sẽ chi trả nếu các trung tâm dữ liệu tại Mỹ của hãng khiến hóa đơn điện của người tiêu dùng tăng lên
Trong khuôn khổ mở rộng quốc tế, công ty đang xem xét mở rộng cam kết này sang các khu vực pháp lý mới
Công ty cũng đang thúc đẩy các phương án hợp tác với lãnh đạo địa phương để tái đầu tư vào các cộng đồng nơi đặt cơ sở của mình

5 bình luận

snisty 2026-05-07

Liệu có thể mượn năng lực tính toán từ những chiếc PC nhàn rỗi trên khắp thế giới như kiểu P2P ngày xưa không nhỉ..
Thay vào đó hoàn lại bằng token có thể dùng API.. có vẻ Bitcoin từng có ý định như vậy
Nhưng chắc cuối cùng vẫn không được vì tốc độ truyền thông nhỉ..

blizard4479 2026-05-07

Lượng có thể dùng trong 5 giờ đã tăng gấp đôi, nhưng hạn mức theo tuần vẫn giữ nguyên, nên người dùng nặng chắc sẽ chạm giới hạn sử dụng nhanh hơn tương ứng.

laeyoung 2026-05-07

Không thấy nhắc đến giới hạn theo tuần nên vừa thấy ổn mà cũng hơi mơ hồ 👀

awbrg789 2026-05-07

Mình cũng muốn sớm được thử mythos nữa.

GN⁺ 2026-05-07

Ý kiến trên Hacker News

Có vẻ kinh tế AI sẽ đi theo hướng này: suy luận sẽ rẻ hơn, và khi các bộ gia tốc chuyên dụng ra thị trường thì cạnh tranh về giá sẽ bắt đầu
Trong khi đó huấn luyện vẫn sẽ tiếp tục đắt đỏ, nên Anthropic/OpenAI sẽ nghiêng về phía kinh doanh huấn luyện
Mô hình sẽ trở thành tài sản có thể thuê theo đơn vị hoặc mua đứt, còn người dùng sẽ chạy trên phần cứng suy luận, thuê phần cứng suy luận hoặc sở hữu nó
Hoặc sẽ hình thành cấu trúc trả phí premium cho một công ty làm thay toàn bộ việc này
Quy mô 300 megawatt công suất mới và hơn 220.000 GPU NVIDIA thực sự lớn đến mức khó tin
Tôi tự hỏi có bài blog nào nói về loại hạ tầng được dùng ngay cả chỉ cho phần suy luận của các mô hình mới như Opus không
Có lẽ là bí mật, nhưng nếu có thể dùng trực tiếp mô hình qua AWS Bedrock thì cũng phần nào là manh mối chăng
- Có lẽ họ đang nói về hạ tầng tính toán, nhưng hạ tầng điện lực cũng rất thú vị
  Data center đôi khi vận hành theo cách ngớ ngẩn vì tốc độ mở rộng vận hành quan trọng hơn chi phí
  Có quy định của công ty điện lực và những thứ như ramp rate để tránh làm hỏng lưới điện, nhưng có giải thích rằng data center đang vi phạm điều đó rất nặng
  Biến động tải rất lớn, điện lại được cấp bằng máy phát khí tự nhiên phía sau đồng hồ đo, và có câu chuyện rằng trục lẽ ra phải dùng được 7 năm thì do khởi động-dừng lặp đi lặp lại chỉ trụ được 10 tháng
  https://www.volts.wtf/p/doing-data-centers-the-not-dumb-way
  Về phía tính toán thì NVIDIA có thiết kế tham chiếu tiêu chuẩn
  https://www.nvidia.com/en-us/technologies/enterprise-referen...
  Tôi chưa xem kỹ, nhưng có lẽ sẽ có mạng liên GPU của Mellanox, mã tùy biến quy mô lớn để chia tensor lên GPU, và mã chuyển activation giữa các node GPU
- Không hẳn chính xác là theo cách đó
  Anthropic đang lưu trữ mô hình của mình trong AWS Bedrock dưới dạng dịch vụ được quản lý, và khách hàng gọi LLM giống như gọi một API khác
  Không thể nhìn thấy yêu cầu API đó được xử lý bởi hạ tầng AWS nào
Việc Anthropic thuê data center do Elon xây cho Grok nghe đúng kiểu plot twist không thể bịa ra nổi
- Từ phía SpaceX thì khá khôn ngoan
  Họ đang biến tài sản xây cho Grok, một cỗ máy đốt tiền, thành một nguồn doanh thu khá lớn trước IPO
- Vụ sáp nhập đó trông khá rõ là cách để làm hài lòng nhà đầu tư trong khi âm thầm đóng xAI
  Đồng thời nó cũng được dùng như một cách đẩy nợ Twitter ra công chúng, nên các kế toán rõ ràng là rất giỏi
- Đây là cú lật hợp lý cho cả hai bên
  Anthropic có được lượng compute mà họ cực kỳ cần để tiếp tục tăng trưởng, Elon cho thuê lượng compute mà xAI không dùng hết vì nhu cầu Grok thấp, còn SpaceX thì có doanh thu để ghi vào sổ sách chuẩn bị IPO
  Câu “chúng tôi sẽ cẩn trọng bổ sung công suất bằng cách hợp tác với các nền dân chủ có khuôn khổ pháp lý và quản lý đủ sức hỗ trợ các khoản đầu tư quy mô này” nếu dịch sang ngôn ngữ đời thực thì gần với “chúng tôi sẽ ưu tiên lợi nhuận trên hết”
  Elon là nhân vật cực hữu ủng hộ Trump, còn Trump cũng chẳng dân chủ lắm, nhưng ý là chúng tôi thực sự cần thêm tiền
  Có cảm giác họ cũng muốn khiến người ta quên việc xAI đã nhận tiền từ các chính phủ phi dân chủ ở Trung Đông, và nếu bán được mô hình Anthropic thì chắc họ cũng sẽ mua compute từ Trung Quốc
Phần khiến tôi thấy vô lý nhất là chỗ trong vòng một tháng
Data center đâu phải thiết bị plug-and-play có đặc tả được viết tốt và giao diện tiêu chuẩn quốc tế
Khi thấy câu “như một phần của thỏa thuận này, chúng tôi đã bày tỏ quan tâm tới việc hợp tác với SpaceX để phát triển năng lực tính toán AI trên quỹ đạo ở quy mô nhiều gigawatt”, thì hoặc là Anthropic nghiêm túc với dự án vũ trụ này hơn công chúng, hoặc việc đăng câu này là điều kiện để lấy được compute
- Tôi đồng ý 100% với khả năng việc đăng câu này là điều kiện để lấy được compute
- Anthropic cần mọi lượng compute có thể có
  Nếu Elon muốn xây data center trên quỹ đạo thì Anthropic sẽ sẵn sàng chạy mô hình trên đó
  Điều đáng nghi không phải là Elon có thể xây data center trên quỹ đạo hay không, mà là liệu nó có hiệu quả kinh tế hơn phương án mặt đất hay không
- Tôi không nghĩ điện toán không gian sẽ thành công, nhưng nói rằng “nếu sau này cung cấp với giá tốt thì chúng tôi sẵn sàng mua” rõ ràng là hoàn toàn có thể
  Được thì được, không được thì thôi
- Trông đơn giản là nịnh người có quyền lực
  Như một phần của thỏa thuận để giành quyền tiếp cận data center mặt đất, họ đang tô vẽ điện toán quỹ đạo ngoài không gian, vốn rõ ràng rất viển vông, như thể nó hơn thế
  Tôi tin là một ngày nào đó thứ như vậy có thể tồn tại, nhưng giống FSD ở chỗ chẳng hề gần với hiện thực hóa
  Chi phí để nói như vậy gần như bằng 0, rồi sau này chỉ cần viện cớ là không còn hứng thú nữa
  Nếu có chi phí thì chỉ là một chút danh tiếng
- Hầu hết CEO Big Tech đều từng nói kiểu này
Data center Colossus 1 là nơi dùng điện bất hợp pháp, làm ô nhiễm không khí ở khu nghèo gần Memphis, và còn có khả năng làm ô nhiễm nước
Nó cũng làm tăng nhu cầu trên lưới điện và có thể khiến cư dân gặp nguy hiểm hơn do gây mất điện quy mô lớn trong điều kiện thời tiết cực đoan
https://en.wikipedia.org/wiki/Colossus_(supercomputer)#Envir...
Vậy nên có thể xếp Anthropic vào danh sách những công ty ưu tiên lợi nhuận hơn an toàn, dù họ nói rất nhiều về an toàn
- Từ bất hợp pháp ở đây khá nặng
  Ngay cả liên kết Wikipedia bạn đưa cũng nói có thể có những điểm mập mờ liên quan đến giấy phép, nhưng tôi không thấy chỗ nào khẳng định điện là “bất hợp pháp”
- Tôi không hiểu data center làm ô nhiễm nước bằng cách nào
  Chúng đâu có sản xuất hóa chất hay làm việc kiểu đó
- Không phải mọi cáo buộc xuất hiện trên báo chí đều là sự thật
  Phải rất hoài nghi với kiểu cáo buộc này, nhất là khi có doanh nghiệp lắm tiền dính vào, vì chỉ những tuyên bố thiệt hại “nghe có lý và dai dẳng” cũng có thể dẫn tới kiện tụng hoặc áp lực dàn xếp
- Tìm thử thì có vẻ phần lớn data center hầu như không nộp thuế bang đối với doanh thu phát sinh từ chính data center đó
  Nếu đúng thì đây là một lỗ hổng thuế khổng lồ, và việc đầu tư vốn vào data center ở mức cao cũng không có gì lạ
  [0] https://www.datacenterknowledge.com/regulations/how-are-data...
Nếu họ không tăng gấp đôi cả hạn mức tuần thì việc tăng gấp đôi giới hạn tốc độ 5 giờ chỉ là marketing
Nó chỉ có nghĩa là giờ bạn có thể chạm hạn mức tuần trong 3 ngày thay vì 5 ngày
- Tôi chưa từng chạm gần hạn mức tuần, nhưng rất hay đụng hạn mức theo giờ
- Từ khi nâng lên gói $100, tôi không nghĩ mình đã chạm bất kỳ giới hạn nào trong 5 tháng qua
  Vào những tuần dùng nhiều, tôi thường dùng đều hơn 6 giờ mỗi ngày
  Tuy vậy tôi cũng khá nghiêm ngặt trong việc luôn giữ mỗi session dưới 200.000~250.000 token
- Cá nhân tôi dùng gói đăng ký Claude Code cơ bản, chủ yếu để thư giãn đầu óc bằng cách code 1~2 giờ vào buổi tối ngày thường hoặc cuối tuần
  Mỗi tuần tôi dùng khoảng 3~5 session
  Khi làm việc phức tạp hơn thì rất nhanh hết cửa sổ 5 giờ nên khá khó chịu, nhưng tôi vẫn chưa chạm hạn mức tuần
  Có lẽ khá nhiều người giống tôi
- Đúng vậy, yếu tố giới hạn thực sự là hạn mức tuần
  Nếu thật sự đẩy mạnh thì ngay cả hạn mức tuần của gói Max $200/tháng cũng có thể dùng hết dễ dàng chỉ trong một ngày
- Với Opus 4.6 mà tôi vẫn cố chấp dùng, trong quy trình làm việc của tôi có thể đốt khoảng 10% hạn mức tuần trong một cửa sổ 5 giờ
  Trong đầu tôi tính hạn mức tuần theo ngày, tức khoảng 14% mỗi ngày, nên đầu tuần sẽ dùng ít hơn và cuối tuần thì thoải mái hơn một chút
  Rồi đến hai ngày cuối lại phải nghĩ xem làm sao tiêu hết phần đã để dành
  Cửa sổ 5 giờ khiến việc này khó hơn, và vào ngày cuối tuần tôi ghét việc cứ phải cố nhét 10% vào mỗi cửa sổ 5 giờ trong suốt thời gian còn thức
  Tôi muốn làm việc vào lúc mình năng suất nhất, chứ không muốn làm theo mấy khung giờ vô lý
  Tôi không muốn phải nghĩ kiểu “có lẽ 11 giờ sáng mình sẽ cần Claude nhiều nhất, nên phải gửi một tin nhắn ngớ ngẩn cho Haiku lúc 7 giờ 30 sáng để bắt đầu cửa sổ 5 giờ rồi đến 12 giờ 30 lại chuyển tiếp”
  Nên tôi vui vì thay đổi này, nhưng đây cũng là chuyện họ đang giả vờ ban ơn cho người dùng bằng cách giảm nhẹ một vấn đề 100% do chính họ tạo ra
  Tôi hiểu họ muốn giảm mức sử dụng vào giờ cao điểm, nhưng vẫn thấy ghét
Họ nói sẽ tăng gấp đôi giới hạn tốc độ 5 giờ của Claude Code cho các gói Pro, Max, Team và Enterprise tính phí theo ghế, đồng thời bỏ việc siết giới hạn giờ cao điểm với Pro và Max, và cũng tăng mạnh giới hạn tốc độ API cho mô hình Claude Opus
Cuối cùng thì trông như Elon đã từ bỏ xAI và chuyển sang bán compute
- Không rõ có liên quan đến cùng data center hay không, nhưng thông báo này được đưa ra chỉ vài giờ sau khi nhiều mô hình Grok gần đây bị khai tử sau một thông báo ngắn
  Grok 4.1 Fast từng là cách rẻ nhất để nghiên cứu trên X, thậm chí còn rẻ hơn cả X API, nhưng đã biến mất vào ngày 15 tháng 5
  https://docs.x.ai/developers/models
  Có thể họ đang dọn compute để đem bán
- Chưa thể khẳng định Elon đã từ bỏ xAI
  Chỉ là các mô hình mã nguồn mở như Gemma và Qwen đang cải thiện quá nhanh, đến mức ngay cả Anthropic cũng nhìn thấy rủi ro thật sự với giá trị dài hạn của mô hình và công cụ của mình
  Về cơ bản, nếu tôi là Anthropic hay xAI thì tôi sẽ tạo doanh thu ở mọi nơi có thể và xem cái gì sống sót
  Trong bối cảnh mọi thứ biến động mạnh thế này, chẳng có giá trị gì trong việc mưu cầu thống trị độc quyền
- Chi tiết là bí mật
  Có thể chỉ là thời gian GPU vốn bị lãng phí, nhưng cũng có thể Anthropic đã đưa ra một đề nghị khó từ chối
  Chỉ là suy đoán, nhưng nếu đó là lời đề nghị mà Elon không thể từ chối thì có thể Anthropic đã đồng ý cung cấp một phần dữ liệu huấn luyện hoặc công nghệ
- Thành thật mà nói thì có thể đây là ý hay
  Khó mà xem xAI là một phòng thí nghiệm nghiêm túc
- Tôi không nghĩ là từ bỏ
  Họ sẽ có được thông tin nội bộ về cách Claude hoạt động, và cả dòng dữ liệu sử dụng Claude khổng lồ
  Có vẻ tất cả những điều đó rồi sẽ được phản ánh vào việc phát triển Grok sau này
Giá mà tôi biết tin này từ hai ngày trước
Tôi đã thử dùng Claude Code vài ngày rồi liên tục chạm hạn mức nên định nâng lên Max, nhưng trong luồng nâng cấp họ yêu cầu xác minh danh tính qua Persona
Tôi thấy không ổn nên định hủy nâng cấp, nhưng rồi quyền truy cập Claude Code trong gói hiện tại của tôi cũng bị chặn hoàn toàn và không thể mở lại nếu không hoàn tất xác minh danh tính
Tôi sẽ không bao giờ làm vậy, và đó thực sự là một trải nghiệm tệ
Nếu có mặt tích cực thì là nó khiến tôi nhận ra Deepseek rẻ hơn nhiều và cho chất lượng tương tự trong công việc reverse engineering
Cuối cùng tôi đã hủy thuê bao vì các giới hạn, và chuyển toàn bộ quy trình làm việc của mình sang pi để hoàn toàn không phụ thuộc vào mô hình
Đây là tin tốt, nhưng tôi sẽ không quay lại
Anthropic đã làm quá nhiều điều sai trong thời gian quá ngắn nên đã mất tôi
Opus đã bị GPT 5.5, DeepSeek, Kimi và Qwen thay thế, và tất cả đều hoạt động với bộ harness duy nhất của tôi, cho phép đổi mô hình rất dễ
Nếu một bên nào đó bắt đầu cư xử theo kiểu tương tự, tôi có thể chuyển ngay lập tức