- Anthropic thông báo sẽ mở rộng hạn mức sử dụng của Claude Code và Claude API thông qua quan hệ đối tác với SpaceX và nhiều thỏa thuận năng lực tính toán được ký gần đây
- Giới hạn sử dụng trong 5 giờ của Claude Code được tăng gấp đôi (áp dụng cho các gói Pro, Max, Team và Enterprise theo số ghế), đồng thời loại bỏ việc cắt giảm hạn mức vào giờ cao điểm đối với tài khoản Pro và Max
- API rate limits của mô hình Claude Opus đã được nâng lên đáng kể, và dung lượng bổ sung này trực tiếp cải thiện mức sử dụng khả dụng cho người đăng ký Claude Pro và Claude Max
- Anthropic đã ký hợp đồng sử dụng toàn bộ năng lực tính toán của trung tâm dữ liệu Colossus 1 của SpaceX, qua đó có thể tiếp cận hơn 300MW công suất mới và hơn 220.000 GPU NVIDIA trong vòng một tháng
- Việc mở rộng năng lực tính toán của Anthropic được thực hiện bên cạnh các thỏa thuận với Amazon, Google và Broadcom, Microsoft và NVIDIA, cùng Fluidstack; đồng thời cũng cân nhắc hạ tầng nội địa, gánh nặng chi phí điện và đầu tư cho cộng đồng địa phương
Mở rộng hạn mức sử dụng Claude
- Anthropic tăng hạn mức sử dụng của Claude Code và Claude API thông qua quan hệ đối tác với SpaceX và nhiều thỏa thuận năng lực tính toán được ký gần đây
- Cả 3 thay đổi đều có hiệu lực ngay trong ngày công bố
- Giới hạn sử dụng trong 5 giờ của Claude Code được tăng gấp đôi cho các gói Pro, Max, Team và Enterprise theo số ghế
- Đối với tài khoản Pro và Max, việc cắt giảm hạn mức vào giờ cao điểm của Claude Code đã được loại bỏ
- API rate limits của mô hình Claude Opus cũng được nâng lên đáng kể
Quan hệ đối tác năng lực tính toán mới với SpaceX
- Anthropic đã ký hợp đồng sử dụng toàn bộ năng lực tính toán của trung tâm dữ liệu Colossus 1 của SpaceX
- Nhờ thỏa thuận này, công ty có thể tiếp cận hơn 300MW công suất mới và hơn 220.000 GPU NVIDIA trong vòng một tháng
- Dung lượng bổ sung này trực tiếp cải thiện mức sử dụng khả dụng cho người đăng ký Claude Pro và Claude Max
- Thỏa thuận lần này được bổ sung bên cạnh các công bố mở rộng năng lực tính toán lớn hiện có của Anthropic
- Quá trình huấn luyện và vận hành Claude sử dụng nhiều loại phần cứng AI như AWS Trainium, Google TPUs và NVIDIA GPUs
- Anthropic cho biết sẽ tiếp tục tìm kiếm cơ hội để đưa thêm dung lượng lên trực tuyến
- Trong khuôn khổ thỏa thuận với SpaceX, công ty cũng bày tỏ quan tâm đến việc hợp tác với SpaceX để phát triển năng lực tính toán AI trên quỹ đạo ở quy mô nhiều GW
Mở rộng quốc tế và hạ tầng nội địa
- Khách hàng doanh nghiệp trong các ngành có mức độ quản lý nghiêm ngặt như dịch vụ tài chính, y tế và chính phủ ngày càng cần hạ tầng nội địa để đáp ứng yêu cầu về tuân thủ và lưu trú dữ liệu
- Theo đó, một phần việc mở rộng năng lực của Anthropic đang được triển khai trên phạm vi quốc tế
- Hợp tác được công bố gần đây với Amazon bao gồm thêm năng lực suy luận tại châu Á và châu Âu
- Các khu vực được bổ sung công suất sẽ được lựa chọn cẩn trọng, với ưu tiên hợp tác cùng các quốc gia dân chủ có khung pháp lý và quy định đủ khả năng hỗ trợ đầu tư quy mô lớn
- Việc bảo đảm chuỗi cung ứng an toàn cho phần cứng, mạng lưới và cơ sở vật chất cần cho năng lực tính toán cũng là một tiêu chí quan trọng
Chi phí điện và đầu tư cho cộng đồng địa phương
- Anthropic gần đây đã công bố cam kết sẽ chi trả nếu các trung tâm dữ liệu tại Mỹ của hãng khiến hóa đơn điện của người tiêu dùng tăng lên
- Trong khuôn khổ mở rộng quốc tế, công ty đang xem xét mở rộng cam kết này sang các khu vực pháp lý mới
- Công ty cũng đang thúc đẩy các phương án hợp tác với lãnh đạo địa phương để tái đầu tư vào các cộng đồng nơi đặt cơ sở của mình
1 bình luận
Ý kiến trên Hacker News
Trong khi đó huấn luyện vẫn sẽ tiếp tục đắt đỏ, nên Anthropic/OpenAI sẽ nghiêng về phía kinh doanh huấn luyện
Mô hình sẽ trở thành tài sản có thể thuê theo đơn vị hoặc mua đứt, còn người dùng sẽ chạy trên phần cứng suy luận, thuê phần cứng suy luận hoặc sở hữu nó
Hoặc sẽ hình thành cấu trúc trả phí premium cho một công ty làm thay toàn bộ việc này
Tôi tự hỏi có bài blog nào nói về loại hạ tầng được dùng ngay cả chỉ cho phần suy luận của các mô hình mới như Opus không
Có lẽ là bí mật, nhưng nếu có thể dùng trực tiếp mô hình qua AWS Bedrock thì cũng phần nào là manh mối chăng
Data center đôi khi vận hành theo cách ngớ ngẩn vì tốc độ mở rộng vận hành quan trọng hơn chi phí
Có quy định của công ty điện lực và những thứ như ramp rate để tránh làm hỏng lưới điện, nhưng có giải thích rằng data center đang vi phạm điều đó rất nặng
Biến động tải rất lớn, điện lại được cấp bằng máy phát khí tự nhiên phía sau đồng hồ đo, và có câu chuyện rằng trục lẽ ra phải dùng được 7 năm thì do khởi động-dừng lặp đi lặp lại chỉ trụ được 10 tháng
https://www.volts.wtf/p/doing-data-centers-the-not-dumb-way
Về phía tính toán thì NVIDIA có thiết kế tham chiếu tiêu chuẩn
https://www.nvidia.com/en-us/technologies/enterprise-referen...
Tôi chưa xem kỹ, nhưng có lẽ sẽ có mạng liên GPU của Mellanox, mã tùy biến quy mô lớn để chia tensor lên GPU, và mã chuyển activation giữa các node GPU
Anthropic đang lưu trữ mô hình của mình trong AWS Bedrock dưới dạng dịch vụ được quản lý, và khách hàng gọi LLM giống như gọi một API khác
Không thể nhìn thấy yêu cầu API đó được xử lý bởi hạ tầng AWS nào
Họ đang biến tài sản xây cho Grok, một cỗ máy đốt tiền, thành một nguồn doanh thu khá lớn trước IPO
Đồng thời nó cũng được dùng như một cách đẩy nợ Twitter ra công chúng, nên các kế toán rõ ràng là rất giỏi
Anthropic có được lượng compute mà họ cực kỳ cần để tiếp tục tăng trưởng, Elon cho thuê lượng compute mà xAI không dùng hết vì nhu cầu Grok thấp, còn SpaceX thì có doanh thu để ghi vào sổ sách chuẩn bị IPO
Câu “chúng tôi sẽ cẩn trọng bổ sung công suất bằng cách hợp tác với các nền dân chủ có khuôn khổ pháp lý và quản lý đủ sức hỗ trợ các khoản đầu tư quy mô này” nếu dịch sang ngôn ngữ đời thực thì gần với “chúng tôi sẽ ưu tiên lợi nhuận trên hết”
Elon là nhân vật cực hữu ủng hộ Trump, còn Trump cũng chẳng dân chủ lắm, nhưng ý là chúng tôi thực sự cần thêm tiền
Có cảm giác họ cũng muốn khiến người ta quên việc xAI đã nhận tiền từ các chính phủ phi dân chủ ở Trung Đông, và nếu bán được mô hình Anthropic thì chắc họ cũng sẽ mua compute từ Trung Quốc
Data center đâu phải thiết bị plug-and-play có đặc tả được viết tốt và giao diện tiêu chuẩn quốc tế
Nếu Elon muốn xây data center trên quỹ đạo thì Anthropic sẽ sẵn sàng chạy mô hình trên đó
Điều đáng nghi không phải là Elon có thể xây data center trên quỹ đạo hay không, mà là liệu nó có hiệu quả kinh tế hơn phương án mặt đất hay không
Được thì được, không được thì thôi
Như một phần của thỏa thuận để giành quyền tiếp cận data center mặt đất, họ đang tô vẽ điện toán quỹ đạo ngoài không gian, vốn rõ ràng rất viển vông, như thể nó hơn thế
Tôi tin là một ngày nào đó thứ như vậy có thể tồn tại, nhưng giống FSD ở chỗ chẳng hề gần với hiện thực hóa
Chi phí để nói như vậy gần như bằng 0, rồi sau này chỉ cần viện cớ là không còn hứng thú nữa
Nếu có chi phí thì chỉ là một chút danh tiếng
Nó cũng làm tăng nhu cầu trên lưới điện và có thể khiến cư dân gặp nguy hiểm hơn do gây mất điện quy mô lớn trong điều kiện thời tiết cực đoan
https://en.wikipedia.org/wiki/Colossus_(supercomputer)#Envir...
Vậy nên có thể xếp Anthropic vào danh sách những công ty ưu tiên lợi nhuận hơn an toàn, dù họ nói rất nhiều về an toàn
Ngay cả liên kết Wikipedia bạn đưa cũng nói có thể có những điểm mập mờ liên quan đến giấy phép, nhưng tôi không thấy chỗ nào khẳng định điện là “bất hợp pháp”
Chúng đâu có sản xuất hóa chất hay làm việc kiểu đó
Phải rất hoài nghi với kiểu cáo buộc này, nhất là khi có doanh nghiệp lắm tiền dính vào, vì chỉ những tuyên bố thiệt hại “nghe có lý và dai dẳng” cũng có thể dẫn tới kiện tụng hoặc áp lực dàn xếp
Nếu đúng thì đây là một lỗ hổng thuế khổng lồ, và việc đầu tư vốn vào data center ở mức cao cũng không có gì lạ
[0] https://www.datacenterknowledge.com/regulations/how-are-data...
Nó chỉ có nghĩa là giờ bạn có thể chạm hạn mức tuần trong 3 ngày thay vì 5 ngày
Vào những tuần dùng nhiều, tôi thường dùng đều hơn 6 giờ mỗi ngày
Tuy vậy tôi cũng khá nghiêm ngặt trong việc luôn giữ mỗi session dưới 200.000~250.000 token
Mỗi tuần tôi dùng khoảng 3~5 session
Khi làm việc phức tạp hơn thì rất nhanh hết cửa sổ 5 giờ nên khá khó chịu, nhưng tôi vẫn chưa chạm hạn mức tuần
Có lẽ khá nhiều người giống tôi
Nếu thật sự đẩy mạnh thì ngay cả hạn mức tuần của gói Max $200/tháng cũng có thể dùng hết dễ dàng chỉ trong một ngày
Trong đầu tôi tính hạn mức tuần theo ngày, tức khoảng 14% mỗi ngày, nên đầu tuần sẽ dùng ít hơn và cuối tuần thì thoải mái hơn một chút
Rồi đến hai ngày cuối lại phải nghĩ xem làm sao tiêu hết phần đã để dành
Cửa sổ 5 giờ khiến việc này khó hơn, và vào ngày cuối tuần tôi ghét việc cứ phải cố nhét 10% vào mỗi cửa sổ 5 giờ trong suốt thời gian còn thức
Tôi muốn làm việc vào lúc mình năng suất nhất, chứ không muốn làm theo mấy khung giờ vô lý
Tôi không muốn phải nghĩ kiểu “có lẽ 11 giờ sáng mình sẽ cần Claude nhiều nhất, nên phải gửi một tin nhắn ngớ ngẩn cho Haiku lúc 7 giờ 30 sáng để bắt đầu cửa sổ 5 giờ rồi đến 12 giờ 30 lại chuyển tiếp”
Nên tôi vui vì thay đổi này, nhưng đây cũng là chuyện họ đang giả vờ ban ơn cho người dùng bằng cách giảm nhẹ một vấn đề 100% do chính họ tạo ra
Tôi hiểu họ muốn giảm mức sử dụng vào giờ cao điểm, nhưng vẫn thấy ghét
Cuối cùng thì trông như Elon đã từ bỏ xAI và chuyển sang bán compute
Grok 4.1 Fast từng là cách rẻ nhất để nghiên cứu trên X, thậm chí còn rẻ hơn cả X API, nhưng đã biến mất vào ngày 15 tháng 5
https://docs.x.ai/developers/models
Có thể họ đang dọn compute để đem bán
Chỉ là các mô hình mã nguồn mở như Gemma và Qwen đang cải thiện quá nhanh, đến mức ngay cả Anthropic cũng nhìn thấy rủi ro thật sự với giá trị dài hạn của mô hình và công cụ của mình
Về cơ bản, nếu tôi là Anthropic hay xAI thì tôi sẽ tạo doanh thu ở mọi nơi có thể và xem cái gì sống sót
Trong bối cảnh mọi thứ biến động mạnh thế này, chẳng có giá trị gì trong việc mưu cầu thống trị độc quyền
Có thể chỉ là thời gian GPU vốn bị lãng phí, nhưng cũng có thể Anthropic đã đưa ra một đề nghị khó từ chối
Chỉ là suy đoán, nhưng nếu đó là lời đề nghị mà Elon không thể từ chối thì có thể Anthropic đã đồng ý cung cấp một phần dữ liệu huấn luyện hoặc công nghệ
Khó mà xem xAI là một phòng thí nghiệm nghiêm túc
Họ sẽ có được thông tin nội bộ về cách Claude hoạt động, và cả dòng dữ liệu sử dụng Claude khổng lồ
Có vẻ tất cả những điều đó rồi sẽ được phản ánh vào việc phát triển Grok sau này
Tôi đã thử dùng Claude Code vài ngày rồi liên tục chạm hạn mức nên định nâng lên Max, nhưng trong luồng nâng cấp họ yêu cầu xác minh danh tính qua Persona
Tôi thấy không ổn nên định hủy nâng cấp, nhưng rồi quyền truy cập Claude Code trong gói hiện tại của tôi cũng bị chặn hoàn toàn và không thể mở lại nếu không hoàn tất xác minh danh tính
Tôi sẽ không bao giờ làm vậy, và đó thực sự là một trải nghiệm tệ
Nếu có mặt tích cực thì là nó khiến tôi nhận ra Deepseek rẻ hơn nhiều và cho chất lượng tương tự trong công việc reverse engineering
Đây là tin tốt, nhưng tôi sẽ không quay lại
Anthropic đã làm quá nhiều điều sai trong thời gian quá ngắn nên đã mất tôi
Opus đã bị GPT 5.5, DeepSeek, Kimi và Qwen thay thế, và tất cả đều hoạt động với bộ harness duy nhất của tôi, cho phép đổi mô hình rất dễ
Nếu một bên nào đó bắt đầu cư xử theo kiểu tương tự, tôi có thể chuyển ngay lập tức