1 điểm bởi GN⁺ 1 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Anthropic thông báo sẽ mở rộng hạn mức sử dụng của Claude Code và Claude API thông qua quan hệ đối tác với SpaceX và nhiều thỏa thuận năng lực tính toán được ký gần đây
  • Giới hạn sử dụng trong 5 giờ của Claude Code được tăng gấp đôi (áp dụng cho các gói Pro, Max, Team và Enterprise theo số ghế), đồng thời loại bỏ việc cắt giảm hạn mức vào giờ cao điểm đối với tài khoản Pro và Max
  • API rate limits của mô hình Claude Opus đã được nâng lên đáng kể, và dung lượng bổ sung này trực tiếp cải thiện mức sử dụng khả dụng cho người đăng ký Claude Pro và Claude Max
  • Anthropic đã ký hợp đồng sử dụng toàn bộ năng lực tính toán của trung tâm dữ liệu Colossus 1 của SpaceX, qua đó có thể tiếp cận hơn 300MW công suất mới và hơn 220.000 GPU NVIDIA trong vòng một tháng
  • Việc mở rộng năng lực tính toán của Anthropic được thực hiện bên cạnh các thỏa thuận với Amazon, Google và Broadcom, Microsoft và NVIDIA, cùng Fluidstack; đồng thời cũng cân nhắc hạ tầng nội địa, gánh nặng chi phí điện và đầu tư cho cộng đồng địa phương

Mở rộng hạn mức sử dụng Claude

  • Anthropic tăng hạn mức sử dụng của Claude CodeClaude API thông qua quan hệ đối tác với SpaceX và nhiều thỏa thuận năng lực tính toán được ký gần đây
  • Cả 3 thay đổi đều có hiệu lực ngay trong ngày công bố
  • Giới hạn sử dụng trong 5 giờ của Claude Code được tăng gấp đôi cho các gói Pro, Max, Team và Enterprise theo số ghế
  • Đối với tài khoản Pro và Max, việc cắt giảm hạn mức vào giờ cao điểm của Claude Code đã được loại bỏ
  • API rate limits của mô hình Claude Opus cũng được nâng lên đáng kể

Quan hệ đối tác năng lực tính toán mới với SpaceX

  • Anthropic đã ký hợp đồng sử dụng toàn bộ năng lực tính toán của trung tâm dữ liệu Colossus 1 của SpaceX
  • Nhờ thỏa thuận này, công ty có thể tiếp cận hơn 300MW công suất mới và hơn 220.000 GPU NVIDIA trong vòng một tháng
  • Dung lượng bổ sung này trực tiếp cải thiện mức sử dụng khả dụng cho người đăng ký Claude Pro và Claude Max
  • Thỏa thuận lần này được bổ sung bên cạnh các công bố mở rộng năng lực tính toán lớn hiện có của Anthropic
  • Quá trình huấn luyện và vận hành Claude sử dụng nhiều loại phần cứng AI như AWS Trainium, Google TPUs và NVIDIA GPUs
  • Anthropic cho biết sẽ tiếp tục tìm kiếm cơ hội để đưa thêm dung lượng lên trực tuyến
  • Trong khuôn khổ thỏa thuận với SpaceX, công ty cũng bày tỏ quan tâm đến việc hợp tác với SpaceX để phát triển năng lực tính toán AI trên quỹ đạo ở quy mô nhiều GW

Mở rộng quốc tế và hạ tầng nội địa

  • Khách hàng doanh nghiệp trong các ngành có mức độ quản lý nghiêm ngặt như dịch vụ tài chính, y tế và chính phủ ngày càng cần hạ tầng nội địa để đáp ứng yêu cầu về tuân thủ và lưu trú dữ liệu
  • Theo đó, một phần việc mở rộng năng lực của Anthropic đang được triển khai trên phạm vi quốc tế
  • Hợp tác được công bố gần đây với Amazon bao gồm thêm năng lực suy luận tại châu Á và châu Âu
  • Các khu vực được bổ sung công suất sẽ được lựa chọn cẩn trọng, với ưu tiên hợp tác cùng các quốc gia dân chủ có khung pháp lý và quy định đủ khả năng hỗ trợ đầu tư quy mô lớn
  • Việc bảo đảm chuỗi cung ứng an toàn cho phần cứng, mạng lưới và cơ sở vật chất cần cho năng lực tính toán cũng là một tiêu chí quan trọng

Chi phí điện và đầu tư cho cộng đồng địa phương

  • Anthropic gần đây đã công bố cam kết sẽ chi trả nếu các trung tâm dữ liệu tại Mỹ của hãng khiến hóa đơn điện của người tiêu dùng tăng lên
  • Trong khuôn khổ mở rộng quốc tế, công ty đang xem xét mở rộng cam kết này sang các khu vực pháp lý mới
  • Công ty cũng đang thúc đẩy các phương án hợp tác với lãnh đạo địa phương để tái đầu tư vào các cộng đồng nơi đặt cơ sở của mình

1 bình luận

 
Ý kiến trên Hacker News
  • Có vẻ kinh tế AI sẽ đi theo hướng này: suy luận sẽ rẻ hơn, và khi các bộ gia tốc chuyên dụng ra thị trường thì cạnh tranh về giá sẽ bắt đầu
    Trong khi đó huấn luyện vẫn sẽ tiếp tục đắt đỏ, nên Anthropic/OpenAI sẽ nghiêng về phía kinh doanh huấn luyện
    Mô hình sẽ trở thành tài sản có thể thuê theo đơn vị hoặc mua đứt, còn người dùng sẽ chạy trên phần cứng suy luận, thuê phần cứng suy luận hoặc sở hữu nó
    Hoặc sẽ hình thành cấu trúc trả phí premium cho một công ty làm thay toàn bộ việc này
  • Quy mô 300 megawatt công suất mớihơn 220.000 GPU NVIDIA thực sự lớn đến mức khó tin
    Tôi tự hỏi có bài blog nào nói về loại hạ tầng được dùng ngay cả chỉ cho phần suy luận của các mô hình mới như Opus không
    Có lẽ là bí mật, nhưng nếu có thể dùng trực tiếp mô hình qua AWS Bedrock thì cũng phần nào là manh mối chăng
    • Có lẽ họ đang nói về hạ tầng tính toán, nhưng hạ tầng điện lực cũng rất thú vị
      Data center đôi khi vận hành theo cách ngớ ngẩn vì tốc độ mở rộng vận hành quan trọng hơn chi phí
      Có quy định của công ty điện lực và những thứ như ramp rate để tránh làm hỏng lưới điện, nhưng có giải thích rằng data center đang vi phạm điều đó rất nặng
      Biến động tải rất lớn, điện lại được cấp bằng máy phát khí tự nhiên phía sau đồng hồ đo, và có câu chuyện rằng trục lẽ ra phải dùng được 7 năm thì do khởi động-dừng lặp đi lặp lại chỉ trụ được 10 tháng
      https://www.volts.wtf/p/doing-data-centers-the-not-dumb-way
      Về phía tính toán thì NVIDIA có thiết kế tham chiếu tiêu chuẩn
      https://www.nvidia.com/en-us/technologies/enterprise-referen...
      Tôi chưa xem kỹ, nhưng có lẽ sẽ có mạng liên GPU của Mellanox, mã tùy biến quy mô lớn để chia tensor lên GPU, và mã chuyển activation giữa các node GPU
    • Không hẳn chính xác là theo cách đó
      Anthropic đang lưu trữ mô hình của mình trong AWS Bedrock dưới dạng dịch vụ được quản lý, và khách hàng gọi LLM giống như gọi một API khác
      Không thể nhìn thấy yêu cầu API đó được xử lý bởi hạ tầng AWS nào
  • Việc Anthropic thuê data center do Elon xây cho Grok nghe đúng kiểu plot twist không thể bịa ra nổi
    • Từ phía SpaceX thì khá khôn ngoan
      Họ đang biến tài sản xây cho Grok, một cỗ máy đốt tiền, thành một nguồn doanh thu khá lớn trước IPO
    • Vụ sáp nhập đó trông khá rõ là cách để làm hài lòng nhà đầu tư trong khi âm thầm đóng xAI
      Đồng thời nó cũng được dùng như một cách đẩy nợ Twitter ra công chúng, nên các kế toán rõ ràng là rất giỏi
    • Đây là cú lật hợp lý cho cả hai bên
      Anthropic có được lượng compute mà họ cực kỳ cần để tiếp tục tăng trưởng, Elon cho thuê lượng compute mà xAI không dùng hết vì nhu cầu Grok thấp, còn SpaceX thì có doanh thu để ghi vào sổ sách chuẩn bị IPO
      Câu “chúng tôi sẽ cẩn trọng bổ sung công suất bằng cách hợp tác với các nền dân chủ có khuôn khổ pháp lý và quản lý đủ sức hỗ trợ các khoản đầu tư quy mô này” nếu dịch sang ngôn ngữ đời thực thì gần với “chúng tôi sẽ ưu tiên lợi nhuận trên hết”
      Elon là nhân vật cực hữu ủng hộ Trump, còn Trump cũng chẳng dân chủ lắm, nhưng ý là chúng tôi thực sự cần thêm tiền
      Có cảm giác họ cũng muốn khiến người ta quên việc xAI đã nhận tiền từ các chính phủ phi dân chủ ở Trung Đông, và nếu bán được mô hình Anthropic thì chắc họ cũng sẽ mua compute từ Trung Quốc
  • Phần khiến tôi thấy vô lý nhất là chỗ trong vòng một tháng
    Data center đâu phải thiết bị plug-and-play có đặc tả được viết tốt và giao diện tiêu chuẩn quốc tế
  • Khi thấy câu “như một phần của thỏa thuận này, chúng tôi đã bày tỏ quan tâm tới việc hợp tác với SpaceX để phát triển năng lực tính toán AI trên quỹ đạo ở quy mô nhiều gigawatt”, thì hoặc là Anthropic nghiêm túc với dự án vũ trụ này hơn công chúng, hoặc việc đăng câu này là điều kiện để lấy được compute
    • Tôi đồng ý 100% với khả năng việc đăng câu này là điều kiện để lấy được compute
    • Anthropic cần mọi lượng compute có thể có
      Nếu Elon muốn xây data center trên quỹ đạo thì Anthropic sẽ sẵn sàng chạy mô hình trên đó
      Điều đáng nghi không phải là Elon có thể xây data center trên quỹ đạo hay không, mà là liệu nó có hiệu quả kinh tế hơn phương án mặt đất hay không
    • Tôi không nghĩ điện toán không gian sẽ thành công, nhưng nói rằng “nếu sau này cung cấp với giá tốt thì chúng tôi sẵn sàng mua” rõ ràng là hoàn toàn có thể
      Được thì được, không được thì thôi
    • Trông đơn giản là nịnh người có quyền lực
      Như một phần của thỏa thuận để giành quyền tiếp cận data center mặt đất, họ đang tô vẽ điện toán quỹ đạo ngoài không gian, vốn rõ ràng rất viển vông, như thể nó hơn thế
      Tôi tin là một ngày nào đó thứ như vậy có thể tồn tại, nhưng giống FSD ở chỗ chẳng hề gần với hiện thực hóa
      Chi phí để nói như vậy gần như bằng 0, rồi sau này chỉ cần viện cớ là không còn hứng thú nữa
      Nếu có chi phí thì chỉ là một chút danh tiếng
    • Hầu hết CEO Big Tech đều từng nói kiểu này
  • Data center Colossus 1 là nơi dùng điện bất hợp pháp, làm ô nhiễm không khí ở khu nghèo gần Memphis, và còn có khả năng làm ô nhiễm nước
    Nó cũng làm tăng nhu cầu trên lưới điện và có thể khiến cư dân gặp nguy hiểm hơn do gây mất điện quy mô lớn trong điều kiện thời tiết cực đoan
    https://en.wikipedia.org/wiki/Colossus_(supercomputer)#Envir...
    Vậy nên có thể xếp Anthropic vào danh sách những công ty ưu tiên lợi nhuận hơn an toàn, dù họ nói rất nhiều về an toàn
    • Từ bất hợp pháp ở đây khá nặng
      Ngay cả liên kết Wikipedia bạn đưa cũng nói có thể có những điểm mập mờ liên quan đến giấy phép, nhưng tôi không thấy chỗ nào khẳng định điện là “bất hợp pháp”
    • Tôi không hiểu data center làm ô nhiễm nước bằng cách nào
      Chúng đâu có sản xuất hóa chất hay làm việc kiểu đó
    • Không phải mọi cáo buộc xuất hiện trên báo chí đều là sự thật
      Phải rất hoài nghi với kiểu cáo buộc này, nhất là khi có doanh nghiệp lắm tiền dính vào, vì chỉ những tuyên bố thiệt hại “nghe có lý và dai dẳng” cũng có thể dẫn tới kiện tụng hoặc áp lực dàn xếp
    • Tìm thử thì có vẻ phần lớn data center hầu như không nộp thuế bang đối với doanh thu phát sinh từ chính data center đó
      Nếu đúng thì đây là một lỗ hổng thuế khổng lồ, và việc đầu tư vốn vào data center ở mức cao cũng không có gì lạ
      [0] https://www.datacenterknowledge.com/regulations/how-are-data...
  • Nếu họ không tăng gấp đôi cả hạn mức tuần thì việc tăng gấp đôi giới hạn tốc độ 5 giờ chỉ là marketing
    Nó chỉ có nghĩa là giờ bạn có thể chạm hạn mức tuần trong 3 ngày thay vì 5 ngày
    • Tôi chưa từng chạm gần hạn mức tuần, nhưng rất hay đụng hạn mức theo giờ
    • Từ khi nâng lên gói $100, tôi không nghĩ mình đã chạm bất kỳ giới hạn nào trong 5 tháng qua
      Vào những tuần dùng nhiều, tôi thường dùng đều hơn 6 giờ mỗi ngày
      Tuy vậy tôi cũng khá nghiêm ngặt trong việc luôn giữ mỗi session dưới 200.000~250.000 token
    • Cá nhân tôi dùng gói đăng ký Claude Code cơ bản, chủ yếu để thư giãn đầu óc bằng cách code 1~2 giờ vào buổi tối ngày thường hoặc cuối tuần
      Mỗi tuần tôi dùng khoảng 3~5 session
      Khi làm việc phức tạp hơn thì rất nhanh hết cửa sổ 5 giờ nên khá khó chịu, nhưng tôi vẫn chưa chạm hạn mức tuần
      Có lẽ khá nhiều người giống tôi
    • Đúng vậy, yếu tố giới hạn thực sự là hạn mức tuần
      Nếu thật sự đẩy mạnh thì ngay cả hạn mức tuần của gói Max $200/tháng cũng có thể dùng hết dễ dàng chỉ trong một ngày
    • Với Opus 4.6 mà tôi vẫn cố chấp dùng, trong quy trình làm việc của tôi có thể đốt khoảng 10% hạn mức tuần trong một cửa sổ 5 giờ
      Trong đầu tôi tính hạn mức tuần theo ngày, tức khoảng 14% mỗi ngày, nên đầu tuần sẽ dùng ít hơn và cuối tuần thì thoải mái hơn một chút
      Rồi đến hai ngày cuối lại phải nghĩ xem làm sao tiêu hết phần đã để dành
      Cửa sổ 5 giờ khiến việc này khó hơn, và vào ngày cuối tuần tôi ghét việc cứ phải cố nhét 10% vào mỗi cửa sổ 5 giờ trong suốt thời gian còn thức
      Tôi muốn làm việc vào lúc mình năng suất nhất, chứ không muốn làm theo mấy khung giờ vô lý
      Tôi không muốn phải nghĩ kiểu “có lẽ 11 giờ sáng mình sẽ cần Claude nhiều nhất, nên phải gửi một tin nhắn ngớ ngẩn cho Haiku lúc 7 giờ 30 sáng để bắt đầu cửa sổ 5 giờ rồi đến 12 giờ 30 lại chuyển tiếp”
      Nên tôi vui vì thay đổi này, nhưng đây cũng là chuyện họ đang giả vờ ban ơn cho người dùng bằng cách giảm nhẹ một vấn đề 100% do chính họ tạo ra
      Tôi hiểu họ muốn giảm mức sử dụng vào giờ cao điểm, nhưng vẫn thấy ghét
  • Họ nói sẽ tăng gấp đôi giới hạn tốc độ 5 giờ của Claude Code cho các gói Pro, Max, Team và Enterprise tính phí theo ghế, đồng thời bỏ việc siết giới hạn giờ cao điểm với Pro và Max, và cũng tăng mạnh giới hạn tốc độ API cho mô hình Claude Opus
    Cuối cùng thì trông như Elon đã từ bỏ xAI và chuyển sang bán compute
    • Không rõ có liên quan đến cùng data center hay không, nhưng thông báo này được đưa ra chỉ vài giờ sau khi nhiều mô hình Grok gần đây bị khai tử sau một thông báo ngắn
      Grok 4.1 Fast từng là cách rẻ nhất để nghiên cứu trên X, thậm chí còn rẻ hơn cả X API, nhưng đã biến mất vào ngày 15 tháng 5
      https://docs.x.ai/developers/models
      Có thể họ đang dọn compute để đem bán
    • Chưa thể khẳng định Elon đã từ bỏ xAI
      Chỉ là các mô hình mã nguồn mở như Gemma và Qwen đang cải thiện quá nhanh, đến mức ngay cả Anthropic cũng nhìn thấy rủi ro thật sự với giá trị dài hạn của mô hình và công cụ của mình
      Về cơ bản, nếu tôi là Anthropic hay xAI thì tôi sẽ tạo doanh thu ở mọi nơi có thể và xem cái gì sống sót
      Trong bối cảnh mọi thứ biến động mạnh thế này, chẳng có giá trị gì trong việc mưu cầu thống trị độc quyền
    • Chi tiết là bí mật
      Có thể chỉ là thời gian GPU vốn bị lãng phí, nhưng cũng có thể Anthropic đã đưa ra một đề nghị khó từ chối
      Chỉ là suy đoán, nhưng nếu đó là lời đề nghị mà Elon không thể từ chối thì có thể Anthropic đã đồng ý cung cấp một phần dữ liệu huấn luyện hoặc công nghệ
    • Thành thật mà nói thì có thể đây là ý hay
      Khó mà xem xAI là một phòng thí nghiệm nghiêm túc
    • Tôi không nghĩ là từ bỏ
      Họ sẽ có được thông tin nội bộ về cách Claude hoạt động, và cả dòng dữ liệu sử dụng Claude khổng lồ
      Có vẻ tất cả những điều đó rồi sẽ được phản ánh vào việc phát triển Grok sau này
  • Giá mà tôi biết tin này từ hai ngày trước
    Tôi đã thử dùng Claude Code vài ngày rồi liên tục chạm hạn mức nên định nâng lên Max, nhưng trong luồng nâng cấp họ yêu cầu xác minh danh tính qua Persona
    Tôi thấy không ổn nên định hủy nâng cấp, nhưng rồi quyền truy cập Claude Code trong gói hiện tại của tôi cũng bị chặn hoàn toàn và không thể mở lại nếu không hoàn tất xác minh danh tính
    Tôi sẽ không bao giờ làm vậy, và đó thực sự là một trải nghiệm tệ
    Nếu có mặt tích cực thì là nó khiến tôi nhận ra Deepseek rẻ hơn nhiều và cho chất lượng tương tự trong công việc reverse engineering
  • Cuối cùng tôi đã hủy thuê bao vì các giới hạn, và chuyển toàn bộ quy trình làm việc của mình sang pi để hoàn toàn không phụ thuộc vào mô hình
    Đây là tin tốt, nhưng tôi sẽ không quay lại
    Anthropic đã làm quá nhiều điều sai trong thời gian quá ngắn nên đã mất tôi
    Opus đã bị GPT 5.5, DeepSeek, Kimi và Qwen thay thế, và tất cả đều hoạt động với bộ harness duy nhất của tôi, cho phép đổi mô hình rất dễ
    Nếu một bên nào đó bắt đầu cư xử theo kiểu tương tự, tôi có thể chuyển ngay lập tức