AWS Bedrock sẽ yêu cầu chia sẻ dữ liệu với Anthropic cho Mythos và các mô hình tương lai

(news.ycombinator.com)

1 điểm bởi GN⁺ 2026-06-12 | 1 bình luận | Chia sẻ qua WhatsApp

Lưu lượng của các mô hình cấp Mythos sẽ được lưu giữ trong 30 ngày để phát hiện các mẫu lạm dụng không thể nhìn thấy trong một lần trao đổi đơn lẻ
Điều kiện này áp dụng cho Fable 5 trên Bedrock, Mythos 5 và các mô hình tương lai có mức năng lực tương đương hoặc cao hơn
Việc lưu giữ dữ liệu trong thời gian giới hạn là điều kiện để Anthropic phát hiện các mẫu lạm dụng không thể thấy chỉ từ một lần trao đổi đơn lẻ
Nếu đồng ý lưu giữ dữ liệu, dữ liệu sẽ vượt ra ngoài ranh giới dữ liệu và bảo mật của AWS
Sau 30 ngày, dữ liệu sẽ bị xóa tự động, nhưng các trường hợp hiếm liên quan đến điều tra an toàn hoặc bị yêu cầu lưu giữ theo pháp luật sẽ là ngoại lệ

Phạm vi áp dụng và điều kiện lưu giữ

Trích dẫn từ thông báo của AWS áp dụng cho Fable 5 trên Bedrock, Mythos 5 và các mô hình tương lai có mức năng lực tương đương hoặc cao hơn
Anthropic yêu cầu lưu giữ 30 ngày đối với toàn bộ lưu lượng của các mô hình cấp Mythos
Việc lưu giữ dữ liệu trong thời gian giới hạn là biện pháp để phát hiện các mẫu lạm dụng không thể thấy trong một lần trao đổi đơn lẻ

Ranh giới dữ liệu và ngoại lệ xóa dữ liệu

Nếu đồng ý lưu giữ dữ liệu, dữ liệu đó sẽ vượt ra ngoài ranh giới dữ liệu và bảo mật của AWS
Theo tài liệu hỗ trợ của Claude, dữ liệu sẽ bị xóa tự động sau 30 ngày
Nếu dữ liệu nằm trong phạm vi điều tra an toàn hoặc pháp luật yêu cầu phải lưu giữ, thì sẽ là ngoại lệ đối với việc xóa tự động sau 30 ngày

1 bình luận

GN⁺ 2026-06-12

Ý kiến trên Hacker News

Cốt lõi của vấn đề là AI dạng dịch vụ là một ngõ cụt. Các công ty cung cấp có động cơ rất mạnh để dùng toàn bộ dữ liệu đó nhằm vượt lên trước đối thủ, và họ cũng có thể làm vậy trong bí mật
Hơn nữa, các cơ quan điều tra chắc chắn cũng sẽ rất muốn tiếp cận chỗ đó. Hy vọng một ngày nào đó sẽ có mã nguồn mở và phần cứng giá rẻ đủ để chạy được những mô hình có năng lực
- Điều đó đã xảy ra rồi
  https://www.theguardian.com/world/2026/feb/23/openai-tumber-...
- Có thật là “có thể làm trong bí mật” không? Không lưu giữ dữ liệu (ZDR) là điều khoản tiêu chuẩn trong hợp đồng doanh nghiệp, nên nếu nhà cung cấp phớt lờ điều khoản hợp đồng và chấp nhận mức trách nhiệm đó thì đây là chuyện khá nghiêm trọng
  Thêm nữa, Anthropic có SOC2 và ISO27001, nên cũng đã trải qua một mức độ kiểm toán độc lập nhất định. Dĩ nhiên họ vẫn có thể tìm cách che giấu các bản ghi và việc logging đó, nhưng ngược lại họ cũng có động cơ rất mạnh để không âm thầm thu thập dữ liệu ấy
  Tuy vậy, ZDR thường đi kèm mức chi tiêu tối thiểu trong hợp đồng, nên cá nhân hoặc công ty nhỏ lại bị loại ra và buộc phải phó mặc cho nhà cung cấp
- Nếu là kiểm toán SOC 2 Type 2 thì theo tôi kiểm toán viên phải xác minh việc truy cập. Nếu mua bản trả phí/doanh nghiệp của ba nhà cung cấp hàng đầu như Anthropic, Google, OpenAI thì đó đều là SOC 2 Type 2, và những dịch vụ như vậy phải duy trì nhật ký truy cập, đồng thời kiểm toán viên độc lập phải xác minh rằng dữ liệu không bị truy cập hay sử dụng trái quy định, đúng không?
  Về bản chất, đó cũng là lý do AWS báo cáo việc này ngay từ đầu
- Gốc rễ của vấn đề là người bình thường không lên tiếng đủ mạnh về các vấn đề họ thấy trong cuộc sống, nên rốt cuộc về thực chất trở thành gia súc
  Có ai quan tâm ý kiến của gia súc không? Có thể một số người có, nhưng đa số thì không
- Tất cả chuyện này đều cực kỳ phản địa đàng và tôi không biết nó sẽ khá hơn bằng cách nào. Một vài siêu tập đoàn có thể tiếp cận tài nguyên tính toán và cả đống sở hữu trí tuệ bị đánh cắp để huấn luyện các mô hình bí mật thì chẳng có động cơ gì để đóng góp ngược lại
  Họ có thể nói rằng mô hình quá nguy hiểm để công khai cho công chúng, rồi làm yếu đi bản phát hành công khai, chỉ cho các siêu tập đoàn hoặc đối tác quốc gia mà họ ưu ái truy cập bản bí mật thực sự tốt
  Có thể hy vọng các mô hình trọng số mở từ Trung Quốc sẽ đuổi kịp, nhưng đến lúc chúng thực sự ngang tầm các mô hình độc quyền tiên tiến nhất thì khả năng cao họ cũng sẽ ngừng công bố trọng số. Họ đâu làm việc này vì thiện ý
  Khó mà hình dung điều gì có thể làm chệch hướng xu thế này
Đây là hành động kỳ quặc, và phần nào cho thấy Anthropic không được điều hành bởi những người nghiêm túc. Nếu áp chính sách này lên AWS/GitHub/Zed v.v., họ sẽ nhường lợi thế lớn trong bán hàng doanh nghiệp/chính phủ cho đối thủ chỉ cần có mô hình hiệu năng tương đương và UI khá ổn
- Các đối thủ có thể tạo ra mô hình tương tự từ lâu đã thèm thuồng ý tưởng chia sẻ dữ liệu dựa trên sự đồng ý. Anthropic mở cửa trước, nên các công ty khác giờ cũng có thể làm điều tương tự mà không phải chịu áp lực trở thành “người đầu tiên”. Tôi nghĩ các mô hình sắp tới của OpenAI v.v. cũng sẽ đặt ra yêu cầu giống vậy
  Sau thông báo về Mythos, đã rõ là chúng ta đang đi tới một tương lai nơi các mô hình mạnh nhất mới nhất không còn được cung cấp cho người dùng phổ thông. Không chỉ tốn tiền hơn, mà còn đòi thêm cái giá dưới dạng xác minh trường hợp sử dụng và chia sẻ dữ liệu. Mô hình 5.5-Cyber của OpenAI cũng vậy, nên đây không chỉ là chuyện riêng của Anthropic
  Chúng ta khó chịu là vì đã quen với việc cứ có mô hình mới bóng bẩy xuất hiện là được sờ vào ngay. Nhưng gọi Anthropic là “ngu ngốc” trong chủ đề này có vẻ là một kiểu mong muốn duy cảm tính
- Thành thật mà nói, những người đang đặt cược số tiền lớn vào đây có lẽ đã suy nghĩ nhiều hơn rất nhiều so với ý nghĩ thoáng qua khi viết bình luận này
- Họ đang đặt cược rằng nếu đối thủ không thể chưng cất mô hình mạnh nhất của họ thì họ có thể dẫn trước đủ lâu, và rốt cuộc mọi người sẽ chấp nhận các điều kiện đó
- OpenAI gần đây cũng đã thêm mô hình của mình vào Bedrock, nên việc chuyển đổi sẽ dễ hơn
- Rất khó biết bao nhiêu phần trong những gì Anthropic đang nói lúc này là chiêu trò marketing trước IPO, và đây sẽ là chính sách kéo dài bao lâu
  Nếu đây là kiểu marketing “mô hình của chúng tôi mạnh đến mức phải trói lại vào ban đêm”, thì nó có vẻ là một chiến lược được dựng lên cực kỳ tệ. Tôi không nghĩ ra cách nào tốt hơn để phá vỡ niềm tin khách hàng mà họ đã vất vả xây dựng
  1. Nếu chúng tôi không thích việc bạn đang làm, hoặc thấy bạn có thể cạnh tranh với chúng tôi, chúng tôi sẽ âm thầm phá hỏng đoạn mã bạn trả tiền để tạo ra
  2. Đảm bảo quyền riêng tư bị suy yếu đáng kể. Chúng tôi sẽ lưu mọi thứ bạn gửi trong một khoảng thời gian không xác định trong lúc điều tra
    Cả hai điều này đều có vẻ tự hủy, nhất là khi nghĩ tới việc Anthropic đặc biệt thu hút được khách hàng doanh nghiệp trong mảng lập trình, và dường như cũng đang tiếp tục nhắm tới khách hàng quân sự
    Phần âm thầm từ chối thực sự rất khác thường. Tôi không rõ điều đó chỉ có nghĩa là họ sẽ cố tình làm chậm đi và không cung cấp đúng giá trị tương xứng với số tiền bạn trả, hay là họ sẽ chủ động đưa sự phá hoại vào mã được sinh ra. Sao họ không đơn giản từ chối yêu cầu?
    Có lẽ họ muốn lập luận rằng bản thân việc từ chối sẽ phát đi tín hiệu quá lớn về điều họ cho là có giá trị, nhưng câu chuyện về “tự cải thiện đệ quy” với tôi là 100% lời nhảm nhí để thổi IPO. Họ ngạo mạn đến mức thật sự nghĩ rằng các công ty phát triển LLM khác không thể tự tìm ra những thứ như hạ tầng phát triển cơ bản sao?
    Chỉ riêng việc Anthropic cho rằng âm thầm làm hỏng các yêu cầu nhằm tạo ra thứ gì đó có thể cạnh tranh với họ là hơi chấp nhận được thôi cũng đã đủ tệ rồi. Chưa kể nhìn vào mức độ bất tài khủng khiếp trong cách “Fable” từ chối yêu cầu, thì các quyết định kiểu này sẽ khiến nhiều yêu cầu bị âm thầm làm hỏng hơn rất nhiều so với dự định
    Tên mô hình của Anthropic như “Mythos”, “Fable” nghe như do một đứa 14 tuổi nghĩ ra, kiểu tin rằng đặt tên “hoành tráng” sẽ làm mô hình trông mạnh hơn. Nó giống như gắn sọc đua và pô nổ ầm ĩ lên một chiếc Honda Civic vậy
Chính sách này áp dụng cho mọi nhà cung cấp. Cảnh báo của Cursor ở đây: https://i.redd.it/7sfyker2ya6h1.png
Anthropic đã hứa sẽ không dùng dữ liệu được ghi lại để huấn luyện mô hình, nên tôi không thực sự hiểu một phần lo ngại ở đây. Mô hình đe dọa chính xác là gì? Là Anthropic sẽ vi phạm điều khoản và huấn luyện mô hình sao? Trước đây thì tin họ đủ để không ghi lại dữ liệu, nhưng giờ lại không tin họ sẽ tuân thủ giới hạn sử dụng đối với dữ liệu đã được ghi lại sao?
Tôi cũng bị thuyết phục phần nào bởi một số câu trả lời. Tuy nhiên, cũng cần thấy rằng thay đổi này chủ yếu ảnh hưởng đến người dùng Enterprise. Dữ liệu của gói tiêu dùng vốn đã được lưu trong 30 ngày. Nguồn: https://privacy.claude.com/en/articles/10023548-how-long-do-...
- Bạn tin bên kia đến mức nào thực ra không quá quan trọng. Trong thế giới tuân thủ quy định, điều quan trọng duy nhất là họ có ký hợp đồng bảo đảm tuân thủ hay không
  Với AWS thì có hợp đồng như vậy, còn với Anthropic thì không. Nếu Anthropic thực sự nắm được dữ liệu về mặt vật lý, thì chúng ta tự đưa dữ liệu ra ngoài ranh giới các bên mà chúng ta có thể giao dịch
  Trừ khi họ ký hợp đồng và triển khai toàn bộ biện pháp tuân thủ tương ứng, còn nếu bạn nghĩ việc họ ngay lập tức bắt chước được những gì AWS đã xây dựng suốt 10 năm ở mọi khu vực pháp lý nơi AWS hoạt động là một thỏa thuận tốt, thì thật là phi lý
- Meta cũng từng hứa sẽ tôn trọng quyền riêng tư. Cứ thay tên công ty bằng bất kỳ công ty nào trong top 50 thế giới rồi nhìn lại xem họ đã giữ lời đến đâu, hoặc đã sống khỏe thế nào sau khi phá luật
  Ở Mỹ không có khung pháp lý nào đủ sức khiến một công ty phá sản vì những vi phạm kiểu này. Nên không có gì được bảo đảm cả
  Meta đã công khai torrent sách, và chẳng ai buộc họ gỡ bỏ hay tiêu hủy mô hình AI. Với Anthropic cũng thế, đó chỉ là chi phí kinh doanh. Họ vẫn được phép giữ nguyên mô hình, và việc phá luật không kéo theo hậu quả thực chất nào
- Có thêm một nhà cung cấp nữa mà bạn phải tin tưởng về dữ liệu. Giả định trước đây là AWS xử lý dữ liệu an toàn, và dù sao dữ liệu cũng có thể đã nằm trong AWS rồi
  Giờ có hai nhà cung cấp cùng xử lý dữ liệu, nên ngay cả khi bạn tin cả hai như nhau thì rủi ro vẫn tăng gấp đôi. Nếu bạn cho rằng kiểm soát dữ liệu của AWS vững hơn Anthropic, thì rủi ro còn tăng hơn gấp đôi
  Cũng có thể tồn tại các yêu cầu quản trị dữ liệu như quốc gia được phép lưu trữ và truyền dữ liệu, các loại chứng nhận, hợp đồng, v.v., và giờ bạn phải mở rộng chúng sang cả bên xử lý dữ liệu thứ hai
  Về cơ bản, nếu bạn đã dùng AWS rồi thì thêm một mô hình Bedrock chỉ chạy trong AWS là tương đối dễ về mặt pháp lý và không làm thay đổi lớn tư thế bảo mật. Nhưng nếu dữ liệu còn phải được ghi lại ở Anthropic nữa, thì lựa chọn trở nên phức tạp hơn nhiều
- Cả hai điều đều có thể đúng cùng lúc. Có lẽ vẫn có thể tin rằng Anthropic sẽ không huấn luyện trên các phiên Fable của chúng ta, nhưng việc ZDR bị suy yếu so với chuẩn ngành vẫn là một tiền lệ rủi ro
  Có điểm tương đồng giữa lưu giữ dữ liệu và giám sát đại trà nói chung. Cả hai hệ thống đều có thể được dùng hoàn toàn với mục đích tốt nếu có các biện pháp bảo vệ phù hợp. Nhưng lịch sử cho thấy các hệ thống giám sát bị chiếm dụng cho mục đích xấu một cách đáng kinh ngạc. Các nhà cung cấp mô hình cũng có động cơ rất mạnh để tận dụng dữ liệu lưu trữ cho mục đích nội bộ
  Dù tôi không tin chính sách này ngay lập tức xâm phạm quyền riêng tư của mình, nó vẫn đáng để phản đối
- Nói rằng không lưu dữ liệu khác với việc nói sẽ lưu dữ liệu 30 ngày và xem xét xem có “vấn đề” gì không
  Những điểm như ai sẽ xem xét, xem xét bằng cách nào, và “vấn đề” mà họ tìm là gì đều khiến giác quan cảnh báo của tôi nổi lên. Quá mơ hồ, và họ có thể giữ riêng cho mình mô hình “nguy hiểm” này
Với các doanh nghiệp bị quản lý chặt hoặc khách hàng chính phủ, gần như chắc chắn chuyện này sẽ không ổn. Nhưng AWS hẳn cũng biết điều đó, nên tôi tò mò vì sao họ lại đồng ý
- Lý do họ đồng ý thì quá rõ, nhưng vẫn đáng để nói ra. Vì nó đáng giá đến mức đó. Nhu cầu với mô hình này là chưa từng có, và nếu AWS từ chối thì thiệt hại duy nhất của Anthropic chỉ là doanh thu bị lùi một quý trong lúc họ chuẩn bị Fable bằng năng lực tính toán mới có từ xAI và Google
- GitHub Copilot cũng vậy [1]. GitHub Copilot đã vào khu vực chính phủ nhiều hơn giải pháp của AWS
  Anthropic đang thử, cứ chờ xem đây có phải là một chiến lược táo bạo hay không
  1. https://github.blog/changelog/2026-06-09-claude-fable-5-is-g...
Cái này có mùi như một phiên bản cao cấp của hoạt động gián điệp doanh nghiệp. Nếu giả định phần lớn công ty sau này đều dùng AI này, thì dữ liệu đó sẽ đi thẳng vào một mạng kiểu Echelon, và “thông tin thú vị” sẽ rò sang các bên thân hữu như trong vụ Boeing đối đầu Airbus. Vụ đó ban đầu cũng được đưa tin rộng rãi rồi sau đó chính thức bị chôn xuống
- Nếu là một chương trình gián điệp bí mật thì tại sao lại công khai một phần?
  Nếu họ dùng dữ liệu cho gián điệp bí mật hay giám sát của chính phủ thì hẳn họ đã làm tất cả trong bí mật
- Tôi còn ngửi thấy mùi của một thỏa thuận ngầm với chính phủ hơn
Ugh. Hy vọng công ty chúng tôi sẽ không phải đưa ra quyết định khó khăn giữa việc ở lại với Opus 4.8, chuyển sang nhà cung cấp mô hình khác, hay cập nhật bằng cách làm suy yếu đáng kể điều khoản như cấm huấn luyện lại mô hình và cấm chuyển dữ liệu cho bên thứ ba
Tôi hiểu vì sao Anthropic muốn điều này, nhưng sẽ dễ chịu hơn nhiều nếu dữ liệu không đi tới Anthropic trừ khi Amazon trước tiên dùng công cụ của Anthropic để chạy phân tích rồi xác định rằng có điều gì đó cần xem xét. Như vậy cũng sẽ dễ tạo ngoại lệ hơn trong điều khoản doanh nghiệp và chính sách quyền riêng tư
- Bạn có thể giải thích chính xác AWS hiện được cho là đang bảo đảm điều gì, và công ty bạn coi đó là giá trị ở điểm nào không? Tôi không quá quen với nền tảng này, nhưng tôi cho rằng giống như các công ty Mỹ khác, theo CLOUD Act thì họ sẽ cung cấp dữ liệu cho cơ quan Mỹ khi có yêu cầu hợp pháp, bất kể dữ liệu được lưu ở đâu
Với chúng tôi thì vì họ không phải là bên xử lý phụ nên bị cấm ngay lập tức. Họ cũng làm hỏng luôn cả việc cập nhật danh sách bên xử lý phụ
Nếu đây là cách xử lý bên trong đám mây thì tôi đã không bận tâm, nhưng vì không có quản trị cũng không có kiểm soát nên ngay từ đầu đã là bất khả thi
Điều này trở thành điều khoản loại trừ trên đủ loại ứng dụng
Tôi từng làm vài ứng dụng cho UKGov, và nếu là tôi thì chắc chắn sẽ nêu đây là một dấu hiệu rủi ro cực lớn
Thế là hết. Nếu bạn đưa dữ liệu mật qua Fable thì tức là bạn đang giao nó miễn phí
Có khi trước giờ đã là như vậy rồi, nhưng giờ họ yêu cầu điều đó một cách rõ ràng
Cũng phải công nhận quyết tâm tự bắn vào chân mình của Anthropic chỉ vì niềm tin vào hiệu năng của Mythos
- Điều kỳ lạ hơn là dù các mô hình này sẽ vẫn được cung cấp không giới hạn chỉ cho doanh nghiệp, họ vẫn phải lưu trữ dữ liệu
  Kế hoạch là gì?

AWS Bedrock sẽ yêu cầu chia sẻ dữ liệu với Anthropic cho Mythos và các mô hình tương lai

Phạm vi áp dụng và điều kiện lưu giữ

Ranh giới dữ liệu và ngoại lệ xóa dữ liệu

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News