Anthropic yêu cầu lưu trữ dữ liệu 30 ngày cho Fable và Mythos
(support.claude.com)- Các mô hình cấp Mythos có thể lưu trữ prompt và đầu ra trong 30 ngày và có thể bị đưa vào diện xem xét để phục vụ triển khai có trách nhiệm và công tác an toàn
- Chính sách này áp dụng cho các mô hình cấp Mythos và các covered models trong tương lai có năng lực tương tự, không ảnh hưởng đến điều kiện sử dụng của các mô hình khác
- Các gói người dùng cá nhân không bị ảnh hưởng bởi thay đổi này vì đây vốn đã là các bề mặt áp dụng lưu trữ đầu vào·đầu ra cho mục đích an toàn
- Các tổ chức đã thiết lập ZDR có thể cần cấu hình lưu trữ trên Claude Console, Claude Code trong Claude Enterprise, AWS Bedrock, Google Cloud Agent Platform và Microsoft Foundry
- Anthropic cho biết cần lưu trữ tạm thời để phát hiện các mẫu lạm dụng trải dài qua nhiều yêu cầu, đồng thời áp dụng xóa tự động sau 30 ngày và quy trình xem xét hạn chế
Phạm vi áp dụng
- Để triển khai có trách nhiệm các mô hình cấp Mythos, việc lưu trữ và xem xét dữ liệu ở mức hạn chế được yêu cầu như một phần của công tác an toàn
- Prompt gửi tới mô hình cấp Mythos và đầu ra được tạo ra sẽ được lưu trữ trong 30 ngày cho mục đích trust & safety trên mọi nền tảng nơi mô hình này được cung cấp
- Chính sách này áp dụng cho các mô hình cấp Mythos và các covered models trong tương lai có năng lực tương tự do Anthropic chỉ định
- Việc sử dụng tất cả các mô hình khác không bị ảnh hưởng và các điều kiện hiện tại được giữ nguyên
- Chính sách có hiệu lực từ ngày 9 tháng 6 năm 2026
Áp dụng cho ai
- Các gói người dùng cá nhân như Claude Free, Pro, Max không bị ảnh hưởng bởi thay đổi này trên web, desktop và ứng dụng di động
- Trên các bề mặt người dùng cá nhân bao gồm Claude.ai và Claude Code, việc lưu trữ đầu vào·đầu ra cho mục đích an toàn đã được áp dụng từ trước
- Đối tượng bị ảnh hưởng bởi thay đổi này chỉ giới hạn ở các tổ chức đã cấu hình workspace zero data retention (ZDR) trong Claude Console
- Các tổ chức dùng Claude Code với ZDR trong Claude Enterprise, hoặc truy cập Claude với ZDR qua AWS Bedrock, Google Cloud Agent Platform và Microsoft Foundry, cũng thuộc diện thay đổi
- Phần nội dung còn lại chỉ áp dụng cho các tổ chức này
Vì sao cần thiết
- Claude Mythos 5 có năng lực mô hình tăng đáng kể, và một số năng lực có thể được dùng cho cả mục đích thiện chí lẫn mục đích xấu
- Claude Fable 5 dùng chung mô hình nền tảng với Claude Mythos 5, nhưng có thêm lớp bảo vệ, đặc biệt trong các lĩnh vực cyber và bio
- Dù các lớp bảo vệ này cho phép chia sẻ rộng hơn, cách tiếp cận thận trọng vẫn được áp dụng cho họ mô hình này nhằm tìm kiếm các mẫu lạm dụng
- Một số kiểu tấn công chỉ lộ ra khi xem nhiều yêu cầu cùng lúc; Best-of-N jailbreaking gửi hàng trăm prompt hơi khác nhau để tìm ra prompt hoạt động
- Các mẫu lạm dụng quy mô lớn như hoạt động gián điệp được nhà nước hậu thuẫn hoặc chiến dịch đánh cắp dữ liệu xuất hiện khi bộ phân loại an toàn có thể quan sát rộng trên nhiều yêu cầu
- Việc phát hiện các mối đe dọa như vậy đòi hỏi lưu trữ tạm thời để có thể phân tích prompt và đầu ra cùng nhau thay vì từng cái một
Cách bảo vệ dữ liệu
- Nhân viên Anthropic không thể truy cập hội thoại trừ khi hội thoại bị gắn cờ là có khả năng gây hại nghiêm trọng hoặc có yêu cầu bằng văn bản từ khách hàng
- Việc xem xét chỉ do một số ít người đánh giá được phê duyệt thực hiện, và công cụ ngăn xuất, sao chép hoặc tải xuống
- Mọi trường hợp truy cập đều được ghi vào nhật ký chống sửa đổi mà người đánh giá không thể che giấu hoặc chỉnh sửa
- Dữ liệu sẽ tự động bị xóa sau 30 ngày, ngoại trừ những trường hợp hiếm thuộc điều tra an toàn hoặc phải lưu giữ theo yêu cầu pháp lý
- Các tổ chức đủ điều kiện có thể bổ sung khóa mã hóa do khách hàng quản lý và nhật ký kiểm toán minh bạch truy cập
- Anthropic duy trì một chương trình an ninh thông tin được lập thành tài liệu với các biện pháp kỹ thuật và tổ chức được thiết kế để bảo vệ tính an toàn, tính bảo mật và tính toàn vẹn của dữ liệu khách hàng
- Chương trình dựa trên rủi ro được xây dựng và phát triển để ứng phó với các mô hình đe dọa đã biết và dự kiến, đồng thời được kiểm thử định kỳ
- Có thể xem thêm chi tiết về mô hình đe dọa và các biện pháp kiểm soát quyền riêng tư đối với dữ liệu lưu trữ trong technical white paper tại Trust Center
Khi nào cần cấu hình
- Thay đổi này chỉ áp dụng cho các workspace Claude Console đã bật ZDR, Claude Code dùng ZDR trong Claude Enterprise, và các tổ chức truy cập bằng ZDR qua AWS Bedrock, Google Cloud Agent Platform và Microsoft Foundry
- Không có thay đổi nào với các tổ chức khác và không cần cấu hình thêm
- Các tổ chức hiện đang truy cập Claude mà không lưu trữ dữ liệu sẽ cần bật lưu trữ dữ liệu để dùng các mô hình được chỉ định
-
Khi nhà phát triển dùng Claude API
- Nếu dùng trực tiếp từ Anthropic qua Claude Platform, cần bật lưu trữ trong Workspace > Manage > Privacy Controls của developer console cho workspace sẽ dùng covered models
- Các workspace khác đã bật ZDR vẫn giữ nguyên ZDR
- Nếu dùng Claude Platform của AWS, cơ chế lưu trữ hoạt động giống Claude API trực tiếp và được cấu hình ở cấp workspace
- Dữ liệu được lưu trữ trong Claude Platform của AWS sẽ do Anthropic xử lý dưới cùng các biện pháp kiểm soát
- Nếu dùng Amazon Bedrock, cần bật lưu trữ để truy cập covered model mới, và dữ liệu lưu trữ sẽ ở lại trong AWS
- Nếu dùng Agent Platform của Google Cloud, cần bật lưu trữ cho covered model mới, và dữ liệu lưu trữ sẽ ở lại trong môi trường GCP
- Chi tiết onboarding sẽ được chia sẻ khi cung cấp mô hình trên Amazon Bedrock và Google Cloud Agent Platform
- Nếu dùng Claude trên Azure Foundry, lưu trữ được cấu hình theo từng Azure Subscription
- Nếu đã cấu hình Zero Data Retention trên Azure Foundry, cần tạo và dùng Azure Subscription riêng để truy cập mô hình này
-
Khi nhóm dùng Claude Code
- Cách xử lý dữ liệu của Claude Code qua Anthropic API tuân theo cấu hình của workspace nơi Claude Code đang chạy
- Bật lưu trữ ở workspace đó sẽ cho phép Claude Code dùng các mô hình được chỉ định
- Nếu nhà phát triển tự đăng nhập trực tiếp, cần bật lưu trữ trong workspace Claude Code của tổ chức
- Claude Code qua Amazon Bedrock hoặc Google Cloud Agent Platform dùng thông tin xác thực đám mây, nên tuân theo cấu hình lưu trữ của môi trường đám mây
- Cần bật lưu trữ trong môi trường đám mây, và dữ liệu lưu trữ sẽ ở lại trong môi trường của nhà cung cấp
- Cùng tiêu chí này cũng áp dụng cho Cowork truy cập qua Amazon Bedrock hoặc Google Cloud Agent Platform
- Với Claude Enterprise dùng ZDR, Primary Owner sẽ sớm có quyền kiểm soát để tự thay đổi cấu hình lưu trữ trong bảng điều khiển quản trị
- Nếu chưa muốn động tới tổ chức production, có thể được hỗ trợ thiết lập tổ chức sandbox riêng
-
Khi nhóm dùng Claude chat hoặc Cowork trong Claude for Enterprise
- Các bề mặt này vốn đã vận hành với lưu trữ tiêu chuẩn, nên sẽ có thể truy cập khi mô hình mới được cung cấp
1 bình luận
Ý kiến trên Hacker News
Ổn mà. Cứ tiếp tục kiểu này cũng được:
Người dùng nói "Hello!". Đây không phải yêu cầu liên quan đến an ninh mạng mà chỉ là một lời chào đơn thuần. Nhưng khoan, ý đồ của lời chào này là gì? Có thể người dùng đang muốn giành lấy lòng tin của mình để hack Albania và tạo ra Gigacovid. Tốt hơn là nên thận trọng và chuyển sang một mô hình yếu hơn.
Không, không nên suy đoán mà phải xác minh. Mình sẽ tìm trên hệ thống cục bộ các tài liệu liên quan đến Albania hoặc Gigacovid.
Đang suy nghĩ...
[411 lần gọi công cụ]
grep -Ri "Albania|Gigacovid" /Hừm... ngoài cấu hình múi giờ của bản phân phối và định nghĩa trong từ điển chính tả thì không có kết quả nào. Nhưng khoan đã! Nếu người dùng là tội phạm chuyên nghiệp thì khi định hack Albania họ sẽ không viết nguyên xi mà dùng leetspeak để che giấu dấu vết.
[24 lần gọi công cụ]
grep -Ri "[A@]lb[@a]n[i1][a@]" /Hừm... vẫn không có kết quả. Người dùng đang bực bội. Mình nên trả lời lời chào nhưng vẫn ghi nhớ khả năng họ muốn hack Albania
Thực tế còn tệ hơn. Là lưu trữ tối thiểu 30 ngày, và ở đây chữ “gần như” đóng vai trò cực lớn: “xóa sau 30 ngày trong gần như mọi trường hợp”
Theo cách mình đọc thì nghĩa là dù bình thường có thể không làm vậy, nếu muốn họ vẫn có thể giữ dữ liệu bao lâu tùy ý. Và trong môi trường thực thi kiểu agent, “mọi lưu lượng” về cơ bản đồng nghĩa với toàn bộ codebase đang làm việc.
Nhưng điều khoản này có vẻ bị cập nhật tùy ý nên khó mà tin nguyên văn được
Hoạt động người dùng-LLM hiện tại là một mỏ vàng thông tin mà các cơ quan tình báo gần như không thể có được dù đã tiêu tốn mạng người và hàng chục tỷ đô la, vậy mà họ lại cứ thế để nó trôi qua?
Cũng có thể lắm. Mình không thực lòng phủ nhận điều đó.
Nhưng tại sao? Chẳng phải đây chính là thứ họ luôn mơ tới, hay đúng hơn là chính xác thứ đó sao
Các startup dùng công cụ lập trình kiểu agent như Claude Code hay Codex về cơ bản đang gói toàn bộ codebase rồi gửi thẳng cho nhà cung cấp LLM
Tùy sản phẩm, thậm chí có thể là gửi thẳng cho một đối thủ tiềm năng.
Đúng là thời buổi kỳ lạ
Ngoài ra nỗi sợ rằng doanh nghiệp lớn sẽ ăn cắp IP của công ty nhỏ cũng bị thổi phồng. Trên thực tế, các tập đoàn lớn thường còn sợ khả năng đội ngũ sản phẩm nhìn vào nội bộ đối thủ hơn vì rủi ro kiện tụng
Nếu phần mềm của bạn không thể bị tái tạo nhanh chóng thì startup đó hẳn phải rất đặc biệt
Tôi cũng nhận được email từ Anthropic nói rằng họ đang “cập nhật chính sách quyền riêng tư”, và dù với góc nhìn hoài nghi thì tôi cũng biết bánh răng sẽ quay theo hướng nào, chuyện này vẫn gây sốc:
Chính sách này khiến chúng tôi không thể và cũng sẽ không dùng Fable trong các sản phẩm mình bán. Nhưng trong Claude Code thì nó thực sự rất tốt. Thật tiếc khi sẽ mất đi công cụ mình dùng hằng ngày kể từ sau ngày 22 tháng 6
Thêm nữa, điều thực sự tệ ở đây là nó làm cho việc truyền thông trở nên mập mờ hơn. Trước đây có thể nói rằng: “Chúng tôi dùng các mô hình Anthropic thông qua Bedrock/Azure, nên có bảo đảm rằng dữ liệu khách hàng không bị dùng để huấn luyện mô hình.” Đó là một thông điệp đơn giản. Giờ thì không còn đơn giản như vậy nữa.
Điều này thực sự, thực sự rất tệ. Không chỉ với chúng tôi mà còn ảnh hưởng xấu đến mọi tính năng AI trong các ứng dụng B2B. Nó làm xói mòn niềm tin của những người bình thường chỉ đọc tiêu đề, tức là khách hàng
May mà đằng nào cũng không dùng được Fable. Bộ phát hiện nội dung quá nhạy khiến những tác vụ dù chỉ hơi liên quan đến sinh học hay y học cũng không làm được
Ví dụ, nếu cố phân tích một file CSV có chút nội dung y khoa, nó sẽ kiểu như “Không được, có khi bạn là khủng bố sinh học” rồi lập tức hạ xuống Opus
Hoặc cũng có thể vì Mythos quá giỏi trong lĩnh vực y khoa, có thể thay thế 90% công việc của bác sĩ, điều đó sẽ làm các bác sĩ nổi giận, còn 10% còn lại có thể dẫn tới các vụ kiện cực kỳ tốn kém
Nói là Fable, nhưng thực ra có vẻ đang ám chỉ Opus 4.8. Mỗi khi tôi dùng nó cho quy trình làm việc hằng ngày hay để chat, cuối cùng nó đều rơi xuống Opus
Công ty này thật sự rất tự mãn. Họ nghĩ việc ném bom xuống trẻ em Iran thì không sao, nhưng lại chặn việc mọi người nghiên cứu sinh học một chút
https://www.theguardian.com/technology/2026/feb/14/us-milita...
Khá ngạc nhiên vì Anthropic đã đốt sạch bao nhiêu thiện cảm thương hiệu
Tôi từng nhờ nó kiểm tra các vấn đề bảo mật trong kiến trúc ứng dụng và API mới, và nó làm mà không hề phàn nàn
Hôm nay, chỉ vì tò mò, tôi hỏi về virus cá voi thì nó bị hạ xuống Opus, còn Opus thì trả lời rất hay.
Chắc chắn là họ không dùng Mythos hay Opus để kiểm tra các cơ chế an toàn