1 điểm bởi GN⁺ 4 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Các mô hình cấp Mythos có thể lưu trữ prompt và đầu ra trong 30 ngày và có thể bị đưa vào diện xem xét để phục vụ triển khai có trách nhiệm và công tác an toàn
  • Chính sách này áp dụng cho các mô hình cấp Mythos và các covered models trong tương lai có năng lực tương tự, không ảnh hưởng đến điều kiện sử dụng của các mô hình khác
  • Các gói người dùng cá nhân không bị ảnh hưởng bởi thay đổi này vì đây vốn đã là các bề mặt áp dụng lưu trữ đầu vào·đầu ra cho mục đích an toàn
  • Các tổ chức đã thiết lập ZDR có thể cần cấu hình lưu trữ trên Claude Console, Claude Code trong Claude Enterprise, AWS Bedrock, Google Cloud Agent Platform và Microsoft Foundry
  • Anthropic cho biết cần lưu trữ tạm thời để phát hiện các mẫu lạm dụng trải dài qua nhiều yêu cầu, đồng thời áp dụng xóa tự động sau 30 ngày và quy trình xem xét hạn chế

Phạm vi áp dụng

  • Để triển khai có trách nhiệm các mô hình cấp Mythos, việc lưu trữ và xem xét dữ liệu ở mức hạn chế được yêu cầu như một phần của công tác an toàn
  • Prompt gửi tới mô hình cấp Mythos và đầu ra được tạo ra sẽ được lưu trữ trong 30 ngày cho mục đích trust & safety trên mọi nền tảng nơi mô hình này được cung cấp
  • Chính sách này áp dụng cho các mô hình cấp Mythos và các covered models trong tương lai có năng lực tương tự do Anthropic chỉ định
  • Việc sử dụng tất cả các mô hình khác không bị ảnh hưởng và các điều kiện hiện tại được giữ nguyên
  • Chính sách có hiệu lực từ ngày 9 tháng 6 năm 2026

Áp dụng cho ai

  • Các gói người dùng cá nhân như Claude Free, Pro, Max không bị ảnh hưởng bởi thay đổi này trên web, desktop và ứng dụng di động
  • Trên các bề mặt người dùng cá nhân bao gồm Claude.ai và Claude Code, việc lưu trữ đầu vào·đầu ra cho mục đích an toàn đã được áp dụng từ trước
  • Đối tượng bị ảnh hưởng bởi thay đổi này chỉ giới hạn ở các tổ chức đã cấu hình workspace zero data retention (ZDR) trong Claude Console
  • Các tổ chức dùng Claude Code với ZDR trong Claude Enterprise, hoặc truy cập Claude với ZDR qua AWS Bedrock, Google Cloud Agent Platform và Microsoft Foundry, cũng thuộc diện thay đổi
  • Phần nội dung còn lại chỉ áp dụng cho các tổ chức này

Vì sao cần thiết

  • Claude Mythos 5 có năng lực mô hình tăng đáng kể, và một số năng lực có thể được dùng cho cả mục đích thiện chí lẫn mục đích xấu
  • Claude Fable 5 dùng chung mô hình nền tảng với Claude Mythos 5, nhưng có thêm lớp bảo vệ, đặc biệt trong các lĩnh vực cyber và bio
  • Dù các lớp bảo vệ này cho phép chia sẻ rộng hơn, cách tiếp cận thận trọng vẫn được áp dụng cho họ mô hình này nhằm tìm kiếm các mẫu lạm dụng
  • Một số kiểu tấn công chỉ lộ ra khi xem nhiều yêu cầu cùng lúc; Best-of-N jailbreaking gửi hàng trăm prompt hơi khác nhau để tìm ra prompt hoạt động
  • Các mẫu lạm dụng quy mô lớn như hoạt động gián điệp được nhà nước hậu thuẫn hoặc chiến dịch đánh cắp dữ liệu xuất hiện khi bộ phân loại an toàn có thể quan sát rộng trên nhiều yêu cầu
  • Việc phát hiện các mối đe dọa như vậy đòi hỏi lưu trữ tạm thời để có thể phân tích prompt và đầu ra cùng nhau thay vì từng cái một

Cách bảo vệ dữ liệu

  • Nhân viên Anthropic không thể truy cập hội thoại trừ khi hội thoại bị gắn cờ là có khả năng gây hại nghiêm trọng hoặc có yêu cầu bằng văn bản từ khách hàng
  • Việc xem xét chỉ do một số ít người đánh giá được phê duyệt thực hiện, và công cụ ngăn xuất, sao chép hoặc tải xuống
  • Mọi trường hợp truy cập đều được ghi vào nhật ký chống sửa đổi mà người đánh giá không thể che giấu hoặc chỉnh sửa
  • Dữ liệu sẽ tự động bị xóa sau 30 ngày, ngoại trừ những trường hợp hiếm thuộc điều tra an toàn hoặc phải lưu giữ theo yêu cầu pháp lý
  • Các tổ chức đủ điều kiện có thể bổ sung khóa mã hóa do khách hàng quản lý và nhật ký kiểm toán minh bạch truy cập
  • Anthropic duy trì một chương trình an ninh thông tin được lập thành tài liệu với các biện pháp kỹ thuật và tổ chức được thiết kế để bảo vệ tính an toàn, tính bảo mật và tính toàn vẹn của dữ liệu khách hàng
  • Chương trình dựa trên rủi ro được xây dựng và phát triển để ứng phó với các mô hình đe dọa đã biết và dự kiến, đồng thời được kiểm thử định kỳ
  • Có thể xem thêm chi tiết về mô hình đe dọa và các biện pháp kiểm soát quyền riêng tư đối với dữ liệu lưu trữ trong technical white paper tại Trust Center

Khi nào cần cấu hình

  • Thay đổi này chỉ áp dụng cho các workspace Claude Console đã bật ZDR, Claude Code dùng ZDR trong Claude Enterprise, và các tổ chức truy cập bằng ZDR qua AWS Bedrock, Google Cloud Agent Platform và Microsoft Foundry
  • Không có thay đổi nào với các tổ chức khác và không cần cấu hình thêm
  • Các tổ chức hiện đang truy cập Claude mà không lưu trữ dữ liệu sẽ cần bật lưu trữ dữ liệu để dùng các mô hình được chỉ định
  • Khi nhà phát triển dùng Claude API

    • Nếu dùng trực tiếp từ Anthropic qua Claude Platform, cần bật lưu trữ trong Workspace > Manage > Privacy Controls của developer console cho workspace sẽ dùng covered models
    • Các workspace khác đã bật ZDR vẫn giữ nguyên ZDR
    • Nếu dùng Claude Platform của AWS, cơ chế lưu trữ hoạt động giống Claude API trực tiếp và được cấu hình ở cấp workspace
    • Dữ liệu được lưu trữ trong Claude Platform của AWS sẽ do Anthropic xử lý dưới cùng các biện pháp kiểm soát
    • Nếu dùng Amazon Bedrock, cần bật lưu trữ để truy cập covered model mới, và dữ liệu lưu trữ sẽ ở lại trong AWS
    • Nếu dùng Agent Platform của Google Cloud, cần bật lưu trữ cho covered model mới, và dữ liệu lưu trữ sẽ ở lại trong môi trường GCP
    • Chi tiết onboarding sẽ được chia sẻ khi cung cấp mô hình trên Amazon Bedrock và Google Cloud Agent Platform
    • Nếu dùng Claude trên Azure Foundry, lưu trữ được cấu hình theo từng Azure Subscription
    • Nếu đã cấu hình Zero Data Retention trên Azure Foundry, cần tạo và dùng Azure Subscription riêng để truy cập mô hình này
  • Khi nhóm dùng Claude Code

    • Cách xử lý dữ liệu của Claude Code qua Anthropic API tuân theo cấu hình của workspace nơi Claude Code đang chạy
    • Bật lưu trữ ở workspace đó sẽ cho phép Claude Code dùng các mô hình được chỉ định
    • Nếu nhà phát triển tự đăng nhập trực tiếp, cần bật lưu trữ trong workspace Claude Code của tổ chức
    • Claude Code qua Amazon Bedrock hoặc Google Cloud Agent Platform dùng thông tin xác thực đám mây, nên tuân theo cấu hình lưu trữ của môi trường đám mây
    • Cần bật lưu trữ trong môi trường đám mây, và dữ liệu lưu trữ sẽ ở lại trong môi trường của nhà cung cấp
    • Cùng tiêu chí này cũng áp dụng cho Cowork truy cập qua Amazon Bedrock hoặc Google Cloud Agent Platform
    • Với Claude Enterprise dùng ZDR, Primary Owner sẽ sớm có quyền kiểm soát để tự thay đổi cấu hình lưu trữ trong bảng điều khiển quản trị
    • Nếu chưa muốn động tới tổ chức production, có thể được hỗ trợ thiết lập tổ chức sandbox riêng
  • Khi nhóm dùng Claude chat hoặc Cowork trong Claude for Enterprise

    • Các bề mặt này vốn đã vận hành với lưu trữ tiêu chuẩn, nên sẽ có thể truy cập khi mô hình mới được cung cấp

1 bình luận

 
Ý kiến trên Hacker News
  • Ổn mà. Cứ tiếp tục kiểu này cũng được:
    Người dùng nói "Hello!". Đây không phải yêu cầu liên quan đến an ninh mạng mà chỉ là một lời chào đơn thuần. Nhưng khoan, ý đồ của lời chào này là gì? Có thể người dùng đang muốn giành lấy lòng tin của mình để hack Albania và tạo ra Gigacovid. Tốt hơn là nên thận trọng và chuyển sang một mô hình yếu hơn.
    Không, không nên suy đoán mà phải xác minh. Mình sẽ tìm trên hệ thống cục bộ các tài liệu liên quan đến Albania hoặc Gigacovid.
    Đang suy nghĩ...
    [411 lần gọi công cụ]
    grep -Ri "Albania|Gigacovid" /
    Hừm... ngoài cấu hình múi giờ của bản phân phối và định nghĩa trong từ điển chính tả thì không có kết quả nào. Nhưng khoan đã! Nếu người dùng là tội phạm chuyên nghiệp thì khi định hack Albania họ sẽ không viết nguyên xi mà dùng leetspeak để che giấu dấu vết.
    [24 lần gọi công cụ]
    grep -Ri "[A@]lb[@a]n[i1][a@]" /
    Hừm... vẫn không có kết quả. Người dùng đang bực bội. Mình nên trả lời lời chào nhưng vẫn ghi nhớ khả năng họ muốn hack Albania

    • Phần duy nhất trông có vẻ do con người viết là không có màn tự vỗ vai sau khi đốt một đống token bằng kiểu câu như “making good progress —
    • Đề cử Memoirs Found in a Bathtub của Stanisław Lem. Có đúng kiểu lối suy nghĩ này
    • Bỏ sót đoạn sau chữ Hello là “hạ cấp xuống mô hình tệ hơn
    • Giờ đã tiêu thêm 20 đô la tín dụng sử dụng rồi...
    • Giống độc thoại nội tâm trong Death Note
  • Thực tế còn tệ hơn. Là lưu trữ tối thiểu 30 ngày, và ở đây chữ “gần như” đóng vai trò cực lớn: “xóa sau 30 ngày trong gần như mọi trường hợp”
    Theo cách mình đọc thì nghĩa là dù bình thường có thể không làm vậy, nếu muốn họ vẫn có thể giữ dữ liệu bao lâu tùy ý. Và trong môi trường thực thi kiểu agent, “mọi lưu lượng” về cơ bản đồng nghĩa với toàn bộ codebase đang làm việc.

    We will require 30-day retention for all traffic on Mythos-class models, on both first- and third-party surfaces. We won’t use this data to train new Claude models, or for any non-safety-related purpose, and we’ve instituted new privacy protections including logging all human access to the data and ensuring its deletion after 30 days in almost all cases (see this post for further details). The data will help us defend against complex and novel attacks (including new jailbreaks and attacks that operate across many requests) as well as help us identify and reduce false positives.

    • Có vẻ sau khi mình đăng bình luận thì câu chữ đã đổi, và giờ ghi rõ là đúng 30 ngày như thể không còn ngoại lệ
      Nhưng điều khoản này có vẻ bị cập nhật tùy ý nên khó mà tin nguyên văn được
    • Sao lại có thể là họ vốn còn chưa kiểm toán việc truy cập dữ liệu khách hàng?
    • Cách nói “có thể bình thường họ không làm vậy” là quá rộng lượng. Mình nghĩ bình thường họ sẽ làm vậy. Đó mới là cốt lõi
    • Không thể không tự hỏi liệu câu “chúng tôi sẽ không huấn luyện trên dữ liệu của bạn” có áp dụng cả cho phía hợp đồng với Pentagon kia không. Tất nhiên là không liên quan đâu. Hoặc là...
      Hoạt động người dùng-LLM hiện tại là một mỏ vàng thông tin mà các cơ quan tình báo gần như không thể có được dù đã tiêu tốn mạng người và hàng chục tỷ đô la, vậy mà họ lại cứ thế để nó trôi qua?
      Cũng có thể lắm. Mình không thực lòng phủ nhận điều đó.
      Nhưng tại sao? Chẳng phải đây chính là thứ họ luôn mơ tới, hay đúng hơn là chính xác thứ đó sao
    • Tệ hơn nữa là nếu bật bộ nhớ và dùng Fable, dữ liệu cũ cũng có thể bị kéo vào mạng lưới thu thập dữ liệu khổng lồ này. Mình không hiểu sao Anthropic có thể nghĩ chuyện đó là ổn
  • Các startup dùng công cụ lập trình kiểu agent như Claude Code hay Codex về cơ bản đang gói toàn bộ codebase rồi gửi thẳng cho nhà cung cấp LLM
    Tùy sản phẩm, thậm chí có thể là gửi thẳng cho một đối thủ tiềm năng.
    Đúng là thời buổi kỳ lạ

    • Có quá nhiều người đánh giá quá cao mức độ hữu ích của phần mềm hay tài sản trí tuệ đối với việc vận hành một doanh nghiệp thành công. Trên thực tế, số IP thật sự cần bảo vệ là rất ít, và đa phần chỉ đang vận hành mấy ứng dụng CRUD ngớ ngẩn
      Ngoài ra nỗi sợ rằng doanh nghiệp lớn sẽ ăn cắp IP của công ty nhỏ cũng bị thổi phồng. Trên thực tế, các tập đoàn lớn thường còn sợ khả năng đội ngũ sản phẩm nhìn vào nội bộ đối thủ hơn vì rủi ro kiện tụng
    • Và cả mọi khóa cũng bị gửi đi cùng. Sớm muộn gì môi trường thực thi cũng sẽ đọc chúng thôi
    • Quả là kỳ lạ khi một số người tin rằng vì lý do bảo mật thì không nên dùng mô hình cấp Mythos, còn số khác lại tin rằng vì lý do bảo mật thì phải dùng mô hình cấp Mythos để review code
    • Ý bạn là những công cụ giờ có thể làm lại chỉ với một đêm và cái giá của một gói đăng ký Claude Code à?
      Nếu phần mềm của bạn không thể bị tái tạo nhanh chóng thì startup đó hẳn phải rất đặc biệt
    • Chẳng phải các startup dùng GitLab, GitHub, Bitbucket cũng đang mang cùng một loại rủi ro sao?
  • Tôi cũng nhận được email từ Anthropic nói rằng họ đang “cập nhật chính sách quyền riêng tư”, và dù với góc nhìn hoài nghi thì tôi cũng biết bánh răng sẽ quay theo hướng nào, chuyện này vẫn gây sốc:

    As part of our measures to keep our services safe and secure we may ask you to verify your age or identity, and we've described what we collect and how.
    Có lẽ giờ phải xem hiệu năng của mô hình Trung Quốc rồi. Thời kỳ tốt đẹp có vẻ đã qua

  • Chính sách này khiến chúng tôi không thể và cũng sẽ không dùng Fable trong các sản phẩm mình bán. Nhưng trong Claude Code thì nó thực sự rất tốt. Thật tiếc khi sẽ mất đi công cụ mình dùng hằng ngày kể từ sau ngày 22 tháng 6
    Thêm nữa, điều thực sự tệ ở đây là nó làm cho việc truyền thông trở nên mập mờ hơn. Trước đây có thể nói rằng: “Chúng tôi dùng các mô hình Anthropic thông qua Bedrock/Azure, nên có bảo đảm rằng dữ liệu khách hàng không bị dùng để huấn luyện mô hình.” Đó là một thông điệp đơn giản. Giờ thì không còn đơn giản như vậy nữa.
    Điều này thực sự, thực sự rất tệ. Không chỉ với chúng tôi mà còn ảnh hưởng xấu đến mọi tính năng AI trong các ứng dụng B2B. Nó làm xói mòn niềm tin của những người bình thường chỉ đọc tiêu đề, tức là khách hàng

    • Theo điều khoản thì việc dùng dữ liệu để huấn luyện vẫn bị cấm. Mục đích lưu trữ là để ngăn chặn lạm dụng
  • May mà đằng nào cũng không dùng được Fable. Bộ phát hiện nội dung quá nhạy khiến những tác vụ dù chỉ hơi liên quan đến sinh học hay y học cũng không làm được
    Ví dụ, nếu cố phân tích một file CSV có chút nội dung y khoa, nó sẽ kiểu như “Không được, có khi bạn là khủng bố sinh học” rồi lập tức hạ xuống Opus

    • Tôi thậm chí còn không làm việc về sinh học/y học, nhưng gần như mọi tác vụ PyTorch đều bị dính. Thậm chí không phải hạ cấp sau cảnh báo an toàn, mà là từ chối thẳng với lý do “đây là vi phạm điều khoản”
    • Tôi cũng đụng đúng bức tường đó. Không hiểu mấy kẻ ngốc nào lại làm ra thứ này. Lại còn ngay trước IPO nữa. Marketing của Anthropic từ trước đến nay gần như hoàn hảo, không chê vào đâu được, nhưng đây là một sai lầm nghiêm trọng
    • Tôi nghĩ có thể họ đang định tạo một hạng kiếm tiền riêng cho bác sĩ, vì nhóm này có nhiều tiền và yêu cầu rất cụ thể, nhưng nhìn chung lại không chuyển sang làm việc kỹ thuật nhiều
      Hoặc cũng có thể vì Mythos quá giỏi trong lĩnh vực y khoa, có thể thay thế 90% công việc của bác sĩ, điều đó sẽ làm các bác sĩ nổi giận, còn 10% còn lại có thể dẫn tới các vụ kiện cực kỳ tốn kém
  • Nói là Fable, nhưng thực ra có vẻ đang ám chỉ Opus 4.8. Mỗi khi tôi dùng nó cho quy trình làm việc hằng ngày hay để chat, cuối cùng nó đều rơi xuống Opus

  • Công ty này thật sự rất tự mãn. Họ nghĩ việc ném bom xuống trẻ em Iran thì không sao, nhưng lại chặn việc mọi người nghiên cứu sinh học một chút

    • Cũng đừng quên khoảng 50 người thiệt mạng khi họ tấn công Venezuela. Nếu tôi nhớ không nhầm, họ đã khá công khai ca ngợi rằng Claude góp phần lớn vào nhiệm vụ “thành công” đó
      https://www.theguardian.com/technology/2026/feb/14/us-milita...
    • Tôi cứ nghĩ trước đây họ từng từ chối hỗ trợ các hoạt động chiến tranh mà?
  • Khá ngạc nhiên vì Anthropic đã đốt sạch bao nhiêu thiện cảm thương hiệu

    • Liệu họ có thực sự đang đốt thiện cảm không? Với nhiều người dùng thì đây có thể là lý do quyết định để rời bỏ, nhưng với công chúng nói chung hay giới chính trị thì nó lại có tác dụng đóng dấu an toàn lên thương hiệu
  • Tôi từng nhờ nó kiểm tra các vấn đề bảo mật trong kiến trúc ứng dụng và API mới, và nó làm mà không hề phàn nàn
    Hôm nay, chỉ vì tò mò, tôi hỏi về virus cá voi thì nó bị hạ xuống Opus, còn Opus thì trả lời rất hay.
    Chắc chắn là họ không dùng Mythos hay Opus để kiểm tra các cơ chế an toàn