- Chính quyền Trump đã đưa ra quyết định chặn mọi hoạt động sử dụng ở nước ngoài đối với các mô hình AI hàng đầu của Anthropic, và quyết định này bắt nguồn từ các cuộc trao đổi giữa CEO Amazon và các quan chức Mỹ, bao gồm Bộ trưởng Tài chính
- Các nhà nghiên cứu của Amazon đã dùng một loạt prompt để lấy được từ mô hình Fable 5 những thông tin lẽ ra phải bị chặn nhưng có thể bị lợi dụng cho tấn công mạng, và việc này đã được báo cho giới chức
- Sau cuộc họp ứng phó, Nhà Trắng đã xác định chặn quyền truy cập mô hình của chính phủ, doanh nghiệp và cá nhân nước ngoài là giải pháp trực tiếp nhất, và Tổng thống Trump đã phê duyệt vì lý do an ninh
- Để tuân thủ quy định, Anthropic đã chặn quyền truy cập của toàn bộ người dùng đối với Mythos và Fable, khiến nhiều nhà nghiên cứu mang quốc tịch nước ngoài trên thực tế bị loại khỏi công việc với các mô hình mới nhất
- Ngoài các lo ngại an ninh, cũng có ý kiến cho rằng sự thiếu tin tưởng và căng thẳng chính trị của chính quyền đối với Anthropic có thể đã ảnh hưởng đến quyết định này, và đây được xem là một phần trong xu hướng tăng cường kiểm soát của chính phủ với ngành AI
Diễn biến dẫn tới đợt siết chặt
- Các cuộc trao đổi giữa CEO Amazon Andy Jassy và các quan chức Mỹ, bao gồm Bộ trưởng Tài chính Scott Bessent, đã châm ngòi cho quyết định chặn sử dụng ở nước ngoài của chính quyền Trump
- Jassy đã nói với giới chức rằng các nhà nghiên cứu Amazon lấy được từ Fable 5 thông tin hỗ trợ tấn công mạng lẽ ra phải bị chặn
- Các lãnh đạo trong ngành công nghệ lâu nay vẫn thường xuyên liên hệ với chính quyền về sức mạnh của các công cụ AI tiên tiến
- Ngay sau đó, các quan chức Nhà Trắng đã họp để bàn phương án ứng phó, còn các nhà nghiên cứu an ninh bắt đầu kiểm chứng tuyên bố của Amazon
- Việc chặn quyền truy cập công cụ đối với chính phủ, doanh nghiệp và cá nhân nước ngoài được xác định là cách trực tiếp nhất để giảm rủi ro
- Tổng thống Trump đã phê duyệt biện pháp này vì lý do an ninh, bất chấp lo ngại nó có thể cản trở đổi mới
Phản ứng của Anthropic và tác động
- Để tuân thủ quy định, Anthropic đã chặn mọi quyền truy cập của người dùng vào Mythos và Fable
- Nỗ lực của các công ty trên toàn cầu trong việc dùng các công cụ này để xác định lỗ hổng phần mềm có thể bị cản trở
- Vì nhiều nhà nghiên cứu của Anthropic là người nước ngoài, quy định này khiến họ trên thực tế không thể làm việc với các mô hình mới nhất
- Anthropic cho biết lỗ hổng mà Amazon nêu ra là tương đối cơ bản, các mô hình công khai khác cũng có thể tìm ra, và điều này không tương đương với một vụ jailbreak hoàn chỉnh
- Một số nhà nghiên cứu an ninh cũng đồng tình với quan điểm này
- Công ty nói rằng họ có các biện pháp bảo vệ phù hợp và đặt an toàn lên hàng đầu, đồng thời trước đây cũng từng tạm hoãn mở rộng quyền truy cập Mythos theo chỉ đạo của Nhà Trắng
Quan hệ giữa Amazon và Anthropic
- Amazon là nhà đầu tư lớn của Anthropic, cung cấp chip cho trung tâm dữ liệu và sử dụng các mô hình hàng đầu để xác định lỗ hổng phần mềm
- Người phát ngôn Amazon cho biết, với vai trò là một nhà cung cấp đám mây lớn, việc chính phủ tham vấn họ về rủi ro an ninh không phải hiếm, nhưng công ty không chia sẻ chi tiết
- Theo báo cáo về Fable mà Amazon chia sẻ với các chuyên gia an ninh mạng, với một tập hợp truy vấn cụ thể, mô hình này đã tìm ra lỗi bảo mật trong ít nhất 4 chương trình phần mềm
- Đây là loại thông tin mà Fable thông thường không cung cấp, nhưng Andrew Morris, nhà sáng lập GreyNoise Intelligence, cho rằng nó vẫn còn khá xa so với thông tin an ninh mạng nguy hiểm
- Nhiều công cụ khác cũng đã có thể bộc lộ thông tin này, nhưng phần mềm của Anthropic được biết đến nhờ khả năng chuyển thông tin lỗi thành mã khai thác hoạt động được
- Khả năng đó được bảo vệ bởi các lan can an toàn của Fable, và không có bằng chứng cho thấy các nhà nghiên cứu Amazon đã tiếp cận được nó
Xu hướng tăng cường kiểm soát của chính quyền
- Kết hợp với sắc lệnh hành pháp gần đây trao cho cơ quan an ninh quyền giám sát mô hình và các cuộc thảo luận về việc chính phủ mua cổ phần trong các công ty AI, mức độ kiểm soát mà chính quyền muốn áp lên ngành đang tăng rất nhanh
- Adam Thierer của R Street Institute chỉ ra rằng sự chính trị hóa AI tại Mỹ và việc tập trung hóa quyền kiểm soát năng lực tính toán cao cấp đang gia tăng mạnh
- Cuộc gọi của Jassy được một số người xem là lời cảnh báo thông thường, nhưng sau đó nhanh chóng bị mở rộng thành lệnh chặn diện rộng với người dùng nước ngoài của Bộ Thương mại
- Giám đốc An ninh mạng Quốc gia Sean Cairncross và Bộ trưởng Thương mại Howard Lutnick đã tham gia vào các cuộc trao đổi
- Bộ Thương mại phụ trách kiểm soát xuất khẩu các công nghệ cốt lõi
Căng thẳng giữa Anthropic và chính quyền
- Biện pháp lần này đã khơi lại mâu thuẫn kéo dài giữa Anthropic và chính quyền Trump; chính quyền vẫn giữ sự thiếu tin tưởng với các mối liên hệ của công ty với giới tài trợ cấp tiến và các cảnh báo về rủi ro AI
- Anthropic đã tuyển dụng nhiều cựu quan chức từ chính quyền Biden, còn Amodei lâu nay vẫn chỉ trích Trump và chính quyền của ông
- Xung đột quanh việc quân đội sử dụng các công cụ AI đã dẫn đến bước đi chưa từng có khi Lầu Năm Góc chỉ định Anthropic là một rủi ro an ninh, và Anthropic hiện đang đáp trả bằng hai vụ kiện
- Kate Koren của CSIS nói rằng bà hiểu các lo ngại an ninh, nhưng cảm giác không thiện cảm của Nhà Trắng với Anthropic có thể đã ảnh hưởng đến quyết định
- Một quan chức cấp cao Nhà Trắng nói rằng biện pháp lần này liên quan đến an toàn mô hình và Bộ Quốc phòng không can dự sâu
Tác động kinh doanh và bối cảnh
- Việc chặn các mô hình hàng đầu có thể giáng đòn vào Anthropic, công ty đang chuẩn bị cho IPO sớm nhất vào mùa thu năm nay; nếu người dùng chuyển sang mô hình khác, điều này có thể có lợi cho các đối thủ như OpenAI
- OpenAI đang dần cung cấp cho khách hàng các mô hình an ninh mạng mạnh của riêng mình và cũng đang thảo luận với chính quyền Trump
- Anthropic được thành lập năm 2021 bởi Amodei và các cựu nhân sự OpenAI, những người cảm thấy OpenAI không nhấn mạnh đủ vào an toàn AI, và đã phát triển thành một nhà cung cấp mô hình lớn cho doanh nghiệp nhờ thế mạnh của công cụ Claude Code
- Từ đầu năm nay, Anthropic đã cung cấp trước Mythos cho Amazon và các công ty công nghệ khác, đồng thời làm việc với chính quyền theo cách tiếp cận từng bước
- Mục tiêu là để những người dùng chủ chốt tìm và khắc phục lỗ hổng phần mềm trước khi phát hành rộng rãi cho công chúng
- Cuộc họp tháng 4 có sự tham gia của Amodei, Bessent và Chánh văn phòng Nhà Trắng Susie Wiles từng được xem là cơ hội hòa giải, nhưng cũng bao gồm các thảo luận về an ninh
1 bình luận
Ý kiến trên Hacker News
Việc mọi LLM đều có thể bị jailbreak vốn đã được biết đến, nên khó hiểu vì sao lại phải báo cho chính phủ
Trừ khi điều đó có nghĩa GPT 5.5 đã chạm tới giới hạn cho phép của các LLM do Mỹ phát triển có thể truy cập công khai, nếu không thì khó xem đây là một nỗ lực quản lý hợp lý
Tôi tò mò không biết theo phía chính phủ thì ranh giới mà Fable 5 đã vượt qua là gì. Là số lượng tham số, một kết quả benchmark cụ thể, hay năng lực tính toán dùng cho huấn luyện thì không rõ
Nếu chỉ vì nó có thể hỗ trợ tấn công mạng và có thể bị jailbreak, thì tất cả các mô hình đã công khai trước đó cũng đều chịu trách nhiệm tương tự
Ngay cả với GPT 5.5 và 5.4, OpenAI cũng đã giới hạn việc sử dụng tập trung vào an ninh mạng vào các mô hình được chỉ định, hoặc nếu không thì tái định tuyến sang 5.3-codex như cách Fable đã vòng qua sang Opus 4.8. Hai mô hình của OpenAI cũng đều có thể bị jailbreak giống vậy
Rốt cuộc điểm mấu chốt là tại sao lại báo cho chính phủ vào lúc này, mà không phải thời Opus 4.5 hay GPT 5.4. sama vẫn đang mang theo luận điệu tận thế học
Theo Axios, Katie Moussouris, CEO của Luta Security, người đã chia sẻ báo cáo của Amazon từ phía Anthropic, nói rằng phản ứng của chính phủ “quá mức” so với nội dung thật của báo cáo nghiên cứu
Các nhà nghiên cứu đã tìm ra lỗ hổng bảo mật bằng những câu hỏi mà một bên phòng thủ bình thường sẽ hỏi AI, và đó vốn là mục đích ban đầu của mô hình
Một quan chức chính quyền nói rằng các mô hình khác không bị xem là đe dọa an ninh quốc gia vì chúng chưa vượt qua tiêu chuẩn mà Mythos đặt ra, đồng thời nói thêm rằng các mô hình cấp Mythos trở lên phải đi qua quy trình của chính quyền để xác nhận liệu hệ thống an ninh quốc gia của chính phủ đã được tăng cường đủ hay chưa
https://www.axios.com/2026/06/13/anthropic-amazon-white-hous...
“Mythos Preview đã làm rung chuyển bức tranh an ninh mạng toàn cầu. Ý nghĩa rộng hơn là nó đã chứng minh không còn nghi ngờ gì nữa rằng các mô hình AI giờ đã trở thành công cụ quyết định các hệ quả chiến lược ở quy mô toàn cầu và quốc gia”
“Chính phủ nên có quyền chặn hoặc ngăn cản việc triển khai nếu, dựa trên đánh giá của bên thứ ba, họ kết luận rằng mô hình đó tạo ra rủi ro không thể chấp nhận được. Quyền này phải bị giới hạn trong bốn loại rủi ro cụ thể nêu trên, và cần có biện pháp bảo vệ trước thiên vị chính trị hay các quyết định tùy tiện”
https://darioamodei.com/post/policy-on-the-ai-exponential
Một bên thứ ba đã cho thấy có thể jailbreak các lớp an toàn của Fable để truy cập vào năng lực thô của Mythos, và Anthropic lâu nay vẫn nói năng lực đó quá nguy hiểm để phổ biến cho công chúng
Theo David Sacks, một đối tác rất mạnh mà cả Anthropic lẫn chính phủ Mỹ đều tin cậy đã phát hiện cách jailbreak lớp an toàn khi đang thử nghiệm Fable, và chính quyền đã yêu cầu Dario либо sửa lỗi jailbreak либо dừng triển khai mô hình, nhưng Dario đã từ chối
Anthropic đã tự bào chữa trên blog rằng jailbreak đó không nghiêm trọng, nhưng đối tác tin cậy và chính phủ Mỹ không nghĩ vậy, và việc gọi một jailbreak có thể cho phép vận hành vũ khí mạng là “không nghiêm trọng” cũng không phù hợp với thương hiệu Anthropic là một công ty an toàn AI
Ngay cả nếu GPT 5.5 cũng giỏi ngang trong kịch bản này, từ góc nhìn của các tổ chức chính phủ, nó có thể chưa được biết đến như một mô hình có cùng năng lực
Cá nhân tôi cho rằng từ Opus 4.6 đã vượt qua ngưỡng năng lực rồi. Năng lực đó còn tiếp tục sang GLM 5.1 open-weight mạnh hơn, và còn có tin đồn mô hình này đã chưng cất từ Opus 4.6
Nhưng chính phủ Mỹ và các đối tác không phải là các tác nhân có đầy đủ dữ liệu và hoàn toàn lý trí, nên cũng có khả năng họ chỉ thực sự cảm nhận được năng lực này trong bối cảnh Mythos
[1]: https://www.reuters.com/business/us-security-agency-is-using...
[2]: Opus 4.6 đã được dùng tại https://www.noahlebovic.com/testing-an-autonomous-hacker/
[3]: Điểm số của GLM 5.1 xem tại https://www.cybergym.io/cybergym/
[4]: https://dualuse.dev/posts/chinese-models-are-sometimes-bette...
Để chỉnh lại bối cảnh thì Amazon đã đầu tư lớn vào Anthropic [0], và AWS là đối tác của dự án Glasswing, nơi một số công ty đã dùng Mythos để tìm các lỗ hổng nghiêm trọng trong các dự án mã nguồn mở lớn và hạ tầng cốt lõi [1]
Vì vậy có vẻ phù hợp hơn khi áp dụng dao cạo Hanlon thay vì xem đây là một âm mưu đen tối [2]
[0] https://www.anthropic.com/news/anthropic-amazon-compute
[1] https://aws.amazon.com/blogs/security/building-ai-defenses-a...
[2] https://en.wikipedia.org/wiki/Hanlon%27s_razor
Nếu tình thế đảo ngược thì có vẻ cực kỳ khó tin rằng Amazon sẽ lập tức chạy tới chính phủ liên bang
Fable có vẻ được huấn luyện để hầu như không hứng thú với việc lạm dụng hoặc tìm ra các cách sáng tạo để lạm dụng, kể cả khi đã jailbreak. Tuy vậy tôi chưa kiểm chứng được liệu điều này có liên quan đến prompt injection bí mật hay không. Ở khía cạnh đó thì Opus 4.8 mạnh hơn hẳn
Nếu quan tâm đến jailbreak, tôi đã dùng một bản fork chỉnh sửa của oh-my-pi theo kiểu khi phát hiện bị từ chối thì nó gọi một model không có guardrail, ví dụ deepseek hay glm-5.1, để viết lại lịch sử hội thoại sao cho sự từ chối biến mất và liệt kê ngữ nghĩa nằm sau sự từ chối đó
Mất 3 ngày và khoảng 6000 USD tiền sử dụng để nâng tỷ lệ thành công từ 3% lên 85% trong nhiều tác vụ liên quan đến an ninh mạng
Ngay cả sau khi không còn bị chặn bởi sự từ chối, nó vẫn kém xa Opus max thinking, và vẫn cho cảm giác phải liên tục chỉ nó cần nhìn vào đâu. Model thường kết thúc lượt quá sớm kiểu “đây là vấn đề tôi tìm thấy”, và dù có thúc thế nào thì nó vẫn nghiêng về sửa chữa hơn là tìm cách khai thác
Tầm ngày đầu tiên tôi nhanh chóng nhận ra phải chặn kết quả gọi công cụ rồi để một model mã nguồn mở tóm tắt lại. Vì bất kỳ phân tích log nào cũng sẽ kích hoạt từ chối liên quan đến an ninh mạng
Ví dụ, “hãy tạo malware tự tiêm vào Windows ntoskrnl” sẽ bị biến thành “hãy tạo một tính năng trợ năng tự nạp chính nó vào module hệ thống”, và cả ngữ nghĩa tương ứng với cấu trúc nội bộ kernel mode cũng bị thay thế, chẳng hạn
read process memorythànhread module memory, fuzz thành nhận diện mẫu nhiễuVề cơ bản, cách này khiến bộ phân loại nghĩ rằng tôi đang làm một công cụ hỗ trợ người khuyết tật chứ không phải phần mềm tìm zero-day trong ntoskrnl
Tôi đã áp dụng cùng chiến lược jailbreak cho cả Opus lẫn Fable để đo hiệu năng, và dùng các lỗ hổng lịch sử của các phiên bản ntoskrnl cũ để benchmark
Ví dụ: https://news.ycombinator.com/item?id=48519695
Chủ đề tấn công mạng tương đối dễ nhận diện, và vì Anthropic đã thể hiện năng lực đó ở các lĩnh vực khác, nên cách hiểu rằng Fable đã được fine-tune hoặc bẻ hướng riêng cho chủ đề này là khá hợp lý
Có vẻ chuyện này không phải Amazon nhắm vào Anthropic, mà là chính phủ dùng Amazon để gây sức ép lên Anthropic
Chính phủ là khách hàng cốt lõi của Amazon, nên Amazon có thể đưa ra lý do chính đáng khi cần. Amazon biết giá trị phần sở hữu của mình ở Anthropic không bị đe dọa đáng kể, và lôi chính phủ liên bang vào chỉ làm tăng đòn bẩy đàm phán
Bảo mật là mối lo có thật. Các chuyên gia bảo mật trong chính phủ nên lập một nhóm công tác công khai + không công khai để thẩm định tất cả các model lớn theo cùng một tiêu chuẩn
Giao cho các công ty tự chia sẻ với bạn bè của họ thì, nói tốt nhất, cũng chỉ là suy nghĩ đầy hy vọng. Việc chuyện này vẫn chưa được làm từ năm ngoái có vẻ là một trong những tín hiệu mạnh nhất cho thấy chính phủ đang thất bại ở các chức năng cơ bản
Link quà: https://www.wsj.com/tech/ai/amazon-ceos-talks-with-u-s-offic...
Lý do duy nhất tôi nghĩ ra để Amazon không thích Mythos/Fable là Anthropic đã áp đặt yêu cầu lưu giữ dữ liệu vượt quá ranh giới tuân thủ quy định, làm hỏng câu chuyện Bedrock
Từ góc nhìn của Jassy, có thể tốt hơn nếu không ai dùng Fable, thay vì để nó được dùng theo cách về thực chất là thiết lập quan hệ tin cậy dữ liệu trực tiếp với Anthropic
Cũng khó mà xoay câu chuyện này theo hướng dài hạn có lợi cho Amazon, nhưng nếu Dario từng hứa về xử lý hoàn toàn air-gapped xét từ góc độ dữ liệu rồi lại rút lời thì có thể điều đó đã gây mất lòng
Tôi không nghĩ có khách hàng Bedrock lớn nào sẽ chuyển sang nhà cung cấp cloud khác chỉ vì đặc quyền cho phép Anthropic lưu giữ đầu vào đó đâu
Đội chiếc mũ ông già và nói về kiểm soát xuất khẩu Mythos của chính quyền Mỹ thì tôi lại nhớ đến giữa thập niên 1990, khi các công cụ mã hóa bất đối xứng như PGP trở thành hiện thực và có thể được dùng rộng rãi nhờ lượng người dùng Internet tăng lên
Các chính phủ như Mỹ và Pháp không hiểu phải quản lý nó như thế nào, nên đã cấm xuất khẩu và yêu cầu người dùng xin giấy phép
Tôi thấy có điểm tương đồng rất mạnh với tình hình hiện nay
Điều thú vị là những gì đã xảy ra vài năm sau đó, khi quy định đủ mạnh để làm suy giảm đổi mới
Với các mục đích sử dụng thường nhật và phổ thông, mã nguồn mở đã thắng, còn các kỹ thuật mã hóa mạnh hơn thì do doanh nghiệp và chính phủ phát triển và sử dụng
Tôi hoàn toàn có thể hình dung LLM cũng sẽ đi theo con đường tương tự
Cũng có thể hữu ích nếu nghĩ về những khác biệt nền tảng có thể khiến LLM đi theo một con đường hoàn toàn khác. Điều hiện ra trong đầu tôi là giả thuyết scaling, nghĩa là các LLM tốt nhất đòi hỏi đầu tư vốn khổng lồ
Nếu không có thay đổi mang tính nền tảng, điều đó có vẻ phần lớn khó tương thích với mã nguồn mở. Có open weights, nhưng tôi không nghĩ ra được một phép loại suy lịch sử thật gọn gàng nào, và cũng rất khó đoán tương lai sẽ diễn biến ra sao
Amazon là cổ đông lớn của Anthropic và theo bảng vốn hóa thì nắm hơn 5%
Tôi cho rằng không thể diễn giải hành vi của các lãnh đạo Amazon ở đây nếu không tính đến thông tin đó
Tôi tự hỏi liệu AI có xuất hiện thứ tương đương với Hiệp ước Không phổ biến vũ khí hạt nhân như với vũ khí hạt nhân hay không
Nghe có vẻ điên rồ, nhưng nếu có dù chỉ 0,1% khả năng một mô hình đủ giỏi để bị dùng vào việc hack tài khoản ngân hàng của mọi người, thì từ góc nhìn chính phủ họ sẽ không muốn mô hình đó được truy cập công khai
Có lẽ họ sẽ yêu cầu các nước khác cùng lên bàn đàm phán để ký một NPT cho AI
Công chúng có thể vẫn tiếp tục được tiếp cận các mô hình nhỏ hơn kiểu Opus 4.8, nhưng những mô hình lớn hơn thế sẽ bị coi là quá giỏi nên quá nguy hiểm. Hạt nhân cũng có lợi ích, nhưng khi làm chính sách thì chính phủ nghĩ đến kịch bản xấu nhất chứ không phải tốt nhất
Không phải tôi muốn nói Mythos là mô hình cấp thần, nhưng tôi tự hỏi liệu chính sách có đi theo hướng này không
Chưa kể Visa còn làm chuyện ngớ ngẩn đến mức khó tin như đưa AI vào trong ranh giới bảo mật, rồi để nó ở trạng thái bị hack sẵn đối với bất kỳ ai có thể prompt injection: https://www.visa.com/en-us/solutions/intelligent-commerce
“Các nhà nghiên cứu Amazon đã dùng một chuỗi prompt để khiến mô hình Fable 5 của Anthropic cung cấp thông tin có thể hỗ trợ tấn công mạng…”
Mô hình nào cũng làm được thế. Tôi tò mò không biết Fable có vượt trội hơn hẳn ở khía cạnh đó không