- Theo lệnh kiểm soát xuất khẩu do chính phủ Mỹ ban hành dựa trên thẩm quyền an ninh quốc gia, mọi công dân nước ngoài đều bị chặn truy cập Fable 5·Mythos 5, bất kể ở trong hay ngoài nước Mỹ, và để tuân thủ quy định, dịch vụ cho toàn bộ khách hàng đã bị tạm dừng ngay lập tức
- Lệnh được tiếp nhận lúc 5:21 chiều theo giờ ET, nhưng không nêu chi tiết cụ thể về mối lo ngại an ninh quốc gia
- Có vẻ cơ sở của chính phủ là việc nhận biết các kỹ thuật jailbreaking của Fable 5, nhưng các điểm yếu được xác định bằng kỹ thuật này chỉ là các lỗ hổng mức độ nhẹ đã được biết đến và cũng có thể được phát hiện trên các mô hình công khai khác mà không cần vượt rào
- Anthropic cho biết trước khi phát hành, họ đã thực hiện hàng nghìn giờ kiểm thử red team cùng chính phủ Mỹ, UK AISI và các tổ chức bên ngoài, và không có người thử nghiệm nào tìm ra universal jailbreak
- Anthropic không đồng ý với tiêu chuẩn coi khả năng jailbreak trong phạm vi hẹp là lý do để thu hồi một mô hình thương mại đang được hàng trăm triệu người dùng, và cho rằng nếu áp dụng tương tự với các nhà cung cấp mô hình khác thì việc phát hành mô hình mới gần như sẽ bị đình trệ
Nội dung lệnh và tác động tức thì
- Chính phủ Mỹ viện dẫn thẩm quyền an ninh quốc gia để ban hành lệnh kiểm soát xuất khẩu, buộc mọi công dân nước ngoài truy cập Fable 5·Mythos 5 phải bị chặn, bao gồm cả nhân viên Anthropic mang quốc tịch nước ngoài, bất kể ở trong hay ngoài nước Mỹ
- Hệ quả của lệnh là để tuân thủ quy định, Anthropic đã đột ngột vô hiệu hóa Fable 5·Mythos 5 với toàn bộ khách hàng
- Quyền truy cập vào mọi mô hình Anthropic khác không bị ảnh hưởng
- Lệnh được tiếp nhận lúc 5:21 chiều ET cùng ngày, và trong thư không có chi tiết cụ thể về mối lo ngại an ninh quốc gia
Cơ sở suy đoán cho mối lo của chính phủ
- Có vẻ chính phủ đã nhận biết một kỹ thuật jailbreaking để vượt rào Fable 5
- Khi xem xét bản trình diễn của kỹ thuật này, Anthropic kết luận rằng nó chỉ dùng để xác định một số lỗ hổng mức độ nhẹ đã được biết đến
- Những lỗ hổng này tương đối đơn giản, và các mô hình công khai khác cũng có thể phát hiện tương tự mà không cần vượt rào
Lập trường của Anthropic về các cơ chế an toàn của Fable
- Anthropic cho biết đã đưa vào các cơ chế an toàn mạnh mẽ nhằm giảm đáng kể khả năng bị lạm dụng trong các tác vụ như an ninh mạng, đến mức nhiều người dùng còn phàn nàn rằng chúng quá rộng
- Trong nhiều tuần ngay trước khi ra mắt, công ty đã thực hiện tổng cộng hàng nghìn giờ kiểm thử red team cùng chính phủ Mỹ, UK AISI, nhiều tổ chức tư nhân bên thứ ba và các nhóm nội bộ
- Theo Anthropic, các bài kiểm thử này xác nhận rằng cơ chế an toàn của Fable hiệu quả hơn một cách thực chất so với bất kỳ mô hình đã triển khai nào trước đó
- Không có người thử nghiệm nào tìm thấy universal jailbreak — tức cách vượt qua cơ chế an toàn của mô hình trên diện rộng để mở ra nhiều năng lực mạng khác nhau
Giới hạn của việc phòng thủ hoàn toàn trước jailbreak
- Hiện tại, Anthropic cho rằng không nhà cung cấp nào có thể đạt được khả năng chống jailbreak hoàn toàn, và mọi cơ chế an toàn trong ngành đều dễ tổn thương trước non-universal jailbreak — tức chỉ dẫn ra một số thông tin mạng trong các tình huống cụ thể
- Ngay cả universal jailbreak cũng có thể cuối cùng sẽ được phát hiện trong tương lai, và đây là điều đã được nêu rõ khi phát hành Fable 5
Chiến lược Defense in Depth
- Trước thực tế không thể phòng thủ tuyệt đối, Anthropic áp dụng chiến lược defense in depth, nhằm giới hạn jailbreak trong phạm vi hẹp (non-universal) hoặc khiến nó trở nên rất tốn kém (universal), đồng thời dùng giám sát chặt chẽ để nhanh chóng phát hiện và chặn tấn công
- Vì mục tiêu đó, Anthropic yêu cầu lưu giữ dữ liệu khách hàng trong 30 ngày cho Fable; điều này tạo ra chi phí thực tế cho phía khách hàng nhưng cho phép nghiên cứu và giảm thiểu jailbreak
- Công ty tiếp tục duy trì chiến lược phòng thủ nhiều lớp này, và cho rằng nó đã giảm rủi ro xuống mức tương đương với các mô hình hiện có đã được triển khai rộng rãi trong ngành
- Anthropic cho biết họ chưa từng nhận được báo cáo nào về non-universal jailbreak đáng lo ngại dẫn đến kết quả có hại, và mọi jailbreak tiềm năng được công bố cho đến nay đều chỉ tạo ra phản hồi vô hại hoặc là phát hiện nhẹ không có lợi thế riêng của Mythos
Kiểm chứng chứng cứ do chính phủ cung cấp
- Cho đến nay, chính phủ mới chỉ đưa ra chứng cứ bằng lời nói, với nội dung là một non-universal jailbreak trong phạm vi hẹp, yêu cầu mô hình đọc một codebase cụ thể và sửa lỗi phần mềm
- Anthropic cho biết họ chỉ xác định được một jailbreak tiềm năng đã được chia sẻ với chính phủ, và sau khi xem xét báo cáo được cho là cơ sở của lệnh, công ty xác nhận rằng mức năng lực được nêu ra cũng đang phổ biến rộng rãi trên các mô hình khác như GPT-5.5 của OpenAI
- Đây là mức năng lực mà các bên phòng thủ hệ thống sử dụng hằng ngày
- Anthropic cho biết sẽ chia sẻ thêm chi tiết trong vòng 24 giờ tới
Phản ứng và lập trường của Anthropic
- Anthropic cho biết đã tuân thủ lệnh pháp lý của chính phủ và gỡ quyền truy cập Fable 5·Mythos 5 đối với toàn bộ người dùng
- Tuy vậy, công ty không đồng ý rằng việc phát hiện một jailbreak tiềm năng trong phạm vi hẹp lại đủ để trở thành căn cứ thu hồi một mô hình thương mại đã được triển khai tới hàng trăm triệu người
- Nếu áp dụng cùng tiêu chuẩn này cho toàn ngành, Anthropic cho rằng việc phát hành mô hình mới của mọi nhà cung cấp frontier model gần như sẽ bị đình trệ
- Công ty cho rằng chính phủ nên có quyền ngăn chặn các đợt phát hành không an toàn, nhưng điều đó phải là một phần của quy trình pháp lý minh bạch, công bằng, rõ ràng và dựa trên sự thật kỹ thuật, còn biện pháp lần này không đáp ứng các nguyên tắc đó
- Anthropic xin lỗi vì sự nhầm lẫn với khách hàng, cho rằng đây là một sự hiểu lầm, và đang thúc đẩy khôi phục quyền truy cập sớm nhất có thể
6 bình luận
Dù đọc bao nhiêu lần đi nữa thì cũng thấy như họ đã tự bắn vào chân mình, vì suốt thời gian qua cứ làm ầm lên và liên tục nói rằng mô hình của họ rất nguy hiểm.
Không biết đây rốt cuộc sẽ là thành công hay thất bại của marketing trong tương lai, nhưng trước mắt thì có vẻ là thất bại.
Xét đến làn sóng người dùng đổ vào Anthropic sau vụ Lầu Năm Góc, tôi cho rằng vào đúng thời điểm đang chuẩn bị IPO như hiện nay thì đây tuyệt đối không phải là chuyện khiến Anthropic chịu thiệt.
Cũng rất hợp để che lấp các vấn đề như guardrail, vì ngay từ đầu nếu họ không cung cấp mô hình dưới dạng dịch vụ nữa thì sẽ không còn bị kiểm chứng thêm nữa.
Vậy là các công ty AI giờ không còn lý do gì để phát triển những mô hình có hiệu năng tốt hơn nữa. Có vẻ như sự phát triển của AI chỉ đến đây thôi.
Cái quái gì vậy.. haha
kkkkkkkkkkkkkkkkkkkkkkkkkkkkk
Ý kiến trên Hacker News
Họ đã liên tục dùng chiêu trò tiếp thị bằng nỗi sợ để bán mô hình như thể vượt xa mọi đối thủ, nên giờ xem như đang phải trả giá
Cuối cùng có vẻ họ đã tìm được đúng nhóm khán giả ngốc đủ để tin điều đó
Nghe như có vô số công ty và người dùng đang cược mạnh tay hơn vào các mô hình Trung Quốc
Việc các quốc gia khác tiếp cận những mô hình này có thể là vấn đề an ninh quốc gia của Mỹ. Nhưng giờ việc các nước khác phụ thuộc vào những mô hình này, và rộng hơn là vào công nghệ Mỹ nói chung, cũng trở thành một vấn đề an ninh quốc gia tương tự
Xét về mặt logic, chẳng phải kết luận duy nhất còn lại là Mỹ đã chạm tới trần năng lực mô hình mà họ cho phép công chúng tiếp cận hay sao? Đã có tiền lệ như vậy thì ai còn đầu tư vào các mô hình thông minh hơn nữa
Điều có lẽ còn quan trọng hơn là: nếu một mô hình như Mythos, vốn cùng lắm chỉ là cải tiến dần dần so với Opus, mà còn bị đối xử như thế này, thì mọi khoản đầu tư AI dựa trên giả định về ASI/AGI/các mô hình tốt hơn rất nhiều sẽ thu hồi vốn kiểu gì?
Nếu OpenAI hay Grok hoạt động ở mức tương tự thì có lẽ đã không bị cây gậy sắc bén của chính phủ vụt tới
ChatGPT 2 cũng từng bị coi là quá mạnh để công khai
AI đã tiến nhanh hơn văn hóa và tư duy. Khi chúng ta thích nghi với những gì các mô hình này có thể làm, mọi thứ sẽ nới lỏng đôi chút, rồi đợt cải tiến tiếp theo lại khiến tất cả lặp lại. Lúc nào cũng diễn ra như vậy
Đây là hệ quả của màn trình diễn phô trương kiểu Mỹ quanh các mô hình ngôn ngữ lớn. Lần này nó chỉ phản tác dụng mà thôi
Từ nay, dù mô hình có thực sự nguy hiểm hay không, các tuyên bố về rủi ro đối với mô hình tương lai có lẽ sẽ biến mất
Nếu chính phủ có thể ngẫu nhiên ra lệnh ngừng sử dụng mô hình đối với mọi người nước ngoài trong và ngoài nước Mỹ, thì sẽ chẳng ai dám mạo hiểm xây dựng thứ gì quan trọng trên các mô hình đó. Rồi sẽ chỉ còn là vấn đề thời gian trước khi các công ty nước ngoài bắt kịp và chiếm lấy thị trường thương mại của những mô hình này. Dù vậy, như Mỹ vẫn thường làm, họ có thể sẽ cấm đối thủ cạnh tranh, và rốt cuộc có thể dẫn đến tình huống chỉ riêng ở Mỹ là backend dùng mô hình khác
Trong lúc thế giới phải đối mặt với thiếu hụt dầu mỏ toàn cầu, thiếu hụt phân bón và sự can thiệp vụng về vào việc thổi phồng bong bóng, thật đúng là “đáng mừng” khi tay lái đang nằm trong tay một stable genius lẩm cẩm ngoài 80 tuổi, khinh thường pháp quyền và có tới hai mươi hai bác sĩ chuyên khoa
Với các tập đoàn lớn hoặc tổ chức có quy mô nhất định, rất khó chấp nhận rủi ro rằng lõi hạ tầng có thể đột ngột bị vô hiệu hóa vì những chuyện như thế này. Áp lực đòi hỏi on-premises và truy cập ngoại tuyến sẽ tăng vọt, và tôi nghĩ rồi sẽ có ai đó đáp ứng nhu cầu đó, चाहे là cấp phép trọng số hay các môi trường bị giới hạn như TEE/CC
Một số bên sẽ chấp nhận rủi ro lớn hơn để thắng hoặc thua, còn bên khác sẽ đi an toàn hơn, tích lũy kết quả chậm rãi hoặc bị đào thải
Chưa kể đến rủi ro khi các mô hình này viết ra đoạn mã vận hành công việc của công ty, hoặc hoạt động như tác nhân. Đó thậm chí có thể là mô hình được huấn luyện bởi một tác nhân đi ngược hoàn toàn lợi ích của bạn, dù là doanh nghiệp hay quốc gia
Giờ có quá nhiều thứ phải cân nhắc, và đây là thời điểm thú vị để làm kinh doanh
Ngay cả khi dùng tạm mô hình mở từ một công ty Trung Quốc, nếu họ cắt quyền truy cập hoặc thay đổi điều khoản theo hướng không thể chấp nhận, bạn vẫn có thể chuyển sang on-premises. Có thể phiền phức, nhưng không đe dọa sự sống còn. Ngược lại, nếu phụ thuộc vào mô hình đóng rồi bị cắt, bạn sẽ rơi vào đau đớn thực sự
Bức tranh lớn ở đây là quyền kiểm soát hạ tầng. Các mô hình Trung Quốc sẽ trở thành những mô hình mà mọi người thực sự dùng, rồi từ đó đặt ra tiêu chuẩn. Khi đó sẽ có thêm nhiều nghiên cứu, nhiều công cụ hơn, và cả một hệ sinh thái xung quanh chúng sẽ hình thành
Ngay cả trước vụ ồn ào này, xu hướng đó đã bắt đầu rồi khi các mô hình Trung Quốc đang trở thành những mô hình được dùng nhiều nhất trên toàn thế giới. https://www.indiatoday.in/amp/technology/features/story/clau...
Nếu bạn nói mãi trong thời gian dài về việc sản phẩm của mình nguy hiểm đến mức nào, những người có quyền chặn một sản phẩm nguy hiểm khỏi thị trường có thể sẽ nghe thấy điều đó
Nhất là khi những người đó hiện cũng không thông minh cho lắm, và vốn đã tức giận với Anthropic vì công ty này không giúp họ đạt được các mục tiêu độc đoán riêng
Tôi không nghĩ đây là cờ ba chiều của Anthropic. Họ không phải những thiên tài chiến lược đứng sau hậu trường như họ muốn mình trở thành. Những ai thực sự dùng sản phẩm đều biết Fable và Mythos không phải là cỗ máy tận thế mà chỉ là cải tiến dần dần. Theo tôi, đây là hành động trừng phạt của một chính quyền thích trừng phạt, và Anthropic đã vô tình củng cố lý do cho việc đó bằng thứ ngôn từ ngớ ngẩn của chính họ
Có ghi là việc này xảy ra hôm nay lúc 5 giờ 21 phút theo giờ miền Đông
Trang đó hiển thị ngày 11 tháng 6 năm 2026, và trong 10 phút vừa qua đã được cập nhật thành ngày 12 tháng 6 năm 2026
https://imgur.com/a/lx7HCW9
Google hiển thị rằng trang này đã được crawl từ vài ngày trước
Chỉ cần tìm “the us government directive to suspend access to fable” là được
https://imgur.com/a/EOWWUbD
Việc cấm cả người mang quốc tịch nước ngoài sử dụng, dù họ ở Mỹ hay thậm chí là nhân viên Anthropic, có vẻ quá rộng và hà khắc. Lại còn chỉ vì một lỗ hổng jailbreak tiềm ẩn thoạt nhìn có vẻ nhỏ nhặt, nên có cảm giác là còn điều gì đó hơn những gì đang thấy
Điều đó không có nghĩa là mang lại kết quả tốt cho nhà nghiên cứu hay cho bản thân nghiên cứu. Nó gần giống như một dạng bảo hiểm cho việc sử dụng nguồn vốn theo chỉ thị của Mỹ