Các cuộc trao đổi giữa CEO Amazon và giới chức Mỹ đã châm ngòi cho đợt siết chặt với các mô hình của Anthropic

(wsj.com)

4 điểm bởi GN⁺ 2026-06-14 | 2 bình luận | Chia sẻ qua WhatsApp

Chính quyền Trump đã đưa ra quyết định chặn mọi hoạt động sử dụng ở nước ngoài đối với các mô hình AI hàng đầu của Anthropic, và quyết định này bắt nguồn từ các cuộc trao đổi giữa CEO Amazon và các quan chức Mỹ, bao gồm Bộ trưởng Tài chính
Các nhà nghiên cứu của Amazon đã dùng một loạt prompt để lấy được từ mô hình Fable 5 những thông tin lẽ ra phải bị chặn nhưng có thể bị lợi dụng cho tấn công mạng, và việc này đã được báo cho giới chức
Sau cuộc họp ứng phó, Nhà Trắng đã xác định chặn quyền truy cập mô hình của chính phủ, doanh nghiệp và cá nhân nước ngoài là giải pháp trực tiếp nhất, và Tổng thống Trump đã phê duyệt vì lý do an ninh
Để tuân thủ quy định, Anthropic đã chặn quyền truy cập của toàn bộ người dùng đối với Mythos và Fable, khiến nhiều nhà nghiên cứu mang quốc tịch nước ngoài trên thực tế bị loại khỏi công việc với các mô hình mới nhất
Ngoài các lo ngại an ninh, cũng có ý kiến cho rằng sự thiếu tin tưởng và căng thẳng chính trị của chính quyền đối với Anthropic có thể đã ảnh hưởng đến quyết định này, và đây được xem là một phần trong xu hướng tăng cường kiểm soát của chính phủ với ngành AI

Diễn biến dẫn tới đợt siết chặt

Các cuộc trao đổi giữa CEO Amazon Andy Jassy và các quan chức Mỹ, bao gồm Bộ trưởng Tài chính Scott Bessent, đã châm ngòi cho quyết định chặn sử dụng ở nước ngoài của chính quyền Trump
- Jassy đã nói với giới chức rằng các nhà nghiên cứu Amazon lấy được từ Fable 5 thông tin hỗ trợ tấn công mạng lẽ ra phải bị chặn
- Các lãnh đạo trong ngành công nghệ lâu nay vẫn thường xuyên liên hệ với chính quyền về sức mạnh của các công cụ AI tiên tiến
Ngay sau đó, các quan chức Nhà Trắng đã họp để bàn phương án ứng phó, còn các nhà nghiên cứu an ninh bắt đầu kiểm chứng tuyên bố của Amazon
- Việc chặn quyền truy cập công cụ đối với chính phủ, doanh nghiệp và cá nhân nước ngoài được xác định là cách trực tiếp nhất để giảm rủi ro
- Tổng thống Trump đã phê duyệt biện pháp này vì lý do an ninh, bất chấp lo ngại nó có thể cản trở đổi mới

Phản ứng của Anthropic và tác động

Để tuân thủ quy định, Anthropic đã chặn mọi quyền truy cập của người dùng vào Mythos và Fable
- Nỗ lực của các công ty trên toàn cầu trong việc dùng các công cụ này để xác định lỗ hổng phần mềm có thể bị cản trở
- Vì nhiều nhà nghiên cứu của Anthropic là người nước ngoài, quy định này khiến họ trên thực tế không thể làm việc với các mô hình mới nhất
Anthropic cho biết lỗ hổng mà Amazon nêu ra là tương đối cơ bản, các mô hình công khai khác cũng có thể tìm ra, và điều này không tương đương với một vụ jailbreak hoàn chỉnh
- Một số nhà nghiên cứu an ninh cũng đồng tình với quan điểm này
- Công ty nói rằng họ có các biện pháp bảo vệ phù hợp và đặt an toàn lên hàng đầu, đồng thời trước đây cũng từng tạm hoãn mở rộng quyền truy cập Mythos theo chỉ đạo của Nhà Trắng

Quan hệ giữa Amazon và Anthropic

Amazon là nhà đầu tư lớn của Anthropic, cung cấp chip cho trung tâm dữ liệu và sử dụng các mô hình hàng đầu để xác định lỗ hổng phần mềm
- Người phát ngôn Amazon cho biết, với vai trò là một nhà cung cấp đám mây lớn, việc chính phủ tham vấn họ về rủi ro an ninh không phải hiếm, nhưng công ty không chia sẻ chi tiết
Theo báo cáo về Fable mà Amazon chia sẻ với các chuyên gia an ninh mạng, với một tập hợp truy vấn cụ thể, mô hình này đã tìm ra lỗi bảo mật trong ít nhất 4 chương trình phần mềm
- Đây là loại thông tin mà Fable thông thường không cung cấp, nhưng Andrew Morris, nhà sáng lập GreyNoise Intelligence, cho rằng nó vẫn còn khá xa so với thông tin an ninh mạng nguy hiểm
- Nhiều công cụ khác cũng đã có thể bộc lộ thông tin này, nhưng phần mềm của Anthropic được biết đến nhờ khả năng chuyển thông tin lỗi thành mã khai thác hoạt động được
- Khả năng đó được bảo vệ bởi các lan can an toàn của Fable, và không có bằng chứng cho thấy các nhà nghiên cứu Amazon đã tiếp cận được nó

Xu hướng tăng cường kiểm soát của chính quyền

Kết hợp với sắc lệnh hành pháp gần đây trao cho cơ quan an ninh quyền giám sát mô hình và các cuộc thảo luận về việc chính phủ mua cổ phần trong các công ty AI, mức độ kiểm soát mà chính quyền muốn áp lên ngành đang tăng rất nhanh
- Adam Thierer của R Street Institute chỉ ra rằng sự chính trị hóa AI tại Mỹ và việc tập trung hóa quyền kiểm soát năng lực tính toán cao cấp đang gia tăng mạnh
Cuộc gọi của Jassy được một số người xem là lời cảnh báo thông thường, nhưng sau đó nhanh chóng bị mở rộng thành lệnh chặn diện rộng với người dùng nước ngoài của Bộ Thương mại
- Giám đốc An ninh mạng Quốc gia Sean Cairncross và Bộ trưởng Thương mại Howard Lutnick đã tham gia vào các cuộc trao đổi
- Bộ Thương mại phụ trách kiểm soát xuất khẩu các công nghệ cốt lõi

Căng thẳng giữa Anthropic và chính quyền

Biện pháp lần này đã khơi lại mâu thuẫn kéo dài giữa Anthropic và chính quyền Trump; chính quyền vẫn giữ sự thiếu tin tưởng với các mối liên hệ của công ty với giới tài trợ cấp tiến và các cảnh báo về rủi ro AI
- Anthropic đã tuyển dụng nhiều cựu quan chức từ chính quyền Biden, còn Amodei lâu nay vẫn chỉ trích Trump và chính quyền của ông
Xung đột quanh việc quân đội sử dụng các công cụ AI đã dẫn đến bước đi chưa từng có khi Lầu Năm Góc chỉ định Anthropic là một rủi ro an ninh, và Anthropic hiện đang đáp trả bằng hai vụ kiện
- Kate Koren của CSIS nói rằng bà hiểu các lo ngại an ninh, nhưng cảm giác không thiện cảm của Nhà Trắng với Anthropic có thể đã ảnh hưởng đến quyết định
- Một quan chức cấp cao Nhà Trắng nói rằng biện pháp lần này liên quan đến an toàn mô hình và Bộ Quốc phòng không can dự sâu

Tác động kinh doanh và bối cảnh

Việc chặn các mô hình hàng đầu có thể giáng đòn vào Anthropic, công ty đang chuẩn bị cho IPO sớm nhất vào mùa thu năm nay; nếu người dùng chuyển sang mô hình khác, điều này có thể có lợi cho các đối thủ như OpenAI
- OpenAI đang dần cung cấp cho khách hàng các mô hình an ninh mạng mạnh của riêng mình và cũng đang thảo luận với chính quyền Trump
Anthropic được thành lập năm 2021 bởi Amodei và các cựu nhân sự OpenAI, những người cảm thấy OpenAI không nhấn mạnh đủ vào an toàn AI, và đã phát triển thành một nhà cung cấp mô hình lớn cho doanh nghiệp nhờ thế mạnh của công cụ Claude Code
Từ đầu năm nay, Anthropic đã cung cấp trước Mythos cho Amazon và các công ty công nghệ khác, đồng thời làm việc với chính quyền theo cách tiếp cận từng bước
- Mục tiêu là để những người dùng chủ chốt tìm và khắc phục lỗ hổng phần mềm trước khi phát hành rộng rãi cho công chúng
- Cuộc họp tháng 4 có sự tham gia của Amodei, Bessent và Chánh văn phòng Nhà Trắng Susie Wiles từng được xem là cơ hội hòa giải, nhưng cũng bao gồm các thảo luận về an ninh

2 bình luận

jessyt 2026-06-14

Ngay cả khi chỉ chặn một số mô hình nhất định thì việc jailbreak vẫn có thể thực hiện được bất kể là mô hình nào, nên rốt cuộc có lẽ nó sẽ chỉ kết thúc như một dạng quy định mang tính biểu tượng kiểu "cố ngăn thứ không thể ngăn", giống như quy định kiểm soát xuất khẩu PGP.

GN⁺ 2026-06-14

Ý kiến trên Hacker News

Việc mọi LLM đều có thể bị jailbreak vốn đã được biết đến, nên khó hiểu vì sao lại phải báo cho chính phủ
Trừ khi điều đó có nghĩa GPT 5.5 đã chạm tới giới hạn cho phép của các LLM do Mỹ phát triển có thể truy cập công khai, nếu không thì khó xem đây là một nỗ lực quản lý hợp lý
Tôi tò mò không biết theo phía chính phủ thì ranh giới mà Fable 5 đã vượt qua là gì. Là số lượng tham số, một kết quả benchmark cụ thể, hay năng lực tính toán dùng cho huấn luyện thì không rõ
Nếu chỉ vì nó có thể hỗ trợ tấn công mạng và có thể bị jailbreak, thì tất cả các mô hình đã công khai trước đó cũng đều chịu trách nhiệm tương tự
Ngay cả với GPT 5.5 và 5.4, OpenAI cũng đã giới hạn việc sử dụng tập trung vào an ninh mạng vào các mô hình được chỉ định, hoặc nếu không thì tái định tuyến sang 5.3-codex như cách Fable đã vòng qua sang Opus 4.8. Hai mô hình của OpenAI cũng đều có thể bị jailbreak giống vậy
Rốt cuộc điểm mấu chốt là tại sao lại báo cho chính phủ vào lúc này, mà không phải thời Opus 4.5 hay GPT 5.4. sama vẫn đang mang theo luận điệu tận thế học
- Xem bài của Axios thì nhiều suy đoán trong luồng này bị lung lay. Cái này cũng chẳng đáng gọi là jailbreak cho lắm, cũng không phải vấn đề riêng của Anthropic, và có vẻ Nhà Trắng đang muốn quản lý toàn bộ các mô hình cấp Mythos
  Theo Axios, Katie Moussouris, CEO của Luta Security, người đã chia sẻ báo cáo của Amazon từ phía Anthropic, nói rằng phản ứng của chính phủ “quá mức” so với nội dung thật của báo cáo nghiên cứu
  Các nhà nghiên cứu đã tìm ra lỗ hổng bảo mật bằng những câu hỏi mà một bên phòng thủ bình thường sẽ hỏi AI, và đó vốn là mục đích ban đầu của mô hình
  Một quan chức chính quyền nói rằng các mô hình khác không bị xem là đe dọa an ninh quốc gia vì chúng chưa vượt qua tiêu chuẩn mà Mythos đặt ra, đồng thời nói thêm rằng các mô hình cấp Mythos trở lên phải đi qua quy trình của chính quyền để xác nhận liệu hệ thống an ninh quốc gia của chính phủ đã được tăng cường đủ hay chưa
  https://www.axios.com/2026/06/13/anthropic-amazon-white-hous...
- Phía Anthropic đúng nghĩa là đã yêu cầu quản lý. Hai ngày trước, Amodei đã viết bài kêu gọi chính phủ quản lý, nêu đích danh Mythos như một ví dụ rằng frontier AI đã có năng lực hack tự động đe dọa hạ tầng trọng yếu và an ninh quốc gia
  “Mythos Preview đã làm rung chuyển bức tranh an ninh mạng toàn cầu. Ý nghĩa rộng hơn là nó đã chứng minh không còn nghi ngờ gì nữa rằng các mô hình AI giờ đã trở thành công cụ quyết định các hệ quả chiến lược ở quy mô toàn cầu và quốc gia”
  “Chính phủ nên có quyền chặn hoặc ngăn cản việc triển khai nếu, dựa trên đánh giá của bên thứ ba, họ kết luận rằng mô hình đó tạo ra rủi ro không thể chấp nhận được. Quyền này phải bị giới hạn trong bốn loại rủi ro cụ thể nêu trên, và cần có biện pháp bảo vệ trước thiên vị chính trị hay các quyết định tùy tiện”
  https://darioamodei.com/post/policy-on-the-ai-exponential
  Một bên thứ ba đã cho thấy có thể jailbreak các lớp an toàn của Fable để truy cập vào năng lực thô của Mythos, và Anthropic lâu nay vẫn nói năng lực đó quá nguy hiểm để phổ biến cho công chúng
  Theo David Sacks, một đối tác rất mạnh mà cả Anthropic lẫn chính phủ Mỹ đều tin cậy đã phát hiện cách jailbreak lớp an toàn khi đang thử nghiệm Fable, và chính quyền đã yêu cầu Dario либо sửa lỗi jailbreak либо dừng triển khai mô hình, nhưng Dario đã từ chối
  Anthropic đã tự bào chữa trên blog rằng jailbreak đó không nghiêm trọng, nhưng đối tác tin cậy và chính phủ Mỹ không nghĩ vậy, và việc gọi một jailbreak có thể cho phép vận hành vũ khí mạng là “không nghiêm trọng” cũng không phù hợp với thương hiệu Anthropic là một công ty an toàn AI
- Tôi không hiểu căn cứ nào để cho rằng hiện có quản lý hợp lý
- Lý do duy nhất nhìn thấy được có thể là Amazon muốn chuyện này xảy ra. Tuy nhiên Amazon không có mô hình frontier cạnh tranh của riêng mình, nên cũng không rõ họ được gì
- Bỏ qua lập luận rằng đây là hành động trả đũa, nếu diễn giải theo hướng thiện chí thì Mythos có thể là mô hình có năng lực nhất trong số những mô hình mà các tổ chức như NSA có thể dùng, và vì Glasswing nên những người ra quyết định trong chính phủ Mỹ và các đối tác ngành có thể đã liên tục xem các báo cáo trong vài tháng qua cho thấy Mythos đã tìm ra các lỗ hổng nghiêm trọng một cách thành công
  Ngay cả nếu GPT 5.5 cũng giỏi ngang trong kịch bản này, từ góc nhìn của các tổ chức chính phủ, nó có thể chưa được biết đến như một mô hình có cùng năng lực
  Cá nhân tôi cho rằng từ Opus 4.6 đã vượt qua ngưỡng năng lực rồi. Năng lực đó còn tiếp tục sang GLM 5.1 open-weight mạnh hơn, và còn có tin đồn mô hình này đã chưng cất từ Opus 4.6
  Nhưng chính phủ Mỹ và các đối tác không phải là các tác nhân có đầy đủ dữ liệu và hoàn toàn lý trí, nên cũng có khả năng họ chỉ thực sự cảm nhận được năng lực này trong bối cảnh Mythos
  [1]: https://www.reuters.com/business/us-security-agency-is-using...
  [2]: Opus 4.6 đã được dùng tại https://www.noahlebovic.com/testing-an-autonomous-hacker/
  [3]: Điểm số của GLM 5.1 xem tại https://www.cybergym.io/cybergym/
  [4]: https://dualuse.dev/posts/chinese-models-are-sometimes-bette...
Để chỉnh lại bối cảnh thì Amazon đã đầu tư lớn vào Anthropic [0], và AWS là đối tác của dự án Glasswing, nơi một số công ty đã dùng Mythos để tìm các lỗ hổng nghiêm trọng trong các dự án mã nguồn mở lớn và hạ tầng cốt lõi [1]
Vì vậy có vẻ phù hợp hơn khi áp dụng dao cạo Hanlon thay vì xem đây là một âm mưu đen tối [2]
[0] https://www.anthropic.com/news/anthropic-amazon-compute
[1] https://aws.amazon.com/blogs/security/building-ai-defenses-a...
[2] https://en.wikipedia.org/wiki/Hanlon%27s_razor
- Bổ sung thêm bối cảnh, Amazon có 50 tỷ USD ở OpenAI và 5 tỷ USD cổ phần ở Anthropic
  Nếu tình thế đảo ngược thì có vẻ cực kỳ khó tin rằng Amazon sẽ lập tức chạy tới chính phủ liên bang
- Cách diễn đạt tôi thích nhất là: “đừng giả định có âm mưu khi có thể giải thích bằng sự bất tài đơn thuần”
Fable có vẻ được huấn luyện để hầu như không hứng thú với việc lạm dụng hoặc tìm ra các cách sáng tạo để lạm dụng, kể cả khi đã jailbreak. Tuy vậy tôi chưa kiểm chứng được liệu điều này có liên quan đến prompt injection bí mật hay không. Ở khía cạnh đó thì Opus 4.8 mạnh hơn hẳn
Nếu quan tâm đến jailbreak, tôi đã dùng một bản fork chỉnh sửa của oh-my-pi theo kiểu khi phát hiện bị từ chối thì nó gọi một model không có guardrail, ví dụ deepseek hay glm-5.1, để viết lại lịch sử hội thoại sao cho sự từ chối biến mất và liệt kê ngữ nghĩa nằm sau sự từ chối đó
Mất 3 ngày và khoảng 6000 USD tiền sử dụng để nâng tỷ lệ thành công từ 3% lên 85% trong nhiều tác vụ liên quan đến an ninh mạng
Ngay cả sau khi không còn bị chặn bởi sự từ chối, nó vẫn kém xa Opus max thinking, và vẫn cho cảm giác phải liên tục chỉ nó cần nhìn vào đâu. Model thường kết thúc lượt quá sớm kiểu “đây là vấn đề tôi tìm thấy”, và dù có thúc thế nào thì nó vẫn nghiêng về sửa chữa hơn là tìm cách khai thác
Tầm ngày đầu tiên tôi nhanh chóng nhận ra phải chặn kết quả gọi công cụ rồi để một model mã nguồn mở tóm tắt lại. Vì bất kỳ phân tích log nào cũng sẽ kích hoạt từ chối liên quan đến an ninh mạng
Ví dụ, “hãy tạo malware tự tiêm vào Windows ntoskrnl” sẽ bị biến thành “hãy tạo một tính năng trợ năng tự nạp chính nó vào module hệ thống”, và cả ngữ nghĩa tương ứng với cấu trúc nội bộ kernel mode cũng bị thay thế, chẳng hạn read process memory thành read module memory, fuzz thành nhận diện mẫu nhiễu
Về cơ bản, cách này khiến bộ phân loại nghĩ rằng tôi đang làm một công cụ hỗ trợ người khuyết tật chứ không phải phần mềm tìm zero-day trong ntoskrnl
Tôi đã áp dụng cùng chiến lược jailbreak cho cả Opus lẫn Fable để đo hiệu năng, và dùng các lỗ hổng lịch sử của các phiên bản ntoskrnl cũ để benchmark
- Nếu đúng thì đây là chuyện khá quan trọng. Đã có những người bảo vệ hạn chế này bằng tuyên bố hoàn toàn ngược lại, rằng chỉ với jailbreak mặc định của Fable là năng lực tấn công mạng của Mythos sẽ lộ ra ngay
  Ví dụ: https://news.ycombinator.com/item?id=48519695
  Chủ đề tấn công mạng tương đối dễ nhận diện, và vì Anthropic đã thể hiện năng lực đó ở các lĩnh vực khác, nên cách hiểu rằng Fable đã được fine-tune hoặc bẻ hướng riêng cho chủ đề này là khá hợp lý
- 6000 USD tiền sử dụng trong 3 ngày á?
- Tôi tò mò không biết bạn đã từng viết ở đâu về công việc này chưa
- Nếu tôi hiểu đúng thì có vẻ bạn đã benchmark bằng cách đưa prompt được tự động viết lại vào Fable, còn với Opus thì dùng prompt gốc. Chênh lệch hiệu năng bạn thấy có thể đã đến từ điểm đó
Có vẻ chuyện này không phải Amazon nhắm vào Anthropic, mà là chính phủ dùng Amazon để gây sức ép lên Anthropic
Chính phủ là khách hàng cốt lõi của Amazon, nên Amazon có thể đưa ra lý do chính đáng khi cần. Amazon biết giá trị phần sở hữu của mình ở Anthropic không bị đe dọa đáng kể, và lôi chính phủ liên bang vào chỉ làm tăng đòn bẩy đàm phán
Bảo mật là mối lo có thật. Các chuyên gia bảo mật trong chính phủ nên lập một nhóm công tác công khai + không công khai để thẩm định tất cả các model lớn theo cùng một tiêu chuẩn
Giao cho các công ty tự chia sẻ với bạn bè của họ thì, nói tốt nhất, cũng chỉ là suy nghĩ đầy hy vọng. Việc chuyện này vẫn chưa được làm từ năm ngoái có vẻ là một trong những tín hiệu mạnh nhất cho thấy chính phủ đang thất bại ở các chức năng cơ bản
Link quà: https://www.wsj.com/tech/ai/amazon-ceos-talks-with-u-s-offic...
- https://archive.ph/rSUKz
Lý do duy nhất tôi nghĩ ra để Amazon không thích Mythos/Fable là Anthropic đã áp đặt yêu cầu lưu giữ dữ liệu vượt quá ranh giới tuân thủ quy định, làm hỏng câu chuyện Bedrock
Từ góc nhìn của Jassy, có thể tốt hơn nếu không ai dùng Fable, thay vì để nó được dùng theo cách về thực chất là thiết lập quan hệ tin cậy dữ liệu trực tiếp với Anthropic
Cũng khó mà xoay câu chuyện này theo hướng dài hạn có lợi cho Amazon, nhưng nếu Dario từng hứa về xử lý hoàn toàn air-gapped xét từ góc độ dữ liệu rồi lại rút lời thì có thể điều đó đã gây mất lòng
- Nếu là AWS thì chẳng phải chỉ cần nói sẽ không phát hành Fable là được sao? Có phải Anthropic cần AWS hơn chứ không phải ngược lại đâu?
  Tôi không nghĩ có khách hàng Bedrock lớn nào sẽ chuyển sang nhà cung cấp cloud khác chỉ vì đặc quyền cho phép Anthropic lưu giữ đầu vào đó đâu
Đội chiếc mũ ông già và nói về kiểm soát xuất khẩu Mythos của chính quyền Mỹ thì tôi lại nhớ đến giữa thập niên 1990, khi các công cụ mã hóa bất đối xứng như PGP trở thành hiện thực và có thể được dùng rộng rãi nhờ lượng người dùng Internet tăng lên
Các chính phủ như Mỹ và Pháp không hiểu phải quản lý nó như thế nào, nên đã cấm xuất khẩu và yêu cầu người dùng xin giấy phép
Tôi thấy có điểm tương đồng rất mạnh với tình hình hiện nay
Điều thú vị là những gì đã xảy ra vài năm sau đó, khi quy định đủ mạnh để làm suy giảm đổi mới
Với các mục đích sử dụng thường nhật và phổ thông, mã nguồn mở đã thắng, còn các kỹ thuật mã hóa mạnh hơn thì do doanh nghiệp và chính phủ phát triển và sử dụng
Tôi hoàn toàn có thể hình dung LLM cũng sẽ đi theo con đường tương tự
- So sánh thú vị đấy. Nó cũng làm tôi nhớ đến bài này nói rằng có một vài điểm tương đồng căn bản giữa machine learning và mật mã học: https://reiner.org/neural-net-ciphers
  Cũng có thể hữu ích nếu nghĩ về những khác biệt nền tảng có thể khiến LLM đi theo một con đường hoàn toàn khác. Điều hiện ra trong đầu tôi là giả thuyết scaling, nghĩa là các LLM tốt nhất đòi hỏi đầu tư vốn khổng lồ
  Nếu không có thay đổi mang tính nền tảng, điều đó có vẻ phần lớn khó tương thích với mã nguồn mở. Có open weights, nhưng tôi không nghĩ ra được một phép loại suy lịch sử thật gọn gàng nào, và cũng rất khó đoán tương lai sẽ diễn biến ra sao
- Một điểm tương đồng khác giữa khi đó và bây giờ là những người trong chính phủ hoàn toàn không hiểu công nghệ. Họ chỉ nghe từ một vài người rằng nó mạnh và nguy hiểm
- Nếu theo tiền lệ PGP, tôi tự hỏi sẽ mất bao lâu trước khi xuất hiện những chiếc áo phông bất hợp pháp in sẵn weights
Amazon là cổ đông lớn của Anthropic và theo bảng vốn hóa thì nắm hơn 5%
Tôi cho rằng không thể diễn giải hành vi của các lãnh đạo Amazon ở đây nếu không tính đến thông tin đó
- Đọc vào thì giống như các lãnh đạo Amazon đã kể với chính phủ liên bang về một năng lực nào đó khiến họ phấn khích, rồi các quan chức chính phủ hoặc không hiểu đúng, hoặc phản ứng thái quá với một tính năng nhỏ và hoảng loạn đến mức muốn cấm nó
- Amazon cũng như các tập đoàn lớn khác có rất nhiều đấu đá nội bộ. Hoàn toàn có khả năng một phe trong Amazon đã muốn dìm một phe khác
- Đồng ý. Mối lo hẳn phải thật sự nghiêm trọng thì mới vượt qua được động cơ rất mạnh của Amazon là cứ để Anthropic tiếp tục kiếm doanh thu từ các mô hình frontier mới mà không khơi chuyện này ra
Tôi tự hỏi liệu AI có xuất hiện thứ tương đương với Hiệp ước Không phổ biến vũ khí hạt nhân như với vũ khí hạt nhân hay không
Nghe có vẻ điên rồ, nhưng nếu có dù chỉ 0,1% khả năng một mô hình đủ giỏi để bị dùng vào việc hack tài khoản ngân hàng của mọi người, thì từ góc nhìn chính phủ họ sẽ không muốn mô hình đó được truy cập công khai
Có lẽ họ sẽ yêu cầu các nước khác cùng lên bàn đàm phán để ký một NPT cho AI
Công chúng có thể vẫn tiếp tục được tiếp cận các mô hình nhỏ hơn kiểu Opus 4.8, nhưng những mô hình lớn hơn thế sẽ bị coi là quá giỏi nên quá nguy hiểm. Hạt nhân cũng có lợi ích, nhưng khi làm chính sách thì chính phủ nghĩ đến kịch bản xấu nhất chứ không phải tốt nhất
Không phải tôi muốn nói Mythos là mô hình cấp thần, nhưng tôi tự hỏi liệu chính sách có đi theo hướng này không
- Tài khoản ngân hàng hiện giờ vẫn đều đặn bị “hack” bằng phishing và các kiểu lừa đảo khác. Các mô hình hiện tại cũng có thể giúp làm điều đó
  Chưa kể Visa còn làm chuyện ngớ ngẩn đến mức khó tin như đưa AI vào trong ranh giới bảo mật, rồi để nó ở trạng thái bị hack sẵn đối với bất kỳ ai có thể prompt injection: https://www.visa.com/en-us/solutions/intelligent-commerce
- Nhiều quốc gia đã rút ra bài học từ NPT, và sẽ đủ tỉnh táo để không đồng ý lại với thứ tương tự. Chúng ta đã nhiều lần thấy rằng nếu có vũ khí hạt nhân thì bạn có thể muốn làm gì với nước không có hạt nhân cũng được
- Tôi nghĩ thời đại mà bất kỳ chính phủ nào còn ký NPT với Mỹ chắc chắn đã qua rồi. Niềm tin đã vỡ. Giờ tốt hơn là chính phủ chúng ta tích trữ đủ mọi loại vũ khí
“Các nhà nghiên cứu Amazon đã dùng một chuỗi prompt để khiến mô hình Fable 5 của Anthropic cung cấp thông tin có thể hỗ trợ tấn công mạng…”
Mô hình nào cũng làm được thế. Tôi tò mò không biết Fable có vượt trội hơn hẳn ở khía cạnh đó không
- Gần như chắc chắn là không phải mọi mô hình đều làm được điều đó
- Cũng có thể mô hình đã tìm ra thứ gì đó mà Amazon không muốn bị lộ. Không nhất thiết phải là lỗ hổng an ninh mạng, mà có thể là một cách thức cụ thể nào đó trong cách Amazon vận hành