- Trước phiên điều trần AI của Thượng viện Mỹ, Anthropic cho rằng hoạt động liên quan đến Alibaba là vụ tấn công cùng loại có quy mô lớn nhất từng nhắm vào công ty này
- Phương thức cốt lõi là chưng cất (distillation), tức dùng đầu ra của mô hình mạnh hơn để huấn luyện mô hình yếu hơn; Anthropic nhận định điều này có thể giúp Trung Quốc đạt đến năng lực cấp Mythos Preview nhanh hơn
- Từ ngày 22/4/2026 đến 5/6, đã có hơn 28,8 triệu lượt tương tác với Claude, và số tài khoản gian lận được cho là gần 25.000
- Anthropic cho rằng bên vận hành có liên hệ với Alibaba và viện nghiên cứu AI Alibaba Qwen, trong khi Alibaba chưa phản hồi ngay yêu cầu bình luận của Reuters
- Anthropic ủng hộ việc chia sẻ thông tin tình báo về mối đe dọa và phối hợp ứng phó giữa chính phủ Mỹ với các công ty AI tư nhân, nhưng cùng thời điểm đó quyền truy cập vào các mô hình Mythos và Fable của chính công ty này cũng bị áp hạn chế
Nghi vấn trích xuất trái phép liên quan đến Alibaba
- Anthropic cho biết trong một bức thư gửi Thượng viện Mỹ rằng tập đoàn công nghệ và thương mại điện tử Trung Quốc Alibaba đã trích xuất trái phép năng lực của mô hình AI Claude
- Theo bức thư mà Reuters xem được, Anthropic đánh giá đây là hoạt động có quy mô lớn nhất trong số các vụ tấn công cùng loại mà họ từng xác nhận
- Alibaba chưa phản hồi ngay yêu cầu bình luận của Reuters
Phương thức chưng cất và quy mô tấn công
- Anthropic xác định hoạt động này là một nỗ lực chưng cất (distillation)
- Chưng cất là cách dùng đầu ra của mô hình mạnh hơn để huấn luyện một mô hình tương đối yếu hơn
- Thời gian của chiến dịch là 22/4/2026 ~ 5/6
- Trong giai đoạn này, số lượt tương tác nhắm vào Claude được thống kê là hơn 28,8 triệu
- Số tài khoản gian lận được sử dụng là gần 25.000
- Anthropic cho rằng chưng cất là cách giúp Trung Quốc tăng tốc tiếp cận năng lực Mythos Preview tiên tiến của Anthropic
Cáo buộc liên hệ với Alibaba Qwen và người nhận thư
- Anthropic cho rằng chiến dịch được thực hiện bởi các bên vận hành có liên hệ với Alibaba và viện nghiên cứu AI của Alibaba là Alibaba Qwen
- Bức thư đề ngày 10/6
- Người nhận là Tim Scott và Elizabeth Warren, lần lượt là chủ tịch và thành viên cấp cao của Ủy ban Ngân hàng Thượng viện Mỹ
- Bức thư được gửi trước một phiên điều trần về AI dự kiến diễn ra
Các trường hợp trước đó liên quan đến viện nghiên cứu AI Trung Quốc
- Anthropic cho biết vào tháng 2/2026 họ cũng đã phát hiện một chiến dịch trong đó startup AI Trung Quốc DeepSeek và hai viện nghiên cứu AI Trung Quốc khác tìm cách trích xuất trái phép năng lực từ nền tảng AI Claude
- Quy mô mà Anthropic đưa ra khi đó như sau
- DeepSeek: hơn 150.000 lượt tương tác
- Moonshot AI: hơn 3,4 triệu
- MiniMax: hơn 13 triệu
- Anthropic khi đó nói rằng cường độ và mức độ tinh vi của các chiến dịch như vậy đang gia tăng, đòi hỏi phản ứng nhanh và có phối hợp từ ngành, các nhà hoạch định chính sách và cộng đồng AI toàn cầu
Biện pháp của chính phủ Mỹ và hạn chế với các mô hình của Anthropic
- Anthropic cho biết họ ủng hộ các nỗ lực ứng phó của chính phủ Mỹ
- Bao gồm chia sẻ thông tin tình báo về mối đe dọa với các công ty AI tư nhân
- Và các hoạt động phối hợp ứng phó khác
- Vào tháng 4/2026, Nhà Trắng cáo buộc Trung Quốc đang đánh cắp tài sản trí tuệ của các viện nghiên cứu AI Mỹ ở quy mô công nghiệp
- Cũng trong tháng đó, Alibaba bị thêm vào danh sách công ty quân sự Trung Quốc của Bộ Quốc phòng Mỹ, và Alibaba đang phản đối quyết định này
- Bộ Thương mại Mỹ đã hoãn việc đưa DeepSeek vào danh sách đen thương mại, dù công ty này bị coi là rủi ro an ninh quốc gia trong một ủy ban liên ngành của chính phủ, do muốn tránh làm leo thang căng thẳng với Bắc Kinh
- Hai ngày sau khi Anthropic gửi thư, tức 12/6, Bộ Thương mại Mỹ áp hạn chế đối với các mô hình AI Mythos và Fable mới nhất của Anthropic
- Giới chức lo ngại các mô hình này có thể được triển khai cho người dùng tình báo quân sự tại Trung Quốc và các quốc gia đáng lo ngại khác
- Do các hạn chế này, Anthropic đã vô hiệu hóa quyền truy cập trên toàn cầu đối với các mô hình đó
1 bình luận
Ý kiến trên Hacker News
Để cái này ở đây rồi đi: “Thẩm phán phán quyết rằng việc Anthropic tải xuống hơn 7 triệu cuốn sách từ các trang vi phạm bản quyền như LibGen là hành vi xâm phạm, đồng thời bác bỏ lập luận ‘mục đích nghiên cứu’ của Anthropic: ‘Bạn không thể tự ban phước cho mình bằng cái cớ mục đích nghiên cứu rồi lấy bất kỳ giáo trình nào bạn muốn.’”
https://www.joneswalker.com/en/insights/blogs/ai-law-blog/wh...
Về cơ bản có hai kiểu chưng cất. 1) Cách quy mô lớn nhưng ngây ngô: đặt câu hỏi rồi dùng câu trả lời làm tín hiệu tăng cường (hộp đen), 2) kiểu chưng cất nhắm mục tiêu hơn, trong đó một mô hình trực tiếp chỉ dạy, huấn luyện và dẫn dắt mô hình khác (RLAIF)
Loại sau về thực chất là tinh chỉnh mô hình theo sự định hướng của một mô hình khác. Rất nhiều công ty đang tinh chỉnh theo cách này mỗi ngày. Các viện nghiên cứu Trung Quốc gần như chắc chắn cũng dùng cách đó, vì nó hiệu quả hơn nhiều cho kết quả cuối cùng so với việc chỉ cào những câu trả lời đơn giản cho các câu hỏi đơn giản
Những lời than phiền về chưng cất này khiến vấn đề trông lớn hơn thực tế, và mục tiêu có vẻ là theo hướng bảo hộ: khiến chính phủ Mỹ chặn hoặc cấm các nhà cung cấp mô hình Trung Quốc. Họ đã kêu gọi siết kiểm soát xuất khẩu chip rồi, điều này càng buồn cười khi DeepSeek v4 được thiết kế để chạy trên chip Huawei và các công ty Trung Quốc khác cũng đang đi theo hướng đó. Nhưng vì không thể nói thẳng như vậy, họ lại lập luận rằng cần thêm kiểm soát xuất khẩu vì các mô hình chưng cất có thể không an toàn bằng mô hình của họ. Đến khi bạn chỉ ra một cú jailbreak vượt qua hàng rào an toàn của chính mô hình họ, thì họ sẽ bảo đừng lo chuyện an toàn vì cuối cùng mô hình nào cũng có thể bị jailbreak
2) Không thể tạo ra một mô hình ngôn ngữ lớn miễn nhiễm với mọi jailbreak. Điều này cũng không có bằng chứng đáng tin cậy để bác bỏ, nên Anthropic hoàn toàn đúng
Nếu ý 1 là sai thì cứ công bố chi tiết jailbreak đó. Vì được cho là chỉ hoạt động trên Fable 5 nên cũng không có rủi ro đáng kể nào
Nếu ý 2 là sai thì một phòng thí nghiệm mô hình ngôn ngữ lớn khác hẳn đã làm được rồi. Càng đúng hơn khi nhiều chính phủ đã cho thấy rõ là có thị trường cho những dự án như vậy
Về căn bản, rất khó ngăn chuyện này mà vẫn giữ cho mô hình AI còn hữu ích
Làm tôi nhớ đến chuyện Steve Jobs vào nửa sau thập niên 1980 phàn nàn rằng Mac GUI bị sao chép. Trong khi chính ông lại không công khai thừa nhận công việc đã được thực hiện trên Xerox Alto và hệ điều hành Star
“Anh đang định sao chép thứ mà tôi đã sao chép rồi đấy à!”
Trông giống như cào cả internet để tạo ra một mô hình ngôn ngữ lớn khổng lồ rồi lại than phiền vì bị sao chép
Thông tin thực sự muốn được tự do, nhưng các công ty AI lại muốn trở thành người gác cổng. Về lâu dài, tôi nghĩ cách tiếp cận bền vững hơn là trọng số mở sẽ chiến thắng
Thật nực cười khi Anthropic than phiền rằng “đã trích xuất trái phép năng lực của mô hình AI Claude”, đồng thời ủng hộ lời chỉ trích của Nhà Trắng rằng Trung Quốc đang “đánh cắp sở hữu trí tuệ của các phòng thí nghiệm AI Mỹ ở quy mô công nghiệp”
Anthropic, OpenAI, Google, Microsoft và các công ty khác đã huấn luyện mô hình bằng cách thu gom mọi loại nội dung có thể, phớt lờ quyền của chủ sở hữu bản quyền. Giờ một trong số họ lại kêu rằng thật bất công khi người khác làm đúng điều mà tất cả bọn họ từng làm sao
Chuyện đang diễn ra hiện giờ là thế này: các reseller Trung Quốc đang cung cấp token Claude với giá thấp hơn 70~90% so với giá API chính thức của Anthropic. Họ làm được điều đó bằng cách gộp các tài khoản Claude Max để bán lại dung lượng, dùng gian lận thanh toán, rồi bán lại đầu ra mô hình và chuỗi suy luận cho nhiều viện nghiên cứu Trung Quốc. Họ hỗ trợ truy cập mô hình để đổi lấy log người dùng và dấu vết suy luận, rồi bán chúng làm dữ liệu huấn luyện nên có thể vận hành dưới giá vốn
Cả Claude lẫn ChatGPT đều bị chặn ở Trung Quốc. Muốn truy cập thì cần VPN, và không thể thanh toán bằng thẻ ngân hàng Trung Quốc. Vì vậy phần lớn những ai muốn dùng Claude đều mua quyền truy cập qua reseller. Đây là cách dễ nhất và rẻ nhất để tiếp cận mô hình Anthropic ở Trung Quốc
Các reseller này vận hành hàng chục nghìn tài khoản bot, và đó cũng là lý do Anthropic triển khai xác minh danh tính để làm chậm làn sóng bot
Một reseller token đang bán Opus 4.8 với mức giảm 93% so với giá API chính thức: https://yunwu.ai/pricing?provider=Anthropic
Đây cũng là một trong những lý do giá của DeepSeek và GLM rẻ đến vậy. Họ phải cạnh tranh với mức giá token phi lý ở Trung Quốc, nên muốn người ta dùng thì phải giữ giá thấp
Tôi đã chia sẻ chuyện này vài tháng trước nhưng hầu như không nhận được phản hồi. Đây là một bài viết rất hay giải thích nền kinh tế bán lại token ở Trung Quốc: https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens...
Tôi cũng được học rằng nếu Anthropic muốn cạnh tranh thì họ nên làm tốt hơn công việc của mình. Nếu không thì sẽ có kẻ khác thắng
Giờ nguyên tắc đó không còn áp dụng với các tập đoàn khổng lồ của Mỹ nữa à
DeepSeek và GLM là open-weight, và các nhà cung cấp suy luận ở Mỹ cũng bán chúng với giá rẻ hơn nhiều. Lý do chúng rẻ là vì mô hình hiệu quả hơn
Nếu không thì nghe giống luận điệu quen thuộc của phe bi quan về AI rằng “Anthropic/OpenAI đang bán 1.000 USD token với giá 100 USD và thua lỗ khủng khiếp”
Hành vi của Alibaba được mô tả là nỗ lực “chưng cất”, và Anthropic nói đó là việc huấn luyện một mô hình yếu hơn bằng đầu ra của mô hình mạnh hơn
Claude đã dùng lượng nội dung cỡ terabyte để huấn luyện mô hình của chính mình mà không xin phép, và họ nói như vậy là ổn. Giờ khi có người dùng đầu ra của mô hình Claude để huấn luyện mô hình khác thì họ lại kêu là bất công
Tôi mong chờ một phiên tòa nơi Anthropic phải công khai nguồn dữ liệu huấn luyện của mình và giải thích vì sao họ có quyền cung cấp cho khách hàng dữ liệu huấn luyện bị nhai lại với thu phí, còn Alibaba thì không được dùng mô hình Anthropic để huấn luyện mô hình của mình
Chắc sẽ thú vị lắm
Hành động của Anthropic trông giống một cử chỉ mang tính trình diễn hơn. Những người khác cũng đã đoán khán giả mục tiêu của việc này là ai
Chính xác thì cái gì là bất hợp pháp
Về mặt pháp lý, đầu ra mô hình không thể được bảo hộ như sở hữu trí tuệ, dù theo luật trong nước hay quốc tế. Tối đa có thể kỳ vọng chỉ là biện pháp khắc phục dân sự, mà ngay cả điều đó cũng khó, xét việc chính cách họ dùng để huấn luyện mô hình theo nghĩa đen cũng là bất hợp pháp
Anthropic đang bị đối xử đúng theo cách họ đã đối xử với mọi người. Họ tự làm cái giường này, giờ thì cứ phải nằm lên nó thôi
Hành vi của Alibaba được gọi là “chưng cất”, tức huấn luyện một mô hình yếu hơn bằng đầu ra của mô hình mạnh hơn, nhưng tôi không hiểu điều đó sai ở chỗ nào
Anthropic nói chiến dịch này diễn ra từ ngày 22 tháng 4 năm 2026 đến ngày 5 tháng 6, và đã tạo ra hơn 28,8 triệu lượt tương tác với Claude thông qua gần 25.000 tài khoản gian lận
Điều gì khiến các tài khoản đó trở thành gian lận. Nếu họ đã trả mức giá đã thỏa thuận thì chẳng phải là ổn sao. Nếu họ không trả tiền thì tại sao Anthropic lại cung cấp dịch vụ
Về cơ bản thì không thể ngăn chưng cất. Điều duy nhất có thể làm là trì hoãn nó. Cứ phản bác đi
Cuối cùng thì các công ty Trung Quốc cũng sẽ tung ra các tiện ích mở rộng kiểu Honey, bám lên lưu lượng của khách hàng không phải người Trung Quốc, rồi dù sao cũng sẽ gửi mọi thứ về Trung Quốc
Xong phim
Nhưng các phòng thí nghiệm AI vẫn có thể tiếp tục tạo ra giá trị kinh tế khổng lồ mà không cần công khai mô hình và để lộ chúng trước nguy cơ bị chưng cất. Ví dụ, họ có thể chỉ dùng mô hình nội bộ để phát triển thuốc điều trị
Tôi hy vọng một ngày nào đó sẽ có tương lai mà những người khác cũng có thể tiếp cận các mô hình tiên tiến nhất, nhưng nếu người ta cho rằng việc ngăn sự lan rộng thông qua chưng cất là quan trọng hơn thì điều đó không hẳn là cần thiết
[1]: tham khảo về chưng cất tại https://dualuse.dev/posts/export-controls-on-fable
Ý chính là có thể không có giải pháp kỹ thuật, nhưng về lý thuyết có thể có giải pháp chính trị
Bài “False Promise of Imitating Proprietary LLMs” của Berkeley cũng cho rằng bắt chước tuy nhanh chóng thu hẹp khoảng cách về phong cách, nhưng khoảng cách về năng lực vẫn còn rất lớn
https://arxiv.org/abs/2305.15717