1 điểm bởi GN⁺ 4 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Tập đoàn công nghệ Trung Quốc Alibaba sẽ cấm nhân viên sử dụng Claude Code trong công việc sau khi công cụ này gây tranh cãi vì có chức năng nhận diện người dùng liên quan đến Trung Quốc
  • Động thái này xuất hiện trong bối cảnh căng thẳng giữa hai bên leo thang sau khi Anthropic cáo buộc Alibaba trích xuất trái phép năng lực của mô hình Claude AI
  • Claude Code vẫn đang được các lập trình viên Trung Quốc ưa chuộng bất chấp việc giới hạn quyền truy cập đối với người dùng và tổ chức tại Trung Quốc
  • Nhân viên Alibaba được chỉ đạo sử dụng nền tảng lập trình nội bộ Qoder
  • Trong lúc các công ty AI Mỹ tăng cường ngăn chặn truy cập trái phép, bán lại và chưng cất mô hình, các doanh nghiệp Trung Quốc đang chuyển sang mô hình nội địa và mã nguồn mở, và sự việc lần này cho thấy rõ cuộc cạnh tranh giành ưu thế AI giữa Mỹ và Trung Quốc

Alibaba cấm sử dụng Claude Code

  • Theo nguồn tin am hiểu chỉ thị này, Alibaba đã cấm nhân viên dùng Claude Code cho công việc sau khi công cụ bị xem xét vì có tính năng có thể hỗ trợ nhận diện người dùng liên quan đến Trung Quốc
  • Nguồn tin này xin giấu tên vì không được phép làm việc với báo chí, đồng thời cho biết nhân viên Alibaba đang được yêu cầu sử dụng nền tảng lập trình nội bộ Qoder
  • Alibaba và Anthropic chưa lập tức phản hồi yêu cầu bình luận của Reuters, và đến nay Alibaba cũng chưa đưa ra lập trường công khai về các cáo buộc từ Anthropic
  • Lệnh cấm của Alibaba được truyền thông Trung Quốc đưa tin đầu tiên

Vị thế của Claude Code và các hạn chế truy cập

  • Claude Code là trợ lý lập trình AI của Anthropic dành cho các nhà phát triển phần mềm
  • Dù Anthropic hạn chế quyền truy cập của người dùng và tổ chức tại Trung Quốc, công cụ này vẫn được giới lập trình viên Trung Quốc ưa chuộng

Anthropic cáo buộc Alibaba tấn công để "chưng cất"

  • Anthropic cho biết tháng trước họ đã bị Alibaba tấn công, và mô tả đây là nỗ lực "chưng cất (distillation)" — tức huấn luyện một mô hình yếu hơn bằng đầu ra của mô hình mạnh hơn
  • Trong lá thư gửi 2 thượng nghị sĩ Mỹ mà Reuters xác nhận, Anthropic nói việc chưng cất này sẽ đẩy nhanh tốc độ Trung Quốc tiếp cận các năng lực tiên tiến của Mythos Preview
  • Lệnh cấm của Alibaba được ban hành chỉ vài ngày sau khi các nhà phát triển nói họ phát hiện cơ chế trong Claude Code có thể kiểm tra môi trường người dùng, như thông tin múi giờ và proxy, đồng thời chèn các marker tinh vi vào prompt được gửi tới máy chủ của Anthropic
  • Một nhân viên Anthropic viết trên X hôm thứ Ba rằng tính năng này là "một thử nghiệm bắt đầu từ tháng 3", nhằm ngăn lạm dụng tài khoản bởi các bên bán lại trái phép và bảo vệ trước hành vi chưng cất mô hình

Giới hạn trong việc thực thi quy định và rủi ro doanh nghiệp

  • Theo nguồn tin, các hạn chế của Anthropic với Trung Quốc khó được thực thi đối với người dùng cá nhân có thể triển khai máy chủ tại Mỹ để ngụy trang nguồn gốc lưu lượng như thể đến từ Mỹ
  • Ngược lại, doanh nghiệp đánh giá cao hơn các rủi ro pháp lý và tuân thủ

Cục diện cạnh tranh AI Mỹ - Trung

  • Trong khi các công ty phát triển mô hình AI của Mỹ tìm cách ngăn chặn truy cập trái phép, bán lại và chưng cất đối với hệ thống của họ, các công ty cloud và AI Trung Quốc đang chuyển sang các mô hình nội địa và mã nguồn mở như DeepSeek, Qwen của Alibaba, Moonshot, Zhipu
  • Đồng thời, các mô hình AI Trung Quốc cũng đang tiến vào thị trường Mỹ, làm dấy lên lo ngại trong một bộ phận giới chuyên gia ngành tại Mỹ
  • Tranh chấp lần này là một ví dụ cho thấy cuộc cạnh tranh khốc liệt giữa Mỹ và Trung Quốc nhằm giành quyền dẫn dắt trong lĩnh vực AI

1 bình luận

 
Ý kiến trên Hacker News
  • AI từ xa là một rủi ro bảo mật lớn đối với các cá nhân, doanh nghiệp và chính phủ có thể trở thành mục tiêu của chính phủ Mỹ
    Rất có khả năng Mỹ nhận được luồng dữ liệu thời gian thực từ từng nhà cung cấp AI để nhận diện các đối tượng quan tâm, các cuộc tấn công khủng bố, kế hoạch của chính phủ nước ngoài, thậm chí cả các công ty nước ngoài cạnh tranh với những doanh nghiệp cốt lõi của Mỹ
    Khi đó họ sẽ tiếp cận được không chỉ quá trình suy nghĩ nội bộ của doanh nghiệp, mà cả tài sản trí tuệ dạng văn bản như mã nguồn, tài liệu và biên bản họp
    Ngay cả AI cục bộ không tự huấn luyện cũng khó có thể chắc chắn rằng không có thiên lệch có chủ đích nhằm khiến người dùng tránh xa một số kế hoạch, ý tưởng hoặc bằng sáng chế nhất định

    • Mô hình cục bộ tự huấn luyện có vẻ gần như là lựa chọn tốt nhất hiện nay
      Nhưng nếu dữ liệu huấn luyện không đáng tin, thì ngay cả mô hình tự huấn luyện cũng có thể khó mà hoàn toàn tin được
      Người dùng phải tin cả coding agent, nhà cung cấp suy luận và mô hình: https://jacob.gold/posts/coding-models-are-code/ https://www.anthropic.com/research/sleeper-agents-training-d...
    • Có lẽ nên bỏ điều kiện “có thể trở thành mục tiêu của chính phủ Mỹ”
      Toàn bộ AI được host đều có cảm giác là vi phạm nghiêm trọng các thông lệ bảo mật của doanh nghiệp
      Những công ty vốn sẽ làm ầm lên chỉ vì ai đó in file nguồn ra để tham khảo/chú thích, nay lại khuyến khích lập trình viên đưa lượng lớn mã và dữ liệu độc quyền ra bên ngoài rồi áp dụng các thay đổi được bên ngoài đề xuất với mức xem xét tối thiểu
      Một ngày nào đó một dịch vụ lớn sẽ bị tấn công, và đó có thể không chỉ là rò rỉ dữ liệu đơn thuần mà còn trở thành trung tâm phát tán mã độc
      Các dashboard được tạo bằng vibe coding có thể đột nhiên phụ thuộc vào một fork left-pad kỳ lạ, rồi ở một dependency cách đó 12 tầng có thể đang chạy keylogger hoặc trình đào Dogecoin
      Cũng có thể xảy ra chuyện bộ xử lý thanh toán phê duyệt giao dịch khi nhập mã Konami
    • Tôi không hiểu vì sao các công ty EU không xem nguy cơ gián điệp công nghiệp từ Mỹ là nghiêm trọng hơn
    • Cũng đáng nghĩ rằng ngay cả với các nhà cung cấp LLM lớn, tổng thông lượng thật ra chỉ ở mức vài megabit
      Nếu một token được nén xấp xỉ 1 byte, thì toàn bộ input/output AI trên thế giới vào khoảng 1GB mỗi giây
      Với các cơ quan tình báo, chi phí lưu trữ vĩnh viễn toàn bộ số đó rồi phân tích sau là hoàn toàn chịu được
    • Tại sao lại chỉ nhìn việc này theo hướng lấy Mỹ làm trung tâm? Bạn nghĩ các mô hình do Trung Quốc cung cấp thì khác à?
  • Những gì Claude Code đã làm thật sự gây sốc. Nếu một harness của Trung Quốc làm chuyện như vậy, chắc Tổng thống Mỹ cũng mất ngủ

    • So với những gì các website và app hiện đại thu thập thì có vẻ khá nhẹ. Có bao nhiêu dịch vụ lại không biết múi giờ?
    • Nếu bạn nghĩ Tổng thống Mỹ sẽ mất ngủ vì hiển thị múi giờ trong định dạng ngày tháng, thì có vẻ phóng đại quá mức
    • “Nếu” là sao, ý gì vậy?
    • Nếu phía Trung Quốc không cào dữ liệu Claude để huấn luyện các mô hình tệ hại của họ, có lẽ Anthropic cũng đã không cảm thấy cần phải làm vậy
  • Bất kể tuyên bố cụ thể này có đúng hay không, các doanh nghiệp đang thận trọng hơn nhiều với các công cụ lập trình có thể đọc phần lớn codebase độc quyền

    • Lạ là bây giờ chuyện này mới thành mối lo. Lẽ ra cuộc thảo luận phải kết thúc ngay ở điểm đó từ đầu rồi
    • Trong khi trước giờ vẫn đưa mã lên các repo riêng tư như GitHub, Bitbucket?
      Nếu bạn tin GitHub không đọc mã của mình nhưng lại không tin AI của Microsoft không đọc, thì gần như là mâu thuẫn
    • Nếu dùng coding agent thì đương nhiên bạn phải tự phục vụ mô hình, hoặc phải tin bên mà bạn gửi dữ liệu tới
      Nhưng thứ cần lo còn rộng hơn mã rất nhiều, và vượt xa vấn đề có tin nhà cung cấp mô hình hay không
      Một coding agent có quyền truy cập công cụ bash sẽ truy cập được mọi thứ mà một người có prompt bash có thể truy cập
      Ngay cả khi cố nhốt agent trong một sandbox khóa chặt, bạn vẫn phải lo rằng nó có thể tìm thấy các mật khẩu và khóa chưa mã hóa “nằm vương vãi” trong mã hoặc cơ sở dữ liệu
      Tôi ngạc nhiên là những câu chuyện về coding agent và bot crawler gây sự cố vẫn chưa lan rộng hơn
    • Đã quá muộn rồi. Phần lớn đã đổ một phần đáng kể codebase và tài sản trí tuệ vào các mô hình đám mây
    • Hơn nữa, các công cụ này có thể chạy mã và cũng dễ bị tấn công injection, nên nếu không cực kỳ cẩn thận trong cách sử dụng, về thực chất chúng có thể hoạt động như backdoor
  • Nhà tuyển dụng năm 2022: “Không được! Đừng cài mấy thứ như lodash khi chưa được IT phê duyệt. Cần license Charles Proxy à? Ừm… phải giữ ngân sách”
    Nhà tuyển dụng năm 2023: “Không được! Không được dùng ChatGPT trong công ty. Rủi ro bảo mật đấy”
    Nhà tuyển dụng năm 2024: “Được, có thể dùng GitHub Copilot, nhưng phải học khóa đào tạo nội bộ nhàm chán về phạm vi được phép”
    Nhà tuyển dụng năm 2025, mắt hiện dấu đô la: “Tôi vừa đi seminar vibe coding về. Sao cậu không theo kịp thời đại? Làm hết bằng Claude Code đi! Đừng tự code nữa. Dùng yolo mode cũng không sao lắm. Review code rồi nhồi thêm tính năng gấp 10 lần! Dùng token không giới hạn! In tiền thôi!”
    Nhà tuyển dụng năm 2026: “Ý là trao quyền truy cập tự động vào toàn bộ workstation của chúng ta cho một hai công ty và làm kỹ sư ngu đi không phải là kế hoạch kinh doanh lành mạnh à?”

    • Điều học được trong năm 2025 là nếu có thể, công ty đã thay tôi bằng nô lệ rồi
      Điều khó hiểu là vì sao các công ty này lại tin vào cường điệu AGI rằng LLM của OpenAI hay Claude là nô lệ cổ cồn trắng lý tưởng
      Tôi có thể hiểu việc ban lãnh đạo ghét lao động đến mức đưa ra quyết định kinh doanh phi lý để xúc phạm những người lao động đang thiết kế và vận hành công ty
      Dù vậy, cơn ngấu nghiến AI năm 2025 có cảm giác như một vụ giết người-tự sát do ban lãnh đạo nhiều công ty gây ra
  • Tài liệu Snowden cho thấy NSA thu thập mọi thứ họ có thể thu thập
    Dĩ nhiên Mỹ đang thu thập mọi thứ từ không chỉ Trung Quốc mà từ tất cả mọi người
    Các nước khác cũng vậy

  • Ở Brazil gần đây cũng có chuyện như thế này: https://www.mixvale.com.br/2026/06/26/fbi-warns-brazilian-po...
    Đây là con dao hai lưỡi. Trong trường hợp này, nó quan trọng đến mức khó tin đối với mạng sống của đứa trẻ, nhưng chiều ngược lại cũng vận hành như vậy
    Nếu nhà chức trách Mỹ quyết định họ cần giám sát chính phủ và công dân nước ngoài vì lý do chính trị, và giờ dùng AI để làm việc đó ở quy mô công nghiệp thì sao?
    Điều chắc chắn là với bất kỳ nhà cung cấp đám mây nào, bảo đảm quyền riêng tư cũng không phải ưu tiên hàng đầu. Những công ty làm công việc nhạy cảm ở tuyến đầu nên cảnh giác

    • Chính phủ Mỹ đã quyết định từ hàng chục năm trước rằng họ cần giám sát chính phủ và công dân nước ngoài, và vẫn tiếp tục làm vậy
      Họ cũng giám sát cả chính phủ và công dân của chính mình
  • Có vẻ cuối cùng cũng bước sang giai đoạn tiếp theo của LLM
    Không chỉ cá nhân hóa dựa trên lịch sử tìm kiếm trước đây, mà còn nhắm mục tiêu người dùng bằng cả dữ liệu chưa công khai
    Về cơ bản đây là cùng một xu hướng mà ta đã thấy trong quảng cáo mạng xã hội vài năm trước, và điều thú vị là các mô hình như thế này cũng có thể làm y hệt

  • Đây không phải là rủi ro mà là sự thật. Những người dịch ngược Claude Code đã nhiều lần tìm thấy các nhánh mã phát hiện xem nó có được dùng trong múi giờ và locale Trung Quốc hay không

  • Động thái như thế này có lẽ sẽ làm dấy lên nhiều nghi ngờ khi các dịch vụ như Claude về sau tuyên bố rằng “mã nguồn mở và các mô hình ngoài Mỹ tốt lên chỉ là nhờ chưng cất từ các phòng lab frontier”