1 điểm bởi GN⁺ 2025-12-12 | 1 bình luận | Chia sẻ qua WhatsApp
  • Báo cáo cho biết startup AI của Trung Quốc DeepSeek đang được cho là đã sử dụng chip Nvidia Blackwell, một chip thuộc diện Mỹ cấm xuất khẩu, để phát triển mô hình AI thế hệ mới
  • The Information cho rằng những chip này được đặt tại các trung tâm dữ liệu ở quốc gia thứ ba được phép bán ra rồi mới được tháo dỡ và buôn lậu trở về Trung Quốc
  • Mỹ đang cấm xuất khẩu chip bán dẫn tiên tiến sang Trung Quốc, và một số nhà phát triển tiếp tục tiếp cận qua trung tâm dữ liệu nước ngoài hoặc các con đường vòng
  • Nvidia cho rằng về vụ việc này, “chưa từng xác nhận hoạt động như vậy diễn ra”, đồng thời cho biết sẽ điều tra nếu nhận được tố giác
  • Vụ việc này phản ánh thực tế các công ty AI Trung Quốc đang tìm cách giành quyền tiếp cận chip hiệu năng cao trong bối cảnh cuộc cạnh tranh công nghệ Mỹ-Trung

Nghi vấn DeepSeek sử dụng chip bị cấm

  • DeepSeek được The Information đưa tin là đang dùng chip Nvidia Blackwell (một loại chip bị Mỹ cấm xuất khẩu) để phát triển mô hình AI mới
    • Những chip này được cho là đã được lắp trong các trung tâm dữ liệu của các quốc gia thứ ba được phép bán, sau đó tháo ra và chuyển sang Trung Quốc
    • Tin tức cho biết thiết bị đã được đưa vào sau khi vượt qua kiểm tra của một công ty phát triển thiết bị máy chủ
  • Mỹ vẫn cấm xuất khẩu chip bán dẫn tiên tiến sang Trung Quốc
    • Vì vậy đã xuất hiện các trường hợp các nhà phát triển AI ở Trung Quốc tiếp cận chip qua trung tâm dữ liệu nước ngoài hoặc các con đường không chính thức

Vụ việc liên quan đến quy định xuất khẩu của Mỹ

  • Vào tháng 11, công tố viên Mỹ đã truy tố hai người Trung Quốc và hai công dân Mỹ
    • Họ bị cáo buộc thành lập một công ty môi giới bất động sản giả để vận chuyển chip qua Malaysia nhằm đưa về Trung Quốc
  • Các vụ việc này được nêu như một phần của các giao dịch lách đường xuất hiện sau khi Mỹ tăng cường kiểm soát xuất khẩu bán dẫn

Quan điểm của Nvidia

  • Nvidia nói rằng “chúng tôi chưa nhận được thông tin nào xác nhận việc buôn lậu như vậy
    • Người phát ngôn nói: “Nếu việc buôn lậu như vậy có thật thì khả năng xảy ra không cao, nhưng nếu nhận được tố giác, chúng tôi sẽ điều tra”

Bối cảnh của DeepSeek và việc phát triển mô hình AI

  • DeepSeek đã công bố vào tháng 1/2024 rằng đã phát triển một mô hình AI với chi phí thấp nhưng có thể cạnh tranh được với mức tốt nhất tại Thung lũng Silicon
    • Công ty nhận vốn của quỹ phòng hộ Trung Quốc High-Flyer, và được cho là đã tiếp cận 10.000 GPU Nvidia vào năm 2021
    • Đây là thời điểm trước khi Mỹ áp đặt lệnh cấm xuất khẩu
  • Vào tháng 9/2024, công ty đã ra mắt mô hình mới và cho biết đang hợp tác với các nhà sản xuất chip tại Trung Quốc

Quyết định mới của Mỹ và phản ứng của Trung Quốc

  • Tổng thống Donald Trump đầu tuần này đã cho phép xuất khẩu H200, bộ tăng tốc AI đời cũ của Nvidia, sang Trung Quốc
    • Tuy nhiên, lệnh cấm xuất khẩu đối với chip Blackwell mạnh hơn vẫn tiếp tục được duy trì
  • Chính phủ Trung Quốc kêu gọi các doanh nghiệp công nghệ trong nước tăng cường sử dụng thiết bị nội địa
    • DeepSeek cũng đang hợp tác với các nhà sản xuất chip của Trung Quốc theo đúng hướng đi đó

1 bình luận

 
GN⁺ 2025-12-12
Ý kiến trên Hacker News
  • Việc DeepSeek huấn luyện mô hình bằng chip Nvidia được mua trước khi lệnh cấm xuất khẩu chip bán dẫn đại trà của Mỹ có hiệu lực là điều đã được biết từ trước
    Một số người cho rằng sau đó họ vẫn có thể đã tiếp tục mua chip qua các kênh không chính thức
    Tôi cũng đọc ở nơi khác rằng họ đã dùng dữ liệu đầu ra của ChatGPT, Claude và Gemini làm dữ liệu huấn luyện
    Khi ai cũng đang lấy cắp lại dữ liệu bị lấy cắp từ nhau, thì chuyện buôn lậu chút ít cũng chẳng có gì đáng ngạc nhiên

    • Tôi thấy thật buồn cười khi đặt vấn đề đạo đức về việc công ty Trung Quốc lách lệnh trừng phạt của Mỹ
      Ngay cả tổng thống Mỹ cũng đã thừa nhận các lệnh trừng phạt này được dùng cho mục đích bảo hộ thương mại
    • Giữa những kẻ trộm thì không có danh dự
      Anthropic cũng đã trả 1 tỷ USD tiền dàn xếp vì vi phạm bản quyền, nên rốt cuộc mọi mô hình đều là thành quả của việc chiếm đoạt tài sản trí tuệ và dữ liệu cá nhân của nhân loại ở quy mô lớn
      Tôi ủng hộ niềm tin rằng mô hình mở sẽ đánh bại mô hình đóng
    • Cái này không hẳn là “ăn cắp” mà là trả tiền để mua token của OpenAI
      Chỉ có điều trong TOS của OpenAI có điều khoản cấm dùng vào việc huấn luyện mô hình cạnh tranh, nên khá mỉa mai
    • Thật ra chuyện này ai cũng làm
      Việc dùng đầu ra của mô hình khác để huấn luyện được gọi là knowledge distillation
    • Người ta từng nói lạ là không xảy ra model collapse, nhưng dạo này cách này được dùng nhiều để lấy dữ liệu post-training
      Trước đây mô hình Grok thậm chí còn hay mở đầu câu trả lời bằng “as a model trained by OpenAI…”
  • Xem phim tài liệu của GamersNexus sẽ thấy họ giải thích rất rõ cấu trúc chợ đen của GPU AI NVIDIA
    Nội dung nói về cách các công ty như DeepSeek lách lệnh cấm xuất khẩu của Mỹ để mua chip

    • Gần đây tôi cũng bán một chiếc RTX 4090 trên eBay, và có hàng loạt tài khoản Trung Quốc vào đấu giá
      Người thắng đấu giá dùng tài khoản ở Úc nhưng địa chỉ nhận hàng lại là một căn nhà bình thường ở Delaware, Mỹ, và tên cũng khác
      Những trường hợp như vậy thường là du học sinh hoặc kiều dân gốc Hoa mua GPU rồi bán lại
      Có lẽ chiếc 4090 của tôi rồi cũng sẽ được tái sinh ở Trung Quốc thành một Frankenstein GPU với VRAM đã bị mod
    • Thực ra đặt hàng từ Alibaba hoặc eBay sang nước láng giềng rồi đưa tiếp vào Trung Quốc là cực kỳ dễ
      Chỉ cần qua biên giới là GPU coi như đã ở trong Trung Quốc
    • Chính phủ Trung Quốc không bận tâm chuyện đó
      Chỉ lúc đưa hàng vào mới là “buôn lậu”, còn khi đã vào trong Trung Quốc thì không còn là bất hợp pháp
      DeepSeek dùng loại GPU đó là điều hoàn toàn dễ hiểu
    • Nhưng tôi lại tò mò chip Nvidia thực sự được sản xuất ở đâu
  • Các lệnh trừng phạt chỉ làm tăng chi phí một chút, chứ không khiến việc đó trở nên bất khả thi
    Linh kiện điện tử, dầu mỏ hay quyền truy cập ChatGPT thì cuối cùng chỉ cần có tiền là vẫn làm được
    Chỉ là những mặt hàng bị trừng phạt kiểu này có thể bị lợi dụng làm công cụ tuyên truyền
    Ví dụ thử tưởng tượng khi cài driver Nvidia mà phải trả lời câu hỏi về “sự kiện Thiên An Môn” thì sao

    • Ngay cả ma túy dù bị cấm trên toàn thế giới vẫn được tuồn số lượng lớn vào Mỹ, nên buôn lậu GPU còn dễ hơn nhiều và lại còn hợp pháp hơn
      Chở cả một xe tải đầy GPU rõ ràng đơn giản hơn chở ma túy rất nhiều
    • Khi đến Trung Quốc, tôi thấy có khá nhiều người nói về sự kiện Thiên An Môn một cách bất ngờ là khá thoải mái
      Chỉ là trên các nền tảng công khai thì bị cấm
      Vì vậy tôi cũng nghi ngờ chiến lược tuyên truyền kiểu đó thực sự hiệu quả đến đâu
    • Không phải chỉ là “tăng chi phí một chút”, mà chính ma sát phát sinh mới là hiệu quả của lệnh trừng phạt
      Dù không thể chặn hoàn toàn đội tàu buôn lậu dầu của Nga, chỉ cần tạo ra bầu không khí sợ hãi cũng đủ làm giảm lợi nhuận
    • Nó làm tôi nhớ đến kiểu kiểm duyệt “đáp án đúng là ‘chuyện đó chưa từng xảy ra’”
  • Bloomberg dùng cụm “chip bị cấm ở Trung Quốc”, nhưng
    việc Mỹ cấm xuất khẩu và việc bị cấm bên trong Trung Quốc là hai chuyện khác nhau

    • Một số chip thực sự đã từng bị chính phủ Trung Quốc cấm doanh nghiệp trong nước mua
      Bài liên quan (Al Jazeera)
    • Mỹ có xu hướng nghĩ rằng luật của mình có hiệu lực trên toàn thế giới
      Ví dụ như nhiều trường hợp họ tìm cách bắt giữ và dẫn độ người điều hành trang torrent hoặc người liên quan đến WikiLeaks ở nước ngoài
      Thậm chí từng biện minh cả việc bắt cóc và tra tấn công dân nước khác với lý do là “chiến binh thù địch”
  • Tôi nghĩ thế giới hẳn đã tốt hơn nếu Mỹ không cứ tìm cách đè ép các nước khác

    • Tôi lại nhớ đến câu “đừng ghét người chơi, hãy ghét cuộc chơi”
    • Nhưng nếu Trung Quốc ở cùng vị thế đó thì họ cũng sẽ làm y như vậy
      Cường quốc nào cũng có bản năng bảo vệ vị thế của mình
    • Cạnh tranh công bằng là điều lý tưởng, nhưng Trung Quốc cũng chèn ép doanh nghiệp nước ngoài trong nội địa của họ
      Các lệnh trừng phạt của Mỹ không chỉ đơn thuần là chủ nghĩa bảo hộ mà còn là phản ứng trước cạnh tranh không công bằng
    • Có khi dùng nguồn lực cho các lệnh trừng phạt kiểu này để ngăn đội tàu cá Trung Quốc tàn phá môi trường còn là khoản đầu tư tốt hơn
  • Lạ là trong cuộc thảo luận này khả năng tiếp cận cloud gần như không được nhắc tới
    Thuê H100 trên máy chủ Mỹ trước đây vẫn làm được mà không gặp ràng buộc gì

    • OpenAI hay Anthropic đang tận dụng kiến trúc mạng đặc biệt với nhà cung cấp cloud
      Người dùng bình thường rất khó có được hạ tầng ở mức đó
    • Thuê GPU thì dễ và rẻ, nhưng huấn luyện quy mô lớn đòi hỏi phải đặt cụm vật lý tập trung để giảm độ trễ
    • Nếu CIA yêu cầu thì Amazon có lẽ sẽ mở rootkit trên máy chủ ngay lập tức
      Có khi còn chẳng cần reboot
    • Nhưng để làm ở quy mô lớn thì kiểm soát tầng mạng và quy trình KYC là bắt buộc
    • Việc DeepSeek có được mức truy cập cloud như vậy ở quy mô họ cần có vẻ không thực tế
  • Chuyện này chẳng có gì đáng ngạc nhiên, và có lẽ sẽ chẳng có chuyện gì xảy ra cả
    Nếu nơi sản xuất ở ngay nước bên cạnh thì lúc nào cũng sẽ có cách kiếm được chip

    • Thực tế là không có cách nào ngăn được
      Trừ khi cấm hoàn toàn mọi hoạt động bán hàng ra nước ngoài của Nvidia, còn không thì các lệnh trừng phạt khó mà hiệu quả
      Việc chính phủ quản lý mua GPU bằng cơ chế cấp phép cũng không thực tế
    • Nhưng chính phủ Trung Quốc từng có tiền lệ phản ứng mạnh cả với chuyện nhỏ, nên cũng không thể hoàn toàn yên tâm
  • Cách nói của GamersNexus về thái độ “nhắm một mắt, mở một mắt” là rất chính xác
    Trung Quốc đã chỉ thị ngừng dùng chip Nvidia, nhưng trên thực tế điều đó giống một tín hiệu thúc đẩy tự chủ hơn
    Các lệnh trừng phạt của Mỹ cũng giống cuộc chiến chống ma túy ở chỗ là một chính sách được định sẵn sẽ thất bại

    • Cá nhân tôi thấy mô hình nhà nước đưa ra định hướng còn doanh nghiệp tự nguyện làm theo cũng không tệ
      Tất nhiên nếu là tự nguyện chứ không phải cưỡng ép thì sẽ lý tưởng hơn
  • Nếu số chip lần này là hàng đã được mua hợp pháp trước lệnh cấm,
    thì về cơ bản đây có thể chỉ là một tranh cãi không có nhiều ý nghĩa

    • Nhưng chip Blackwell cấp độ datacenter vốn dĩ đã nằm trong diện cấm xuất khẩu ngay từ đầu
      Từng có tin đồn rằng DeepSeek đã lách lệnh trừng phạt, đồng thời bootstrap tham số từ các mô hình khác để cắt giảm chi phí
      Bài báo lần này là nội dung củng cố cho tin đồn đó
  • Tôi nghĩ việc ngăn giao dịch giữa hai quốc gia trên thực tế là rất khó
    GPU là mặt hàng có lưu lượng phân phối thấp và không thể theo dõi bằng vệ tinh,
    nên khác với dầu mỏ, vốn là loại hàng hóa có hạ tầng dễ lộ ra ngoài