- Báo cáo cho biết startup AI của Trung Quốc DeepSeek đang được cho là đã sử dụng chip Nvidia Blackwell, một chip thuộc diện Mỹ cấm xuất khẩu, để phát triển mô hình AI thế hệ mới
- The Information cho rằng những chip này được đặt tại các trung tâm dữ liệu ở quốc gia thứ ba được phép bán ra rồi mới được tháo dỡ và buôn lậu trở về Trung Quốc
- Mỹ đang cấm xuất khẩu chip bán dẫn tiên tiến sang Trung Quốc, và một số nhà phát triển tiếp tục tiếp cận qua trung tâm dữ liệu nước ngoài hoặc các con đường vòng
- Nvidia cho rằng về vụ việc này, “chưa từng xác nhận hoạt động như vậy diễn ra”, đồng thời cho biết sẽ điều tra nếu nhận được tố giác
- Vụ việc này phản ánh thực tế các công ty AI Trung Quốc đang tìm cách giành quyền tiếp cận chip hiệu năng cao trong bối cảnh cuộc cạnh tranh công nghệ Mỹ-Trung
Nghi vấn DeepSeek sử dụng chip bị cấm
- DeepSeek được The Information đưa tin là đang dùng chip Nvidia Blackwell (một loại chip bị Mỹ cấm xuất khẩu) để phát triển mô hình AI mới
- Những chip này được cho là đã được lắp trong các trung tâm dữ liệu của các quốc gia thứ ba được phép bán, sau đó tháo ra và chuyển sang Trung Quốc
- Tin tức cho biết thiết bị đã được đưa vào sau khi vượt qua kiểm tra của một công ty phát triển thiết bị máy chủ
- Mỹ vẫn cấm xuất khẩu chip bán dẫn tiên tiến sang Trung Quốc
- Vì vậy đã xuất hiện các trường hợp các nhà phát triển AI ở Trung Quốc tiếp cận chip qua trung tâm dữ liệu nước ngoài hoặc các con đường không chính thức
Vụ việc liên quan đến quy định xuất khẩu của Mỹ
- Vào tháng 11, công tố viên Mỹ đã truy tố hai người Trung Quốc và hai công dân Mỹ
- Họ bị cáo buộc thành lập một công ty môi giới bất động sản giả để vận chuyển chip qua Malaysia nhằm đưa về Trung Quốc
- Các vụ việc này được nêu như một phần của các giao dịch lách đường xuất hiện sau khi Mỹ tăng cường kiểm soát xuất khẩu bán dẫn
Quan điểm của Nvidia
- Nvidia nói rằng “chúng tôi chưa nhận được thông tin nào xác nhận việc buôn lậu như vậy”
- Người phát ngôn nói: “Nếu việc buôn lậu như vậy có thật thì khả năng xảy ra không cao, nhưng nếu nhận được tố giác, chúng tôi sẽ điều tra”
Bối cảnh của DeepSeek và việc phát triển mô hình AI
- DeepSeek đã công bố vào tháng 1/2024 rằng đã phát triển một mô hình AI với chi phí thấp nhưng có thể cạnh tranh được với mức tốt nhất tại Thung lũng Silicon
- Công ty nhận vốn của quỹ phòng hộ Trung Quốc High-Flyer, và được cho là đã tiếp cận 10.000 GPU Nvidia vào năm 2021
- Đây là thời điểm trước khi Mỹ áp đặt lệnh cấm xuất khẩu
- Vào tháng 9/2024, công ty đã ra mắt mô hình mới và cho biết đang hợp tác với các nhà sản xuất chip tại Trung Quốc
Quyết định mới của Mỹ và phản ứng của Trung Quốc
- Tổng thống Donald Trump đầu tuần này đã cho phép xuất khẩu H200, bộ tăng tốc AI đời cũ của Nvidia, sang Trung Quốc
- Tuy nhiên, lệnh cấm xuất khẩu đối với chip Blackwell mạnh hơn vẫn tiếp tục được duy trì
- Chính phủ Trung Quốc kêu gọi các doanh nghiệp công nghệ trong nước tăng cường sử dụng thiết bị nội địa
- DeepSeek cũng đang hợp tác với các nhà sản xuất chip của Trung Quốc theo đúng hướng đi đó
1 bình luận
Ý kiến trên Hacker News
Việc DeepSeek huấn luyện mô hình bằng chip Nvidia được mua trước khi lệnh cấm xuất khẩu chip bán dẫn đại trà của Mỹ có hiệu lực là điều đã được biết từ trước
Một số người cho rằng sau đó họ vẫn có thể đã tiếp tục mua chip qua các kênh không chính thức
Tôi cũng đọc ở nơi khác rằng họ đã dùng dữ liệu đầu ra của ChatGPT, Claude và Gemini làm dữ liệu huấn luyện
Khi ai cũng đang lấy cắp lại dữ liệu bị lấy cắp từ nhau, thì chuyện buôn lậu chút ít cũng chẳng có gì đáng ngạc nhiên
Ngay cả tổng thống Mỹ cũng đã thừa nhận các lệnh trừng phạt này được dùng cho mục đích bảo hộ thương mại
Anthropic cũng đã trả 1 tỷ USD tiền dàn xếp vì vi phạm bản quyền, nên rốt cuộc mọi mô hình đều là thành quả của việc chiếm đoạt tài sản trí tuệ và dữ liệu cá nhân của nhân loại ở quy mô lớn
Tôi ủng hộ niềm tin rằng mô hình mở sẽ đánh bại mô hình đóng
Chỉ có điều trong TOS của OpenAI có điều khoản cấm dùng vào việc huấn luyện mô hình cạnh tranh, nên khá mỉa mai
Việc dùng đầu ra của mô hình khác để huấn luyện được gọi là knowledge distillation
Trước đây mô hình Grok thậm chí còn hay mở đầu câu trả lời bằng “as a model trained by OpenAI…”
Xem phim tài liệu của GamersNexus sẽ thấy họ giải thích rất rõ cấu trúc chợ đen của GPU AI NVIDIA
Nội dung nói về cách các công ty như DeepSeek lách lệnh cấm xuất khẩu của Mỹ để mua chip
Người thắng đấu giá dùng tài khoản ở Úc nhưng địa chỉ nhận hàng lại là một căn nhà bình thường ở Delaware, Mỹ, và tên cũng khác
Những trường hợp như vậy thường là du học sinh hoặc kiều dân gốc Hoa mua GPU rồi bán lại
Có lẽ chiếc 4090 của tôi rồi cũng sẽ được tái sinh ở Trung Quốc thành một Frankenstein GPU với VRAM đã bị mod
Chỉ cần qua biên giới là GPU coi như đã ở trong Trung Quốc
Chỉ lúc đưa hàng vào mới là “buôn lậu”, còn khi đã vào trong Trung Quốc thì không còn là bất hợp pháp
DeepSeek dùng loại GPU đó là điều hoàn toàn dễ hiểu
Các lệnh trừng phạt chỉ làm tăng chi phí một chút, chứ không khiến việc đó trở nên bất khả thi
Linh kiện điện tử, dầu mỏ hay quyền truy cập ChatGPT thì cuối cùng chỉ cần có tiền là vẫn làm được
Chỉ là những mặt hàng bị trừng phạt kiểu này có thể bị lợi dụng làm công cụ tuyên truyền
Ví dụ thử tưởng tượng khi cài driver Nvidia mà phải trả lời câu hỏi về “sự kiện Thiên An Môn” thì sao
Chở cả một xe tải đầy GPU rõ ràng đơn giản hơn chở ma túy rất nhiều
Chỉ là trên các nền tảng công khai thì bị cấm
Vì vậy tôi cũng nghi ngờ chiến lược tuyên truyền kiểu đó thực sự hiệu quả đến đâu
Dù không thể chặn hoàn toàn đội tàu buôn lậu dầu của Nga, chỉ cần tạo ra bầu không khí sợ hãi cũng đủ làm giảm lợi nhuận
Bloomberg dùng cụm “chip bị cấm ở Trung Quốc”, nhưng
việc Mỹ cấm xuất khẩu và việc bị cấm bên trong Trung Quốc là hai chuyện khác nhau
Bài liên quan (Al Jazeera)
Ví dụ như nhiều trường hợp họ tìm cách bắt giữ và dẫn độ người điều hành trang torrent hoặc người liên quan đến WikiLeaks ở nước ngoài
Thậm chí từng biện minh cả việc bắt cóc và tra tấn công dân nước khác với lý do là “chiến binh thù địch”
Tôi nghĩ thế giới hẳn đã tốt hơn nếu Mỹ không cứ tìm cách đè ép các nước khác
Cường quốc nào cũng có bản năng bảo vệ vị thế của mình
Các lệnh trừng phạt của Mỹ không chỉ đơn thuần là chủ nghĩa bảo hộ mà còn là phản ứng trước cạnh tranh không công bằng
Lạ là trong cuộc thảo luận này khả năng tiếp cận cloud gần như không được nhắc tới
Thuê H100 trên máy chủ Mỹ trước đây vẫn làm được mà không gặp ràng buộc gì
Người dùng bình thường rất khó có được hạ tầng ở mức đó
Có khi còn chẳng cần reboot
Chuyện này chẳng có gì đáng ngạc nhiên, và có lẽ sẽ chẳng có chuyện gì xảy ra cả
Nếu nơi sản xuất ở ngay nước bên cạnh thì lúc nào cũng sẽ có cách kiếm được chip
Trừ khi cấm hoàn toàn mọi hoạt động bán hàng ra nước ngoài của Nvidia, còn không thì các lệnh trừng phạt khó mà hiệu quả
Việc chính phủ quản lý mua GPU bằng cơ chế cấp phép cũng không thực tế
Cách nói của GamersNexus về thái độ “nhắm một mắt, mở một mắt” là rất chính xác
Trung Quốc đã chỉ thị ngừng dùng chip Nvidia, nhưng trên thực tế điều đó giống một tín hiệu thúc đẩy tự chủ hơn
Các lệnh trừng phạt của Mỹ cũng giống cuộc chiến chống ma túy ở chỗ là một chính sách được định sẵn sẽ thất bại
Tất nhiên nếu là tự nguyện chứ không phải cưỡng ép thì sẽ lý tưởng hơn
Nếu số chip lần này là hàng đã được mua hợp pháp trước lệnh cấm,
thì về cơ bản đây có thể chỉ là một tranh cãi không có nhiều ý nghĩa
Từng có tin đồn rằng DeepSeek đã lách lệnh trừng phạt, đồng thời bootstrap tham số từ các mô hình khác để cắt giảm chi phí
Bài báo lần này là nội dung củng cố cho tin đồn đó
Tôi nghĩ việc ngăn giao dịch giữa hai quốc gia trên thực tế là rất khó
GPU là mặt hàng có lưu lượng phân phối thấp và không thể theo dõi bằng vệ tinh,
nên khác với dầu mỏ, vốn là loại hàng hóa có hạ tầng dễ lộ ra ngoài