Những bài học rút ra từ bên trong các viện nghiên cứu AI Trung Quốc

(interconnects.ai)

24 điểm bởi GN⁺ 2026-05-14 | 8 bình luận | Chia sẻ qua WhatsApp

Báo cáo thực địa phân tích khác biệt văn hóa giữa hệ sinh thái AI Trung Quốc và Mỹ, cùng tác động của chúng đến việc phát triển mô hình, dựa trên trải nghiệm trực tiếp thăm các viện nghiên cứu AI lớn của Trung Quốc và trò chuyện với các nhà nghiên cứu
Các nhà nghiên cứu Trung Quốc có xu hướng văn hóa tập trung vào tối ưu chất lượng của mô hình cuối cùng hơn là danh tiếng cá nhân, và một phần đáng kể trong số những người đóng góp cốt lõi vẫn đang là sinh viên
Các công ty AI Trung Quốc có ý thức sở hữu rất mạnh trong việc kiểm soát stack công nghệ của chính mình thay vì mua dịch vụ bên ngoài, và việc công bố mã nguồn mở cũng dựa trên các cân nhắc thực dụng
Phần lớn nhà phát triển AI tại Trung Quốc đang dùng Claude, và nhu cầu AI doanh nghiệp có thể đi theo quỹ đạo của thị trường đám mây thay vì SaaS
Hệ sinh thái AI của Mỹ và Trung Quốc vận hành theo những cách khác nhau về mặt cấu trúc, và nếu ánh xạ đơn giản ngành AI Trung Quốc bằng khung tư duy phương Tây thì có thể dẫn đến lỗi phân loại

Cách tư duy của các nhà nghiên cứu Trung Quốc

Các công ty phát triển LLM tại Trung Quốc kết hợp truyền thống văn hóa lâu đời trong giáo dục và công việc với những khác biệt tinh vi trong cách vận hành doanh nghiệp công nghệ, từ đó có cấu trúc tối ưu để trở thành fast-follower
Việc xây dựng LLM tiên tiến hiện nay xoay quanh công việc tỉ mỉ trên toàn bộ stack, bao gồm dữ liệu, chi tiết kiến trúc và triển khai thuật toán RL; đây là một quá trình phức tạp trong đó thành quả của từng cá nhân phải nhường chỗ cho mục tiêu tối ưu đa mục tiêu của cả mô hình
Các nhà nghiên cứu Mỹ có văn hóa quảng bá mạnh mẽ công việc của mình, và việc theo đuổi danh tiếng như một “nhà khoa học AI hàng đầu” dễ gây ra xung đột trong tổ chức
- Có tin đồn lan truyền rộng rãi rằng tổ chức Llama đã sụp đổ dưới sức nặng của các lợi ích chính trị kiểu này
- Cũng có câu chuyện rằng ở một số viện nghiên cứu, họ đã phải trả thưởng cho các nhà nghiên cứu hàng đầu vì bất mãn khi ý tưởng của họ không được phản ánh trong mô hình cuối cùng
Một phần lớn những người đóng góp cốt lõi tại các viện nghiên cứu Trung Quốc là sinh viên đang theo học, và bản thân các viện này cũng là những tổ chức rất trẻ
- Điều này tương tự cấu trúc của Ai2, nơi sinh viên được đối xử như đồng nghiệp và được tích hợp trực tiếp vào các nhóm LLM
- Trong khi đó, OpenAI, Anthropic, Cursor ở Mỹ không cung cấp thực tập, và ngay cả thực tập liên quan đến Gemini của Google cũng có nguy cơ bị tách rời khỏi công việc thực tế
Những khác biệt văn hóa này cải thiện năng lực xây dựng mô hình theo các cách cụ thể:
- Mức độ sẵn sàng cao hơn đối với những công việc ít được chú ý nhằm cải thiện mô hình cuối cùng
- Nhân lực AI mới không bị trói buộc bởi các chu kỳ hype trước đó nên thích nghi với công nghệ hiện đại nhanh hơn
- Ít cái tôi hơn, khiến cấu trúc tổ chức dễ mở rộng hơn đôi chút và ít bị game hóa hệ thống hơn
- Nguồn nhân lực dồi dào phù hợp để giải quyết các bài toán đã được chứng minh khái niệm ở nơi khác
Những lợi thế này đối lập với định kiến phổ biến rằng các nhà nghiên cứu Trung Quốc tạo ra ít hơn các nghiên cứu học thuật sáng tạo, khai phá theo phong cách 0-to-1
- Các lãnh đạo của các viện nghiên cứu học thuật đang cố nuôi dưỡng một văn hóa nghiên cứu tham vọng hơn
- Một số lãnh đạo kỹ thuật lại hoài nghi, cho rằng việc tái thiết kế hệ thống giáo dục và khuyến khích là thách thức quá lớn để thực hiện trong trạng thái cân bằng kinh tế hiện tại

Đặc điểm của các nhà nghiên cứu sinh viên

Ở Trung Quốc cũng đang xuất hiện hiện tượng chảy máu chất xám tương tự Mỹ, và nhiều người trước đây từng cân nhắc học thuật nay có xu hướng ở lại khu vực công nghiệp
- Một nhà nghiên cứu nói rằng từng quan tâm đến vị trí giáo sư, nhưng rồi nhận xét: “Giảng dạy đã được LLM giải quyết — tại sao sinh viên phải hỏi tôi?”
Sinh viên có lợi thế là tiếp cận LLM mà không có thành kiến sẵn có
- Trong vài năm gần đây, các mô thức cốt lõi của LLM đã chuyển từ MoE scaling → RL scaling → tận dụng agent
- Để làm tốt tất cả điều này, cần nhanh chóng hấp thụ bối cảnh từ lượng lớn tài liệu và stack công nghệ, và sinh viên vốn quen cũng như hào hứng với kiểu công việc đó
Các nhà nghiên cứu sinh viên Trung Quốc ít tham gia vào diễn ngôn triết học và rất trực diện
- Số nhà nghiên cứu Trung Quốc có quan điểm tinh vi về kinh tế học của mô hình hay các rủi ro xã hội dài hạn ít hơn nhiều so với ở Mỹ
- Một nhà nghiên cứu trích dẫn tiền đề nổi tiếng của Dan Wang rằng “Trung Quốc được điều hành bởi kỹ sư, còn Mỹ được điều hành bởi luật sư”
- Ở Trung Quốc không có lộ trình xây dựng có hệ thống sức hút ngôi sao cho các nhà khoa học thông qua những podcast siêu đại chúng như Dwarkesh hay Lex
Khi được hỏi về bất định kinh tế do AI gây ra, các câu hỏi vượt trên AGI, hay tranh luận đạo đức về hành vi của mô hình, các nhà khoa học Trung Quốc phản ánh đặc điểm của một hệ thống nơi ý kiến về tranh luận và cấu trúc xã hội không được khuyến khích

Không khí thực địa ở Bắc Kinh và hệ sinh thái AI Trung Quốc

Bắc Kinh tạo cảm giác rất giống Bay Area, với các viện nghiên cứu cạnh tranh nằm trong khoảng cách đi bộ hoặc di chuyển ngắn
- Trong 36 giờ, tác giả đã ghé thăm Z.ai, Moonshot AI, Đại học Thanh Hoa, Meituan, Xiaomi và 01.ai
- Việc di chuyển bằng Didi rất thuận tiện, và các xe hạng XL ở Trung Quốc thường là minivan điện có ghế massage
Cuộc chiêu mộ nhân tài giữa các nhà nghiên cứu rất giống Mỹ; việc chuyển việc là chuyện bình thường và tiêu chí lựa chọn là nơi nào đang có khí thế tốt nhất
Cộng đồng LLM Trung Quốc mang cảm giác gần với một hệ sinh thái hơn là các bộ lạc đối đầu
- Tất cả các viện nghiên cứu Trung Quốc đều dè chừng ByteDance, đơn vị sở hữu mô hình Doubao rất được ưa chuộng
- ByteDance là viện nghiên cứu frontier kín duy nhất của Trung Quốc
- Tất cả các viện đều tôn trọng DeepSeek như lãnh đạo kỹ thuật có trực giác nghiên cứu tốt nhất khi đưa vào thực thi
- Điều này trái ngược với việc ở Mỹ, khi gặp không chính thức các thành viên viện nghiên cứu thì rất nhanh chóng nảy lửa
Điều gây ấn tượng nhất về sự khiêm tốn của các nhà nghiên cứu Trung Quốc là thái độ thờ ơ với khía cạnh kinh doanh, cho rằng đó “không phải vấn đề của mình”
- Ở Mỹ, mọi người đều bị ám ảnh bởi xu hướng cấp hệ sinh thái như bên bán dữ liệu, compute hay gọi vốn

Những khác biệt và tương đồng của ngành AI Trung Quốc

Việc xây dựng mô hình AI ngày nay không còn chỉ là kết quả kỹ thuật của các nhà nghiên cứu xuất sắc, mà đã trở thành hoạt động phức hợp kết hợp xây dựng, triển khai, huy động vốn và chấp nhận thị trường
6 khác biệt chính so với hệ sinh thái phương Tây:
1. Dấu hiệu ban đầu của nhu cầu AI nội địa
- Có giả thuyết cho rằng vì doanh nghiệp Trung Quốc không chịu trả tiền cho phần mềm nên sẽ không hình thành một thị trường suy luận khổng lồ
- Nhưng điều này chỉ đúng với hệ sinh thái SaaS vốn rất nhỏ trong lịch sử của Trung Quốc, trong khi nước này vẫn có một thị trường đám mây quy mô lớn
- Câu hỏi cốt lõi chưa có lời giải: chi tiêu cho AI doanh nghiệp sẽ đi theo thị trường SaaS (nhỏ) hay thị trường đám mây (mang tính nền tảng)
- Nhìn chung, AI có vẻ đi theo quỹ đạo gần với đám mây hơn, và không ai tỏ ra đặc biệt lo lắng về việc thị trường sẽ tăng trưởng quanh các công cụ mới
2. Hầu hết nhà phát triển đều dùng Claude
- Phần lớn nhà phát triển AI ở Trung Quốc rất chuộng Claude và tập trung vào việc Claude đã thay đổi cách xây dựng phần mềm như thế nào
- Họ vẫn dùng Claude dù trên danh nghĩa nó bị cấm ở Trung Quốc
- Một số nhà nghiên cứu nhắc đến việc dùng công cụ tự phát triển như Kimi hay GLM CLI, nhưng ai cũng nói đến Claude
- Điều đáng ngạc nhiên là rất ít người nhắc đến Codex, dù nó đang tăng độ phổ biến mạnh ở Bay Area
- Dù Trung Quốc trong lịch sử khá dè dặt với việc mua phần mềm, điều này không tạo cảm giác rằng sẽ không có làn sóng tăng mạnh về nhu cầu suy luận
3. Tinh thần sở hữu công nghệ
- Văn hóa Trung Quốc kết hợp với một động cơ kinh tế năng động tạo ra những kết quả khó dự đoán
- Rất nhiều mô hình AI phản ánh trạng thái cân bằng thực dụng và hiện thời của nhiều công ty công nghệ, chứ không phải một đại kế hoạch nào đó
- Trong ngành, ByteDance và Alibaba được tôn trọng như các incumbent được kỳ vọng sẽ thắng ở phần lớn thị trường nhờ nguồn lực đáng kể
- DeepSeek là lãnh đạo kỹ thuật được kính trọng, nhưng vẫn còn cách xa vị thế dẫn đầu thị trường; họ đặt hướng đi chứ không có cấu trúc để chiến thắng về kinh tế
- Ở phương Tây có thể sẽ thấy lạ khi các công ty như Meituan (dịch vụ giao hàng) hay Ant Group lại xây mô hình, nhưng họ cho rằng vì LLM là cốt lõi của sản phẩm công nghệ tương lai nên cần có nền tảng mạnh
- Khi fine-tune mô hình nền tảng chung, họ có thể củng cố stack nhờ phản hồi từ cộng đồng mở, đồng thời duy trì phiên bản fine-tune nội bộ cho sản phẩm của mình
- Tư duy “ưu tiên mở” dựa trên tính thực dụng: có được phản hồi mạnh cho mô hình, đóng góp cho cộng đồng mã nguồn mở và củng cố sứ mệnh
4. Hỗ trợ của chính phủ là có thật nhưng quy mô chưa rõ
- Thường xuyên có các tuyên bố rằng chính phủ Trung Quốc đang tích cực hỗ trợ cuộc cạnh tranh LLM mở
- Đây là một chính phủ phân quyền ở nhiều cấp, và không có playbook rõ ràng về việc chính xác mỗi cấp đang làm gì
- Các quận/khu ở Bắc Kinh cạnh tranh để thu hút văn phòng của các công ty công nghệ
- Sự “hỗ trợ” được cung cấp gần như chắc chắn bao gồm đơn giản hóa thủ tục hành chính như giấy phép, nhưng việc có hỗ trợ thu hút nhân tài hay thậm chí buôn lậu chip hay không thì chưa rõ
- Trong chuyến thăm, đã nhiều lần có nhắc đến sự quan tâm hoặc hỗ trợ từ chính phủ, nhưng không đủ chi tiết để có thể khẳng định dứt khoát
- Không hề có dấu hiệu nào cho thấy cấp cao nhất của chính phủ Trung Quốc tác động đến các quyết định kỹ thuật của mô hình
5. Ngành dữ liệu kém phát triển hơn nhiều
- Tác giả từng nghe rằng Anthropic và OpenAI chi hơn 10 triệu USD cho một môi trường đơn lẻ, và tổng cộng hàng trăm triệu USD mỗi năm để mở rộng frontier RL, nên muốn xác minh liệu các viện nghiên cứu Trung Quốc có mua cùng loại môi trường từ công ty Mỹ hay được hệ sinh thái nội địa hỗ trợ không
- Vấn đề không phải là hoàn toàn không có ngành dữ liệu, mà là chất lượng tương đối thấp, nên trong nhiều trường hợp tự xây môi trường hoặc dữ liệu còn tốt hơn
- Các nhà nghiên cứu trực tiếp dành nhiều thời gian để xây dựng môi trường huấn luyện RL
- Các tập đoàn lớn như ByteDance và Alibaba có đội gán nhãn dữ liệu nội bộ để hỗ trợ việc này
- Tất cả điều đó phản ánh tư duy tự xây thay vì mua đã nêu ở phần trước
6. Nhu cầu cấp bách đối với chip Nvidia
- Compute Nvidia là tiêu chuẩn vàng cho huấn luyện, và mọi viện nghiên cứu đều bị giới hạn phát triển vì thiếu nó
- Nếu có nguồn cung thì chắc chắn họ sẽ mua
- Các bộ tăng tốc khác, bao gồm Huawei, được đánh giá tích cực cho suy luận, và rất nhiều viện nghiên cứu có thể tiếp cận chip Huawei
Những điểm này cho thấy một bức tranh về hệ sinh thái AI rất khác, nơi nếu nhanh chóng ánh xạ cách vận hành của các viện nghiên cứu phương Tây sang Trung Quốc thì sẽ dẫn đến lỗi phân loại
Câu hỏi cốt lõi là liệu những hệ sinh thái khác nhau này có tạo ra những loại mô hình khác biệt một cách có ý nghĩa hay không, hay mô hình Trung Quốc sẽ luôn được mô tả như phiên bản chậm hơn 3–9 tháng của các mô hình frontier Mỹ

Cân bằng toàn cầu

Trung Quốc không phải nơi có thể diễn đạt bằng các quy tắc hay công thức; đó là một nơi có động lực và phản ứng hóa học rất khác
- Nền văn hóa ở đây rất lâu đời và sâu sắc, đồng thời đan xen hoàn toàn với cách xây dựng công nghệ trong nước
Cấu trúc quyền lực hiện tại của Mỹ dùng thế giới quan về Trung Quốc như một thiết bị cốt lõi trong ra quyết định, nhưng Trung Quốc có những phẩm chất và bản năng rất khó mô hình hóa bằng logic ra quyết định phương Tây
Ngay cả khi hỏi trực tiếp vì sao các viện nghiên cứu này công bố mở những mô hình tốt nhất của họ, thì giao điểm giữa tinh thần sở hữu và sự hỗ trợ hệ sinh thái chân thực vẫn khó kết nối thành lời giải thích đơn giản
Gần như mọi công ty công nghệ lớn của Trung Quốc đều đang xây dựng LLM nền tảng đa dụng của riêng mình
- Meituan (dịch vụ giao hàng), Xiaomi (công ty công nghệ tiêu dùng quy mô rộng) và những đơn vị khác đều công bố các mô hình open-weight
- Các công ty tương đương ở Mỹ đơn giản là sẽ mua dịch vụ
- Những công ty này xây LLM không phải để chạy theo xu hướng nóng, mà vì khát vọng nền tảng rất sâu sắc là kiểm soát stack của chính mình và phát triển công nghệ quan trọng nhất của thời đại
Sự nhân hậu, cuốn hút và ấm áp chân thành của các nhà nghiên cứu Trung Quốc tạo nên một trải nghiệm rất đậm tính con người
- Kiểu đối thoại địa chính trị lạnh lùng quen thuộc ở Mỹ hoàn toàn không thấm vào họ
Nếu hệ sinh thái mở có thể thịnh vượng trên toàn cầu, chúng ta có thể tạo ra AI an toàn hơn, dễ tiếp cận hơn và hữu ích hơn; câu hỏi hiện nay là liệu các viện nghiên cứu Mỹ có thực hiện những bước đi để giành lấy vị thế dẫn dắt đó hay không
Ngày càng có nhiều tin đồn về sắc lệnh hành pháp ảnh hưởng đến mô hình mở, điều có thể khiến mối cộng hưởng giữa vai trò dẫn dắt của Mỹ và hệ sinh thái toàn cầu trở nên phức tạp hơn

8 bình luận

jjw9512151 2026-05-14

Đôi khi tôi lo rằng sự ám ảnh quá mức và phi lý về Trung Quốc
có phải đang tạo ra con quái vật bên trong chúng ta hay không.

Cũng giống như một trong những danh nghĩa để Đức Quốc xã lên nắm quyền là chống cộng vậy.

rungain 2026-05-14

"Trung Quốc do các kỹ sư vận hành" -> "Trung Quốc do Đảng Cộng sản vận hành"

kaydash 2026-05-14

Chỉ có một Trung Quốc...!

nutella 2026-05-15

Những công ty này xây dựng LLM không phải để chạy theo xu hướng đang hot, mà vì khát vọng sâu xa và căn bản là kiểm soát stack của riêng mình và phát triển công nghệ quan trọng nhất của thời đại này

Đoạn này thật sự khiến tôi quá ngưỡng mộ

kaboom45 2026-05-14

Tôi nghĩ việc các mô hình được phát hành dưới dạng mã nguồn mở là điều tốt.

dhy0613 2026-05-14

Có lẽ cũng có thể xem đây là một dạng xu hướng: giống như ở Nhật có nhiều người né tránh sản phẩm Hàn Quốc và có thái độ thù địch với Hàn Quốc, thì ở Hàn Quốc cũng có nhiều người né tránh sản phẩm Trung Quốc và có thái độ thù địch với Trung Quốc.

cardi1880 2026-05-14

Càng đọc những nội dung như thế này càng khiến người ta cảm nhận được sự vĩ đại của dân tộc Trung Hoa.

swo386 24 ngày trước

Nói về sự vĩ đại của một dân tộc cụ thể thì có hợp lý không... Nếu xét như vậy, lý do Mỹ vẫn là cường quốc AI mạnh nhất có phải vì "dân tộc" Mỹ vĩ đại không? Dù Qwen hay Deepseek có tốt đến đâu thì thực tế chúng vẫn chưa bằng được Anthropic và OpenAI. Kể cả khi Trung Quốc tung đủ loại gián điệp công nghiệp và đổ số tiền khổng lồ vào ngành bán dẫn mà vẫn chưa đuổi kịp, vậy là vì dân tộc Trung Quốc kém cỏi còn dân tộc Hàn Quốc vĩ đại sao? Đó chỉ là kết quả do cấu trúc xã hội và môi trường tạo ra mà thôi. Việc ca ngợi một dân tộc cụ thể cũng đồng nghĩa với quan niệm rằng tồn tại những dân tộc thấp kém, và điều đó không khác gì tư tưởng kiểu Đức Quốc xã.

Những bài học rút ra từ bên trong các viện nghiên cứu AI Trung Quốc

Cách tư duy của các nhà nghiên cứu Trung Quốc

Đặc điểm của các nhà nghiên cứu sinh viên

Không khí thực địa ở Bắc Kinh và hệ sinh thái AI Trung Quốc

Những khác biệt và tương đồng của ngành AI Trung Quốc

1. Dấu hiệu ban đầu của nhu cầu AI nội địa

2. Hầu hết nhà phát triển đều dùng Claude

3. Tinh thần sở hữu công nghệ

4. Hỗ trợ của chính phủ là có thật nhưng quy mô chưa rõ

5. Ngành dữ liệu kém phát triển hơn nhiều

6. Nhu cầu cấp bách đối với chip Nvidia

Cân bằng toàn cầu

Bài viết liên quan

8 bình luận