11 điểm bởi GN⁺ 5 giờ trước | 3 bình luận | Chia sẻ qua WhatsApp
  • Báo cáo thực địa phân tích khác biệt văn hóa giữa hệ sinh thái AI Trung Quốc và Mỹ, cùng tác động của chúng đến việc phát triển mô hình, dựa trên trải nghiệm trực tiếp thăm các viện nghiên cứu AI lớn của Trung Quốc và trò chuyện với các nhà nghiên cứu
  • Các nhà nghiên cứu Trung Quốc có xu hướng văn hóa tập trung vào tối ưu chất lượng của mô hình cuối cùng hơn là danh tiếng cá nhân, và một phần đáng kể trong số những người đóng góp cốt lõi vẫn đang là sinh viên
  • Các công ty AI Trung Quốc có ý thức sở hữu rất mạnh trong việc kiểm soát stack công nghệ của chính mình thay vì mua dịch vụ bên ngoài, và việc công bố mã nguồn mở cũng dựa trên các cân nhắc thực dụng
  • Phần lớn nhà phát triển AI tại Trung Quốc đang dùng Claude, và nhu cầu AI doanh nghiệp có thể đi theo quỹ đạo của thị trường đám mây thay vì SaaS
  • Hệ sinh thái AI của Mỹ và Trung Quốc vận hành theo những cách khác nhau về mặt cấu trúc, và nếu ánh xạ đơn giản ngành AI Trung Quốc bằng khung tư duy phương Tây thì có thể dẫn đến lỗi phân loại

Cách tư duy của các nhà nghiên cứu Trung Quốc

  • Các công ty phát triển LLM tại Trung Quốc kết hợp truyền thống văn hóa lâu đời trong giáo dục và công việc với những khác biệt tinh vi trong cách vận hành doanh nghiệp công nghệ, từ đó có cấu trúc tối ưu để trở thành fast-follower
  • Việc xây dựng LLM tiên tiến hiện nay xoay quanh công việc tỉ mỉ trên toàn bộ stack, bao gồm dữ liệu, chi tiết kiến trúc và triển khai thuật toán RL; đây là một quá trình phức tạp trong đó thành quả của từng cá nhân phải nhường chỗ cho mục tiêu tối ưu đa mục tiêu của cả mô hình
  • Các nhà nghiên cứu Mỹ có văn hóa quảng bá mạnh mẽ công việc của mình, và việc theo đuổi danh tiếng như một “nhà khoa học AI hàng đầu” dễ gây ra xung đột trong tổ chức
    • Có tin đồn lan truyền rộng rãi rằng tổ chức Llama đã sụp đổ dưới sức nặng của các lợi ích chính trị kiểu này
    • Cũng có câu chuyện rằng ở một số viện nghiên cứu, họ đã phải trả thưởng cho các nhà nghiên cứu hàng đầu vì bất mãn khi ý tưởng của họ không được phản ánh trong mô hình cuối cùng
  • Một phần lớn những người đóng góp cốt lõi tại các viện nghiên cứu Trung Quốc là sinh viên đang theo học, và bản thân các viện này cũng là những tổ chức rất trẻ
    • Điều này tương tự cấu trúc của Ai2, nơi sinh viên được đối xử như đồng nghiệp và được tích hợp trực tiếp vào các nhóm LLM
    • Trong khi đó, OpenAI, Anthropic, Cursor ở Mỹ không cung cấp thực tập, và ngay cả thực tập liên quan đến Gemini của Google cũng có nguy cơ bị tách rời khỏi công việc thực tế
  • Những khác biệt văn hóa này cải thiện năng lực xây dựng mô hình theo các cách cụ thể:
    • Mức độ sẵn sàng cao hơn đối với những công việc ít được chú ý nhằm cải thiện mô hình cuối cùng
    • Nhân lực AI mới không bị trói buộc bởi các chu kỳ hype trước đó nên thích nghi với công nghệ hiện đại nhanh hơn
    • Ít cái tôi hơn, khiến cấu trúc tổ chức dễ mở rộng hơn đôi chút và ít bị game hóa hệ thống hơn
    • Nguồn nhân lực dồi dào phù hợp để giải quyết các bài toán đã được chứng minh khái niệm ở nơi khác
  • Những lợi thế này đối lập với định kiến phổ biến rằng các nhà nghiên cứu Trung Quốc tạo ra ít hơn các nghiên cứu học thuật sáng tạo, khai phá theo phong cách 0-to-1
    • Các lãnh đạo của các viện nghiên cứu học thuật đang cố nuôi dưỡng một văn hóa nghiên cứu tham vọng hơn
    • Một số lãnh đạo kỹ thuật lại hoài nghi, cho rằng việc tái thiết kế hệ thống giáo dục và khuyến khích là thách thức quá lớn để thực hiện trong trạng thái cân bằng kinh tế hiện tại

Đặc điểm của các nhà nghiên cứu sinh viên

  • Ở Trung Quốc cũng đang xuất hiện hiện tượng chảy máu chất xám tương tự Mỹ, và nhiều người trước đây từng cân nhắc học thuật nay có xu hướng ở lại khu vực công nghiệp
    • Một nhà nghiên cứu nói rằng từng quan tâm đến vị trí giáo sư, nhưng rồi nhận xét: “Giảng dạy đã được LLM giải quyết — tại sao sinh viên phải hỏi tôi?”
  • Sinh viên có lợi thế là tiếp cận LLM mà không có thành kiến sẵn có
    • Trong vài năm gần đây, các mô thức cốt lõi của LLM đã chuyển từ MoE scaling → RL scaling → tận dụng agent
    • Để làm tốt tất cả điều này, cần nhanh chóng hấp thụ bối cảnh từ lượng lớn tài liệu và stack công nghệ, và sinh viên vốn quen cũng như hào hứng với kiểu công việc đó
  • Các nhà nghiên cứu sinh viên Trung Quốc ít tham gia vào diễn ngôn triết học và rất trực diện
    • Số nhà nghiên cứu Trung Quốc có quan điểm tinh vi về kinh tế học của mô hình hay các rủi ro xã hội dài hạn ít hơn nhiều so với ở Mỹ
    • Một nhà nghiên cứu trích dẫn tiền đề nổi tiếng của Dan Wang rằng “Trung Quốc được điều hành bởi kỹ sư, còn Mỹ được điều hành bởi luật sư
    • Ở Trung Quốc không có lộ trình xây dựng có hệ thống sức hút ngôi sao cho các nhà khoa học thông qua những podcast siêu đại chúng như Dwarkesh hay Lex
  • Khi được hỏi về bất định kinh tế do AI gây ra, các câu hỏi vượt trên AGI, hay tranh luận đạo đức về hành vi của mô hình, các nhà khoa học Trung Quốc phản ánh đặc điểm của một hệ thống nơi ý kiến về tranh luận và cấu trúc xã hội không được khuyến khích

Không khí thực địa ở Bắc Kinh và hệ sinh thái AI Trung Quốc

  • Bắc Kinh tạo cảm giác rất giống Bay Area, với các viện nghiên cứu cạnh tranh nằm trong khoảng cách đi bộ hoặc di chuyển ngắn
    • Trong 36 giờ, tác giả đã ghé thăm Z.ai, Moonshot AI, Đại học Thanh Hoa, Meituan, Xiaomi và 01.ai
    • Việc di chuyển bằng Didi rất thuận tiện, và các xe hạng XL ở Trung Quốc thường là minivan điện có ghế massage
  • Cuộc chiêu mộ nhân tài giữa các nhà nghiên cứu rất giống Mỹ; việc chuyển việc là chuyện bình thường và tiêu chí lựa chọn là nơi nào đang có khí thế tốt nhất
  • Cộng đồng LLM Trung Quốc mang cảm giác gần với một hệ sinh thái hơn là các bộ lạc đối đầu
    • Tất cả các viện nghiên cứu Trung Quốc đều dè chừng ByteDance, đơn vị sở hữu mô hình Doubao rất được ưa chuộng
    • ByteDance là viện nghiên cứu frontier kín duy nhất của Trung Quốc
    • Tất cả các viện đều tôn trọng DeepSeek như lãnh đạo kỹ thuật có trực giác nghiên cứu tốt nhất khi đưa vào thực thi
    • Điều này trái ngược với việc ở Mỹ, khi gặp không chính thức các thành viên viện nghiên cứu thì rất nhanh chóng nảy lửa
  • Điều gây ấn tượng nhất về sự khiêm tốn của các nhà nghiên cứu Trung Quốc là thái độ thờ ơ với khía cạnh kinh doanh, cho rằng đó “không phải vấn đề của mình
    • Ở Mỹ, mọi người đều bị ám ảnh bởi xu hướng cấp hệ sinh thái như bên bán dữ liệu, compute hay gọi vốn

Những khác biệt và tương đồng của ngành AI Trung Quốc

  • Việc xây dựng mô hình AI ngày nay không còn chỉ là kết quả kỹ thuật của các nhà nghiên cứu xuất sắc, mà đã trở thành hoạt động phức hợp kết hợp xây dựng, triển khai, huy động vốn và chấp nhận thị trường
  • 6 khác biệt chính so với hệ sinh thái phương Tây:
  • 1. Dấu hiệu ban đầu của nhu cầu AI nội địa

    • Có giả thuyết cho rằng vì doanh nghiệp Trung Quốc không chịu trả tiền cho phần mềm nên sẽ không hình thành một thị trường suy luận khổng lồ
    • Nhưng điều này chỉ đúng với hệ sinh thái SaaS vốn rất nhỏ trong lịch sử của Trung Quốc, trong khi nước này vẫn có một thị trường đám mây quy mô lớn
    • Câu hỏi cốt lõi chưa có lời giải: chi tiêu cho AI doanh nghiệp sẽ đi theo thị trường SaaS (nhỏ) hay thị trường đám mây (mang tính nền tảng)
    • Nhìn chung, AI có vẻ đi theo quỹ đạo gần với đám mây hơn, và không ai tỏ ra đặc biệt lo lắng về việc thị trường sẽ tăng trưởng quanh các công cụ mới
  • 2. Hầu hết nhà phát triển đều dùng Claude

    • Phần lớn nhà phát triển AI ở Trung Quốc rất chuộng Claude và tập trung vào việc Claude đã thay đổi cách xây dựng phần mềm như thế nào
    • Họ vẫn dùng Claude dù trên danh nghĩa nó bị cấm ở Trung Quốc
    • Một số nhà nghiên cứu nhắc đến việc dùng công cụ tự phát triển như Kimi hay GLM CLI, nhưng ai cũng nói đến Claude
    • Điều đáng ngạc nhiên là rất ít người nhắc đến Codex, dù nó đang tăng độ phổ biến mạnh ở Bay Area
    • Dù Trung Quốc trong lịch sử khá dè dặt với việc mua phần mềm, điều này không tạo cảm giác rằng sẽ không có làn sóng tăng mạnh về nhu cầu suy luận
  • 3. Tinh thần sở hữu công nghệ

    • Văn hóa Trung Quốc kết hợp với một động cơ kinh tế năng động tạo ra những kết quả khó dự đoán
    • Rất nhiều mô hình AI phản ánh trạng thái cân bằng thực dụng và hiện thời của nhiều công ty công nghệ, chứ không phải một đại kế hoạch nào đó
    • Trong ngành, ByteDance và Alibaba được tôn trọng như các incumbent được kỳ vọng sẽ thắng ở phần lớn thị trường nhờ nguồn lực đáng kể
    • DeepSeek là lãnh đạo kỹ thuật được kính trọng, nhưng vẫn còn cách xa vị thế dẫn đầu thị trường; họ đặt hướng đi chứ không có cấu trúc để chiến thắng về kinh tế
    • Ở phương Tây có thể sẽ thấy lạ khi các công ty như Meituan (dịch vụ giao hàng) hay Ant Group lại xây mô hình, nhưng họ cho rằng vì LLM là cốt lõi của sản phẩm công nghệ tương lai nên cần có nền tảng mạnh
    • Khi fine-tune mô hình nền tảng chung, họ có thể củng cố stack nhờ phản hồi từ cộng đồng mở, đồng thời duy trì phiên bản fine-tune nội bộ cho sản phẩm của mình
    • Tư duy “ưu tiên mở” dựa trên tính thực dụng: có được phản hồi mạnh cho mô hình, đóng góp cho cộng đồng mã nguồn mở và củng cố sứ mệnh
  • 4. Hỗ trợ của chính phủ là có thật nhưng quy mô chưa rõ

    • Thường xuyên có các tuyên bố rằng chính phủ Trung Quốc đang tích cực hỗ trợ cuộc cạnh tranh LLM mở
    • Đây là một chính phủ phân quyền ở nhiều cấp, và không có playbook rõ ràng về việc chính xác mỗi cấp đang làm gì
    • Các quận/khu ở Bắc Kinh cạnh tranh để thu hút văn phòng của các công ty công nghệ
    • Sự “hỗ trợ” được cung cấp gần như chắc chắn bao gồm đơn giản hóa thủ tục hành chính như giấy phép, nhưng việc có hỗ trợ thu hút nhân tài hay thậm chí buôn lậu chip hay không thì chưa rõ
    • Trong chuyến thăm, đã nhiều lần có nhắc đến sự quan tâm hoặc hỗ trợ từ chính phủ, nhưng không đủ chi tiết để có thể khẳng định dứt khoát
    • Không hề có dấu hiệu nào cho thấy cấp cao nhất của chính phủ Trung Quốc tác động đến các quyết định kỹ thuật của mô hình
  • 5. Ngành dữ liệu kém phát triển hơn nhiều

    • Tác giả từng nghe rằng Anthropic và OpenAI chi hơn 10 triệu USD cho một môi trường đơn lẻ, và tổng cộng hàng trăm triệu USD mỗi năm để mở rộng frontier RL, nên muốn xác minh liệu các viện nghiên cứu Trung Quốc có mua cùng loại môi trường từ công ty Mỹ hay được hệ sinh thái nội địa hỗ trợ không
    • Vấn đề không phải là hoàn toàn không có ngành dữ liệu, mà là chất lượng tương đối thấp, nên trong nhiều trường hợp tự xây môi trường hoặc dữ liệu còn tốt hơn
    • Các nhà nghiên cứu trực tiếp dành nhiều thời gian để xây dựng môi trường huấn luyện RL
    • Các tập đoàn lớn như ByteDance và Alibaba có đội gán nhãn dữ liệu nội bộ để hỗ trợ việc này
    • Tất cả điều đó phản ánh tư duy tự xây thay vì mua đã nêu ở phần trước
  • 6. Nhu cầu cấp bách đối với chip Nvidia

    • Compute Nvidia là tiêu chuẩn vàng cho huấn luyện, và mọi viện nghiên cứu đều bị giới hạn phát triển vì thiếu nó
    • Nếu có nguồn cung thì chắc chắn họ sẽ mua
    • Các bộ tăng tốc khác, bao gồm Huawei, được đánh giá tích cực cho suy luận, và rất nhiều viện nghiên cứu có thể tiếp cận chip Huawei
  • Những điểm này cho thấy một bức tranh về hệ sinh thái AI rất khác, nơi nếu nhanh chóng ánh xạ cách vận hành của các viện nghiên cứu phương Tây sang Trung Quốc thì sẽ dẫn đến lỗi phân loại
  • Câu hỏi cốt lõi là liệu những hệ sinh thái khác nhau này có tạo ra những loại mô hình khác biệt một cách có ý nghĩa hay không, hay mô hình Trung Quốc sẽ luôn được mô tả như phiên bản chậm hơn 3–9 tháng của các mô hình frontier Mỹ

Cân bằng toàn cầu

  • Trung Quốc không phải nơi có thể diễn đạt bằng các quy tắc hay công thức; đó là một nơi có động lực và phản ứng hóa học rất khác
    • Nền văn hóa ở đây rất lâu đời và sâu sắc, đồng thời đan xen hoàn toàn với cách xây dựng công nghệ trong nước
  • Cấu trúc quyền lực hiện tại của Mỹ dùng thế giới quan về Trung Quốc như một thiết bị cốt lõi trong ra quyết định, nhưng Trung Quốc có những phẩm chất và bản năng rất khó mô hình hóa bằng logic ra quyết định phương Tây
  • Ngay cả khi hỏi trực tiếp vì sao các viện nghiên cứu này công bố mở những mô hình tốt nhất của họ, thì giao điểm giữa tinh thần sở hữu và sự hỗ trợ hệ sinh thái chân thực vẫn khó kết nối thành lời giải thích đơn giản
  • Gần như mọi công ty công nghệ lớn của Trung Quốc đều đang xây dựng LLM nền tảng đa dụng của riêng mình
    • Meituan (dịch vụ giao hàng), Xiaomi (công ty công nghệ tiêu dùng quy mô rộng) và những đơn vị khác đều công bố các mô hình open-weight
    • Các công ty tương đương ở Mỹ đơn giản là sẽ mua dịch vụ
    • Những công ty này xây LLM không phải để chạy theo xu hướng nóng, mà vì khát vọng nền tảng rất sâu sắc là kiểm soát stack của chính mình và phát triển công nghệ quan trọng nhất của thời đại
  • Sự nhân hậu, cuốn hút và ấm áp chân thành của các nhà nghiên cứu Trung Quốc tạo nên một trải nghiệm rất đậm tính con người
    • Kiểu đối thoại địa chính trị lạnh lùng quen thuộc ở Mỹ hoàn toàn không thấm vào họ
  • Nếu hệ sinh thái mở có thể thịnh vượng trên toàn cầu, chúng ta có thể tạo ra AI an toàn hơn, dễ tiếp cận hơn và hữu ích hơn; câu hỏi hiện nay là liệu các viện nghiên cứu Mỹ có thực hiện những bước đi để giành lấy vị thế dẫn dắt đó hay không
  • Ngày càng có nhiều tin đồn về sắc lệnh hành pháp ảnh hưởng đến mô hình mở, điều có thể khiến mối cộng hưởng giữa vai trò dẫn dắt của Mỹ và hệ sinh thái toàn cầu trở nên phức tạp hơn

3 bình luận

 

"Trung Quốc do các kỹ sư vận hành" -> "Trung Quốc do Đảng Cộng sản vận hành"

 
jjw9512151 8 phút trước

Đôi khi tôi lo rằng sự ám ảnh quá mức và phi lý về Trung Quốc
có phải đang tạo ra con quái vật bên trong chúng ta hay không.

Cũng giống như một trong những danh nghĩa để Đức Quốc xã lên nắm quyền là chống cộng vậy.

 

Chỉ có một Trung Quốc...!