Bản đồ thị trường mô hình AI vật lý: Cuộc cạnh tranh xung quanh trí tuệ robot

(cbinsights.com)

7 điểm bởi GN⁺ 2026-01-30 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Lĩnh vực robot đã huy động mức đầu tư kỷ lục 40,7 tỷ USD vào năm 2025, tăng 74% so với năm trước, chiếm 9% tổng vốn đầu tư mạo hiểm và nổi lên cùng AI phần mềm thành lĩnh vực dẫn dắt đầu tư
AI vật lý là công nghệ cốt lõi cho phép robot hoạt động trong thế giới vật lý bằng cách học từ dữ liệu thay vì dựa vào các quy tắc lập trình trước đó
Khác với mô hình ngôn ngữ, mô hình AI vật lý cần dữ liệu robot thực tế, tạo ra cơ hội chiếm lĩnh sớm để kiểm soát thị trường
Trên 10 danh mục mô hình AI vật lý, có hơn 70 doanh nghiệp đang cạnh tranh trong các mảng dữ liệu & mô phỏng, cách tiếp cận mô hình, mô hình nền tảng và quan sát
Hợp tác đa robot là vấn đề then chốt chưa được giải quyết của AI vật lý; doanh nghiệp giải quyết trước sẽ dẫn dắt mở rộng công nghiệp của đội robot tự chủ

Điểm rút ra chính

Dữ liệu đào tạo độc quyền là lợi thế cạnh tranh cốt lõi của AI vật lý, khi các tập đoàn công nghệ lớn đang đẩy mạnh thâu tóm để giành quyền tiếp cận dữ liệu
- Nvidia đã mua lại nhà cung cấp dữ liệu tổng hợp Gretel vào tháng 3/2025 với mức giá trên 320 triệu USD
- Meta đầu tư 14,8 tỷ USD vào cổ phần của công ty hạ tầng dữ liệu và phát triển mô hình Scale
- OpenAI từng tìm cách thâu tóm Medal để có được dữ liệu đào tạo, nhưng Medal đã ra mắt General Intuition, nền tảng xây dựng mô hình dựa trên dữ liệu đó
- Doanh nghiệp sở hữu dữ liệu đào tạo độc quyền có thể phát triển mô hình vượt trội, trong khi đối thủ phải phụ thuộc vào quyền truy cập theo giấy phép
- Việc tiếp cận sớm dữ liệu đa dạng, chất lượng cao là chìa khóa để đạt quy mô thương mại
World model cho phép robot tự dự đoán và lập kế hoạch, là năng lực mà các mô hình ngôn ngữ lớn (LLM) chưa đạt được
- Đầu tư vào world model tăng từ 1,4 tỷ USD năm 2024 lên 6,9 tỷ USD năm 2025
- Các công ty trong lĩnh vực này có điểm Mosaic trung bình 722 (top 3% toàn thị trường)
- Để thành công, cần dữ liệu đào tạo chất lượng cao trong môi trường kiểm soát và hợp tác chặt chẽ với nhà sản xuất phần cứng
Hợp tác đa robot vẫn là bài toán then chốt chưa được giải quyết của AI vật lý
- Các công ty Mỹ huy động hơn 17 tỷ USD từ 17 thương vụ
- Các công ty Trung Quốc huy động 416 triệu USD từ 15 thương vụ
- Cả hai khu vực đều tập trung gần như hoàn toàn vào năng lực robot đơn lẻ, và chỉ một số ít doanh nghiệp xây dựng lớp điều phối để vận hành nhiều loại robot cùng nhau
- Doanh nghiệp giải quyết bài toán hợp tác trước sẽ kiểm soát được mở rộng công nghiệp của đội robot tự chủ

Tổng quan danh mục

Dữ liệu & mô phỏng
- Cung cấp nền tảng cho robot học, trong đó robot đòi hỏi lượng dữ liệu đào tạo lớn nhưng việc thu thập dữ liệu thực tế diễn ra chậm và tốn chi phí
- Cấu trúc gồm ba tiểu thị trường:
  - Dữ liệu đào tạo tổng hợp — robotics: công cụ tạo bộ dữ liệu tổng hợp như hình ảnh, dữ liệu cảm biến và cảnh 3D mà không cần thu thập thực tế tốn kém
  - Nhà cung cấp dữ liệu trình diễn robot: các doanh nghiệp thu thập dữ liệu điều khiển từ xa cho học bắt chước, quỹ đạo chuyển động và video thực tế
  - Nền tảng mô phỏng robotics: môi trường ảo để robot học, thử nghiệm và xác minh trước khi triển khai vật lý
- Thiếu hụt dữ liệu là nút thắt chính của AI vật lý, khiến tiếp cận dữ liệu đào tạo thực tế khó khăn do chi phí và khả năng sẵn có
  - Các thị trường này có điểm Mosaic trung bình khoảng 600 (nửa trên theo động lượng thị trường)
  - 50% doanh nghiệp đã bước vào giai đoạn triển khai, cho thấy hạ tầng dữ liệu AI vật lý đang trưởng thành từ nghiên cứu sang khả năng thương mại hóa thực tế
- Nhiều doanh nghiệp phụ thuộc vào dữ liệu tổng hợp và mô phỏng, trong đó Nvidia dẫn đầu thị trường
  - Tuy nhiên dữ liệu tổng hợp không đủ, và dữ liệu robot thực tế vẫn giữ vai trò quan trọng cho việc huấn luyện mô hình đáng tin cậy
  - Scale đã nhận 16,4 tỷ USD đầu tư và xếp hạng top 1% về điểm Mosaic
  - Scale kết hợp tạo dữ liệu tổng hợp và thu thập dữ liệu thực tế (bao gồm dữ liệu từ thao tác từ xa của con người và dữ liệu cảm biến môi trường vật lý của robot), mở rộng hoạt động gán nhãn dữ liệu sang phát triển mô hình
- Các doanh nghiệp mới nổi đang tìm kiếm nguồn dữ liệu mới để vượt qua khoảng trống dữ liệu sẵn có
  - General Intuition đã huy động 134 triệu USD để huấn luyện mô hình trên video gameplay có thể áp dụng cho hệ thống robot
  - micro1 đã huy động 35 triệu USD với định giá 500 triệu USD, đang xây dựng bộ dữ liệu đào tạo robot lớn nhất thế giới bằng video tương tác của con người
- Nếu không có bộ dữ liệu hoặc nền tảng mô phỏng độc quyền, doanh nghiệp robot có nguy cơ phải dựa vào giấy phép từ các đơn vị dẫn đầu hoặc tụt lại về các loại dữ liệu cốt lõi như chạm, áp lực và chuyển động vật lý
Tiếp cận mô hình
- Trao cho robot khả năng thị giác, suy luận và hành động, trong đó mỗi mô hình được xây dựng dựa trên một mô hình khác
- Cho phép robot thích nghi với nhiệm vụ mới thay vì lập trình cứng
- Cấu trúc gồm ba tiểu thị trường:
  - Nhà phát triển mô hình Vision-Language (VLM): mô hình đa phương thức kết hợp hiểu thị giác và ngôn ngữ, đóng vai trò lớp nhận diện cho robot
  - Nhà phát triển mô hình Vision-Language-Action (VLA): dựa trên VLM để kết hợp nhận thức thị giác, hiểu ngôn ngữ và điều khiển động cơ, trực tiếp chuyển lệnh thành hành động vật lý
  - Nhà phát triển AI world model: mô hình mô phỏng sự thay đổi môi trường để dự đoán quan hệ không gian, quy luật vật lý và nhân quả
- AI vật lý đang chuyển robot từ lập trình cứng sang hệ thống thích ứng linh hoạt theo nhiệm vụ, với mô hình VLA nổi lên như kiến trúc dẫn dắt
  - Các doanh nghiệp robot humanoid dẫn đầu như Figure, 1X, Galbot đang xây dựng mô hình VLA độc quyền
  - Các tập đoàn công nghệ lớn như Nvidia, Meta đang phát triển mô hình cấp phép thương mại cho nhà sản xuất robot
- World model có thể là đột phá thực sự khi bổ sung khả năng suy luận dự đoán
  - Các doanh nghiệp như World Labs và Runway đang xây dựng world model
  - Khác với VLA phản hồi tức thời với tín hiệu đầu vào, world model mô phỏng sự thay đổi môi trường theo thời gian
  - Giúp robot dự đoán kết quả, lập kế hoạch hành vi nhiều bước và khôi phục khi có lỗi
Mô hình nền tảng
- Kết hợp dữ liệu và kiến trúc để tạo ra trí tuệ robot tiền huấn luyện có khả năng nhận diện, suy luận và hành động
- Một số là mô hình tổng quát cho thao tác, một số là mô hình chuyên biệt
- Nhà phát triển có thể cấp phép mô hình này để triển khai mà không phải xây từ đầu
- Cấu trúc gồm ba tiểu thị trường:
  - Nhà phát triển mô hình nền tảng robot: mô hình tổng quát giúp robot trên nhiều phần cứng có thể nhìn, nghĩ và di chuyển
  - Nhà phát triển mô hình nền tảng xe tự lái: được huấn luyện trên bộ dữ liệu lái quy mô lớn, tích hợp nhận diện, dự đoán, lập kế hoạch và điều khiển, nhằm thay thế các hệ thống tự hành hiện có cho robo-taxi, vận chuyển xe tải và giao hàng
  - Nhà phát triển mô hình hợp tác đa robot: xử lý phân bổ nhiệm vụ, tránh va chạm và ra quyết định phân tán để đội robot có thể phối hợp
- Thị trường mô hình nền tảng rất năng động
  - Các tập đoàn công nghệ lớn của Mỹ (Microsoft, Google, Amazon) và các doanh nghiệp dẫn đầu Trung Quốc (Huawei, Baidu) đang cạnh tranh với các startup đáng chú ý như DeepSeek, Physical Intelligence
- Nhiều doanh nghiệp hoạt động trên nhiều loại mô hình nền tảng
  - Dữ liệu đào tạo của một miền có thể góp phần cải thiện hiệu năng mô hình của miền khác
  - Nvidia là công ty duy nhất hoạt động ở cả ba danh mục mô hình nền tảng, trở thành hạ tầng cho toàn bộ stack AI vật lý
- Hợp tác đa robot là tuyến đầu kế tiếp
  - Các kịch bản như humanoid, robot vận chuyển tự hành và xe nâng tự hành cùng hoạt động tại kho hàng
  - Hợp tác giữa nhiều loại robot đòi hỏi lớp điều phối để quản lý nhiệm vụ, nguồn lực và tránh va chạm mà không cần kiểm soát trung tâm
  - Chỉ một số startup (Field AI, Intrinsic) và tập đoàn công nghệ lớn theo đuổi bài toán này
  - Phần lớn công việc vẫn dừng ở giai đoạn nghiên cứu hơn là triển khai thương mại
- Doanh nghiệp sở hữu mô hình độc quyền có thể giành được biên lợi nhuận cao hơn nhờ khác biệt hóa và tích hợp dọc
- Doanh nghiệp cấp phép AI bên thứ ba có thể hưởng lợi về chi phí thấp từ tính hàng hóa của việc thương mại hóa mô hình, nhưng cạnh tranh dựa trên tốc độ triển khai và chất lượng tích hợp
Quan sát (Observability)
- Ghi nhận các tình huống khi robot vận hành trong sản xuất để thu hẹp khoảng cách giữa phát triển phòng thí nghiệm và triển khai thực tế
- Nền tảng quan sát robotics: nền tảng giám sát, gỡ lỗi và tối ưu hóa robot trong cả giai đoạn phát triển và sản xuất
- Khi robot bị lỗi hoặc hoạt động bất ngờ, kỹ sư có thể tái hiện lại sự cố để xác định nguyên nhân và đẩy thay đổi sửa lỗi
- Các trường hợp biên thực tế được phản hồi vào mô phỏng và đào tạo để cải thiện mô hình, nâng cao hiệu năng
- Foxglove và Formant là các ví dụ điển hình, theo dõi hiệu năng, phân tích lỗi và học được thông tin triển khai để phản hồi vào bộ dữ liệu đào tạo, mô phỏng và mô hình
- Doanh nghiệp có khả năng quan sát mạnh có thể cải thiện nhanh chóng mô hình bằng cách học từ lỗi
- Tình huống bất ngờ chuyển thành lợi thế học tập, trở thành yếu tố then chốt để phân biệt giữa hệ thống sẵn sàng sản xuất và nguyên mẫu phòng thí nghiệm

Bản đồ thị trường mô hình AI vật lý: Cuộc cạnh tranh xung quanh trí tuệ robot

Điểm rút ra chính

Tổng quan danh mục

Dữ liệu & mô phỏng

Tiếp cận mô hình

Mô hình nền tảng

Quan sát (Observability)

Bài viết liên quan

Chưa có bình luận nào.