10 điểm bởi GN⁺ 7 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Ngành robotics hiện đang ở giai đoạn tương đương GPT-2.5, khi các foundation model đã cho thấy năng lực thực tế, nhưng khoảng cách giữa thành quả trong phòng thí nghiệm và triển khai ngoài hiện trường vẫn còn rất lớn
  • Ngay cả dự báo thị trường 38 tỷ USD vào năm 2035 mà Goldman Sachs đã nâng lên gấp 6 lần chỉ trong 1 năm cũng bị Bessemer xem là bảo thủ, và riêng chi phí dữ liệu robotics trong 2 năm tới được dự báo sẽ tiêu tốn hơn 3 tỷ USD cho toàn ngành
  • 48% nhà sáng lập startup robotics tại Mỹ đến từ 4 tổ chức Stanford, MIT, Berkeley, CMU, và sự tập trung nhân tài này được dự báo sẽ thúc đẩy cấu trúc người thắng ăn cả nhanh hơn
  • Mức trung vị Series A của các công ty robotics quốc phòng đạt 105 triệu USD, gấp đôi doanh nghiệp phi quốc phòng, và với mức định giá 60 tỷ USD của Anduril, lĩnh vực này được dự báo sẽ tạo ra IPO đầu tiên vượt 50 tỷ USD
  • Trong 5 năm qua, chỉ có 42 công ty robotics nhận đầu tư trên 30 triệu USD, tương đương 1/18 mức của phần mềm, cho thấy robotics không hề có bong bóng mà đang ở trạng thái thiếu đầu tư mang tính cấu trúc

Nhu cầu mang tính cấu trúc và triển vọng thị trường của robotics

  • Nhu cầu thay thế lao động cho các công việc tay chân lặp lại hoặc môi trường làm việc nguy hiểm đang tiếp tục tăng lên do biến đổi cơ cấu dân số ở Mỹ, châu Âu, Nhật Bản và Trung Quốc
  • Một số nhà phân tích dự báo thị trường robotics sẽ đạt 38 tỷ USD vào năm 2035, và Goldman Sachs đã điều chỉnh tăng dự báo này gấp 6 lần chỉ trong một năm
  • Bessemer cho rằng ngay cả dự báo này cũng bảo thủ cả về tốc độ lẫn quy mô
  • Jeremy Levine, partner tại Bessemer, cho biết: "Trong vòng 10–20 năm tới, sẽ có số lượng robot nhiều hơn hiện nay 100.000 lần trên Trái Đất"
  • Bessemer nhìn thấy cơ hội đầu tư ở thời điểm dịch chuyển nhân tài, đột phá công nghệ và các yếu tố thuận gió mang tính cấu trúc cùng tăng tốc, với danh mục gồm Waymo, Mind Robotics, Foxglove, Breaker, Noda, Voxel51, DroneDeploy, Auterion, Perceptron, ANYbotics...

Dự báo 1: Khoảnh khắc ChatGPT của robotics đang đến gần nhưng vẫn chưa tới

  • Ngành robotics đang ở giai đoạn ChatGPT tương đương GPT-2.5, nơi foundation model đã thể hiện năng lực thực chất và các định luật scaling bắt đầu xuất hiện, nhưng khoảng cách giữa demo nghiên cứu và triển khai production vẫn còn rất lớn
  • Mô hình π0 của Physical Intelligence đã thành công trong việc gấp quần áo với độ khéo léo ở mức con người
  • Bài báo EgoScale công bố tháng 2/2026 đã chứng minh hiệu năng của policy được cải thiện một cách có thể dự đoán theo quy mô dữ liệu pretraining, đưa ra bằng chứng mạnh mẽ đầu tiên rằng foundation model cho robotics đi theo đường cong cải thiện dựa trên dữ liệu giống như LLM
  • Có hai câu hỏi cốt lõi vẫn chưa được giải quyết
    • Cần bao nhiêu dữ liệu để thu hẹp khoảng cách giữa hiệu năng trong phòng thí nghiệm và độ tin cậy 99,9% mà production yêu cầu
    • Khoảnh khắc ChatGPT của robotics sẽ trông như thế nào khi nó thực sự đến
  • Khác với chatbot, không thể chứng minh năng lực chỉ bằng một hộp văn bản; bằng chứng sẽ là robot có thể thực hiện tác vụ phức tạp trong môi trường xa lạ mà không cần con người can thiệp
  • Những lĩnh vực đã thương mại hóa gồm: tự động hóa kho vận, hỗ trợ phẫu thuật, giao hàng chặng cuối, kiểm tra công nghiệp — tức các hệ thống chuyên dụng trong môi trường hạn chế hiện đã tạo doanh thu
  • Armen Aghajanyan, CEO của Perceptron: "Cốt lõi của robotics trong thế giới thực không phải là thuật toán điều khiển tốt hơn mà là foundation model hiểu được thế giới vật lý; điều khiển robot chỉ là một lớp mỏng nằm trên đó"

Dự báo 2: Định luật scaling xuất hiện — dữ liệu đắt đỏ, vốn là hào lũy, và world model có thể là lối tắt

  • LLM có thể tận dụng hàng trăm nghìn tỷ token văn bản từ internet, nhưng robotics không có corpus tương đương như vậy
  • Dữ liệu thao tác robot trên toàn thế giới được ước tính chỉ khoảng 300.000 giờ, tạo ra khoảng cách mang tính cấu trúc nếu so với khoảng 1 tỷ giờ video internet và 300 nghìn tỷ token văn bản
  • Bessemer ước tính trong 2 năm tới, chi phí dữ liệu robotics toàn ngành sẽ vượt 3 tỷ USD
    • Bao gồm teleoperation, video egocentric, mô phỏng và thu thập trình diễn vật lý
    • Dữ liệu robot không thể scrape hoặc mua sẵn, mà phải tự tạo ra theo từng tác vụ và từng môi trường
  • Ian Glow, CEO của Zeromatter: "Chỉ teleop thôi sẽ không thể là một chiến lược dữ liệu thành công; cần đưa dữ liệu vào từ internet hoặc simulator thông qua reinforcement learning để đạt được quy mô và độ đa dạng cần thiết"
  • World model: mạng nơ-ron học các quy luật vật lý từ video ở quy mô internet
    • V-JEPA 2 của Meta sau khi được huấn luyện trên hơn 1 triệu giờ video đã đạt tỷ lệ thành công zero-shot pick-and-place 80% trên cánh tay robot thật chỉ với thêm 62 giờ dữ liệu robot
    • Tuy nhiên, Cosmos của NVIDIA đã dùng 10.000 GPU H100 trong 3 tháng để huấn luyện, cho thấy world model cũng là một cách tiếp cận thâm dụng vốn
  • Mô phỏng và reinforcement learning: chuyển đổi sim-to-real hoạt động tốt với locomotion, nhưng trong manipulation thì các vấn đề về độ trung thực với vật thể mềm, vải vóc, chất lỏng... vẫn là bài toán nghiên cứu chưa được giải quyết
  • Brian Moore, CEO của Voxel51: "Yếu tố phân biệt người dẫn đầu với những tuyên bố phô trương trong Physical AI là sự ám ảnh với chất lượng dữ liệu; dữ liệu kém không chỉ là kém hiệu quả mà còn là rủi ro"

Dự báo 3: Sự tập trung nhân tài sẽ nhanh chóng quyết định người thắng — đây không phải thị trường nơi 50 công ty cùng thành công

  • Trong số các công ty robotics của Mỹ được thành lập trong 5 năm gần đây và nhận đầu tư trên 30 triệu USD, 43% nhà sáng lập có bằng tiến sĩ
  • Trong số đó, 48% đến từ 4 tổ chức Stanford, MIT, Berkeley và CMU
  • 56% có ít nhất một đồng sáng lập là tiến sĩ, và 43% có nhà sáng lập đi ra trực tiếp từ giới học thuật
  • Hào lũy nhân tài tạo hiệu ứng lãi kép theo chuỗi nhân tài → vốn → đối tác dữ liệu → quan hệ khách hàng → bộ dữ liệu độc quyền, khiến cấu trúc người thắng ăn cả hình thành nhanh hơn phần lớn dự đoán
  • Trong lĩnh vực LLM, open source như Llama hay Mistral đã dân chủ hóa khả năng tiếp cận năng lực, nhưng trong robotics, dù open source như LeRobot, Genesis, Isaac Lab đang phát triển, vẫn tồn tại ma sát vật lý là "vẫn cần robot"
  • Những đội ngũ có chuyên môn sâu nhất về sim-to-real, manipulation, locomotion, sensor fusion đang xây dựng lợi thế mà các bản phát hành open source không dễ sao chép

Dự báo 4: Công ty full-stack sẽ nắm giá trị ngắn hạn — doanh nghiệp foundation model thuần túy còn phải chờ

  • Với LLM, chỉ cần một API endpoint duy nhất như GPT-4 là đội ngũ 2 người cũng có thể ngay lập tức xây sản phẩm frontier AI, nhưng robotics lại cần thu thập dữ liệu theo domain, fine-tuning theo môi trường, tích hợp phần cứng và hạ tầng vận hành
  • Hào lũy hiện nay nằm ở pipeline dữ liệu độc quyền, chuyên môn theo domain, hạ tầng triển khai và quan hệ khách hàng tạo ra feedback loop, hơn là ở kiến trúc mô hình
  • Chi phí phần cứng giảm đang đẩy nhanh động lực này
    • Mike Winn, CEO của DroneDeploy: "Robot mặt đất trong xây dựng đã giảm từ 100.000 USD xuống dưới 15.000 USD mỗi chiếc, còn drone docking giảm từ 200.000 USD xuống dưới 20.000 USD, nghĩa là đang vượt qua ngưỡng để triển khai ở quy mô lớn"
  • Stack đang tách thành ba lớp
    • Lớp hạ tầng: foundation model, world model
    • Lớp ứng dụng: các công ty full-stack sở hữu phần cứng tùy biến riêng (humanoid, hệ thống công nghiệp) + các công ty full-stack áp dụng AI lên nền tảng thương mại sẵn có
  • Lý do giá trị tập trung ở lớp ứng dụng là vì lớp hạ tầng vẫn chưa đủ tính tổng quát để tự hỗ trợ triển khai end-to-end
  • Khi foundation model tốt hơn và chuyển đổi sim-to-real trưởng thành, khoảnh khắc API của robotics sẽ đến, nhưng đó là câu chuyện sau năm 2028; ở giai đoạn hiện tại, tích hợp theo chiều dọc là nơi tạo ra giá trị bền vững
  • Adrian Macneil, CEO của Foxglove: "Lợi thế quyết định trong Physical AI không nằm ở sự mới lạ của mô hình mà ở chất lượng của hạ tầng dữ liệu; khi các mô hình hội tụ, công ty có data flywheel mạnh nhất sẽ chiến thắng"

Dự báo 5: Robotics quốc phòng sẽ dẫn dắt IPO đầu tiên vượt 50 tỷ USD của danh mục này

  • Mức trung vị Series A của các công ty robotics quốc phòng là 105 triệu USD tính đến năm 2025, cao hơn gấp đôi mức 50 triệu USD của doanh nghiệp phi quốc phòng, và khoảng cách này đã nới rộng qua từng năm kể từ 2021
  • Anduril chốt mức định giá 60 tỷ USD vào tháng 3/2026, còn Saronic trong cùng tháng huy động Series D 1,75 tỷ USD cho lĩnh vực đóng tàu tự hành
  • Chu kỳ mua sắm quốc phòng dài nhưng có thể dự đoán, quy mô hợp đồng lớn, tỷ lệ gia hạn cao và chi phí chuyển đổi đáng kể
  • Khác với robotics thương mại, người mua trong quốc phòng vận hành theo bài toán khác: rủi ro an ninh quốc gia chứ không phải ROI
  • Yếu tố địa chính trị càng khuếch đại điều này: khoảng 90% robot humanoid bán ra trên toàn cầu trong năm 2025 là hàng Trung Quốc
  • Các mô hình AI của Trung Quốc trung bình vẫn chậm hơn Mỹ khoảng 7 tháng, nhưng khoảng cách đó đang liên tục thu hẹp, và chính phủ Mỹ bắt đầu coi robotics là yếu tố thiết yếu đối với an ninh quốc gia
  • Ở góc độ dual-use, những công ty có khả năng phòng thủ tốt nhất không xây hệ thống vũ khí một mục đích, mà xây nền tảng tự hành, hệ thống nhận thức và hạ tầng ra quyết định có thể dùng cả trong thương mại
  • Matthew Buffa, đồng sáng lập Breaker: "Những công ty thú vị nhất không chọn một trong hai giữa quốc phòng và thương mại, mà xây các hệ thống đủ năng lực để đáp ứng yêu cầu quốc phòng đồng thời cũng đổi mới về mặt thương mại"

Dự báo 6: Không có bong bóng robotics — trái lại, lĩnh vực này còn chưa nhận đủ vốn

  • Trong 5 năm qua, có 745 công ty phần mềm nhận đầu tư trên 30 triệu USD, trong khi robotics chỉ có 42 công ty, tức ít hơn 18 lần
    • Trong khi đó, thị trường nền tảng của robotics lại lớn hơn 30 lần so với tổng chi tiêu phần mềm toàn cầu
  • Ngay cả khi tính đến tính thâm dụng vốn của kinh doanh phần cứng, lĩnh vực này vẫn đang ở trạng thái thiếu đầu tư mang tính cấu trúc so với cơ hội
  • Phần lớn nhà phân tích dự báo ngành sẽ tăng trưởng gấp 50 lần trong 10 năm tới, nhưng Bessemer cho rằng ngay cả như vậy cũng chỉ giới hạn ở tự động hóa workflow hiện có, chưa phản ánh các loại hình hoạt động kinh tế mới do robot đa dụng tạo ra
  • Không phải mọi công ty được rót vốn đều sẽ thành công; một số mức định giá đang bị thổi phồng và vốn sẽ tập trung vào một số ít người dẫn đầu
  • Tuy nhiên, tính chọn lọc và tính khan hiếm là hai chuyện khác nhau; tổng mức đầu tư vào robotics vẫn còn rất xa mới tương xứng với quy mô cơ hội và tốc độ phát triển năng lực
  • Ngay lúc này là cửa sổ để đầu tư vào những công ty cốt lõi, trước khi khoảnh khắc ChatGPT xuất hiện và trước khi quá trình hợp nhất nhân tài hoàn tất; nếu chờ bằng chứng rõ ràng về điểm bẻ lái thì cơ hội sẽ trôi qua
  • Nikita Rudin, CEO của Flexion: "5 năm nữa, phần lớn robot được triển khai trên toàn thế giới sẽ không phải do các startup nổi tiếng ngày nay tạo ra, mà do những công ty thậm chí còn chưa bắt đầu làm robot nhưng biết cách sản xuất ở quy mô lớn chế tạo"

Các bài toán chưa được giải quyết và những tranh luận còn mở

  • Khoảng cách độ tin cậy: nâng tỷ lệ thành công của tác vụ từ 80% lên 99,9% không phải là vấn đề tuyến tính
    • Cần những cách tiếp cận khác biệt về bản chất như cảm biến xúc giác, force feedback, chuyển đổi sim-to-real cho manipulation
    • Lisa Yan, CEO của Argus Systems: "Từ kinh nghiệm ở Waymo, triển khai thực tế càng về sau càng khó hơn và bộc lộ bài toán tuyển chọn dữ liệu chuyên biệt; việc thu hẹp khoảng cách từ 99% lên 99,9% mất nhiều thời gian hơn phần lớn mọi người dự đoán"
  • Bài toán chi phí suy luận: world model và các mô hình vision-language-action cỡ lớn có chi phí chạy thời gian thực cao
    • Mô hình văn bản có thể batch trên hạ tầng dùng chung cho hàng nghìn người dùng đồng thời, nhưng mô hình robotics phải tạo trạng thái môi trường mỗi vài mili giây cho từng robot, nên trên thực tế cần pipeline GPU chuyên dụng
    • Chi phí suy luận của LLM đã giảm khoảng 1.000 lần trong 3 năm, và việc robotics có đi theo đường cong tương tự hay không sẽ quyết định tính khả thi thương mại của cách tiếp cận foundation model
  • Interpretability đang nổi lên như lớp hạ tầng thế hệ tiếp theo
    • Chỉ riêng quý 1/2026, khoảng 6 tỷ USD đã chảy vào 6–7 công ty world model
    • Mahesh Krishnamurthi, đồng sáng lập Vayu Robotics: "Khi ngành trưởng thành, interpretability sẽ trở thành yếu tố không thể thỏa hiệp; hiện tại các mô hình này vẫn là hộp đen, và chúng tôi kỳ vọng sẽ có một làn sóng startup xây công cụ để mở chúng ra"
  • Open source vs closed: trong LLM, open source đã thúc đẩy hệ sinh thái phát triển rất mạnh, nhưng trong robotics — nơi dữ liệu vật lý và hạ tầng triển khai quan trọng không kém kiến trúc mô hình — vẫn chưa rõ động lực tương tự có lặp lại hay không
    • Open source có thể sẽ hàng hóa hóa kiến trúc mô hình nhanh hơn dự kiến, nhưng lớp dữ liệu và triển khai có khả năng vẫn giữ tính độc quyền đủ lâu
    • Những công ty hiểu rõ nên mở phần nào của stack và nên bảo vệ phần nào sẽ có lợi thế chiến lược

Sự cùng tồn tại của hai sự thật

  • Brad Porter, CEO của Cobot: "Khoảnh khắc ChatGPT của robotics đang đến nhanh hơn phần lớn mọi người nghĩ, và khi nó đến thì thời gian production (robot thật, tác vụ thật, môi trường thật) sẽ là nút thắt; những công ty tối ưu cho triển khai chứ không phải demo sẽ tách nhóm một cách quyết định"
  • Philipp Wu, đồng sáng lập một công ty robotics stealth: "Mốc thời gian thực tế sẽ dài hơn rất nhiều so với phần lớn dự đoán, và robotics đa dụng vẫn còn cách ít nhất 5 năm nữa"
  • Hai góc nhìn này không mâu thuẫn mà đang mô tả hai chiều kích khác nhau: Porter nói về con đường dẫn tới điểm bẻ lái, còn Wu nói về việc điểm bẻ lái đó thực sự còn xa đến mức nào
  • Hàm ý cho nhà sáng lập: hãy triển khai quyết liệt ngay từ bây giờ, nhưng xây dựng với khoảnh khắc đa dụng như đường chân trời phía trước
  • Điểm bẻ lái đang đến gần; nhân tài đang dịch chuyển, phần cứng đang bị hàng hóa hóa, hạ tầng dữ liệu đang được xây dựng, và những công ty sẽ định nghĩa Physical AI trong 10 năm tới đang được thành lập và nhận đầu tư ngay lúc này

1 bình luận

 
ragingwind 4 giờ trước

Tò mò không biết sẽ có những công ty nào xuất hiện.