Ra mắt Figure 03 - robot hình người đa năng thế hệ thứ 3

(figure.ai)

1 điểm bởi GN⁺ 2025-10-10 | 1 bình luận | Chia sẻ qua WhatsApp

Figure AI đã công bố Figure 03, robot hình người thế hệ thứ 3 có khả năng thực hiện công việc đa năng và học trực tiếp từ con người, hướng đến mục tiêu sử dụng trong gia đình, thương mại và sản xuất hàng loạt
Được trang bị hệ thống cảm biến thế hệ mới và hệ thống bàn tay được thiết kế cho Helix, AI thị giác-ngôn ngữ-hành động do hãng tự phát triển, robot đạt tốc độ khung hình gấp 2, giảm độ trễ xuống còn 1/4 và mở rộng góc nhìn thêm 60%, qua đó hiện thực hóa thao tác chính xác và điều hướng thông minh trong môi trường phức tạp
Với các đặc điểm tăng cường an toàn cho môi trường gia đình như lớp đệm foam đa mật độ và lớp phủ vải mềm, trang phục thay thế có thể giặt, sạc không dây, pin đạt chứng nhận UN38.3 và hệ thống âm thanh cải tiến cho hội thoại thoại thời gian thực, robot được tối ưu cho sử dụng tại nhà
Để phục vụ sản xuất hàng loạt, Figure chuyển từ gia công CNC sang các quy trình khuôn như đúc áp lực, ép phun và dập, qua đó giảm mạnh số lượng linh kiện và chi phí sản xuất; cơ sở sản xuất nội bộ BotQ có thể sản xuất tối đa 12.000 robot mỗi năm
Nhờ cảm biến xúc giác độ chính xác cao ở đầu ngón tay có thể phát hiện áp lực tới 3 gram và camera nhúng trong lòng bàn tay, Helix có thể giữ ổn định các vật thể có hình dạng và chất liệu đa dạng; cùng khả năng offload dữ liệu mmWave 10Gbps để học liên tục, hệ thống này đặt nền móng cho robot đa năng thực thụ

Figure 03

Figure 03 là robot hình người thế hệ thứ 3 của Figure, một nền tảng được thiết kế cho Helix, môi trường gia đình và triển khai quy mô toàn cầu
Mục tiêu là trở thành robot đa năng thực thụ có thể thực hiện các công việc giống con người và học trực tiếp từ con người
Để làm được điều đó, cả phần cứng lẫn phần mềm đã được thiết kế lại hoàn toàn; các điểm chính như sau

Helix: Figure 03 áp dụng hệ thống cảm biến và cấu trúc bàn tay được chế tạo riêng để hỗ trợ Helix, AI thị giác-ngôn ngữ-hành động độc quyền
Gia đình: Việc bổ sung các tính năng như vật liệu tinh tế hơn, sạc không dây, hệ thống âm thanh nâng cấp và cải thiện độ an toàn của pin giúp tăng mạnh độ an toàn và khả năng sử dụng
Sản xuất hàng loạt: Được thiết kế với mục tiêu sản xuất số lượng lớn có giá trị cao, qua đó xây dựng chuỗi cung ứng và quy trình sản xuất mới
Mở rộng toàn cầu: Chi phí sản xuất thấp hơn và những tiến bộ liên quan đến Helix cũng nâng cao đáng kể tính khả dụng về mặt thương mại

Thiết kế cho Helix

Với nhận định rằng không thể mở rộng robot hình người nếu thiếu AI, Figure 03 được thiết kế với mục tiêu cốt lõi là hiện thực hóa suy luận trong thế giới thực thông qua Helix AI
- Hệ thống cảm biến và hệ thống bàn tay được thiết kế lại hoàn toàn, chế tạo riêng để vận hành Helix
Hệ thống thị giác thế hệ mới hỗ trợ điều khiển visual-motor tần số cao
- Kiến trúc camera mới đạt tốc độ khung hình gấp 2, độ trễ còn 1/4 và góc nhìn trên mỗi camera rộng hơn 60% trong một form factor gọn hơn
- Kết hợp với độ sâu trường ảnh mở rộng, hệ thống mang đến cho Helix luồng nhận thức dày đặc và ổn định hơn
- Những tiến bộ này là yếu tố thiết yếu để điều hướng thông minh và thao tác chính xác trong các không gian phức tạp, đông đúc như gia đình
Tích hợp camera nhúng trong lòng bàn tay với góc nhìn rộng và cảm nhận độ trễ thấp trên mỗi bàn tay
- Cung cấp phản hồi thị giác dự phòng ở cự ly gần trong khi gắp nắm
- Ngay cả khi camera chính bị che khuất (như khi thao tác trong tủ hoặc không gian hẹp), Helix vẫn duy trì nhận thức thị giác để thực hiện điều khiển thích ứng thời gian thực
Bàn tay của Figure 03 tạo ra bước nhảy lớn về tính tuân ứng và thiết kế xúc giác
- Đầu ngón tay mềm hơn và thích ứng tốt hơn giúp tăng diện tích tiếp xúc bề mặt, cho phép gắp nắm ổn định hơn với vật thể có hình dạng và kích thước đa dạng
- Sau khi khảo sát các lựa chọn sẵn có trên thị trường, Figure nhận thấy cảm biến xúc giác hiện tại có những giới hạn cố hữu khiến chúng không thể chịu được sử dụng trong thế giới thực, nên đã tự phát triển cảm biến xúc giác thế hệ 1
  - Thiết kế dựa trên ba nguyên tắc: độ bền cực cao, độ tin cậy dài hạn và cảm nhận độ chính xác cao
- Cảm biến ở mỗi đầu ngón tay có thể phát hiện lực nhỏ tới mức áp lực 3 gram - đủ nhạy để nhận biết trọng lượng của một chiếc kẹp đặt trên ngón tay
  - Với độ chính xác này, Helix có thể phân biệt giữa trạng thái gắp an toàn và dấu hiệu sắp trượt, từ đó thực hiện điều khiển tinh tế với vật thể mong manh, không đều hoặc đang chuyển động
Bao gồm khả năng offload dữ liệu mmWave 10 Gbps, cho phép toàn bộ fleet tải lên dữ liệu ở mức terabyte để học hỏi và cải thiện liên tục
- Những tiến bộ này khiến Figure 03 đặc biệt phù hợp cho học end-to-end từ pixel tới hành động ở quy mô lớn

Thiết kế cho gia đình

Để hoạt động hiệu quả trong gia đình, robot phải có khả năng phối hợp trơn tru với con người trong môi trường hằng ngày
- Với điều đó trong đầu, Figure 03 đưa vào nhiều cải tiến thiết kế tập trung vào an toàn
Foam đa mật độ được bố trí chiến lược để ngăn các điểm kẹp, và robot được phủ bằng vải mềm thay cho các bộ phận gia công cứng
- So với Figure 02, khối lượng giảm 9%, thể tích giảm đáng kể, giúp di chuyển dễ dàng hơn trong không gian gia đình
Pin của Figure 03 mở rộng giới hạn về độ an toàn pin cho robot
- Bao gồm nhiều lớp bảo vệ trước lạm dụng hoặc trục trặc (các cơ chế an toàn ở cấp BMS, cell, interconnect và pack)
- Đã đạt chứng nhận tiêu chuẩn UN38.3
Bên cạnh an toàn, Figure 03 còn được thiết kế cho tính tiện dụng hằng ngày
- Lớp vải mềm có thể giặt hoàn toàn và có thể tháo hoặc thay mà không cần dụng cụ, cho phép thay nhanh và dễ
- Có thể tùy biến với nhiều lựa chọn trang phục khác nhau, bao gồm trang phục làm từ vật liệu chống cắt và bền hơn
Để giao tiếp tự nhiên với robot, Figure 03 được trang bị hệ thống phần cứng âm thanh nâng cấp cho hội thoại thoại thời gian thực tốt hơn
- Kích thước loa lớn gấp 2 và công suất gần gấp 4 so với Figure 02
- Micro được bố trí lại để cải thiện hiệu năng và độ rõ
Tiếp tục theo đuổi tầm nhìn về một hệ thống hoàn toàn tự chủ và không dây, Figure 03 hỗ trợ sạc cảm ứng không dây và offload dữ liệu không dây
- Chỉ cần đứng trên đế không dây bằng cuộn sạc đặt ở bàn chân, robot có thể sạc ở mức 2kW
- Trong môi trường gia đình, robot có thể tự động dock và sạc lại theo nhu cầu suốt cả ngày

Thiết kế cho sản xuất hàng loạt

Robot hình người từ trước tới nay thường được thiết kế như các nguyên mẫu kỹ thuật tốn thời gian và chi phí cao
- Figure 03 là robot đầu tiên được thiết kế ngay từ đầu với mục tiêu sản xuất hàng loạt
Điều này được thực hiện thông qua ba sáng kiến chính
- Tái tạo thiết kế và quy trình
- Xây dựng chuỗi cung ứng hoàn toàn mới
- Phát triển cơ sở sản xuất công suất cao BotQ
Khi chuyển từ Figure 02 sang Figure 03, Figure đã thiết kế lại gần như mọi thành phần của robot với khả năng sản xuất và chi phí trong tâm trí
- Các nhóm kỹ thuật cơ khí và điện đã mạnh tay cắt giảm số lượng linh kiện, số bước lắp ráp và những thành phần không thiết yếu để đáp ứng yêu cầu thiết kế
- Trong khi Figure 02 chủ yếu được thiết kế để sản xuất bằng gia công CNC, Figure 03 phụ thuộc nhiều vào các quy trình khuôn như đúc áp lực, ép phun và dập
  - Sự chuyển đổi này đòi hỏi khoản đầu tư ban đầu đáng kể cho khuôn, nhưng lợi ích là rất rõ ràng
  - Chi phí sản xuất cho mỗi unit Figure 03 giảm mạnh, và khi sản lượng tăng lên, hiệu quả kinh tế cũng được cải thiện
Để mở rộng Figure 03, Figure cần xây dựng một chuỗi cung ứng hoàn toàn mới cho một ngành công nghiệp hiện chưa tồn tại
- Figure lựa chọn tích hợp theo chiều dọc cho nhiều module quan trọng trong toàn bộ bản dựng, bao gồm actuator, pin, cảm biến, kết cấu và thiết bị điện tử (tất cả đều được thiết kế hoàn toàn in-house)
- Đối với các thành phần riêng lẻ, công ty xác định chiến lược và thiết lập quan hệ đối tác với các nhà cung cấp có thể đáp ứng khối lượng cần thiết, tiến độ và tiêu chuẩn chất lượng nghiêm ngặt mà đội ngũ yêu cầu
- Kết quả của nỗ lực kéo dài một năm này là mạng lưới đối tác toàn cầu có thể phát triển cùng Figure và sản xuất từ hàng nghìn đến cuối cùng là hàng triệu linh kiện theo kế hoạch tăng sản lượng đầy tham vọng
BotQ là cơ sở sản xuất chuyên dụng của Figure được thiết kế để mở rộng sản xuất robot
- Dây chuyền sản xuất thế hệ 1 của BotQ ban đầu có thể sản xuất tối đa 12.000 robot hình người mỗi năm
- Mục tiêu là sản xuất tổng cộng 100.000 robot trong 4 năm tới
- Thay vì phụ thuộc vào nhà sản xuất theo hợp đồng, Figure đưa việc sản xuất các hệ thống quan trọng nhất về nội bộ để duy trì kiểm soát nghiêm ngặt về chất lượng, tính lặp lại và tốc độ
- Cơ sở này được trang bị các hệ thống hiện đại và tích hợp số, xây dựng trên Manufacturing Execution System(MES) do công ty tự phát triển
  - Mọi cụm lắp ráp con và lắp ráp cuối đều đi qua dây chuyền này với khả năng truy xuất đầy đủ, bảo đảm chất lượng, tính lặp lại và cải tiến liên tục

Thiết kế cho quy mô toàn cầu

Việc Figure tập trung vào thị trường gia đình không hề làm suy giảm tiềm năng của Figure 03 cho thị trường thương mại
- Bằng cách giải quyết tính biến thiên và độ khó của môi trường gia đình, Figure đang phát triển một sản phẩm đa năng thực thụ có thể thực hiện phạm vi công việc rộng nhất có thể trong lực lượng lao động
Figure 03 phù hợp với các ứng dụng thương mại vì nhiều lý do
- Actuator có thể vận hành nhanh gấp 2 với mật độ mô-men xoắn (nm/kg) được cải thiện
- Hệ quả quan trọng nhất của điều này là khả năng pick-and-place vật phẩm ở tốc độ cao hơn
Những cải tiến ở bàn tay và hệ thống cảm biến được tạo ra cho Helix có ý nghĩa lớn đối với các trường hợp sử dụng thương mại
- Nhờ nâng cấp camera và hệ thống nhận thức, Figure 03 có thể điều hướng thông minh trong môi trường thương mại và thực hiện thao tác chính xác
- Những thay đổi ở bàn tay được nhấn mạnh ở trên (tăng tính tuân ứng, diện tích bề mặt đầu ngón tay, cảm biến xúc giác) cho phép gắp nắm ổn định tốt hơn với nhiều loại vật thể như các mảnh kim loại tấm nhỏ và túi poly có thể biến dạng
Nhờ sạc cảm ứng, Figure 03 có thể hoạt động gần như liên tục chỉ bằng cách đứng trên thảm sạc trong một khoảng thời gian giữa các ca sử dụng
- Offload dữ liệu không dây tốc độ cao cho phép robot chỉ cần quay về dock trong thời gian nghỉ giữa ca để offload một cách liền mạch
Khách hàng thương mại có thể thiết kế đồng phục riêng cho fleet Figure 03 của mình
- Có thể chọn vật liệu bền hơn hoặc chống cắt, cùng các thay đổi thiết kế khác cho từng môi trường cụ thể
- Màn hình bên hông mới của Figure 03 cho phép nhận diện nhanh trong các fleet lớn và có thể được tùy biến hoàn toàn theo yêu cầu thương hiệu hoặc vận hành của từng khách hàng

Kết luận

Figure 03 là bước tiến chưa từng có trong việc chuyển robot hình người từ nguyên mẫu thử nghiệm thành sản phẩm có thể triển khai và mở rộng
- Bằng cách kết hợp nhận thức và trí tuệ xúc giác tiên tiến với thiết kế an toàn cho gia đình và mức độ sẵn sàng cho sản xuất hàng loạt, Figure đang xây dựng một nền tảng có thể học hỏi, thích nghi và làm việc trong cả môi trường gia đình lẫn thương mại
Được thiết kế cho Helix, gia đình và quy mô toàn cầu, Figure 03 đặt nền móng cho robot đa năng thực thụ - với khả năng làm thay đổi cách con người sống và làm việc

1 bình luận

GN⁺ 2025-10-10

Ý kiến trên Hacker News

Chỉ ra rằng mọi ví dụ trong video đều là các cảnh được tuyển chọn kỹ, nếu hỏi những người thực sự nghiên cứu robot hình người thì họ sẽ nói tỷ lệ thất bại khi lặp lại tác vụ vẫn cao và con đường dẫn tới thành công rất hẹp; nếu mời robot của nhiều công ty đến, xác nhận trước các chức năng của chúng rồi dựng một môi trường benchmark không có trong dữ liệu huấn luyện thì mới có thể thấy tỷ lệ thất bại thực tế; hiện giờ vẫn chỉ là giai đoạn demo công nghệ; phần lớn huấn luyện diễn ra trong mô phỏng xấp xỉ vật lý, phần còn lại là con người điều khiển trực tiếp bằng joystick; mọi thao tác dùng tay đều thuộc nhóm này và tỷ lệ thất bại khá cao
- Tác vụ ở video cuối là “nhặt hộp từ đống kiện hàng và đặt lên băng chuyền sao cho nhãn hướng xuống” có vẻ thực tế nhất; đã từng thấy trên Twitter một video không cắt cảnh cho thấy mẫu trước đó lặp lại việc này suốt 1 giờ (liên kết); có thể robot hình người không hẳn là cần thiết, nhưng khả năng nhặt, thao tác nhiều loại kiện hàng khác nhau và phục hồi sau lỗi thì khá ấn tượng
- Đây chính là vấn đề; nếu robot này làm được thì sẽ có ứng dụng rõ ràng như bổ sung hàng lên kệ trong cửa hàng; tác vụ pick-and-place có điều kiện khá hạn chế nhưng lại cần khả năng di chuyển như con người và là môi trường phù hợp với hình dạng humanoid; tò mò không biết đã tiến gần đến mức nào; việc này đã được thử từ năm 2020 (liên kết), và tiếp tục vào năm 2022 (liên kết); đó là robot dạng chạy trên ray được dùng tại 7-11 Japan; robot đi quanh cửa hàng để kiểm tra trực quan các kệ và so sánh với planogram thì đã được dùng khá rộng rãi; chúng không trực tiếp thao tác hàng hóa; cũng đã có các hệ thống hỗ trợ lập kế hoạch công việc tồn kho; một nhóm nghiên cứu ở ĐH Công nghệ Delft cho rằng trong vòng 5 năm nữa sẽ làm được (liên kết), dù không rõ chính xác mốc thời gian của nguồn này
- Đã nói hộ rất đúng điều tôi muốn nói; thực ra mọi video đều phục vụ mục đích marketing; sau khi xem video Logistics (liên kết), tôi muốn thấy mẫu lần này thử làm việc nhà; chắc chắn sẽ không hề mượt mà và sẽ có nhiều sai sót, thất bại; không phải theo nghĩa xấu, mà tôi chỉ mong họ cứ cho thấy nguyên trạng như vậy thì sẽ tốt hơn; nếu có video tiếp theo thì tôi nhất định sẽ xem
- Từ trước đến nay vẫn luôn như vậy; công ty mới thành lập chưa được bao nhiêu năm; tôi không phải tín đồ của phe robot hình người, nhưng muốn bắt đầu cái gì thì cũng phải bắt đầu từ đâu đó; tiếc là để gọi vốn thì lúc nào cũng có thế trận “cường điệu > sự thật”, nên mới có những video được tuyển chọn kỹ như thế này
- Tôi đã xem một video họ làm phân loại bưu kiện Amazon liên tục suốt 1 giờ (liên kết), nên cũng tự hỏi phải đối chiếu nhận định ở trên với thực tế đó như thế nào
Cảm giác các bình luận ở đây quá tiêu cực; chỉ 5 năm trước thôi thì chuyện này hoàn toàn bất khả thi; còn bây giờ, sắp đến mức ngay cả demo robot tiêu dùng có thể làm hầu hết việc nhà mà không gặp vấn đề lớn sau vài lần lặp lại cũng đã xuất hiện; mọi thứ đang thay đổi đột ngột như nước bất ngờ sôi lên
- Bạn nói 5 năm trước là bất khả thi, nhưng Boston Dynamics đã công bố các demo sản phẩm thực tế từ 20 năm trước rồi, không phải quảng cáo thổi phồng; vậy mà chưa có lấy một trường hợp nào dẫn đến sử dụng thực tế ở thị trường quy mô lớn; cứ kỳ vọng thì được, nhưng cũng hiểu vì sao mọi người đều thận trọng
- Trước khi mục tiêu đạt được thì không ai biết khi nào sẽ tới; có những thứ bùng nổ đột ngột như smartphone, nhưng cũng có những thứ như nhiệt hạch, hàng chục năm vẫn chưa mở ra được đột phá; robot hình người giống vế sau hơn nên người ta không còn reo hò ngay lập tức trước mỗi bước tiến mới nữa; về sau nếu thật sự có đột phá thì ai cũng sẽ nói đó mới là thứ “thật”, nhưng trước thời điểm đó thì ai cũng nghi ngờ
- Bạn nói “sau vài lần lặp lại sẽ có thể làm hầu hết việc nhà mà không gặp vấn đề”, nhưng tôi lại nghĩ rồi cả nghề thợ ống nước mà người ta bảo chúng ta nên làm khi công việc cổ cồn trắng bị LLM thay thế cũng sẽ biến mất hết
- Dù người ta nói đến các demo có thể lặp lại hay tốc độ tiến hóa nhanh, thực tế vẫn thường là giá quá đắt hoặc không thể tự học và làm việc trong môi trường thực; đây chắc là video robot gấp áo thứ N rồi, nhưng vẫn chưa từng thấy nó xử lý một căn phòng bừa bộn hay lấy đồ từ đống quần áo giặt; tôi từng nghĩ robot AI đầu tiên sẽ là pet, vậy mà có vẻ còn chưa bằng cả Furby
Dù robot kiểu này có làm hết việc nhà đi nữa, tôi vẫn lo đời sống riêng tư của mình sẽ bị lộ cho nhà sản xuất; nhìn vào các vụ xâm phạm bảo mật của camera Ring (liên kết) là đủ thấy, nhưng robot có thể di chuyển thì mức độ xâm phạm riêng tư sẽ còn nghiêm trọng hơn nhiều; nếu mua thì tôi cần những đảm bảo quyền riêng tư thật nghiêm túc
- Đã từng có trường hợp với mẫu Roomba có gắn camera, hình ảnh nhạy cảm bị gửi về nhà sản xuất và nhân viên còn chia sẻ các video đó lên mạng xã hội; chuyện đó đã thực sự xảy ra rồi; trước đây cũng có hệ thống an ninh bằng drone camera bay quanh nhà, nhưng không rõ sau đó ra sao; tôi từng lo sẽ xuất hiện đủ loại vụ rò rỉ quyền riêng tư như vậy (liên kết)
- Figure 03 được nói là có data offloading mmWave 10Gbps để cả fleet có thể tải lên hàng terabyte dữ liệu cho continuous learning; chỉ đọc đến đoạn này là tôi từ chối ngay
- Chưa nói đến quyền riêng tư, chỉ cần tưởng tượng có kiểu người như @elder_plinius bước vào nhà thì chuyện gì có thể xảy ra; vấn đề AI safety sẽ trở thành một vấn đề thực tế hơn rất nhiều ngay khi AI có cơ thể
- Điều làm tôi sợ nhất là bị hack từ xa, rồi trong lúc tôi ngủ robot có thể làm hại tôi
- Tôi muốn nó được lập trình để khi người nhà bước vào thì robot lập tức rời khỏi phòng, và chỉ dọn dẹp trong những phòng luôn trống mà thôi
Mọi người đang chỉ trích rất dữ; nên nhớ hiện tại chính là trạng thái tệ nhất mà các robot này từng có; khi một robot tiến bộ ở một tác vụ thì cả hệ có thể chia sẻ việc học đó; từ giờ trở đi chúng sẽ chỉ ngày càng tốt hơn
- Dù biết video đã được dàn dựng hoặc tuyển chọn kỹ, bước tiến lần này vẫn ấn tượng đến mức đáng sợ; tôi thậm chí còn ngạc nhiên khi mọi người lại nhìn nó tiêu cực đến vậy
- Tôi không nghi ngờ tiến bộ kỹ thuật tự thân, nhưng cá nhân tôi không còn tích cực được nữa vì cảm giác sự phát triển công nghệ đã chuyển sang hướng phản địa đàng quá nhanh; có lẽ đó cũng là lý do có nhiều phản ứng tiêu cực như vậy; tất nhiên cũng có thể một phần là vì người ta lo bong bóng đầu tư
Tôi không hiểu tại sao lại phải sạc; chỉ cần lắp 3 viên pin dung lượng bằng 1/3 và cho phép sạc độc lập từng viên, rồi robot đi tới trạm và chỉ việc thay pin là được; tôi không hiểu tại sao nhất định phải dùng sạc không dây hay cắm cáp; thay pin có vẻ hợp lý hơn nhiều; còn tốt hơn nữa nếu robot có thể tự thay thế và tái chế pin dựa trên dữ liệu tuổi thọ pin; nếu trạm sạc ở ngoài trời dưới các tấm pin mặt trời thì còn tiết kiệm được tiền điện; lúc sạc hay thay pin nó cũng có thể tự khóa cửa, và nếu thời tiết xấu thì kéo toàn bộ thiết lập vào trong
- Còn tùy tuổi thọ pin; nếu dùng được cả ngày thì ban đêm đứng lên pad để sạc là hợp lý; thêm pin tháo rời sẽ làm tăng trọng lượng và giảm tự do trong việc bố trí vị trí pin; tốc độ sạc cũng quan trọng nữa, nếu 30 phút đã sạc được 80% thì có thể tranh thủ sạc ngắn giữa các tác vụ chính; nếu có thể sạc cảm ứng dưới chân, chỉ cần để nó đứng trên một tấm sạc lớn là trong môi trường như nhà máy có thể chạy gần như vô hạn; nếu gấp đồ giặt hay rửa bát mất 30 phút thì có thể đặt thảm sạc ngay tại đó để vừa làm vừa sạc; biết đâu nhà xây mới trong tương lai sẽ có cuộn sạc tích hợp trong mọi sàn nhà
- Thay pin cần thêm các bộ phận chuyển động và vỏ chuyên dụng, pin cũng phải cứng cáp hơn và tối thiểu cần 2 viên; việc cắm cáp có vẻ robot có thể tự làm được, nhưng thực tế môi trường khó lường nên dây có thể gây vướng víu (dù tất nhiên bộ sạc cảm ứng cũng có thể bị cản trở...)
- Lý do hợp lý nhất có lẽ là ngay cả trong tình huống được lập trình sẵn, việc thay pin ở đúng vị trí vẫn còn khó; ngay cả tự cắm cáp để sạc cũng chưa làm được; thế mà lại được đóng gói quá mức như thể có thể gấp đồ giặt; nếu có thông báo kiểu đó thì tôi sẽ bán cổ phiếu ngay lập tức
- Cũng phải nghĩ xem điều gì xảy ra nếu nó không thay pin được và cũng không đến được trạm sạc; kiểu như robot hút bụi mắc kẹt dưới ghế sofa, nhưng lần này bạn có thể phải lôi một khối cao 150 cm, nặng 300 kg ra ngoài
- Walker S2 có vẻ xử lý thay pin khá tốt trong demo (liên kết)
Tôi thấy ý kiến ví nó với GPT-2 khá thú vị; bề ngoài là một phép so sánh hay nhưng bản chất hoàn toàn khác; GPT thì dữ liệu huấn luyện như tài liệu web, sách vở... đã tồn tại sẵn từ trước; tài nguyên tính toán cũng đã có sẵn; rốt cuộc đó là một cuộc chơi “ghép các nguồn lực sẵn có” để hiện thực hóa ý tưởng từ bài báo năm 2017, và khi thử thì đã thành công; còn với robot hình người thì bản thân dữ liệu thực cần cho huấn luyện mạng nơ-ron gần như không tồn tại ở quy mô đủ lớn, hơn nữa tính chất dữ liệu cũng không đơn giản như dự đoán token mà phức tạp hơn nhiều; dù vậy tôi vẫn cổ vũ tinh thần dám thử của đội Figure; các ví dụ được tuyển chọn kỹ là quá rõ, nhưng vì mục đích không phải bán sản phẩm mà là cho nhà đầu tư thấy R&D và nghiên cứu, nên cuối cùng tôi nghĩ điều này vẫn có ích cho đổi mới
- Đề xuất ý tưởng dùng RL trong môi trường mô phỏng và để visual LLM phụ trách xác minh (kiểm tra trạng thái bằng ảnh 2D, Vision-Language Model trả về 0 hoặc 1), đồng thời áp dụng các mô hình mở rộng video kiểu Sora vào các tác vụ như chuyển đồ từ máy giặt sang máy sấy, theo cấu trúc dự đoán dựa trên FPV (First Person View)
- Không liên quan trực tiếp đến nội dung, nhưng chia sẻ các liên kết tài liệu nghiên cứu liên quan có thể đáng tham khảo
  liên kết1
  liên kết2
  liên kết3
  liên kết4
- Có phải đang giả định rằng cách huấn luyện hiện tại sẽ tiếp tục được giữ nguyên không? Có vẻ sẽ cần những phương pháp học trực tiếp từ môi trường; nghiên cứu gần đây cũng đã đề xuất các kiến trúc có thể dẫn đến dạng trí tuệ tổng quát như vậy; chỉ là tôi chưa thấy nhiều trường hợp phía này nhận được đầu tư lớn hay các thử nghiệm đủ mạnh
Các trường hợp sử dụng trong video quả thật khá thú vị; vì thế giới được thiết kế theo chuẩn con người nên tôi nghĩ robot có hình dạng con người là phù hợp; không cần phải cải tạo máy giặt hay cả ngôi nhà cho phù hợp với robot, đó là một ưu điểm; nhưng đưa robot vào những công việc cần yếu tố con người như lễ tân khách sạn thì hoàn toàn vô lý; nếu bỏ hết các lợi ích mà con người mang lại như cảm xúc, sự thân thiện, thì một kiosk đơn giản sẽ tốt hơn và thực tế hơn nhiều
- Tôi từng nghĩ về việc nên hướng tới tính thân thiện với con người hay hiệu quả; trong nhiều trường hợp chúng ta đã chọn thiên về hiệu quả hơn; khi robot có thể xử lý hoàn toàn đủ loại công việc thì lý do duy trì các không gian ưu tiên cho con người sẽ biến mất, và ưu thế của hình dạng humanoid cũng sẽ phai đi; ví dụ kho logistics hiện giờ vẫn lấy con người làm trung tâm, nhưng khi tự động hóa hoàn toàn thì tiêu chuẩn đó cũng sẽ biến mất
- Vài năm trước tôi đi công tác Las Vegas, và rất ấn tượng với việc check-in/check-out khách sạn đã được tự động hóa; chỉ cần đưa mã và hộ chiếu ở kiosk là có thể chọn các tùy chọn mong muốn, nhận hoặc in hướng dẫn vị trí phòng, và phát keycard rất nhanh; cảm giác như 4 kiosk có thể xử lý hơn 90% khối lượng của 4 nhân viên, và cảm giác chờ đợi cũng khác; tuy vậy kiosk cũng hỏng khá nhiều, nhìn ở sân bay là thấy đủ kiểu lỗi; còn chuyện máy giặt thì đáp án nên là thúc đẩy chuẩn hóa trong home automation; với công nghệ như Thread, “robot nhà” nên nhận được thông tin thời gian thực thay vì phải tự kiểm tra trạng thái
- Tôi đã từ lâu chủ trương tự động hóa check-in ở khách sạn và thuê xe; gần đây tôi thực sự dùng một hệ thống như vậy ở dịch vụ thuê xe, nhưng không mượt; hệ thống không nhận ra mã, tôi phải nhờ nhân viên giúp nhiều lần, rồi còn bị gán nhầm chìa khóa; cuối cùng vẫn phải để con người nhập lại chìa thì mới giải quyết được; ý tưởng thì hay nhưng năng lực thực thi còn kém
- Trớ trêu thay, robot biết đi có lẽ thực tế nhất khi là một “máy tính có thể tự di chuyển”; nếu nó được dùng làm máy chủ di động, loa, hoặc phần chân cho thiết bị đo đạc dữ liệu để có thể tự triển khai trong hiện trường, thì sẽ cực kỳ hữu ích vì giải phóng 15% bộ não khỏi các việc lặt vặt; (quay lại chuyện keycard khách sạn, về mặt kỹ thuật thì đầu đọc keycard hoàn toàn có thể kiêm luôn đầu đọc thẻ tín dụng; nhưng trong thực tế, nhân viên còn có vai trò quan sát trực tiếp tình trạng an toàn của khách nên không dễ tự động hóa hoàn toàn)
- Có những người ghét yếu tố con người ở quầy lễ tân; nếu có thể, tôi thậm chí sẵn sàng trả thêm tiền chỉ để có lựa chọn nhận QR code hay pass và đi thẳng vào phòng mà không phải tiếp xúc với ai
Có vẻ các kỹ sư không hiểu tại sao con người lại thích những công cụ cấp cao nhưng kém hiệu quả hơn (như humanoid) thay vì các công cụ cấp thấp hiệu quả cao; ví dụ để lắp máy rửa bát thì phải mua, lắp đặt, học cách dùng theo sách hướng dẫn, nhưng giao tiếp trực quan kiểu bảo ai đó “rửa bát giúp tôi” lại đơn giản hơn nhiều; dù kết quả có kém hơn một chút thì nhiều người vẫn sẵn sàng trả thêm khá nhiều tiền; không phải ai cũng sẵn sàng bỏ thời gian và công sức để đổi lấy hiệu quả, đó là bản tính con người
- Với việc thuê người thật cũng vậy; dù chi phí theo giờ cao hơn và hiệu năng có thể thấp hơn, bạn vẫn tránh được nhiều sự phức tạp khi tuyển và quản lý nhân viên; (không phải tôi cho đó là ý hay, chỉ đơn giản đang nghĩ dưới góc độ chi phí)
- Tuy nhiên giới hạn của điều đó cũng rất rõ; ví dụ rửa bát thì hiện nay chỉ cần chịu chi là đã có thể thuê người giúp việc gia đình với hiệu quả cao nhất và độ linh hoạt cao nhất; nếu có một kiểu người hầu tự động xử lý được nhiều việc nhà, thì giá trị mua thực tế có thể nằm ở đâu đó từ $1k đến $100k, chưa kể chi phí bảo trì thêm, độ tin cậy và nhiều biến số khác; tôi khá tò mò không biết phạm vi “nhiều người sẽ thích” thực sự rộng đến mức nào
Bản thân thiết kế robot đã khó, nhưng điều thực sự khó là “triển khai thực tế”; dùng vài chiếc ở đâu, cho việc gì mới là mấu chốt; phải xem tác vụ nào thực sự đủ hữu ích, cách nó thích nghi với từng môi trường triển khai ra sao, và theo thời gian thay đổi thế nào; trở ngại lớn nhất của robot đa dụng từ trước đến nay luôn là AI; nếu Figure thực sự tạo ra được một AI tinh vi và đa năng, tức có thể lập tức triển khai trong nhiều môi trường khác nhau và cho kết quả tốt ở nhiều tác vụ, thì đó sẽ là sản phẩm bùng nổ; hãy theo dõi số lượng triển khai thực tế, xem nó có được dùng ở các công ty nhỏ, không gian phức tạp như xây dựng hay bảo trì hay không, có làm ổn cả việc dỡ hàng xe tải ở Walmart hay xếp hàng lên kệ cửa hàng không; nếu làm được vậy thì mới là thật
- Thực tế thì giai đoạn triển khai đầu tiên có lẽ vẫn giống trailer 7 phút trơn tru kia: làm quản gia rót champagne trong tiệc, robot lễ tân khách sạn, tức là món đồ chơi mới lạ cho giới giàu có; còn chuyện triển khai hàng loạt nghiêm túc ở quy mô Walmart có lẽ phải thêm vài thế hệ nữa mới tới
Tôi nghĩ nếu loại robot này ra mắt ở mức khoảng 30 triệu won thì sẽ đến lúc nhà nào cũng có; cùng với nhiệt hạch, tôi kỳ vọng robot gia đình sẽ trở thành một trong những công nghệ biểu tượng của thế hệ chúng ta; đã tưởng tượng quá lâu rồi, và tôi tin trong đời mình cuối cùng nó sẽ trở nên khả thi về mặt kinh tế; viễn cảnh có robot trong nhà vừa khiến tôi sợ hãi, vừa kính nể, vừa bất an
- Vấn đề quyền riêng tư chắc chắn phải được giải quyết; về lý thuyết, robot chỉ nên giao tiếp với máy chủ đặt ở tầng hầm nhà tôi mà thôi
- Tôi cũng chờ xem những vụ robot kiểu này bị hack rồi bị lợi dụng cho các tội ác nghiêm trọng sẽ lên mặt báo
- Vì giá trị của việc nhà không cao nên tôi nghĩ sẽ khó được đại chúng chấp nhận cho đến khi nó đủ rẻ; tôi không định chi 30 triệu won chỉ để rửa bát hay bật máy giặt; giới giàu có mê công nghệ có thể mua vì thấy mới lạ, nhưng số đông vẫn sẽ cân đo hiệu quả chi phí; trước đây robot hút bụi Roomba rẻ nên bán rất chạy, còn giờ thì ở nhiều nhà nó chỉ nằm đó; ứng dụng mạnh nhất của robot là trong công nghiệp, sản xuất, xây dựng, nông nghiệp, và không nhất thiết phải có hình dạng humanoid, thậm chí ngoại hình đó còn có thể làm tăng phản ứng từ công đoàn; có khi một thứ trông “chỉ như công cụ” lại dễ được chào đón hơn
- Tôi đã bỏ qua cả trào lưu smart home rồi, nên đợt này chắc cũng bỏ qua luôn; cứ như bình thường, tôi sẽ tự rửa bát và giặt đồ lấy

Ra mắt Figure 03 - robot hình người đa năng thế hệ thứ 3

Figure 03

Thiết kế cho Helix

Thiết kế cho gia đình

Thiết kế cho sản xuất hàng loạt

Thiết kế cho quy mô toàn cầu

Kết luận

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News