AI chính sách tổng quát đầu tiên cho trí tuệ vật lý, hiện thực hóa khả năng gấp đồ giặt
(physicalintelligence.company)-
Trí tuệ vật lý (π)π0: chính sách tổng quát đầu tiên của chúng tôi
-
Chúng ta đang sống trong kỷ nguyên cách mạng AI, và AI có thể giải quyết những vấn đề "dễ" như thắng một ván cờ hay khám phá thuốc mới, nhưng các vấn đề trong thế giới vật lý như gấp áo sơ mi hoặc dọn bàn vẫn là những bài toán khó. Để giải quyết điều này, cần trang bị cho các hệ thống AI trí tuệ vật lý.
-
Trong 8 tháng qua, chúng tôi đã phát triển π0, một mô hình nền tảng robot tổng quát, là bước đầu tiên hướng tới việc xây dựng AI cho phép người dùng yêu cầu robot thực hiện công việc họ muốn. π0 bao trùm hình ảnh, văn bản và hành động, đồng thời tiếp thu trí tuệ vật lý thông qua kinh nghiệm của robot.
-
Lời hứa của chính sách robot tổng quát
-
Hiện tại, robot chỉ có chuyên môn trong phạm vi hẹp và không thể hành động trong môi trường phức tạp. AI có thể đơn giản hóa việc lập trình các hành vi mới bằng cách giúp robot học và làm theo chỉ dẫn của người dùng. Để làm được điều này cần rất nhiều dữ liệu.
-
Nếu có thể huấn luyện một chính sách robot tổng quát, chúng ta có thể tạo ra một mô hình có khả năng thực hiện nhiều kỹ năng khác nhau và điều khiển nhiều loại robot khác nhau. Mô hình này cũng có thể được chuyên biệt hóa cho các tác vụ mới chỉ với lượng dữ liệu nhỏ.
-
Hỗn hợp huấn luyện xuyên hiện thực hóa
-
π0 được huấn luyện bằng tiền huấn luyện thị giác-ngôn ngữ ở quy mô Internet, các bộ dữ liệu thao tác robot mã nguồn mở, và bộ dữ liệu tác vụ tinh vi trên 8 robot khác nhau. Nó có thể thực hiện nhiều tác vụ đa dạng, thông qua prompt zero-shot hoặc fine-tuning.
-
Kế thừa khả năng hiểu ngữ nghĩa ở quy mô Internet
-
π0 kế thừa tri thức ngữ nghĩa và khả năng hiểu thị giác từ mô hình thị giác-ngôn ngữ (VLM) đã được tiền huấn luyện ở quy mô Internet. VLM được huấn luyện để mô hình hóa văn bản và hình ảnh trên web.
-
Hậu huấn luyện cho thao tác tinh vi
-
Các tác vụ phức tạp và tinh vi có thể được chuyên biệt hóa bằng cách fine-tuning mô hình. Ví dụ, gấp đồ giặt là một tác vụ cực kỳ khó.
-
Đánh giá và so sánh π0
-
So với các mô hình nền tảng robot khác, π0 cho thấy hiệu năng vượt trội trên mọi tác vụ. Ngay cả khi so với π0-small, nó cũng thể hiện hiệu năng tốt hơn.
-
Hướng đi sắp tới
-
Mục tiêu của Physical Intelligence là phát triển một mô hình nền tảng có thể điều khiển mọi robot. Các thí nghiệm đến nay cho thấy nó có thể điều khiển nhiều loại robot và thực hiện những tác vụ trước đây chưa từng thành công. Tuy nhiên, chính sách robot tổng quát vẫn còn ở giai đoạn đầu và sẽ cần nhiều tiến bộ hơn nữa trong tương lai.
1 bình luận
Ý kiến trên Hacker News
Đề cập đến việc cần robot làm việc nhà để phục vụ sự hài lòng của con người
Góc nhìn hoài nghi về tính thực dụng của robot
Vấn đề hạn chế không gian ở các thành phố châu Âu
Tiềm năng của robot như công cụ tự động hóa phòng thí nghiệm
Tiềm năng của robot nấu ăn
Vấn đề về tính đơn giản và chi phí của robot
Sự thay đổi trong việc giặt giũ
Vấn đề về tốc độ của robot