- Google DeepMind giới thiệu RoboCat, một hệ thống tự học thông qua việc thực hiện nhiều tác vụ khác nhau bằng cánh tay robot.
- Hệ thống này dựa trên Gato, một mô hình đa phương thức có thể hoạt động cả trong môi trường thực và môi trường mô phỏng (
gato trong tiếng Tây Ban Nha nghĩa là 'mèo').
- Để tự cải thiện, trước tiên hệ thống thu thập dữ liệu thực cho tác vụ mới.
- Từ dữ liệu thực, tinh chỉnh mô hình nền tảng để tạo ra một tác nhân phái sinh.
- Tác nhân mới luyện tập khoảng 10.000 lần để tạo bộ dữ liệu huấn luyện.
- Tích hợp dữ liệu thực và dữ liệu tự tạo vào bộ dữ liệu huấn luyện của RoboCat.
- Huấn luyện phiên bản RoboCat mới.
- Nhờ đó, hệ thống có thể thích nghi trong vài giờ với các cánh tay robot mới có nhiều khớp hơn hoặc nhiều ngón kẹp hơn.
- Ngoài ra còn hình thành một vòng lặp huấn luyện tích cực: mô hình ban đầu chỉ đạt tỷ lệ thành công 36% ở một số tác vụ, nhưng sau đó tăng hơn gấp đôi lên 74%.
3 bình luận
Cuối cùng thì cũng đã mở ra một sân chơi nơi trí tuệ nhân tạo gặp gỡ và trải nghiệm thế giới thực.
Bình luận trong chuỗi HN buồn cười quá.
Tôi cũng đã nghĩ gần như y hệt, kiểu như:
Có phải chỉ mình tôi mong đợi một con mèo robot không? Hơi thất vọng một chút...Ít nhất họ cũng nên dán một miếng sticker hình mèo lên cánh tay robot.
Tóm tắt bài báo cho ra như sau.
RoboCat là một tác nhân tự cải thiện dành cho thao tác robot. Hệ thống này được huấn luyện trên bộ dữ liệu lớn và đa dạng về các tác vụ robot, sử dụng nhiều môi trường mô phỏng cùng với cánh tay robot thực tế.
Các mục tiêu chính của RoboCat như sau.
Các kết quả chính như sau.
Tóm lại, RoboCat, một tác nhân tự cải thiện dành cho thao tác robot được huấn luyện trên bộ dữ liệu lớn và đa dạng, cho thấy nó có thể khái quát hóa sang tác vụ và robot mới với lượng dữ liệu tối thiểu thông qua tinh chỉnh và tự cải thiện. Khả năng tận dụng trải nghiệm robot không đồng nhất ở quy mô lớn của hệ thống này có tiềm năng tạo ra thay đổi lớn cho việc học của robot.