- DeepMind đã công bố Scalable Instructable Multiworld Agent(SIMA)
-
- Google DeepMind có lịch sử lâu dài trong lĩnh vực AI và game, từ các trò chơi Atari cho đến hệ thống AlphaStar chơi StarCraft II ở cấp độ tương đương đại kiện tướng con người
- SIMA là một tác nhân AI đa dụng cho môi trường ảo 3D, có thể làm theo chỉ dẫn bằng ngôn ngữ tự nhiên trong nhiều môi trường trò chơi điện tử khác nhau
- Nghiên cứu lần này đặt mục tiêu chuyển hướng sang một tác nhân AI chơi game mang tính tổng quát và có thể nhận chỉ dẫn, thay vì tập trung vào từng trò chơi riêng lẻ
- Được huấn luyện trên nhiều trò chơi điện tử thông qua hợp tác với nhiều nhà phát triển game
- Lần đầu tiên cho thấy tác nhân AI có thể hiểu các thế giới game đa dạng và thực hiện tác vụ trong đó theo chỉ dẫn bằng ngôn ngữ tự nhiên
Học từ trò chơi điện tử
- SIMA được huấn luyện và kiểm thử trên 9 trò chơi điện tử khác nhau, bao gồm No Man’s Sky của Hello Games và Teardown của Tuxedo Labs
- Để cho tác nhân tiếp xúc với nhiều môi trường đa dạng, nhóm nghiên cứu đã hợp tác với các nhà phát triển game và thiết lập quan hệ đối tác với 8 studio game
- SIMA học được nhiều kỹ năng, từ khám phá đơn giản, sử dụng menu cho đến khai thác tài nguyên, điều khiển tàu vũ trụ và chế tạo mũ bảo hiểm
- Cũng được sử dụng trong 4 môi trường nghiên cứu, bao gồm Construction Lab, một môi trường mới được xây dựng bằng Unity
SIMA: tác nhân AI đa năng
- SIMA là một tác nhân AI có thể nhận biết và hiểu nhiều môi trường khác nhau, sau đó thực hiện hành động để đạt được mục tiêu được chỉ định
- Bao gồm mô hình để ánh xạ hình ảnh-ngôn ngữ chính xác và mô hình video dự đoán điều gì sẽ xảy ra tiếp theo trên màn hình
- Không cần truy cập vào mã nguồn game hay API riêng biệt, chỉ cần hình ảnh màn hình và chỉ dẫn ngôn ngữ tự nhiên đơn giản do người dùng cung cấp
- SIMA sử dụng đầu ra bàn phím và chuột để điều khiển nhân vật trung tâm của game và thực hiện các chỉ dẫn này
Khả năng tổng quát hóa trong game và các môi trường khác
- Tác nhân được huấn luyện trên nhiều game cho thấy hiệu năng tốt hơn tác nhân chỉ được huấn luyện trên một game duy nhất
- Cần thêm nhiều nghiên cứu để đạt được hiệu năng ở mức con người không chỉ trong môi trường đã huấn luyện mà cả trong các môi trường chưa từng thấy
- Hiệu năng của SIMA phụ thuộc vào ngôn ngữ; nếu không có huấn luyện ngôn ngữ hoặc chỉ dẫn, nó vẫn hành động phù hợp nhưng không có mục đích
Tiến bộ trong nghiên cứu tác nhân AI
- Kết quả của SIMA cho thấy tiềm năng phát triển các tác nhân AI tổng quát dựa trên ngôn ngữ
- Đây là nghiên cứu ở giai đoạn đầu, và nhóm nghiên cứu kỳ vọng sẽ tiếp tục phát triển SIMA hơn nữa bằng cách tích hợp thêm nhiều môi trường huấn luyện và các mô hình có năng lực cao hơn
- Mục tiêu cuối cùng là xây dựng các hệ thống và tác nhân AI tổng quát có thể hiểu và thực hiện an toàn nhiều tác vụ khác nhau, hữu ích cho con người cả trên mạng lẫn trong thế giới thực
Ý kiến của GN⁺
- SIMA là một nghiên cứu quan trọng cho thấy AI có thể hiểu chỉ dẫn và hành động như con người trong nhiều môi trường khác nhau
- Những nghiên cứu như vậy có thể mở ra tương lai nơi AI không chỉ thực hiện các tác vụ đơn giản mà còn có thể lập kế hoạch chiến lược phức tạp và xử lý đa nhiệm
- Tuy nhiên, để AI đạt được hiệu năng ở mức con người, vẫn còn cần rất nhiều nghiên cứu và phát triển
- Cần có thêm thảo luận về cách công nghệ này có thể được áp dụng để giải quyết các vấn đề trong thế giới thực, cũng như những giới hạn tiềm tàng của khả năng tổng quát hóa của AI
- Một dự án AI khác có chức năng tương tự là OpenAI Gym, một nền tảng AI có thể học từ nhiều trò chơi điện tử khác nhau
1 bình luận
Ý kiến trên Hacker News