Google SIMA - Tác nhân AI tạo sinh cho môi trường ảo 3D

(deepmind.google)

8 điểm bởi GN⁺ 2024-03-14 | 1 bình luận | Chia sẻ qua WhatsApp

DeepMind đã công bố Scalable Instructable Multiworld Agent(SIMA)
- - Google DeepMind có lịch sử lâu dài trong lĩnh vực AI và game, từ các trò chơi Atari cho đến hệ thống AlphaStar chơi StarCraft II ở cấp độ tương đương đại kiện tướng con người
SIMA là một tác nhân AI đa dụng cho môi trường ảo 3D, có thể làm theo chỉ dẫn bằng ngôn ngữ tự nhiên trong nhiều môi trường trò chơi điện tử khác nhau
Nghiên cứu lần này đặt mục tiêu chuyển hướng sang một tác nhân AI chơi game mang tính tổng quát và có thể nhận chỉ dẫn, thay vì tập trung vào từng trò chơi riêng lẻ
Được huấn luyện trên nhiều trò chơi điện tử thông qua hợp tác với nhiều nhà phát triển game
Lần đầu tiên cho thấy tác nhân AI có thể hiểu các thế giới game đa dạng và thực hiện tác vụ trong đó theo chỉ dẫn bằng ngôn ngữ tự nhiên

Học từ trò chơi điện tử

SIMA được huấn luyện và kiểm thử trên 9 trò chơi điện tử khác nhau, bao gồm No Man’s Sky của Hello Games và Teardown của Tuxedo Labs
Để cho tác nhân tiếp xúc với nhiều môi trường đa dạng, nhóm nghiên cứu đã hợp tác với các nhà phát triển game và thiết lập quan hệ đối tác với 8 studio game
SIMA học được nhiều kỹ năng, từ khám phá đơn giản, sử dụng menu cho đến khai thác tài nguyên, điều khiển tàu vũ trụ và chế tạo mũ bảo hiểm
Cũng được sử dụng trong 4 môi trường nghiên cứu, bao gồm Construction Lab, một môi trường mới được xây dựng bằng Unity

SIMA: tác nhân AI đa năng

SIMA là một tác nhân AI có thể nhận biết và hiểu nhiều môi trường khác nhau, sau đó thực hiện hành động để đạt được mục tiêu được chỉ định
Bao gồm mô hình để ánh xạ hình ảnh-ngôn ngữ chính xác và mô hình video dự đoán điều gì sẽ xảy ra tiếp theo trên màn hình
Không cần truy cập vào mã nguồn game hay API riêng biệt, chỉ cần hình ảnh màn hình và chỉ dẫn ngôn ngữ tự nhiên đơn giản do người dùng cung cấp
SIMA sử dụng đầu ra bàn phím và chuột để điều khiển nhân vật trung tâm của game và thực hiện các chỉ dẫn này

Khả năng tổng quát hóa trong game và các môi trường khác

Tác nhân được huấn luyện trên nhiều game cho thấy hiệu năng tốt hơn tác nhân chỉ được huấn luyện trên một game duy nhất
Cần thêm nhiều nghiên cứu để đạt được hiệu năng ở mức con người không chỉ trong môi trường đã huấn luyện mà cả trong các môi trường chưa từng thấy
Hiệu năng của SIMA phụ thuộc vào ngôn ngữ; nếu không có huấn luyện ngôn ngữ hoặc chỉ dẫn, nó vẫn hành động phù hợp nhưng không có mục đích

Tiến bộ trong nghiên cứu tác nhân AI

Kết quả của SIMA cho thấy tiềm năng phát triển các tác nhân AI tổng quát dựa trên ngôn ngữ
Đây là nghiên cứu ở giai đoạn đầu, và nhóm nghiên cứu kỳ vọng sẽ tiếp tục phát triển SIMA hơn nữa bằng cách tích hợp thêm nhiều môi trường huấn luyện và các mô hình có năng lực cao hơn
Mục tiêu cuối cùng là xây dựng các hệ thống và tác nhân AI tổng quát có thể hiểu và thực hiện an toàn nhiều tác vụ khác nhau, hữu ích cho con người cả trên mạng lẫn trong thế giới thực

Ý kiến của GN⁺

SIMA là một nghiên cứu quan trọng cho thấy AI có thể hiểu chỉ dẫn và hành động như con người trong nhiều môi trường khác nhau
Những nghiên cứu như vậy có thể mở ra tương lai nơi AI không chỉ thực hiện các tác vụ đơn giản mà còn có thể lập kế hoạch chiến lược phức tạp và xử lý đa nhiệm
Tuy nhiên, để AI đạt được hiệu năng ở mức con người, vẫn còn cần rất nhiều nghiên cứu và phát triển
Cần có thêm thảo luận về cách công nghệ này có thể được áp dụng để giải quyết các vấn đề trong thế giới thực, cũng như những giới hạn tiềm tàng của khả năng tổng quát hóa của AI
Một dự án AI khác có chức năng tương tự là OpenAI Gym, một nền tảng AI có thể học từ nhiều trò chơi điện tử khác nhau

1 bình luận

GN⁺ 2024-03-14

Ý kiến trên Hacker News

Không thể quên việc OpenAI được giới thiệu tại TI7 có thể đấu với các tuyển thủ Dota chuyên nghiệp. Dota là một trò chơi cực kỳ phức tạp và khó. Trải nghiệm đó đã mang lại một thay đổi lớn trong sự nghiệp của tôi.
Hy vọng các nhà phát triển có thể dùng công nghệ này để thổi thêm sức sống vào NPC. Lời hứa về những NPC sống cuộc đời độc lập trong nhiều game RPG chưa bao giờ thật sự dẫn đến kết quả nổi bật, nhưng có lẽ với AI thì giờ điều đó đang đến gần hơn.
Trong MMORPG, việc dùng bot vốn đã là một vấn đề nghiêm trọng, đang làm méo mó nền kinh tế của người chơi và làm giảm trải nghiệm game của mọi người. Trò chơi mèo vờn chuột để ngăn chặn những gold farmer này sẽ trở nên khó khăn hơn rất nhiều.
Những câu chuyện khoa học viễn tưởng về ngày tận thế robot trở thành hiện thực giờ không còn là khoa học viễn tưởng nữa. Vì các game bạo lực "thú vị" rẻ hơn nhiều và phong phú hơn so với các trình mô phỏng thực tế nhàm chán.
Việc dùng nó như một công cụ CI cho phát triển game sẽ rất thú vị. Các bài kiểm thử playthrough end-to-end để xác minh không chỉ UI mà cả phần viết nội dung và luồng chơi. Tôi có thể hình dung ra việc nhận được các báo cáo như "Thời gian để chặt cây đầu tiên: +20%".
Công nghệ này + công nghệ Vtuber + chatbot tương tác với khán giả + công nghệ chuyển đổi giọng nói == tự động hóa influencer game
Tôi tự hỏi SIMA có thể hoạt động tốt đến mức nào nếu so với AlphaStar của DeepMind trong StarCraft II, hoặc nếu tôi đưa ra chỉ thị cấp cao còn SIMA thực thi thì sẽ ra sao. Rồi tôi có cảm giác đáng ngại rằng loại game chiến tranh này có lẽ đã đang được dùng để thử nghiệm rồi. Cũng sẽ cần những cơ chế an toàn ngược, nơi AI nêu lên lo ngại và yêu cầu xác nhận trước khi thực hiện một số yêu cầu.
Làm tôi nhớ đến Ender’s Game, nơi họ lừa một đứa trẻ nghĩ rằng mình chỉ đang chơi game trên máy tính để khiến nó tiêu diệt cả một chủng loài ngoài hành tinh.
Trò đùa "GeForce GTX G-Assist" của Nvidia vào tháng 4 năm 2017 có lẽ sắp trở thành hiện thực.
Thật ngạc nhiên khi họ đã dùng Transformer-XL từ năm 2019 - tôi không biết vẫn còn người dùng các kiến trúc như XLNet.

Google SIMA - Tác nhân AI tạo sinh cho môi trường ảo 3D

Học từ trò chơi điện tử

SIMA: tác nhân AI đa năng

Khả năng tổng quát hóa trong game và các môi trường khác

Tiến bộ trong nghiên cứu tác nhân AI

Ý kiến của GN⁺

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News