Xây dựng một studio game AI: những điều chúng tôi học được

xguru · 2024-06-17T11:14:01+09:00

Braindump là một nỗ lực nhằm hình dung việc tạo ra game có thể trông như thế nào trong thế giới mới của LLM và AI tạo sinh Với Braindump, bạn có thể xây dựng game top-down/2.5D hoặc một thế giới tương tác chỉ bằng cách nhập prompt Ví dụ, nếu nhập "tạo một chiến đấu cơ có thể bắn laser và thả bom BB-8", hệ thống sẽ tạo ra mô hình 3D, dữ liệu game và script cần thiết Từ thử nghiệm đầu tiên đến hiện tại Bắt đầu như một nguyên mẫu đơn giản khoảng 6 tháng trước, sau đó bổ sung tính năng tạo mô hình 3D, multiplayer và cải thiện UX nhiều lần Hiện tại Braindump có các tính năng cốt lõi sau Định nghĩa unit, kỹ năng và thuộc tính (ví dụ: "một con orc có 50 HP làm rơi đũa phép") Đặt object lên bản đồ game (ví dụ: "xếp 20 con orc thành hình tròn") Tạo luật chơi và logic game (ví dụ: "khi máu của orc về 0 thì tạo một ghost orc tại vị trí đó") Tạo mô hình 3D mới (ví dụ: "hãy làm con orc màu hồng và gắn tai bông xù", dùng Meshy) Tất cả đều có thể truy cập thông qua một giao diện prompt ngôn ngữ tự nhiên tích hợp Thách thức 1: thiết kế UX cho prompting Khi dùng LLM để xây dựng thứ gì đó, có hai vấn đề lớn Làm sao để LLM hoạt động nhất quán theo ý muốn UX tốt nhất để tương tác với LLM là gì Sau nhiều thử nghiệm prompt, nhóm đã chuyển sang cách tiếp cận lặp như hiện nay Việc tạo toàn bộ game từ một mô tả tổng thể duy nhất không hoạt động tốt Xây dựng game dần dần qua nhiều prompt tạo cơ hội mô tả chi tiết hơn hoặc lặp lại để cải thiện Nhóm vẫn đang tiếp tục thử nghiệm để tìm ra sự cân bằng phù hợp giữa prompt và các control truyền thống Thách thức 2: thiết kế game API cho LLM Việc tạo code cho các game engine hiện có gặp khó khăn LLM giỏi tạo code snippet, nhưng lại gặp khó với các phần mềm lớn hơn cũng như việc xây dựng và duy trì kiến trúc phần mềm Thay vào đó, nhóm xây dựng một "game API" rất tinh gọn bằng TypeScript để cung cấp càng nhiều cấu trúc càng tốt, giúp LLM tập trung vào việc viết code và dữ liệu Khi cung cấp các type definition (.d.ts) sinh ra từ API này cho GPT như system prompt, GPT hầu như sử dụng API đúng và nhất quán ngay từ lần thử đầu tiên Nhóm cũng phát hiện một lợi ích đáng ngạc nhiên của việc kiểm tra kiểu dữ liệu: khi GPT phát hiện lỗi, nó sẽ cố tự sửa Macro được sinh ra Game API cũng mở ra một luồng UX thú vị khác: macro được sinh ra Thông thường, macro trong ứng dụng là các chương trình nhỏ có thể tự động hóa công việc Trong hệ thống Braindump, mọi prompt đều sinh ra code, và đoạn code đó có thể tự động hóa gần như mọi thứ mà game API xử lý Ví dụ, bạn có thể nhập một prompt như "đặt lều cạnh đống lửa trại" Nó cũng có thể tự động hóa các công việc nhàm chán (ví dụ: "tạo 5 con mèo khác nhau với các chỉ số khác nhau") Hoặc bạn có thể yêu cầu nó trả lời những câu hỏi cần tính toán (ví dụ: "có bao nhiêu cái lều đang quay về phía bắc?") Điều này mở ra một cách làm việc hoàn toàn mới Ban đầu hơi lạ, nhưng khi đã quen thì có thể hoàn thành những việc rất tẻ nhạt theo cách sáng tạo chỉ trong vài giây Chỉnh sửa cộng tác với AI Nhóm muốn mọi thứ trong Braindump đều trở thành multiplayer Bao gồm cả việc làm game lẫn chơi game Ban đầu chỉ có một khung chat lớn để mọi người cùng đóng góp, nhưng cách này gây rối Vấn đề chính là mọi người thường làm hai việc khác nhau không liên quan tới nhau Sau khi thử nhiều giải pháp, nhóm chốt lại với thứ họ gọi là "Threads" Bạn có thể bắt đầu một prompt ở bất kỳ đâu trong thế giới, rồi tinh chỉnh hoặc bổ sung cho prompt đó khi cần Ban đầu thread được cung cấp trạng thái game mới nhất, nhưng không có toàn bộ lịch sử của dự án Nhiều thread có thể cùng "chạy" đồng thời, nhưng mỗi thread chỉ có thể chạy một prompt tại một thời điểm Cho đến nay, cách này hoạt động khá tốt Trong các bài test, đã có 5 người cùng làm việc trong một thế giới cùng lúc; chắc chắn vẫn hơi hỗn loạn nhưng vẫn vận hành được Nhóm đang tích cực tìm cách để người dùng có thể phối hợp hiệu quả hơn Benchmarking và kiểm thử Nhóm đã phát triển một công cụ benchmarking để đánh giá hiệu năng của prompt engine Công cụ này chạy hàng chục kịch bản, mỗi kịch bản có prompt riêng, rồi dùng GPT để đánh giá prompt đó có thành công hay không Một GPT thứ hai gọi là "evaluator" (có system prompt riêng) sẽ được cung cấp các điều kiện này, trạng thái mô phỏng khi hoàn tất và mọi lỗi phát sinh, rồi được yêu cầu xác định xem bài test có thành công hay không Bộ test vẫn còn ở giai đoạn đầu, nhưng nhóm đang liên tục bổ sung thêm test mỗi khi phát hiện kiểu prompt mới hoặc các ca thất bại mới Vì sao xây dựng Braindump Cá nhân tác giả luôn yêu thích game và sự sáng tạo AI tạo sinh là bước tiến tự nhiên tiếp theo của việc nâng cao năng suất Nó cho phép chúng ta đơn giản là làm được nhiều việc hơn Khi các studio lớn ngày càng làm ra những tựa game an toàn và bảo thủ hơn, việc trao quyền cho các nhóm nhỏ hoặc thậm chí từng cá nhân để họ tạo nên game mơ ước của mình là một điều đáng vui Tác giả muốn xem mọi người sẽ nghĩ ra và hiện thực hóa những ý tưởng điên rồ nào khi họ có cả một studio game AI ngay trong tầm tay Kế hoạch phía trước Braindump mới chỉ vừa bắt đầu Hiện tại hệ thống đã khá giỏi trong việc thực thi các "mệnh lệnh" ("tạo mèo"), nhưng nhóm biết rằng nó còn có thể mở rộng để xử lý cả những tác vụ mơ hồ hơn hoặc "lớn" hơn nhiều Nhóm đang nghiên cứu các hướng sau Hỗ trợ các prompt "lớn" hơn thông qua Planning Khiến GPT ngừng phỏng đoán và thay vào đó yêu cầu người dùng làm rõ Cải thiện chất lượng code bằng cách để GPT tự phê bình công việc của mình Cải thiện khả năng khám phá và truyền cảm hứng ("mình có thể tạo gì với thứ này?") Cải thiện các tính năng của game engine theo cách phù hợp với LLM

(braindump.me)

22 điểm bởi xguru 2024-06-17 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Braindump là một nỗ lực nhằm hình dung việc tạo ra game có thể trông như thế nào trong thế giới mới của LLM và AI tạo sinh
Với Braindump, bạn có thể xây dựng game top-down/2.5D hoặc một thế giới tương tác chỉ bằng cách nhập prompt
- Ví dụ, nếu nhập "tạo một chiến đấu cơ có thể bắn laser và thả bom BB-8", hệ thống sẽ tạo ra mô hình 3D, dữ liệu game và script cần thiết

Từ thử nghiệm đầu tiên đến hiện tại

Bắt đầu như một nguyên mẫu đơn giản khoảng 6 tháng trước, sau đó bổ sung tính năng tạo mô hình 3D, multiplayer và cải thiện UX nhiều lần
Hiện tại Braindump có các tính năng cốt lõi sau
- Định nghĩa unit, kỹ năng và thuộc tính (ví dụ: "một con orc có 50 HP làm rơi đũa phép")
- Đặt object lên bản đồ game (ví dụ: "xếp 20 con orc thành hình tròn")
- Tạo luật chơi và logic game (ví dụ: "khi máu của orc về 0 thì tạo một ghost orc tại vị trí đó")
- Tạo mô hình 3D mới (ví dụ: "hãy làm con orc màu hồng và gắn tai bông xù", dùng Meshy)
Tất cả đều có thể truy cập thông qua một giao diện prompt ngôn ngữ tự nhiên tích hợp

Thách thức 1: thiết kế UX cho prompting

Khi dùng LLM để xây dựng thứ gì đó, có hai vấn đề lớn
1. Làm sao để LLM hoạt động nhất quán theo ý muốn
2. UX tốt nhất để tương tác với LLM là gì
Sau nhiều thử nghiệm prompt, nhóm đã chuyển sang cách tiếp cận lặp như hiện nay
- Việc tạo toàn bộ game từ một mô tả tổng thể duy nhất không hoạt động tốt
- Xây dựng game dần dần qua nhiều prompt tạo cơ hội mô tả chi tiết hơn hoặc lặp lại để cải thiện
Quảng cáo
Nhóm vẫn đang tiếp tục thử nghiệm để tìm ra sự cân bằng phù hợp giữa prompt và các control truyền thống

Thách thức 2: thiết kế game API cho LLM

Việc tạo code cho các game engine hiện có gặp khó khăn
- LLM giỏi tạo code snippet, nhưng lại gặp khó với các phần mềm lớn hơn cũng như việc xây dựng và duy trì kiến trúc phần mềm
Thay vào đó, nhóm xây dựng một "game API" rất tinh gọn bằng TypeScript để cung cấp càng nhiều cấu trúc càng tốt, giúp LLM tập trung vào việc viết code và dữ liệu
Khi cung cấp các type definition (.d.ts) sinh ra từ API này cho GPT như system prompt, GPT hầu như sử dụng API đúng và nhất quán ngay từ lần thử đầu tiên
Nhóm cũng phát hiện một lợi ích đáng ngạc nhiên của việc kiểm tra kiểu dữ liệu: khi GPT phát hiện lỗi, nó sẽ cố tự sửa

Macro được sinh ra

Game API cũng mở ra một luồng UX thú vị khác: macro được sinh ra
Thông thường, macro trong ứng dụng là các chương trình nhỏ có thể tự động hóa công việc
Trong hệ thống Braindump, mọi prompt đều sinh ra code, và đoạn code đó có thể tự động hóa gần như mọi thứ mà game API xử lý
- Ví dụ, bạn có thể nhập một prompt như "đặt lều cạnh đống lửa trại"
- Nó cũng có thể tự động hóa các công việc nhàm chán (ví dụ: "tạo 5 con mèo khác nhau với các chỉ số khác nhau")
- Hoặc bạn có thể yêu cầu nó trả lời những câu hỏi cần tính toán (ví dụ: "có bao nhiêu cái lều đang quay về phía bắc?")
Điều này mở ra một cách làm việc hoàn toàn mới
- Ban đầu hơi lạ, nhưng khi đã quen thì có thể hoàn thành những việc rất tẻ nhạt theo cách sáng tạo chỉ trong vài giây

Chỉnh sửa cộng tác với AI

Nhóm muốn mọi thứ trong Braindump đều trở thành multiplayer
- Bao gồm cả việc làm game lẫn chơi game
Ban đầu chỉ có một khung chat lớn để mọi người cùng đóng góp, nhưng cách này gây rối
- Vấn đề chính là mọi người thường làm hai việc khác nhau không liên quan tới nhau
Sau khi thử nhiều giải pháp, nhóm chốt lại với thứ họ gọi là "Threads"
- Bạn có thể bắt đầu một prompt ở bất kỳ đâu trong thế giới, rồi tinh chỉnh hoặc bổ sung cho prompt đó khi cần
- Ban đầu thread được cung cấp trạng thái game mới nhất, nhưng không có toàn bộ lịch sử của dự án
- Nhiều thread có thể cùng "chạy" đồng thời, nhưng mỗi thread chỉ có thể chạy một prompt tại một thời điểm
Cho đến nay, cách này hoạt động khá tốt
- Trong các bài test, đã có 5 người cùng làm việc trong một thế giới cùng lúc; chắc chắn vẫn hơi hỗn loạn nhưng vẫn vận hành được
- Nhóm đang tích cực tìm cách để người dùng có thể phối hợp hiệu quả hơn

Benchmarking và kiểm thử

Nhóm đã phát triển một công cụ benchmarking để đánh giá hiệu năng của prompt engine
- Công cụ này chạy hàng chục kịch bản, mỗi kịch bản có prompt riêng, rồi dùng GPT để đánh giá prompt đó có thành công hay không
Một GPT thứ hai gọi là "evaluator" (có system prompt riêng) sẽ được cung cấp các điều kiện này, trạng thái mô phỏng khi hoàn tất và mọi lỗi phát sinh, rồi được yêu cầu xác định xem bài test có thành công hay không
Bộ test vẫn còn ở giai đoạn đầu, nhưng nhóm đang liên tục bổ sung thêm test mỗi khi phát hiện kiểu prompt mới hoặc các ca thất bại mới

Vì sao xây dựng Braindump

Cá nhân tác giả luôn yêu thích game và sự sáng tạo
AI tạo sinh là bước tiến tự nhiên tiếp theo của việc nâng cao năng suất
- Nó cho phép chúng ta đơn giản là làm được nhiều việc hơn
Khi các studio lớn ngày càng làm ra những tựa game an toàn và bảo thủ hơn, việc trao quyền cho các nhóm nhỏ hoặc thậm chí từng cá nhân để họ tạo nên game mơ ước của mình là một điều đáng vui
Tác giả muốn xem mọi người sẽ nghĩ ra và hiện thực hóa những ý tưởng điên rồ nào khi họ có cả một studio game AI ngay trong tầm tay

Kế hoạch phía trước

Braindump mới chỉ vừa bắt đầu
Hiện tại hệ thống đã khá giỏi trong việc thực thi các "mệnh lệnh" ("tạo mèo"), nhưng nhóm biết rằng nó còn có thể mở rộng để xử lý cả những tác vụ mơ hồ hơn hoặc "lớn" hơn nhiều
Nhóm đang nghiên cứu các hướng sau
- Hỗ trợ các prompt "lớn" hơn thông qua Planning
- Khiến GPT ngừng phỏng đoán và thay vào đó yêu cầu người dùng làm rõ
- Cải thiện chất lượng code bằng cách để GPT tự phê bình công việc của mình
- Cải thiện khả năng khám phá và truyền cảm hứng ("mình có thể tạo gì với thứ này?")
- Cải thiện các tính năng của game engine theo cách phù hợp với LLM