Beyond A*: Lập kế hoạch tốt hơn bằng Transformer
- Các mô hình Transformer đã đạt được nhiều tiến bộ lớn trong nhiều lĩnh vực ứng dụng, nhưng vẫn tụt lại sau các phương pháp lập kế hoạch dựa trên ký hiệu truyền thống khi giải quyết các bài toán ra quyết định phức tạp.
- Nhóm nghiên cứu đề xuất cách huấn luyện Transformer để giải các bài toán lập kế hoạch phức tạp, đồng thời phát triển mô hình Searchformer, có thể giải tối ưu các câu đố Sokoban chưa từng thấy trước đó trong 93,7% số trường hợp, đồng thời sử dụng ít hơn tới 26,8% số bước tìm kiếm so với tìm kiếm A* truyền thống.
- Searchformer là một mô hình Transformer encoder-decoder được huấn luyện để dự đoán hành vi tìm kiếm của A*, sau đó được tinh chỉnh thông qua expert iteration để tạo ra kế hoạch tối ưu với ít bước tìm kiếm hơn A*.
Phương pháp huấn luyện và hiệu năng
- Trong phương pháp huấn luyện, hành vi tìm kiếm của A* được biểu diễn thành chuỗi token thể hiện thời điểm các trạng thái được thêm vào và loại bỏ khỏi cây tìm kiếm trong quá trình lập kế hoạch ký hiệu.
- Trong nghiên cứu ablation về điều hướng mê cung, Searchformer vượt trội đáng kể so với mô hình cơ sở dự đoán trực tiếp kế hoạch tối ưu, trong khi kích thước mô hình nhỏ hơn 5-10 lần và tập dữ liệu huấn luyện nhỏ hơn 10 lần.
- Nhóm nghiên cứu cho thấy Searchformer hiệu quả trong việc tăng tỷ lệ giải được bài toán và rút ngắn hành vi tìm kiếm đối với các tác vụ ra quyết định lớn và phức tạp hơn như Sokoban.
Ý kiến của GN⁺
- Nghiên cứu này cho thấy một khả năng ứng dụng mới của các mô hình Transformer trong lĩnh vực trí tuệ nhân tạo. Bằng cách đưa ra một cách tiếp cận hiệu quả hơn so với các phương pháp dựa trên ký hiệu hiện có trong việc giải các bài toán ra quyết định phức tạp, đây là một bước tiến quan trọng giúp mở rộng phạm vi ứng dụng của AI.
- Mô hình Searchformer cho thấy khả năng giải quyết vấn đề nhanh hơn và hiệu quả hơn với ít tài nguyên hơn. Đây có thể là một lợi thế lớn, đặc biệt khi triển khai AI trong các môi trường bị hạn chế về tài nguyên.
- Nghiên cứu này gợi ý rằng sự phát triển của công nghệ AI không nhất thiết chỉ phụ thuộc vào nhiều dữ liệu hơn và các mô hình lớn hơn, mà còn có thể đạt được thông qua các phương pháp luận thông minh hơn và những cải tiến về thuật toán. Đây là một hướng tiếp cận rất thú vị và hữu ích xét trên khía cạnh tính bền vững và hiệu quả của nghiên cứu AI.
1 bình luận
Ý kiến Hacker News