8 điểm bởi xguru 2023-02-17 | 1 bình luận | Chia sẻ qua WhatsApp
  • Nằm trong repo có tên Mctx (MCTS-in-JAX)
  • Một thư viện cực nhanh triển khai thuật toán Monte Carlo Tree Search (MCTS) theo kiểu JAX-native
    • Thuật toán tìm kiếm chọn nước đi tốt nhất trong các trò chơi theo lượt bằng quy trình "chọn → mở rộng → mô phỏng → cập nhật nút trong cây chiến lược"
  • Đây là thành phần phức tạp nhất của AlphaGo, và việc tối ưu hóa nó là cực kỳ quan trọng
  • Không chỉ dùng cho AlphaGo mà còn được sử dụng trong AlphaZero (Go, Chess, Shogi) và MuZero (AlphaZero + game Atari)

1 bình luận

 
xguru 2023-02-17

Tôi thấy tweet này trên HN: https://news.ycombinator.com/item?id=34801636
Thực ra repo này đã được công khai khoảng 1 năm rồi, và cũng có những bình luận chỉ trích rằng đây không phải toàn bộ AlphaGo nên tiêu đề hơi giật tít.
Nghe nói bản triển khai AlphaGo gốc dùng TensorFlow/TPU, còn cái này chỉ là bản tái triển khai bằng JAX.