2 điểm bởi GN⁺ 2024-10-19 | 1 bình luận | Chia sẻ qua WhatsApp

Không cần thuật toán ở cấp độ đại kiện tướng cờ vua

  • Kho lưu trữ này cung cấp phần triển khai cho bài báo "Không cần thuật toán ở cấp độ đại kiện tướng cờ vua"
  • Thành công gần đây của machine learning chủ yếu đến từ các kiến trúc dựa trên attention quy mô lớn và các bộ dữ liệu ở quy mô chưa từng có
  • Bài báo này khảo sát tác động của việc huấn luyện quy mô lớn đối với cờ vua
  • Khác với các engine cờ vua truyền thống, mô hình không phụ thuộc vào heuristic phức tạp hay tìm kiếm tường minh
  • Một mô hình transformer với 270 triệu tham số được huấn luyện có giám sát trên bộ dữ liệu 10 triệu ván cờ vua
  • Sử dụng giá trị hành động từ engine Stockfish 16 để chú thích cho từng bàn cờ, tạo ra khoảng 15 tỷ điểm dữ liệu
  • Mô hình lớn nhất đạt Elo blitz 2895 trên Lichess khi đấu với con người và giải được các thế cờ đố khó mà không cần thuật toán tìm kiếm tường minh
  • Vượt qua mạng policy và value của AlphaZero (không dùng tìm kiếm) và GPT-3.5-turbo-instruct
  • Thông qua khảo sát có hệ thống về kích thước mô hình và bộ dữ liệu, bài báo cho thấy năng lực chơi cờ mạnh chỉ xuất hiện ở quy mô đủ lớn
  • Đã thực hiện các thí nghiệm diện rộng về lựa chọn thiết kế và siêu tham số để kiểm chứng kết quả

Tóm tắt của GN⁺

  • Dự án này là một nghiên cứu quan trọng cho thấy có thể đạt hiệu năng cao trong cờ vua mà không cần các thuật toán tìm kiếm truyền thống
  • Khai thác bộ dữ liệu quy mô lớn và mô hình transformer để khám phá những khả năng mới cho engine cờ vua
  • Cho thấy hiệu năng tốt hơn khi so sánh với các engine cờ vua mạnh hiện có như AlphaZero
  • Cung cấp thông tin thú vị và hữu ích cho những người quan tâm đến cờ vua, đồng thời gợi mở các khả năng ứng dụng mới của machine learning
  • Các dự án có chức năng tương tự gồm AlphaZero và Leela Chess Zero

1 bình luận

 
GN⁺ 2024-10-19
Ý kiến trên Hacker News
  • Khó tìm được đối thủ cờ vua có trình độ đúng như người dùng mong muốn. Phần lớn engine giảm độ sâu tìm kiếm để hạ độ khó, nhưng cách này không hiệu quả

    • Người dùng muốn một đối thủ máy tính mang lại cảm giác như đang chơi với con người
  • Một người dùng đã có bài thuyết trình về chưng cất tri thức liên quan đến cờ vua, giải thích cách chưng cất các chức năng tìm kiếm phi tuyến phức tạp thành mô hình transformer gần tuyến tính cho đầu vào chuẩn như cờ vua

  • Với những ai quan tâm đến mạng nơ-ron cờ vua, có một kho GitHub được khuyến nghị vì cung cấp mã dễ tiếp cận dùng PyTorch và kiến trúc tương tự mạng nơ-ron cờ vua đang có hiệu năng hàng đầu hiện nay

  • Có một bài viết trên blog so sánh mạng LC0 với mạng transformer của DeepMind

  • Bài báo "Grandmaster-Level Chess Without Search" nhấn mạnh tầm quan trọng của kiến trúc dựa trên attention quy mô lớn và bộ dữ liệu lớn, đồng thời huấn luyện cờ vua bằng mô hình transformer 270M tham số

    • Sử dụng engine Stockfish 16 để tạo ra hơn 1 tỷ điểm dữ liệu và đạt Elo blitz 2895 trên Lichess khi đấu với con người
    • Vượt qua mạng policy và value của AlphaZero
  • Bộ dữ liệu tổng hợp quy mô lớn được tạo ra bằng cách dùng tìm kiếm truyền thống, điều này tương đương với việc mã hóa cây tìm kiếm vào mô hình transformer

  • Matthew Sadler đã thiết lập Leela Zero để chơi theo trực giác, và cách này vẫn huấn luyện ván đấu hiệu quả ngay cả khi không có tìm kiếm

  • Khi giải cờ vua sẽ tạo ra một cây quá lớn, và có hai hướng tiếp cận để tối ưu hóa điều này

    • Xấp xỉ cây và xấp xỉ phần chú giải
    • Có thể xấp xỉ cây bằng dữ liệu 270M từ
  • Chuỗi FEN được chuyển thành chuỗi độ dài cố định để mã hóa trạng thái bàn cờ, và hành động được lưu bằng ký pháp UCI

    • Nếu phải viết lại tokenizer cho mỗi biến thể của bài toán thì đó chỉ là lập trình đơn thuần