15 điểm bởi xguru 2022-11-24 | 1 bình luận | Chia sẻ qua WhatsApp
  • Meta AI đã phát triển và công bố một trí tuệ nhân tạo thể hiện năng lực ở mức con người trong Diplomacy, trò chơi cờ chiến lược nổi tiếng
  • Trong phiên bản trực tuyến của trò chơi này, AI đã lọt vào top 10% với số điểm cao gấp hơn 2 lần con người
  • Diplomacy là một thử thách mà trong nhiều thập kỷ qua AI không thể chinh phục được
    • Trong trò chơi, cần hiểu động cơ và góc nhìn của người khác để lập kế hoạch phức tạp và điều chỉnh chiến lược
    • Đồng thời phải giao tiếp với họ bằng ngôn ngữ tự nhiên để đạt được thỏa thuận và tạo sự tin tưởng về quan hệ đối tác cũng như liên minh
    • CICERO đàm phán rất giỏi, đến mức đôi khi còn được ưa thích hơn cả những người chơi là con người khác
    • Nếu không nhận ra người khác đang bluff hoặc không hiểu hành vi mang tính tấn công, bạn sẽ nhanh chóng thua cuộc
    • Ngoài ra, nếu không nói chuyện như người thật (ví dụ thể hiện sự đồng cảm, xây dựng quan hệ, nói về hiểu biết trong game, v.v.) thì người khác sẽ không muốn hợp tác cùng
  • Cốt lõi của thành tựu này là việc phát triển công nghệ mới tại giao điểm của hai lĩnh vực AI hoàn toàn khác nhau
    • Strategic Reasoning được dùng trong các hệ thống như AlphaGo/Pluribus
    • Xử lý ngôn ngữ tự nhiên (NLP) được dùng trong các hệ thống như GPT-3/BlenderBot 3/LaMDA/OPT-175B
  • Ví dụ, ở giai đoạn cuối trận, CICERO có thể suy luận rằng mình cần sự hỗ trợ của một người chơi cụ thể, rồi lập chiến lược để giành được thiện cảm của người đó
  • Đồng thời công bố cả mã nguồn và bài báo

1 bình luận

 
xguru 2022-11-24

Diplomacy là một trò chơi board game ra mắt từ tận năm 1959, và đến năm 2008 còn có cả phiên bản kỷ niệm 50 năm. Trong game, người chơi sẽ điều khiển một trong 7 quốc gia châu Âu thuộc giai đoạn trước Thế chiến thứ nhất: Anh, Pháp, Áo-Hung, Đức, Ý, Nga và Thổ Nhĩ Kỳ. Trò chơi bắt đầu từ mùa xuân năm 1901, sau đó mỗi năm người chơi thực hiện hành động ở lượt xuân và thu. Quân đội chỉ có hai loại là lục quân và hải quân, và có thể chọn một trong các hành động như di chuyển sang khu vực lân cận (bao gồm tấn công), hỗ trợ đồng minh ở khu vực lân cận để tấn công/phòng thủ, hoặc giữ nguyên vị trí hiện tại. Tất cả đơn vị đều có sức tấn công 1 và khả năng di chuyển 1 như nhau. Tất nhiên lục quân chỉ có thể đi trên đất liền, còn có thể được vận chuyển qua biển nhờ hải quân (Convoy). Tức là chỉ có đúng 4 hành động: Hold/Move/Support/Convoy

Trên bản đồ trải dài khắp châu Âu có tổng cộng 34 khu hậu cần (Supply Center) được đánh dấu bằng ngôi sao, và ai chiếm được 18 khu sẽ thắng. Mọi quốc gia bắt đầu với 3 khu hậu cần, riêng Nga bắt đầu với 4 khu. Vì vậy ban đầu có 12 khu để trống. Sau khi kết thúc lượt thu, mỗi quốc gia có thể duy trì số đơn vị tương ứng với số khu hậu cần mình đang nắm giữ. Lực lượng xuất phát của từng nước cũng khác nhau, chẳng hạn có nước bắt đầu với 2 lục quân và 1 hải quân, có nước thì 2 hải quân và 1 lục quân. Anh, quốc gia mạnh về hải quân, bắt đầu với hải quân ở London và Edinburgh, lục quân ở Liverpool; còn Pháp bắt đầu với lục quân ở Paris và Marseilles, hải quân ở Brest. Tất nhiên Nga bắt đầu với lục quân ở Moscow/Warsaw và hải quân ở Sevastopol/Saint Petersburg. Khu vực được chia thành 3 loại: nội địa, biển và ven biển; nội địa chỉ lục quân mới chiếm được, biển chỉ hải quân, còn ven biển thì cả lục quân lẫn hải quân đều có thể chiếm.

Cách vận hành của trò chơi thực ra rất đơn giản. Hoàn toàn không có xúc xắc hay yếu tố ngẫu nhiên nào khác; ở mỗi lượt, mọi người phải thông qua đàm phán ngoại giao để tranh thủ sự giúp đỡ từ các nước xung quanh, sao cho có lợi cho việc di chuyển quân của mình. Việc ngoại giao có thể diễn ra công khai hoặc bí mật. Vì thường được chơi theo kiểu bất đồng bộ nên đôi khi cũng đặt giới hạn thời gian. Sau đó mỗi người nộp một "phiếu mệnh lệnh" cho các đơn vị của mình, master sẽ tổng hợp và xử lý tất cả. Vì thế game cũng có thể chơi theo kiểu Play By Mail, tức là gửi qua lại nội dung bằng thư. Có thể hiểu là mọi người nộp mệnh lệnh rồi cùng mở ra cùng lúc. Trong mỗi phiếu, mỗi đơn vị chỉ được nhận đúng 1 mệnh lệnh. Ví dụ, nếu Pháp có 3 đơn vị thì phiếu mệnh lệnh sẽ là "A Par–Bur, A Mar–Spa, F Bre–Pic". Nghĩa là: "di chuyển lục quân từ Paris sang Burgundy / di chuyển từ Marseilles sang Spain, hải quân từ Brest sang Picardy"

Sở dĩ phải làm vậy là vì sức mạnh của mọi đơn vị đều giống nhau ở mức 1, nhưng mỗi khu vực chỉ có đúng 1 đơn vị (quân đội) được đứng, nên nếu có tình huống 2 đơn vị cùng di chuyển vào một khu thì hành động đó sẽ bị hủy. Thứ giúp giải quyết chuyện này chính là hỗ trợ (Support) từ quân đồng minh ở khu vực lân cận. Nếu nhờ hỗ trợ mà số đơn vị tấn công nhiều hơn số đơn vị phòng thủ thì bạn sẽ chiếm được khu đó. Vì thế, muốn đạt được điều mình muốn thì phải ngoại giao thật tích cực.

"Lần này tôi định đánh vào Ukraine, cậu giúp tôi một tay nhé? Cùng tiến quân về phía tây nào"
"Không thích đâu!" / "Thế tôi được gì?"

Thực sự đây là một trò chơi mà từ đầu đến cuối, tất cả đều là "tương tác ngoại giao diễn ra thông qua đối thoại", nên việc AI có thể chơi nó một cách bài bản quả thật rất đáng kinh ngạc.