4 điểm bởi GN⁺ 2025-06-09 | 1 bình luận | Chia sẻ qua WhatsApp
  • Việc phát hành bản remaster của Oblivion đã khiến công nghệ Radiant AI từ 19 năm trước lại trở thành chủ đề nóng
  • Bethesda từng hứa rằng AI này sẽ mang đến hành vi tự chủ của NPC và lịch trình chân thực, nhưng trên thực tế việc triển khai bị giới hạn
  • Trong các bài giới thiệu trước phát hành, demo E3 và phỏng vấn với fan, đã xuất hiện khoảng cách giữa quảng bá cường điệu và thực tế
  • Hệ thống thực tế được triển khai là một cơ chế gói AI dựa trên mục tiêu, thiết kế hành vi xoay quanh lịch trình hơn là các nhu cầu phức tạp hay quyền tự chủ thực sự
  • Nhân dịp bản remaster, các cuộc thảo luận về lịch sử phát triển và giới hạn của AI trong game đang tăng lên

Mở đầu: Bản remaster Oblivion và di sản

  • Khi The Elder Scrolls IV: Oblivion Remastered ra mắt, sự quan tâm tới RPG kinh điển của Bethesda lại tăng lên
  • Bản remaster sử dụng Unreal Engine 5 để nâng cấp toàn diện đồ họa và một phần UI, nhưng game engine và nội dung thực tế vẫn giữ nguyên cấu trúc của bản gốc năm 2006
  • Ở thời điểm đó, Oblivion được kỳ vọng lớn nhờ thế giới mở đầy tham vọng, AI NPC mang tính đột phá và lồng tiếng toàn phần
  • Trọng tâm chú ý là Radiant AI mà Bethesda quảng bá, với lời hứa NPC sẽ hành xử như trong thế giới thực
  • Bài viết này khám phá nội dung thực sự của công nghệ đó, cách nó được triển khai, sự khác biệt giữa lời hứa và thực tế, cũng như vị trí của nó hiện nay

Thời kỳ Morrowind: Môi trường AI của Bethesda trước đó

  • Morrowind tập trung vào thế giới được làm thủ công, nhưng gần như không có lịch trình cố định hay hành vi AI
  • NPC chủ yếu đứng yên tại chỗ và chỉ thay đổi hành vi khi tương tác với người chơi
  • Những đối thủ cùng thời như Ultima, Arcanum, Gothic đã cung cấp hành vi NPC dựa trên lịch trình
  • Bethesda muốn bù đắp hạn chế này trong Oblivion bằng một hệ thống AI mang tính đột phá

Lời hứa: Quảng bá trước phát hành và demo E3

Bài viết chính thức và phát ngôn quảng bá

  • Từ năm 2004, Bethesda giới thiệu với báo chí rằng Oblivion có 1.000 NPC, mỗi người đều có mục tiêu và lịch trình độc lập
  • Họ nhấn mạnh rằng mỗi NPC được trao "mục tiêu" và sẽ "tự mình đạt được bằng nhiều cách khác nhau" (ví dụ: nếu không có tiền thì ăn cắp thức ăn, đi săn, hoặc trộm của người chơi)
  • Các cuộc trò chuyện không có script giữa NPC và sinh hoạt hằng ngày tự do cũng nằm trong các lời hứa đó

Demo E3 2005

  • Trong phần demo do chính Todd Howard trình bày, đã có các ví dụ về việc NPC luyện bắn cung, dùng thuốc khi cần và tự chủ thực hiện nhiều hành động khác nhau
  • Các kịch bản như NPC mua thức ăn, ăn cắp, hoặc kiếm được nhờ làm nông tùy theo nhu cầu cũng được trình diễn
  • Demo này nhấn mạnh ấn tượng rằng mỗi NPC sẽ tự động quyết định động cơ và cách hành động nhờ AI

Phỏng vấn fan và giải thích từ nhà phát triển

  • Trên diễn đàn chính thức và trong các AMA (Ask Me Anything), đội ngũ phát triển nhấn mạnh đây là "trí tuệ nhân tạo dựa trên mục tiêu-quy tắc"
  • Họ giải thích rằng khi nhà thiết kế đặt mục tiêu và các đặc tính (tinh thần trách nhiệm, độ hiếu chiến, sự tự tin...), đó sẽ là hệ thống thay đổi hành vi theo tình huống
  • Cũng có những giai thoại cho biết trong quá trình thử nghiệm phát triển, AI hoạt động quá thông minh làm hỏng cân bằng quest hoặc tạo ra hành vi khó lường (giết người, lừa đảo) xảy ra thường xuyên

Trích dẫn chưa được xác nhận và các trường hợp AI gặp vấn đề

  • Trong cộng đồng fan, nhiều câu chuyện lan truyền rằng trong giai đoạn thử nghiệm, NPC đã có những hành vi ngoài ý muốn như chiếm đoạt vật phẩm cần thiết, lính canh bỏ vị trí, cướp sạch cửa hàng
  • Nhà phát triển đã cố tình giảm mức độ các tính năng AI này hoặc điều chỉnh thiết lập của từng NPC để giữ cho trải nghiệm chơi ổn định

Phát hành và phản ứng

  • Oblivion thành công lớn về mặt thương mại, nhưng sau khi phát hành cũng có nhiều chỉ trích về khoảng cách giữa lời hứa AI và thực tế
  • Nhiều ý kiến cho rằng thay vì hành vi NPC phức tạp, thứ nổi bật trên thực tế lại là các mẫu hành vi và hội thoại lặp lại, đơn giản

Radiant AI thực chất là gì?

  • Radiant AI không liên quan tới AI tạo sinh, LLM hay mạng nơ-ron ngày nay, mà là một hệ thống trí tuệ nhân tạo truyền thống, không thời gian thực, dựa trên mục tiêu/quy tắc
  • Trên thực tế, đây không phải một cấu trúc kỹ thuật duy nhất mà là một khái niệm tích hợp nhiều thành phần như hệ thống nhân vật mở rộng, hệ thống gói AI và hệ thống hội thoại
  • Trong đó, hệ thống gói mới là phần lõi quan trọng nhất, chịu trách nhiệm vận hành lịch trình và mẫu hành vi của NPC

Đặc tính nhân vật và biến hành vi

  • Mọi NPC/sinh vật (actor) trong Oblivion đều có các chỉ số, kho đồ, kỹ năng và phe phái tương tự người chơi
  • Những thuộc tính AI quan trọng nhất gồm:
    • Disposition (mức thiện cảm): chỉ số thân thiện/thù địch với nhân vật khác, ảnh hưởng đến hành vi
    • Aggression (độ hiếu chiến): quyết định mức độ dễ trở nên thù địch
    • Confidence (sự tự tin): quyết định khi nào sẽ bỏ chạy trong chiến đấu
    • Energy (năng lượng): ảnh hưởng đến tần suất các hành vi di chuyển như Wandering
    • Responsibility (tinh thần trách nhiệm): quyết định mức độ tuân thủ pháp luật và thái độ với hành vi phạm tội
  • NPC trong Oblivion không có các nhu cầu thực sự kiểu The Sims (đói/ngủ...). Giới hạn ở đây là “họ hành động theo lịch, nhưng không có hình phạt nếu không tuân theo, cũng không có nhu cầu tự chủ thực sự”

Hệ thống gói AI

  • Mỗi NPC được gán một hoặc nhiều gói để xác định cách hành động và lịch trình
  • Có nhiều loại gói như Travel (di chuyển), Wander (đi lại ngẫu nhiên), Find (tìm đối tượng/vật phẩm), Eat (ăn), UseItemAt (sử dụng vật phẩm), Sleep (ngủ) v.v.
  • Một số gói như Find và Eat có thể gây ra hành vi phạm tội (trộm cắp, cướp bóc) tùy theo thuộc tính Responsibility
  • Trên thực tế, nhiều giai thoại AI ngoài dự đoán (cướp cửa hàng, đi săn, NPC đánh nhau với nhau...) bắt nguồn từ sự kết hợp giữa các gói và thuộc tính này

Lịch trình/điều kiện của gói AI

  • Mỗi gói có thời gian biểu kích hoạt và biểu thức điều kiện, tự động chuyển đổi theo lịch trình và tình huống trong game
  • Điều kiện được biểu diễn bằng các tổ hợp và phép so sánh của nhiều giá trị hàm trạng thái actor/thế giới/người chơi, cho phép thiết kế hành vi NPC dựa trên ngữ cảnh phức hợp
  • Điều này mang lại ưu điểm là nhà thiết kế có thể xây dựng các mẫu sinh hoạt nhất quán mà không cần script phức tạp

Kết luận

  • Radiant AI là khẩu hiệu công nghệ chủ chốt mà Bethesda đưa ra khi hứa hẹn một thế giới game chân thực và các NPC tự chủ
  • Cách triển khai thực tế là một hệ thống gói AI dựa trên mục tiêu-quy tắc, được thiết kế để NPC thể hiện nhiều hành vi khác nhau trong các lịch trình và điều kiện định sẵn
  • Trong thử nghiệm nội bộ, hệ thống từng cho thấy nhiều hành vi tự chủ đáng kinh ngạc và khó lường, nhưng khi phát hành chính thức, phần lớn đã bị giới hạn hoặc điều chỉnh vì trải nghiệm người chơi và vấn đề cân bằng
  • Sau phát hành, fan và cộng đồng modder vẫn tiếp tục thảo luận về giới hạn cũng như cách hệ thống này vận hành thực tế
  • Nhờ Oblivion Remaster, những vấn đề về sự phát triển và giới hạn của AI trong game, cũng như cân bằng trong thiết kế game như Radiant AI đang một lần nữa được chú ý

1 bình luận

 
GN⁺ 2025-06-09
Ý kiến trên Hacker News
  • Tôi nghĩ cách triển khai gần nhất với Radiant AI là Dwarf Fortress. Những hệ thống AI game hoàn toàn định hướng theo mục tiêu và khó đoán như thế này xung đột với lối chơi dựa trên cốt truyện. Game lấy cốt truyện làm trung tâm cần có kết quả mang tính quyết định và người chơi phải là nhân vật chính. Trong khi đó, Dwarf Fortress không có cốt truyện định sẵn cũng không có một nhân vật người chơi cần được bảo vệ. Việc cả pháo đài bị xóa sổ vì những sự cố phi lý đến mức khó tin chính là một phần lớn của niềm vui

    • Có một game tương tự Dwarf Fortress là Song of Syx. Nó dễ tiếp cận hơn DF rất nhiều và xử lý đồng thời tới 20.000 thực thể. Bản đồ thế giới cũng rất lớn và người chơi chỉ điều khiển một phe trong số nhiều phe. Từng thực thể riêng lẻ cũng đều được mô hình hóa trong Song of Syx (dù không chi tiết bằng DF)
      Songs of Syx on Steam
    • Tôi cũng nghĩ tương tự. Tôi rất tò mò muốn biết thế giới sẽ ra sao nếu để kiểu mô phỏng này chạy 100 giờ. Nếu một nửa dân làng bị lính canh giết và chủ cửa hàng biến mất thì game sẽ không còn vận hành đúng nữa. Emergent behavior xuất hiện trong các mô phỏng phức tạp rất khó tinh chỉnh. Một vấn đề tinh tế khác là mọi NPC đều phải luôn hoạt động. Phải nhét một lượng thực thể khổng lồ vào ngân sách CPU của 1 frame. Những thứ như pathfinding hay tương tác với vật thể cũng chỉ khả thi khi thông tin về toàn bộ thế giới (vị trí vật thể, bản đồ đường đi, v.v.) luôn được giữ trong bộ nhớ. Với PC năm 2005 thì đó thực sự là một thử thách lớn
    • Sau Oblivion thì có những game như Divinity: Original Sin 1,2, nơi gần như bạn có thể giết mọi nhân vật mà vẫn hoàn thành game. NPC quan trọng cũng có thể dùng cờ essential để không chết vì tai nạn, trừ khi người chơi trực tiếp solo hạ họ. Radiant AI cũng có thể đơn giản là không áp dụng cho các NPC quan trọng về cốt truyện. Thực ra điểm mạnh lớn nhất của game Bethesda chưa bao giờ là cốt truyện chính
    • Một số phần của series Ultima và cả Morrowind cũng từng mô phỏng các thói quen thường ngày của NPC như “ngủ, mở cửa hàng, thăm gia đình, đi khám phá”
    • Tôi nghĩ có thể biểu diễn hiện tượng này bằng toán học. Tôi muốn lấy khái niệm Radiant Economy mà Todd Howard từng nói tới, dựng nó thành một hệ động lực hay mô hình game theory, rồi chứng minh xem về dài hạn có phải cuối cùng ai cũng thành trắng tay hoặc thành tỷ phú hay không
  • Nhân nói về việc bác bỏ giai thoại NPC người bán skooma bị giết, có một chi tiết quan trọng đã bị bỏ sót. Không phải toàn bộ người nghiện skooma đều ở trong căn chòi. Trên world map còn có hai NPC riêng đi qua lại giữa các thành phố để tìm căn chòi đó. Nhưng do bug, các NPC này bị gán sai faction nên không thể đi qua cửa, thành ra nếu người chơi không mở cửa giúp thì họ sẽ đứng ngoài uống skooma cả đời
    Liên kết wiki liên quan

    • Thông tin thú vị đấy. Tôi đã xem AI package của cả ba NPC, và trong game gốc thì họ không hề mang theo skooma cũng không đi tìm skooma. Xét theo thoại và environmental storytelling thì họ là con nghiện, nhưng về mặt kỹ thuật thì không phải. Việc họ đứng lại bên ngoài căn chòi là có thật. Nhưng nguyên nhân không phải do faction mà đơn giản là họ không có chìa khóa để vào
  • Sau khi chơi Starfield, giờ tôi không còn kỳ vọng Bethesda sẽ làm ra điều gì đặc biệt nữa. Từ thời Oblivion đến Starfield, họ đã chuyển từ cảm giác một studio nhỏ dám chấp nhận rủi ro để tạo ra niềm vui độc đáo thành một studio AAA an toàn và dễ đoán. Radiant AI giờ cũng chỉ được dùng cho trò “nhiệm vụ lặp vô hạn với nội dung X * Y”, trong khi mục tiêu thực sự ban đầu là thổi sức sống vào thế giới. Nếu muốn thấy cùng một ý tưởng đó, tôi khuyên nên chơi Dwarf Fortress. Thế giới DF có một lịch sử được hình thành từ hàng nghìn tương tác kiểu Radiant AI trước khi người chơi bước vào, rồi sau đó người chơi trở thành một phần của thế giới ấy. Nếu thêm nhân vật/hội thoại dựa trên LLM vào thì tôi nghĩ cảm giác sống động sẽ còn mạnh hơn nhiều

    • Theo tôi, Starfield là ví dụ rất rõ cho thấy hoặc là đội ngũ phát triển không hiểu điều gì làm nên sức hút của các game cũ, hoặc là không có đủ lãnh đạo để ngăn những quyết định tệ. Các game TES gần đây như Skyrim, FO4 lấy môi trường/storytelling, khám phá, chiến đấu và chế tạo làm cốt lõi. Nhưng Starfield lại tạo hàng trăm hành tinh theo kiểu procedural, và kết quả là chẳng có gì đáng xem. Environmental storytelling cũng không thể làm được. Khám phá thì chỉ toàn chuỗi màn hình loading. Thật khó tin là không ai ngăn lại một concept game sai từ gốc như vậy. Nếu Bethesda không hiểu cốt lõi thành công của chính mình thì làm sequel cũng sẽ rất khó
    • Thất bại lớn nhất của Starfield là thiếu sáng tạo. Cốt truyện, lời thoại, diễn xuất, ở khía cạnh nào cũng không có gì hấp dẫn. Đây không phải vấn đề kỹ thuật kiểu game engine mà là chỗ cần một cá tính sáng tạo mạnh mẽ. Những game như RDR2 hay Witcher 3 có cá tính rất rõ, còn Starfield thì mang phong cách Corporate Memphis nhạt nhẽo
    • Chiến lược dùng AI để tạo vô hạn các quest nhạt nhẽo thì chẳng có đối tượng khán giả nào cả. Với người chơi chỉ kết thúc game 1-2 lần thì đó không phải thứ họ quan tâm, còn những ai muốn nhiều hơn thì sẽ dùng mod cộng đồng. Cuối cùng nó chỉ làm tăng thêm những vòng lặp vô nghĩa kiểu “vào hang giết quái” mà thôi
    • Starfield cũng bị chê quá tay so với mức nó đáng bị chê. Đúng là nó không có kiểu cứ mỗi 100 feet lại có thứ gì đó để quan sát hay tương tác như Fallout 4, nên thế giới có cảm giác trống trải. Nhưng tôi thấy đây là một thay đổi có chủ đích. Thực ra nó gần với người kế thừa tinh thần của Daggerfall hơn. Tôi chơi ít hơn so với các game Bethesda cũ, nhưng ngược lại thỉnh thoảng vẫn có những thứ mới mẻ. Tôi nghĩ kiểu thay đổi này vẫn cần thiết hơn là cứ lặp đi lặp lại cùng một công thức mãi
    • Từ Morrowind tới Starfield, tôi cho rằng Oblivion thậm chí còn là một bước thụt lùi so với Morrowind, như về bản sắc nghệ thuật, việc lạm dụng map marker, hay làm nông độ sâu cốt truyện
  • Với tư cách là fan Bethesda đã chơi Fallout và Skyrim hàng nghìn giờ, tôi thấy bài viết này cực kỳ thú vị. Tôi đặc biệt thích cách tác giả trực tiếp tạo NPC để thử nghiệm trong nhiều tình huống khác nhau. Gần đây tôi mới lần đầu chơi Oblivion remaster, và thấy các tương tác NPC cùng độ sống động ở đó còn hợp gu tôi hơn các phần sau. Tôi cũng đồng ý với giải thích rằng cảnh Todd Howard từng nói, nơi một NPC nhặt dao găm giữa trận rồi dùng nó đánh lại đối thủ, thật ra không thể xảy ra trong game nếu không có script. Tuy vậy, tôi từng thấy chuyện tương tự trong Fallout 3. Một sự cố liên quan đến NPC đã tác động đến vũ khí tôi cất trong nhà ở Megaton (một cell riêng), và đó là lý do cuối cùng khiến tôi cài mod đổi nhà rồi học G.E.C.K. để tự sửa

    • Giai thoại thú vị đấy. Nhưng theo cấu trúc hệ thống thì NPC không thể truy cập cell bên trong nhà của người chơi, nên tình huống đó không thể xảy ra. Theo kiến trúc engine, khi bạn ở bên ngoài thì nội thất căn nhà không được nạp vào bộ nhớ, và điều này giống nhau ở toàn bộ series. Nếu bạn có bằng chứng ngược lại thì tôi rất muốn xem
  • Tôi nhớ từng suýt chết ngoài hoang dã khi chơi Gothic, rồi một NPC cốt lõi tình cờ xuất hiện và giết con thú giúp tôi. NPC đó mỗi ngày di chuyển qua lại giữa hai trại, và đúng lúc ấy anh ta ở gần vị trí đó nên mới can thiệp. AI thật sự rất ấn tượng, đồng thời cũng vận hành theo kiểu xuất hiện và tương tác khi đi vào trong bán kính. Tôi từng nghĩ giá mà Radiant AI được làm theo kiểu đó thì hay biết mấy

    • Oblivion cũng có khá nhiều NPC với lịch trình phức tạp đi lại giữa các thành phố. Ví dụ nổi tiếng nhất là nữ bá tước Leyawin, người mỗi tháng một lần đến Chorrol thăm mẹ cùng đoàn hộ vệ
    • Radiant AI hoạt động đúng theo kiểu đó. Game luôn giữ global path graph theo từng cell trong bộ nhớ, và mô phỏng việc di chuyển của NPC ngay cả ở những khu vực chưa được load
  • Nghe giai thoại thời kỳ đầu của Radiant AI kiểu “ai cũng trộm cắp rồi bị bỏ tù hoặc chết”, tôi bắt đầu cảm thấy các đặc tính dưới đây có quan hệ xung đột với nhau:
    – Luôn phải có đủ nhân vật thú vị
    – Với mô phỏng trực tiếp + emergent behavior, các nhân vật có thể biến mất
    – Không có ai mới đến hoặc rời khỏi thị trấn

    • Vấn đề “luôn có đủ nhân vật thú vị” có thể giải bằng một hệ thống chuyển giao vai trò cho người kế nhiệm khi NPC quan trọng chết. Đồng thời, bản thân thế giới cũng không được là nơi sát nhân đầy rẫy, và phải thật sự tồn tại một nền kinh tế khép kín. Cũng có nhắc đến giới hạn phải nhét dữ liệu giọng nói vào một chiếc DVD duy nhất (mà chuyện chuyển giao vai trò còn làm vấn đề nặng thêm), nhưng nếu tổng hợp giọng nói bằng AI sau này giải quyết đủ tốt ở mức chi tiết thì có thể thật sự xử lý được bài toán voice-over. Dù vậy, sự gượng gạo của tạo phẩm nhân tạo có khi lại là vấn đề lớn hơn. Có lẽ cách phù hợp là chỉ xử lý ở mức từng từ, chuyển text -> phoneme
    • Về bản chất, “mức độ mô phỏng/hiện thực nào đó” và “mật độ sự kiện theo giờ đủ để đáp ứng kỳ vọng người chơi” không thể cùng tồn tại hài hòa. Trong một hệ thống xã hội vận hành lành mạnh, không thể liên tục tạo ra các sự kiện như tù tội, tình ái, bắt cóc, hôn nhân, ghen tuông, âm mưu... với tốc độ đó được. Đó cũng là lý do các series TV càng nhiều mùa thì càng trở nên kỳ quặc. Dwarf Fortress xử lý bằng cách mở rộng quy mô bối cảnh hơn nữa (tăng số lượng nhân vật), đồng thời cường điệu năng suất bằng yếu tố fantasy. Ví dụ, để 1 dwarf có thể bán thời gian chăm một khu nấm 25㎡ mà nuôi sống được 15 người
  • Đọc bài xong lại khiến tôi tò mò về sự kết hợp giữa AI hiện đại và mô phỏng thế giới mở. Không chỉ là đồ họa đẹp, mà là NPC thật sự biết suy luận. Ví dụ như tương tác mặc cả giá bia ale với NPC ở quán trọ trong World of Warcraft. Tôi rất muốn thấy điều đó

    • Tôi thấy thú vị hơn ở hướng AI điều phối toàn bộ scene và phối hợp phản ứng của nhiều nhân vật, hơn là chỉ nối chatbot vào. Tức là AI cấp cao không trực tiếp làm từng nhân vật trở nên thông minh hơn, mà hoạt động như một dungeon master để tạo ra phản ứng nhất quán trên toàn thế giới trước hành động của người chơi
    • Không thể kiểm soát phát ngôn lạc đề với độ chính xác 100%. Ví dụ, bạn có thể hỏi NPC về chính trị Mỹ và nó vẫn trả lời được. Ngay cả khi chặn hội thoại tự do thì vẫn sẽ có rất nhiều câu nói kỳ quặc làm tụt immersion. Chưa kể chi phí token cũng là vấn đề
    • “Hallucination” của LLM có thể không phải nhược điểm mà ngược lại còn là yếu tố đem lại niềm vui trong một số trường hợp
    • Tôi vẫn thích bấm một nút là nhận bia ale hơn. Muốn cãi nhau thì tôi lên mạng. Chắc chắn game dùng AI sẽ có chỗ đứng riêng, nhưng không nhất thiết phải lấp đầy toàn bộ trải nghiệm game. Hội thoại viết sẵn về lâu dài vẫn vui hơn
  • Tôi nhớ cụm từ Radiant AI từ thời marketing Oblivion khoảng năm 2005. Với tôi nó cũng ấn tượng đến vậy. Có hype và cũng có thất vọng, nhưng vẫn còn cảm giác tiếc nuối rằng nếu nó được triển khai thật sự thì đã là một tính năng cực kỳ tuyệt

  • “Hail.”
    “Tôi có nghe rằng người Nord ở Skyrim đã giao chiến với nhà Redoran của Morrowind.”
    “Có vẻ đây là thời kỳ đầy biến động trên vùng đất của người Dunmer.”
    “Đừng nói nữa!”
    “Bảo trọng”

  • Đây là một bài viết thú vị được nghiên cứu cực kỳ công phu. Cảm ơn tác giả vì đã làm khối lượng điều tra đồ sộ này. Nó bóc tách được thứ “trường làm méo thực tại” rất đặc trưng của Todd Howard, để thấy từ bản demo E3 2005 nổi tiếng tới sản phẩm phát hành thực tế đã thay đổi như thế nào

    • Cảm ơn vì lời khen! Tôi đã dành hơn 2 tuần thời gian rảnh cho việc nghiên cứu và viết, nhưng cuối cùng cảm thấy đó là một trải nghiệm rất đáng giá