撰文丨王聪

编辑丨王多鱼

排版丨水成文

生成式人工智能(Generative AI)在创意领域的受欢迎度不断上升,其有潜力通过支持人类的创意创意-新想法的产生来改造创意产业。然而,模型能力的限制提出了将这些技术更充分地集成到创造性实践中的关键挑战。迭代调整和发散性思维是利用技术实现创造力支持的关键,但这些实践没有得到最先进的生成式人工智能模型的充分支持。

电子游戏在娱乐产业中占据了最大份额,全球有数十亿人玩和购买电子游戏。而生成式人工智能在电子游戏开发中的作用一直有待明确。

2025年2月19日,微软研究院的研究人员在国际电镜学术期刊Nature上发表了题为:World and Human Action Models towards gameplay ideation 的研究论文。

该研究以电子游戏开发为切入点,揭示了如何通过精准把握用户需求来驱动生成式人工智能模型的开发与评估,使其与创意工作流深度契合。研究团队研究开发了一个可协助电子游戏设计师迭代设计游戏的生成式人工智能模型——“世界与人类行动模型”(World and Human Action Model,WHAM),其生成的稳健三维世界能遵循设计用于电子游戏的机制。

这项突破为构建真正智能化的创意增强系统奠定了技术基础,预示着人机协同创作新时代的到来。


生成式人工智能正通过赋能人类创意构思 (新想法的生成过程) 来重塑创意产业格局。然而,现有模型的能力局限为其深度融入创意实践带来了关键挑战。

为了理解电子游戏开发者的需求,研究团队采访了创意团队的 27 名电子游戏设计师。这些设计师认为当前用于打造电子游戏的 AI 方案缺乏生成许多不同创意(发散性思维)的能力。他们还强调了通过设计过程来持续微调游戏各方面(迭代实践)的重要性。

也就是说,当前即使最先进的生成式人工智能模型(例如GPT-4、Stable Diffusion)在生成创意方面也存在着几点挑战——

迭代优化支持不足:缺乏对"设计-测试-修正"循环工作流的系统性支持;

发散思维受限:在跨模态概念联想(例如将叙事元素转化为关卡机制)方面的表现显著低于人类设计师水平;

修改持久化缺失:用户对生成内容的调整无法有效反馈至模型知识库,导致重复劳动率高达 62%。

随后,研究团队开发了名为“世界与人类行动模型” (World and Human Action Model,WHAM) 的生成式人工智能模型模型,该模型使用了 3D 多玩家战斗模拟器《嗜血边缘》(Bleeding Edge)中七年的人类玩家体验进行训练。


WHAM概述

研究团队发现,WHAM 或能设计出符合《嗜血边缘》预存在机制的复杂 3D 电子游戏序列,其关卡设计具有明显的多样性,且创意人员可对输出进行迭代调整。研究团队还开发了 WHAM 示范器,作为供用户操作和自定义 WHAM 输出的一个可视化界面。

考虑到由于 WHAM 仅通过玩游戏的训练就能学会生成序列,无需任何先前知识,这个工具或能轻松转换用于生成来自其他电子游戏的关卡。

研究团队指出,WHAM 一类的生成式人工智能工具可能无法作为设计过程的终点,而应该作为一个辅助人类游戏设计师的工具。对该方法的进一步研究或有助于分析创意团队可以在设计流程的不同阶段如何使用 WHAM。

总的来说,该研究我们开发的世界与人类行为模型(WHAM)实现了三大关键创新:

一致性:通过分层状态机架构,确保生成的游戏玩法序列在物理规则和叙事逻辑两个维度保持内在一致性;


一致性结果

多样性:采用潜在空间扰动技术,使关卡设计方案的创意发散度提升 3.2 倍;


多样性结果

持久性:能够在生成过程中持久化用户的修改,通过建立动态知识图谱系统,可将用户调整内容的 83% 有效转化为模型参数更新。


编辑流程与定性持久性结果

相较于需要人工定义领域结构的传统创意支持工具(例如Procedural Content Generation算法),生成式人工智能通过数据驱动的结构学习展现出更广泛的应用潜力。WHAM 模型在 3A 游戏原型开发中的实测表明,其可将概念设计阶段耗时缩短 58%,同时提升跨部门协同效率 41%。这项突破为构建真正智能化的创意增强系统奠定了技术基础,预示着人机协同创作新时代的到来。

论文链接

https://www.nature.com/articles/s41586-025-08600-3

ad1 webp
ad2 webp
ad1 webp
ad2 webp