一、GameFactory 的定义
香港大学与快手科技合作的项目中,GameFactory 于 2025 年被提出,是一个创新框架,旨在解决游戏视频生成中的场景泛化难题。在传统游戏开发概念里,也存在名为 The GameFactory(The Games Factory)的软件或平台,例如 The GameFactory 是专为游戏开发爱好者定制的软件,The Games Factory 是多功能游戏开发工具,能助用户在短时间内完成游戏设计与发布。
二、不同概念下的功能
(一)作为解决游戏视频场景泛化的框架
在游戏视频生成领域,场景泛化(即创造新游戏场景的能力)一直是挑战。尽管大规模动作标注视频数据集可应对,但成本高且对开放域场景不实用,GameFactory 框架应运而生。它利用开放域视频数据上预训练的视频扩散模型(从 U - Net 架构发展到基于 Transformer 的架构,能生成更逼真、时长更长的视频),克服现有方法对特定游戏数据集的依赖。
GameFactory 采用独特的三阶段训练策略:
-
第一阶段通过 LoRA 微调预训练模型以适应目标游戏领域,保留大部分原始参数。
-
第二阶段冻结预训练参数和 LoRA,专注训练动作控制模块,避免风格与控制纠缠。
-
第三阶段移除 LoRA 权重,保留动作控制模块参数,使系统能在开放域场景生成受控游戏视频。
同时,研究评估不同控制机制,发现交叉注意力机制处理离散控制信号优于拼接方法,拼接方法处理连续鼠标移动信号更有效,框架支持自回归动作控制,能生成无限长度交互式游戏视频。研究人员还发布高质量动作标注视频数据集 GF - Minecraft 用于训练和评估。
(二)作为游戏创作平台(以 The GameFactory 为例)
-
图形化编程:降低编程门槛,采用事件驱动的图形化编程,用户拖放操作即可确立游戏逻辑流程。
-
资源管理:内置资源编辑器,方便导入和编辑图像、声音、动画等素材,为游戏创建提供便利。
-
物理引擎:集成物理引擎,让游戏场景更真实,如物体下落、碰撞检测等,增强游戏真实感和互动性。
-
多层地图编辑:支持多层地图编辑,构建复杂游戏空间,如设计城堡关卡时分层设置元素和机关。
-
角色与对象:提供角色和对象库,含预设动作和行为,直接用于游戏,节省开发时间。
-
脚本支持:支持 Lua 脚本,为有经验开发者提供更多发挥空间,实现特殊技能效果等复杂功能。
三、应用场景
(一)游戏视频创作领域(针对 GameFactory 框架)
-
新游戏场景拓展:在游戏开发前期,GameFactory 框架能创造新场景,如为沙盒类游戏增加特殊地形或气候场景,节省开发成本和时间。
-
不同游戏类型的通用场景生成:适用于多种游戏类型,生成多样化场景,支持不同类型控制,创建交互式游戏视频,提供不同体验。
-
优化现有游戏视频:对已有游戏项目的视频资源进行补充和优化,如在探险游戏中增加遗迹或陷阱场景。
(二)游戏开发创作领域(以 The GameFactory 为例)
-
独立游戏开发者的创作工具:为资源有限的独立开发者提供便利,帮助制作风格独特的 2D 街机游戏等,快速创建框架并优化。
-
教育领域的游戏编程教学:适合作为教学工具,引导学生理解游戏开发概念,创建简单游戏模型,如猜数字或走迷宫游戏。
-
创意者快速验证游戏想法:为有创意的人提供快速验证平台,如制作宠物养成类游戏原型,测试和改进基本玩法逻辑。
四、发展历程
(一)GameFactory 框架的发展
在视频生成和游戏物理学发展的背景下,从早期的 U - Net 架构到基于 Transformer 的架构,相关方法在相机控制方面不断进步。
此前游戏领域项目如 DIAMOND、GameNGen 和 PlayGen 等存在对特定游戏和数据集过度拟合、场景泛化能力有限的问题。2025 年,香港大学和快手科技组建团队提出 GameFactory 框架,从借鉴优势到设计训练策略,再到探索控制机制和发布数据集,不断突破游戏视频场景生成的局限。
(二)The GameFactory(游戏开发软件)的发展
为降低游戏编程门槛,The GameFactory 应运而生,采用图形化编程等方式吸引用户。
功能不断完善,从基础资源管理到优化物理引擎和多层地图编辑等。社区支持也从弱到强,建立庞大用户群,提供资源。同时优化与不同系统的适配性,满足多样化需求。
五、同类对比(GameFactory 框架相关对比)
(一)DIAMOND、GameNGen 和 PlayGen 等项目
-
场景泛化能力:这些项目存在对特定游戏和数据集过度拟合的问题,GameFactory 利用预训练模型和独特训练策略,实现多样化新场景生成。
-
对已有技术的依赖:早期项目依赖特定数据结构或模型架构,灵活性受限,GameFactory 采用预训练模型和优化控制机制,适应更多游戏场景构建需求。
(二)与传统游戏开发方式对比(针对 The GameFactory)
-
编程复杂度:传统游戏开发需专业编程语言,难度大,The GameFactory 图形化编程降低难度,如碰撞检测逻辑构建更简单。
-
开发周期:传统开发周期长,The GameFactory 能加快开发速度,如制作 2D 平台游戏,初期创意验证和基础逻辑构建有优势。
-
资源利用效率:传统开发中资源管理需专业知识和精力,The GameFactory 内置资源编辑器提高效率,避免性能问题。
六、如何使用
(一)GameFactory 框架(推测情况)
-
数据准备:准备相关视频数据和游戏元素数据,如赛车游戏需收集赛道、操作控制等数据。
-
模型选择与适应调整(第一阶段):根据游戏目标选择预训练模型,用 LoRA 微调适应特定需求。
-
动作控制模块训练(第二阶段):冻结参数,训练动作控制模块,避免风格与控制纠缠。
-
生成现有游戏场景(第三阶段):移除 LoRA 权重,生成游戏视频,用于概念测试等。
-
评估与优化:根据生成视频评估真实度和适配性,优化模型参数和逻辑。
(二)The GameFactory 软件的使用
-
安装下载:从官网下载,解压后双击主程序安装,可更改安装路径,选择是否创建桌面快捷键等。
-
新建项目:打开软件,新建项目,确定游戏类型和分辨率等基础参数。
-
场景设计:利用地图编辑器设计场景,添加层和对象,调整物理属性。
-
角色创建:可导入或绘制角色,配置动作和行为,如设定角色动作切换逻辑。
-
逻辑编写:用事件编辑器设定规则和交互逻辑,初学者图形化操作,有经验者可编写 Lua 脚本。
-
测试与调试:在软件播放器中测试,修复问题,如调整角色速度等。
-
发布游戏:开发完成后导出为各平台可执行文件,如 Windows、Mac 或 HTML5 版本。