三花快讯 · 2024, 9月14日

腾讯 GameGen-O:首个专用于生成开放世界游戏的视频模型

支持多模态交互控制

GameGen-O 是首个为开放世界游戏生成而定制的视频模型。它可以生成高质量的开放世界游戏,包括逼真的角色(巫师 3 的杰洛特、大镖客的亚瑟等)、环境(春夏秋冬等)、动作(开车、骑马、跑步、射击等)和事件(下雨、打雷、龙卷风等)。

最强的是它能多模态交互控制,通过文本提示来生成画面、通过视频引导(类似 CN)生成画面,最强的是允许直接输入操作(手柄或键盘)来控制画面,比如你可以按 WASD 来控制生成的画面

目前该项目还是期货开源,可以先关注下 GameGen-O 的 GitHUB

生成的画面要比之前的 MarioVGGGameNGen 好的多,但可以肯定是离实时渲染还是有点远的。

商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。

本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。