Google改进AI世界模型Genie 3的一致性

Google近期展示了其生成式 AI 世界模型 Genie 3 的最新进展，重点在于提升生成世界的“一致性”，但整体能力距离真正支撑专业游戏开发流程仍有明显差距。

几个月前，Google首次对外介绍 Project Genie 时，这一项目被视为有望改变游戏开发和虚拟世界构建流程的潜在“游戏规则改变者”。然而根据Google最新在 GDC 上的介绍，作为 Project Genie 核心引擎的 Genie 3 模型，目前距离“颠覆产业”甚至“实质性改变行业工作方式”都还有很长的路要走。

Google将 Project Genie 定位为一套可以实时生成可交互世界的工具：开发者只需提供文本描述，Genie 3 的通用模型就能生成“照片级写实”的三维环境，并在此基础上加入物理和逻辑约束，让用户可以即时探索。 Google DeepMind 还将 Genie 3 视为其长期追求通用人工智能（AGI）战略中的关键模型之一，希望借此迈向类似《黑客帝国》那样具备高级推理能力的虚拟智能体形态。

现实情况却远比愿景更为克制。Google在 GDC 以“可玩世界”为主题的演讲中披露，Genie 3 初始版本只能在几秒钟内维持一个三维世界的连贯性。经过最近一轮升级后，当前模型在世界一致性上的表现提升到大约一分钟左右，超过这一时间，画面和场景就会迅速崩坏，演变成混乱而失真的“幻觉式”图像。

技术路径上，Genie 3 生成的“世界”更接近逐帧拼接的视频流，而不是传统意义上由稳定场景与物体组成的 3D 环境。换言之，它更像是对文本提示做出即时反应的动态视频，而非一个结构完整、可持续加载与编辑的游戏关卡或开放世界。 DeepMind 研究员 Alexandre Moufarek 强调，Google并非以取代整个游戏行业为目标来开发 Genie 3 或 Project Genie，但在模型持续演化的过程中，生成游戏的能力未来有可能从中“自然长出”。

在官方表述中，AGI 仍是 Genie 项目的首要目标，不过 Moufarek 也明确表示，希望能够在合适的阶段向游戏开发者开放这类生成式世界技术，让他们有机会先“玩一玩”“试一试”。以目前的成熟度来看，Genie 3 远未达到“直接用它做游戏”的程度，短期内也无法成为工作室生产流水线中的可靠一环。

尽管 Project Genie 并未被设计为直接“颠覆”游戏产业，但相关消息一经公布，仍然引发了部分游戏公司股价波动，反映出市场对生成式世界技术的敏感预期。除了世界一致性这一技术难题外，Genie 在走向实用化的进程中还可能面临一大障碍——版权与知识产权归属问题，尤其是在与任天堂等维权态度强硬的厂商打交道时，任何基于该技术的实际应用都可能长期面临法律挑战和不确定性。

从Google当前的动作来看，公司仍将主要精力放在整体生成式 AI 能力的迭代上。在本届 GDC 上，Google还展示了升级版的 SIMA 2——这一 AI 代理被设计为能够在无需精细脚本的前提下自主游玩电子游戏，是Google探索“会玩游戏的 AI”的又一尝试。

从行业视角看，Genie 3 的进展既体现了生成式世界模型在短时间内取得的可见提升，也暴露出其距离真正生产落地之间的巨大鸿沟：一分钟的一致性，意味着它目前更适合做技术演示或概念验证，而非承担长周期、高可靠性的商业游戏项目。在版权、责任界定和行业生态尚未厘清之前，这类技术更可能作为辅助创意和原型工具存在，而不是取代现有游戏引擎与内容管线的“终极方案”。

对文章打分

Google改进AI世界模型Genie 3的一致性

最新资讯

编辑精选

热门评论

相关文章

Google用旧新闻和大模型归纳出预报山洪的新方法

谷歌剥离光纤业务GFiber 仍将持有少数股权

Google完成对云安全创业公司Wiz的320亿美元收购

波音称线路缺陷将导致部分737 MAX交付延迟

Google为Docs、Sheets、Slides和Drive上线新一代Gemini功能

Google授予CEO皮查伊高达6.92亿美元薪酬方案绩效考核曝光

Top 10

收入过亿的OnlyFans顶流和童年对话：我没能成为宇航员

12306上的高铁站名多个空格？恭喜你发现了“彩蛋”

千问林俊旸“不值得被共情”？阿里员工：沽名钓誉，像孩子一样

微信新能力上线可查图片使用次数

极客湾疑似遭"全网封杀"!背后力量深不可测？

极客湾遭"封杀"引热议连YouTube视频都下架了