AI黑科技！DeepMind发布Genie 3：文本生成720p交互3D环境

谷歌DeepMind实验室于2025年8月公布了第三代通用世界模型Genie 3。这款仍处于研究预览阶段的AI系统，被该实验室研究人员视为实现"人工通用智能"（AGI）的关键技术突破。新媒网跨境获悉，该模型能够通过文本指令生成持续数分钟的交互式3D环境，分辨率达720p且帧率为24fps。

据DeepMind研究总监Shlomi Fruchter（英国籍）介绍，与前代产品相比，Genie 3具备三项核心突破：首先，模型支持"可提示世界事件"功能，允许通过指令动态修改生成环境；其次，采用自回归架构实现物理规律的一致性模拟；第三，模型通过记忆机制维持长时间跨度的场景连贯性。技术验证显示，当配合通用智能体SIMA使用时，该系统能准确执行"接近亮绿色垃圾压缩机"等复杂空间指令。

在技术实现，该模型延续了Veo 3视频生成系统的物理规律理解能力，但不再依赖预设物理引擎。研究科学家Jack Parker-Holder（英国籍）解释称，模型通过分析历史生成帧来预测后续场景变化，这种机制使其自发掌握了物体运动规律的基础认知。测试案例显示，系统能模拟仓库场景中智能体与各类设备的交互过程。

不过外媒报道指出，当前版本仍存在明显局限。滑雪场景演示中未能准确模拟雪粒运动轨迹，多智能体复杂交互建模仍具挑战性，且连续交互时长限制在数分钟内。新媒网跨境了解到，DeepMind团队将2016年AlphaGo的"第37手"视为技术参照点，认为这种支持自主探索的学习框架，可能为具身智能发展开辟新路径。

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/10663.html