DeepMind黑科技!Genie 3突破720P,AI智能体训练迎来虚拟世界狂潮?
谷歌旗下DeepMind实验室在2025年第二季度公布了第三代生成式交互环境模型Genie 3,这项突破性技术被该机构称为"通向通用人工智能(AGI)的关键里程碑"。新媒网跨境获悉,该模型通过自学习物理规律实现实时生成连贯的3D虚拟世界,或将重塑智能体训练范式。
技术突破:从静态生成到动态模拟
据DeepMind研究总监Shlomi Fruchter(以色列籍)在新闻发布会披露,Genie 3首次实现了多分钟级、720P分辨率、24帧/秒的实时交互式环境生成。相较于前代产品Genie 2仅能维持10-20秒的生成时长,新模型通过自回归架构实现了物理规律的持续性模拟——系统会主动回溯已生成画面来决定下一帧内容,这种"记忆能力"使其能准确模拟物体坠落、碰撞等物理现象。外媒披露的演示视频显示,用户仅需输入文本指令,即可生成包含可触发环境事件的动态场景。
技术架构:无预设物理引擎的自学习系统
该模型融合了视频生成模型Veo 3的环境理解能力与Genie 2的场景生成技术,其核心创新在于完全摒弃了硬编码物理引擎。研究团队成员Jack Parker-Holder(英国籍)解释称,系统通过分析海量视频数据自主归纳出物体运动规律,这种"涌现能力"使模型能自动保持虚拟世界的物理一致性。新媒网跨境了解到,这种特性使其特别适用于需要长期连贯性的智能体训练场景。
应用局限:持续时长与交互深度待突破
当前版本仍存在明显技术边界:单次交互时长上限为几分钟,远低于实际训练所需的小时级标准;智能体行为维度受限,多智能体复杂交互建模尚不完善。DeepMind团队在演示中承认,系统虽能响应"可提示世界事件"的环境干预指令,但尚未实现智能体自主发起复杂动作的能力。
行业定位:智能体训练的虚拟试验场
研究团队将该项目定位为"具身智能的阿尔法围棋时刻",援引2016年AlphaGo(阿尔法围棋)与李世石对弈中创造传奇"第37手"的案例,强调该系统为智能体提供了通过试错探索未知策略的虚拟环境。目前Genie 3仍处于研究预览阶段,未开放公众访问权限。实验室表示,下一步将重点提升环境持久性与交互自由度,但未透露具体商业化时间表。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。

评论(0)