谷歌AGI“世界模型”！突破数分钟限制，虚拟环境训练机器人红利？

谷歌近日公布了其在通用人工智能（AGI）领域的最新突破——Genie 3“世界模型”，这一技术可通过生成高仿真虚拟环境，为机器人及自动驾驶系统提供拟真训练场景。新媒网跨境获悉，该成果由谷歌旗下DeepMind团队，目前仍处于内部测试阶段，尚未公布具体商用时间表。

虚拟环境构建取得技术突破
根据2025年第二季度披露的技术细节，Genie 3能根据文本指令即时生成包含物理规则的动态场景。演示案例显示，系统可模拟高山滑雪、湖畔漫步等复杂场景，并能通过追加指令实时调整环境要素，如在雪场突然加入鹿群等突发事件。其场景持续时间已突破同类产品限制，可达数分钟级别，远超谷歌现有视频生成模型Veo 3的8秒时长上限。

产业应用瞄准智能体开发
DeepMind在技术声明中强调，世界模型被视为实现AGI的关键基础设施。与仅擅长单项任务的传统AI不同，AGI系统需具备类人的综合认知能力。目前该技术已应用于仓库物流机器人训练，通过物理规则精确的虚拟环境加速学习过程。此外，谷歌同步开发的游戏智能体SIMA能在《模拟山羊3》等虚拟场景中执行复杂操作指令。

学术视角揭示技术演进路径
英国萨里大学以人为本人工智能研究所专家安德鲁·罗戈伊斯基（Andrew Rogoyski）指出，虚拟具身化将弥补现有大语言模型的行动短板。其解释称：“当前AI虽能处理海量数据，但缺乏物理世界的交互经验。世界模型通过模拟实体环境，为AI系统提供了认知发展的新维度。”这一观点与谷歌2024年SIMA研究白皮书中的论述形成呼应。

行业竞争态势持续升温
值得注意的是，就在Genie 3技术演示同期，外媒曝光了OpenAI首席执行官萨姆·奥尔特曼（Sam Altman，美国）疑似展示GPT-5模型的社交动态。新媒网跨境了解到，头部科技企业在AGI赛道的布局明显加速，但谷歌方面仍保持谨慎态度，明确表示当前模型存在多项技术局限，暂不适合开放公众访问。
Illustration shows Google logo, keyboard and robot hands