谷歌AGI“世界模型”!突破数分钟限制,虚拟环境训练机器人红利?
谷歌近日公布了其在通用人工智能(AGI)领域的最新突破——Genie 3“世界模型”,这一技术可通过生成高仿真虚拟环境,为机器人及自动驾驶系统提供拟真训练场景。新媒网跨境获悉,该成果由谷歌旗下DeepMind团队,目前仍处于内部测试阶段,尚未公布具体商用时间表。
虚拟环境构建取得技术突破
根据2025年第二季度披露的技术细节,Genie 3能根据文本指令即时生成包含物理规则的动态场景。演示案例显示,系统可模拟高山滑雪、湖畔漫步等复杂场景,并能通过追加指令实时调整环境要素,如在雪场突然加入鹿群等突发事件。其场景持续时间已突破同类产品限制,可达数分钟级别,远超谷歌现有视频生成模型Veo 3的8秒时长上限。
产业应用瞄准智能体开发
DeepMind在技术声明中强调,世界模型被视为实现AGI的关键基础设施。与仅擅长单项任务的传统AI不同,AGI系统需具备类人的综合认知能力。目前该技术已应用于仓库物流机器人训练,通过物理规则精确的虚拟环境加速学习过程。此外,谷歌同步开发的游戏智能体SIMA能在《模拟山羊3》等虚拟场景中执行复杂操作指令。
学术视角揭示技术演进路径
英国萨里大学以人为本人工智能研究所专家安德鲁·罗戈伊斯基(Andrew Rogoyski)指出,虚拟具身化将弥补现有大语言模型的行动短板。其解释称:“当前AI虽能处理海量数据,但缺乏物理世界的交互经验。世界模型通过模拟实体环境,为AI系统提供了认知发展的新维度。”这一观点与谷歌2024年SIMA研究白皮书中的论述形成呼应。
行业竞争态势持续升温
值得注意的是,就在Genie 3技术演示同期,外媒曝光了OpenAI首席执行官萨姆·奥尔特曼(Sam Altman,美国)疑似展示GPT-5模型的社交动态。新媒网跨境了解到,头部科技企业在AGI赛道的布局明显加速,但谷歌方面仍保持谨慎态度,明确表示当前模型存在多项技术局限,暂不适合开放公众访问。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。

评论(0)