AI黑科技!DeepMind发布Genie 3:文本生成720p交互3D环境

2025-08-05人工智能

Image

谷歌DeepMind实验室于2025年8月公布了第三代通用世界模型Genie 3。这款仍处于研究预览阶段的AI系统,被该实验室研究人员视为实现"人工通用智能"(AGI)的关键技术突破。新媒网跨境获悉,该模型能够通过文本指令生成持续数分钟的交互式3D环境,分辨率达720p且帧率为24fps。

据DeepMind研究总监Shlomi Fruchter(英国籍)介绍,与前代产品相比,Genie 3具备三项核心突破:首先,模型支持"可提示世界事件"功能,允许通过指令动态修改生成环境;其次,采用自回归架构实现物理规律的一致性模拟;第三,模型通过记忆机制维持长时间跨度的场景连贯性。技术验证显示,当配合通用智能体SIMA使用时,该系统能准确执行"接近亮绿色垃圾压缩机"等复杂空间指令。

在技术实现,该模型延续了Veo 3视频生成系统的物理规律理解能力,但不再依赖预设物理引擎。研究科学家Jack Parker-Holder(英国籍)解释称,模型通过分析历史生成帧来预测后续场景变化,这种机制使其自发掌握了物体运动规律的基础认知。测试案例显示,系统能模拟仓库场景中智能体与各类设备的交互过程。

不过外媒报道指出,当前版本仍存在明显局限。滑雪场景演示中未能准确模拟雪粒运动轨迹,多智能体复杂交互建模仍具挑战性,且连续交互时长限制在数分钟内。新媒网跨境了解到,DeepMind团队将2016年AlphaGo的"第37手"视为技术参照点,认为这种支持自主探索的学习框架,可能为具身智能发展开辟新路径。

新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源:新媒网 https://nmedialink.com/posts/10663.html

评论(0)

暂无评论,快来抢沙发~
谷歌DeepMind发布第三代通用世界模型Genie 3,该AI系统被视为实现AGI的关键突破。Genie 3可通过文本指令生成数分钟的交互式3D环境,分辨率达720p,帧率为24fps。模型具备可提示世界事件、自回归架构物理模拟、记忆机制等核心突破,配合通用智能体SIMA可执行复杂空间指令。当前版本仍有局限,但DeepMind认为该模型为具身智能发展开辟新路径。
发布于 2025-08-05
查看人数 784
人民币汇率走势
CNY
亚马逊热销榜
共 0 SKU 上次更新 NaN:NaN:NaN
类目: 切换分类
暂无数据
暂无数据
关注我们
新媒网跨境发布
本站原创内容版权归作者及NMedia共同所有,未经许可,禁止以任何形式转载。