谷歌AI模型Genie 3:交互时长暴涨!虚拟环境720p时代来临?
2025-08-05人工智能
谷歌DeepMind近日推出新一代AI“世界模型”Genie 3,该模型能够实时生成用户及AI智能体可交互的3D环境。新媒网跨境获悉,与2024年12月发布的Genie 2相比,新版模型在交互时长、环境稳定性及分辨率等方面实现显著升级。
根据谷歌官方技术博客披露,Genie 3支持用户通过文本提示生成可持续交互数分钟的虚拟环境,较Genie 2仅能维持10-20秒的交互时长有质的飞跃。该模型具备约1分钟的视觉记忆能力,当用户视线移开后再返回时,场景中的固定元素(如墙面粉刷痕迹、黑板文字)将保持原有状态。技术参数显示,生成环境分辨率达720p,帧率为24fps。
世界模型作为AI领域的重要分支,可通过模拟环境服务于教育、娱乐及机器人训练等场景。其核心特征在于无需传统3D建模,仅凭AI算法即可动态生成可探索空间。谷歌对此技术路线持续加码,不仅组建了由前OpenAI Sora视频工具联合负责人领衔的专项团队,更在半年内实现两代产品的迭代突破。
值得注意的是,Genie 3新增“可触发世界事件”功能。用户可通过指令实时修改环境参数,例如调整天气系统或添加新角色。新媒网跨境了解到,该功能为虚拟环境注入了动态变量,显著提升了交互自由度。
当前版本仍存在明确限制。外媒报道显示,模型对用户交互方式设有约束条件,且可识别文本通常需预先植入环境描述。谷歌表示,Genie 3将以“有限研究预览”形式面向少量学术机构及内容创作者开放,旨在系统评估技术风险并制定相应缓解方案。公司后续将探索扩大测试范围的可行性。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
谷歌DeepMind推出新一代AI“世界模型”Genie 3,可实时生成用户及AI智能体可交互的3D环境。相比Genie 2,Genie 3在交互时长、环境稳定性及分辨率上显著升级,支持文本提示生成可持续交互数分钟的虚拟环境,并具备视觉记忆能力。该模型新增“可触发世界事件”功能,提升了交互自由度,目前以“有限研究预览”形式开放。
发布于 2025-08-05
查看人数 1837
关注我们

新媒网跨境发布
本站原创内容版权归作者及NMedia共同所有,未经许可,禁止以任何形式转载。
评论(0)