谷歌高管在社交平台的一次互动，意外透露了AI视频生成技术的新可能。
7月初，DeepMind首席执行官德米斯·哈萨比斯在X平台回应网友提问时，对"将Veo 3生成的视频变成可玩游戏"的设想留下耐人寻味的回复："这难道不是很有趣吗？"次日，谷歌AI Studio产品负责人洛根·基尔帕特里克用四个"噤声"表情回应，引发行业遐想。
Google Veo presentation at Google I/O 2024

新媒网跨境获悉，尽管谷歌官方表示暂无具体计划披露，但技术路径已显端倪。视频生成模型与世界模型存在本质差异：前者合成逼真影像序列，后者则能模拟真实环境动态，预测行为引发的连锁反应。

谷歌的技术储备正朝此方向迈进。其多模态基础模型Gemini 2.5 Pro计划升级为类脑世界模型。去年12月，DeepMind发布的Genie 2已能生成无限变化的可玩场景。今年初，谷歌更组建专项团队研发物理世界模拟技术。

目前处于公测阶段的Veo 3，已实现音视频同步生成能力。它能模拟真实物理运动轨迹，虽尚未达到世界模型标准，但已具备革新游戏叙事的潜力。新媒网跨境认为，该技术可应用于游戏过场动画、宣传片制作及剧情原型设计，大幅降低开发成本。

真正的技术瓶颈在于实时交互控制。游戏开发不仅需要视觉震撼，更要求系统具备持续稳定的响应能力。未来若将Veo的视频生成与Genie的交互引擎结合，或可突破现有技术壁垒。

行业竞速已然展开。除谷歌外，微软、Scenario等企业积极布局，OpenAI的Sora模型同样展现游戏场景生成潜力。新媒网跨境预测，随着李飞飞教授的World Labs等创新团队入局，3D场景即时生成技术将加速迭代。

这条技术赛道充满想象力。当视频生成突破被动输出局限，转向主动交互的模拟系统，数字世界的构建方式或将迎来根本性变革。而谷歌凭借技术矩阵与生态优势，正在这场未来之战中悄然落子。

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/4080.html

Media

谷歌Veo 3震撼突破：AI视频秒变可玩游戏？

评论（0）