谷歌Veo 3震撼突破:AI视频秒变可玩游戏?
谷歌高管在社交平台的一次互动,意外透露了AI视频生成技术的新可能。
7月初,DeepMind首席执行官德米斯·哈萨比斯在X平台回应网友提问时,对"将Veo 3生成的视频变成可玩游戏"的设想留下耐人寻味的回复:"这难道不是很有趣吗?"次日,谷歌AI Studio产品负责人洛根·基尔帕特里克用四个"噤声"表情回应,引发行业遐想。
新媒网跨境获悉,尽管谷歌官方表示暂无具体计划披露,但技术路径已显端倪。视频生成模型与世界模型存在本质差异:前者合成逼真影像序列,后者则能模拟真实环境动态,预测行为引发的连锁反应。
谷歌的技术储备正朝此方向迈进。其多模态基础模型Gemini 2.5 Pro计划升级为类脑世界模型。去年12月,DeepMind发布的Genie 2已能生成无限变化的可玩场景。今年初,谷歌更组建专项团队研发物理世界模拟技术。
目前处于公测阶段的Veo 3,已实现音视频同步生成能力。它能模拟真实物理运动轨迹,虽尚未达到世界模型标准,但已具备革新游戏叙事的潜力。新媒网跨境认为,该技术可应用于游戏过场动画、宣传片制作及剧情原型设计,大幅降低开发成本。
真正的技术瓶颈在于实时交互控制。游戏开发不仅需要视觉震撼,更要求系统具备持续稳定的响应能力。未来若将Veo的视频生成与Genie的交互引擎结合,或可突破现有技术壁垒。
行业竞速已然展开。除谷歌外,微软、Scenario等企业积极布局,OpenAI的Sora模型同样展现游戏场景生成潜力。新媒网跨境预测,随着李飞飞教授的World Labs等创新团队入局,3D场景即时生成技术将加速迭代。
这条技术赛道充满想象力。当视频生成突破被动输出局限,转向主动交互的模拟系统,数字世界的构建方式或将迎来根本性变革。而谷歌凭借技术矩阵与生态优势,正在这场未来之战中悄然落子。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。











评论(0)