美国谷歌Search Live重磅升级!2025年语音交互更自然

2025-12-13AI工具

美国谷歌Search Live重磅升级!2025年语音交互更自然

在全球数字化浪潮中,语音交互正日益成为连接用户与信息的核心方式。近日,谷歌在这一领域再次迈出重要一步,其搜索产品“Search Live”迎来了一次关键升级,全面整合了Gemini 2.5 Flash原生音频模型,预示着语音功能在搜索乃至更广泛的谷歌生态系统中将扮演更为中心的角色。新媒网跨境获悉,此举不仅提升了语音查询的自然度和流畅性,也为未来的跨语言沟通和AI助手发展奠定了基础。

一、谷歌搜索实时语音交互能力跃升:事件详述

谷歌公司近期宣布,已对其“Search Live”功能进行了重大更新,集成了先进的Gemini 2.5 Flash原生音频模型。此次升级的核心在于大幅改进了语音在搜索中的运作方式,并将其应用范围扩展至实时翻译和智能语音代理等多个层面。

  • 谁(Who): 谷歌公司。
  • 何事(What): 升级了Search Live功能,集成了Gemini 2.5 Flash原生音频模型。
  • 何时(When): 此次更新于近期推出,并计划在当周(2025年)内率先在美国地区上线。
  • 何地(Where): 主要体现在谷歌的搜索产品Search Live中,但其影响辐射整个谷歌生态系统,包括Gemini App内的Gemini Live、Google AI Studio以及Vertex AI平台。
  • 为何(Why): 谷歌致力于将语音作为核心交互界面,使用户能够通过更自然的方式获取信息。这不仅包括传统搜索内容,还涵盖了对现实世界环境的提问,以及在不同语言使用者之间进行即时语音翻译的需求。
  • 如何发展(How): 通过集成Gemini 2.5 Flash原生音频模型,Search Live能够提供更加自然、富有表现力的语音响应。用户在与AI模式进行实时对话时,可以体验到前所未有的流畅交流。谷歌方面表示,即使是指导性内容,其语音响应速度也可以进行调整,以适应用户的学习节奏。这标志着谷歌在实现科幻作品中人机语音交互愿景的道路上又迈出了坚实的一步。

二、更广范围的原生音频模型部署

此次Search Live的升级,仅仅是谷歌Gemini 2.5 Flash原生音频模型在整个生态系统中更广泛部署的一部分。该模型已同步应用于Gemini Live(在Gemini应用内)、Google AI Studio和Vertex AI等平台。

该模型能够实时处理口语音频,并生成流畅的口头响应,从而显著降低了自然对话中的障碍,减少了实时交互过程中的摩擦。尽管谷歌的官方声明中并未明确指出该模型是端到端的语音到语音模型(而非传统的语音到文本再到语音转换),但这一更新与谷歌在2024年10月发布的“语音到检索(S2R)”技术一脉相承。S2R是一种基于神经网络的机器学习模型,通过海量的配对音频查询数据集进行训练。

这些变革表明,谷歌正将原生音频能力视为其面向消费者产品的核心功能。通过更自然的方式,用户可以更便捷地获取和接收关于周围物理世界的信息,这是以往技术难以实现的。

三、对语音系统开发者的赋能与提升

对于那些致力于构建语音系统的开发者和企业而言,谷歌表示,更新后的模型在多个方面提升了系统的可靠性。

具体而言,Gemini 2.5 Flash原生音频模型在对话过程中能够更稳定地触发外部功能,更好地理解和遵循复杂的指令,并能在多轮对话中持续保持上下文语境。

这些改进使得实时语音代理在实际工作流中变得更加可靠。在过去,指令被误解或对话流程中断,常常会降低语音系统的可用性。新模型的这些特性,无疑将为开发高质量、高效率的语音交互应用提供坚实的技术支撑。

四、实时流畅的跨语言对话翻译

除了在搜索和语音代理方面的应用,此次更新还引入了对“实时语音到语音翻译”的原生支持。

Gemini模型现在能够实时翻译口语,无论是持续将环境中的语音翻译成目标语言,还是在两种不同语言的使用者之间进行双向对话翻译,都能游刃有余。

该系统在翻译过程中能够保留说话者的语音特征,例如语速节奏和重音强调,从而使得翻译听起来更加流畅和自然,更接近真实的对话。新媒网跨境了解到,谷歌在强调这一翻译功能时,特别提及其支持广泛的语言覆盖、自动语言检测、多语言输入处理以及针对日常环境的降噪能力。这些特性减少了设置的复杂性,使得翻译可以在对话中被动进行,而非需要手动控制。最终,这种翻译体验将更像是一个真实的人在中间为两人进行传译。

五、语音搜索的长期愿景逐步实现

本次更新反映了谷歌对语音搜索的持续迭代,旨在使其更接近最初受《星际迷航》等科幻影视作品中人机语音交互所启发而设想的理想状态。谷歌对语音交互的长期投入,正逐步将科幻场景变为现实。通过这些技术进步,用户在进行搜索时,将能体验到更流畅、更具表现力的对话。增强的Gemini音频模型将带来强大的语音交互体验,并提供多种方式来通过Search Live获得实时帮助。
Google Updates Search Live With Gemini Model Upgrade

新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源:新媒网 https://nmedialink.com/posts/us-google-search-live-2025-voice-upgrade.html

评论(0)
暂无评论,快来抢沙发~
谷歌升级Search Live,集成Gemini 2.5 Flash原生音频模型,提升语音交互能力,支持实时语音翻译,应用于Gemini Live、Google AI Studio等平台,赋能语音系统开发者。该更新提升语音搜索的自然度和流畅性,迈向科幻作品中的人机语音交互愿景。
发布于 2025-12-13
查看人数 196
人民币汇率走势
CNY
亚马逊热销榜
共 0 SKU 上次更新 NaN:NaN:NaN
类目: 切换分类
暂无数据
暂无数据
关注我们
NMedia
新媒网跨境发布
本站原创内容版权归作者及NMedia共同所有,未经许可,禁止以任何形式转载。