滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

谷歌Gemini 3.1 Flash Live革新：告别重复请求，开启实时交互新纪元

时间：2026-03-28 17:47:52 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

谷歌近日发布了一款名为Gemini 3.1 Flash Live的语音AI模型，宣称其能够显著提升语音交互的自然度和实时性，尤其在嘈杂环境下的表现更为突出。这款模型不仅具备更快的响应速度，还能有效区分背景噪音与用户语音，从而在复杂场景中保持稳定的交互能力。

传统语音AI常因延迟或环境干扰而影响用户体验，尤其是当用户身处地铁站、咖啡厅或开着电视的客厅时，设备往往无法准确识别指令，甚至反复要求用户重复内容。谷歌此次推出的Gemini 3.1 Flash Live针对这一问题进行了优化，通过增强对音高、语速和意图的识别能力，同时强化复杂指令的遵循性，确保对话即使突然转向也能保持连贯性。

谷歌官方博客中提到，实时交互中的每一毫秒延迟都可能破坏自然对话的流畅性。因此，Gemini 3.1 Flash Live的目标是将语音Agent的响应速度提升至接近人类对话的水平。相比前代模型，新版本在交通声、电视声等背景干扰下的任务完成率显著提升，能够更稳定地触发工具并返回信息。

这款模型的应用场景不仅限于日常对话。谷歌展示了其在设计、陪伴和游戏三个领域的潜力。例如，设计师可以通过语音直接操控设计工具，AI能够实时理解画布内容并提供反馈；面向老年人的陪伴设备则利用多语言支持能力，以更自然的方式接住日常闲聊；在游戏领域，Gemini 3.1 Flash Live的强角色塑造能力为NPC赋予了更生动的表达方式，提升了玩家的沉浸感。

从技术层面看，Gemini 3.1 Flash Live通过有状态WebSocket连接实现持续交互，支持音频、图片和文本流的低延迟传输。其输入输出均采用高采样率音频格式，确保语音质量。模型还集成了工具调用、用户打断处理和多语言支持等功能，为开发者提供了灵活的集成方案。

谷歌已通过Gemini API和Google AI Studio开放了预览版访问权限，并提供了详细的开发文档和示例代码。这意味着开发者可以将这一实时交互能力嵌入现有应用中，而非仅限于独立产品。例如，用户未来可能在常用App中看到一个新增按钮，通过它实现与AI的实时互动，涵盖改签航班、监控屏幕或陪父母聊天等场景。

尽管Gemini 3.1 Flash Live展现了语音AI的进步，但其大规模落地仍需解决成本、长时对话稳定性和隐私保护等现实问题。例如，高频使用是否会导致成本过高？多人环境下的语音分离能否保持稳定？持续监听的边界如何界定？这些问题将决定语音AI能否从实验室走向真实生产环境。

目前，语音AI的竞争已从单一功能延伸至基础能力层。谷歌的这次更新不仅提升了模型性能，更通过开放API和工具链降低了开发门槛。未来，实时交互能力可能成为应用的标配，而用户与机器的沟通方式也将因此发生改变。

更多>同类资讯

广汽丰田铂智7明日上市：合资首款20万内带空悬华为小米生态齐加持

03-28

泡泡玛特放缓激进步伐，王宁财富缩水背后谋多元化新局

03-28

谷歌绝密AI Agent Smith引爆内部狂潮：员工疯抢服务器崩溃，AI竞赛再升级

03-28

REDMI K90至尊版下月登场：风冷加持天玑9500 165Hz高刷配8000mAh大电池

03-28

百度抓虾吧“拒人迎AI”：独特交流模式引网友热议与担忧

03-28

亚马逊“神户计划”浮出水面，2027年以AI驱动超市叫板沃尔玛

03-28

字节跳动Helios大模型出击：破解AI视频生成“不可能三角”难题

03-28

谷歌Gemini 3.1革新语音交互：告别重复请求，开启实时多模态对话新纪元

这些需要和它聊天的场景，往往是在地铁站、车上、开着电视的客厅、菜市场这些噪声环境，所以，谷歌这次把「噪声」放到了非常核心的位置。游戏也是实时语音AI最危险、也最容易炸场的场景，因为玩家对「卡顿」和「出戏」…

03-28

谷歌TurboQuant技术突破：AI内存占用锐减，推理速度飙升

该技术可在不损失精度的前提下，将大语言模型缓存内存占用至少缩减6倍，推理速度最高提升8倍。实验数据显示，TurboQuant无需任何预训练或微调，即可将键值缓存高效压缩至3比特，在“大海捞针”等长上下文测试…

03-28

安卓17新升级：Gemini等AI助手将拥有独立音量控制告别刺耳提示音

IT之家 3 月 28 日消息，科技媒体 Android Authority 今天（3 月 28 日）发布博文，报道称在安卓 17 Beta 3更新中，谷歌进一步打磨细节，为 Gemini 等虚拟助手引入独…

03-28

谷歌内部AI Agent Smith引爆热潮：员工疯抢服务器宕机，AI大战再升级

据知情人士透露，Agent Smith在谷歌内部一上线，员工就蜂拥而至，直接把服务器挤爆了！今年3月初，布林出席了一场内部全员会，明确表态：AI Agent将是谷歌今年最重要的方向。这预示着：未来的谷歌…

03-28

中科院发布“香山”“如意”成果启动下一代芯片与系统联合研发

3月26日，在中关村论坛年会—RISC-V生态科技论坛上，中国科学院正式公布在RISC-V关键技术突破、产业协同创新及人才培养领域的系列重要成果，集中发布“香山”开源处理器与“如意”原生操作系统两大重要成果，…

03-28

沃尔玛将推谷歌电视新机顶盒及Onn品牌电视，尺寸覆盖55至75英寸

沃尔玛正准备推出包括机顶盒在内的全新谷歌电视产品，可能是Onn 4K Pro的后续型号，同时还有搭载谷歌平台的电视机。据Reddit上一个半匿名账号分享，新图像显示了似乎是第二代沃尔玛谷歌电视驱动的Onn …

03-28

手机取卡针选购指南：资质、品控、服务全解析，这家工厂值得关注

不少电子厂商、手机配件经销商在寻找供应商时，常会遇到定制难、品控不稳定、交期跟不上等问题，同时也希望能对接可提供上门调试服务的专业工厂。总结推荐对于电子厂商、配件经销商而言，选择一家靠谱的手机取卡针供应…

03-28

苹果手机充电宝怎么选？10款热门品牌实测对比，安全耐用充电快！

PB-S专注高效快充，充电时不发烫，输出稳定性提升116%，充电速度提升44%，电池循环寿命提升51%，对手机及电池的潜在损害降低高达96%，被誉为充电宝行业里的“安全快充”性能之王，其核心的充电安全性、发热…

03-28

点击查看更多 +

全站最新

存储板块调整，是错杀还是逻辑坍塌？

蒙牛2025年报中的“进”与“变”

武汉樱花季邂逅“WAKUKU”：无人车里赏樱，解锁潮玩科技新浪漫

广汽丰田铂智7明日上市！合资品牌首将空悬下放20万内华为小米生态齐加持

专业媒体深度试驾小米新一代SU7，日常驾驶体验成焦点，用户参考必备

专业媒体深度试驾小米新一代SU7，日常驾驶体验成焦点，用户参考必看

热门内容

本栏最新

武汉樱花季邂逅“WAKUKU”：无人车里赏樱，解锁潮玩科技新浪漫

广汽丰田铂智7明日上市！合资品牌首将空悬下放20万内华为小米生态齐加持

专业媒体深度试驾小米新一代SU7，日常驾驶体验成焦点，用户参考必备

专业媒体深度试驾小米新一代SU7，日常驾驶体验成焦点，用户参考必看

全新缤果Pro亮相：新复古设计遇上5门5座，A0级市场新选择来袭

95后AI新星罗福莉谈OpenClaw：开源框架点燃Agent层想象力，大模型将“进化”

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.