滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

谷歌Gemini 2.5原生音频模型：实时翻译还能保留情绪，开启拟人交互新篇

时间：2025-12-14 17:59:31 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

谷歌近日推出了一项颠覆性的AI技术——Gemini 2.5 Flash原生音频模型，标志着语音交互正式迈入“拟人化”新纪元。这项技术突破传统语音交互的局限，无需将声音转换为文字再处理，而是直接解析音频信号并生成自然流畅的语音响应，实现了真正的“端到端”实时交互。

想象这样的场景：在东京街头，一位当地老人用日语急切询问地铁站方向，而你只需佩戴耳机，就能听到精准的中文翻译：“请问地铁站往这边走吗？”更令人惊叹的是，AI不仅完整传递了语义，还完美复刻了老人焦急的语调与呼吸节奏。当你用中文回应时，系统会同步将你的声音转化为自然的日语，保留热情友好的语气，仿佛双方直接对话。

这一突破性功能的核心在于“原生音频处理”技术。传统语音交互需经历“语音转文字-AI处理-文字转语音”的复杂流程，导致情感、停顿等关键信息丢失。而Gemini 2.5 Flash直接解析音频流，在理解语义的同时捕捉语调、节奏等微妙特征，使翻译结果既准确又富有“人情味”。在商务谈判或跨文化沟通中，这种能力能精准传递态度与情绪，避免因机械朗读引发的误解。

实时语音翻译功能已在美国、墨西哥、印度启动Beta测试，支持70余种语言及2000多种语言组合。用户无需频繁点击按钮，系统可持续监听周围环境音，自动识别说话者并切换翻译方向。即使对话中混杂多种语言，或处于嘈杂环境，AI也能通过噪声过滤技术确保清晰沟通。例如，在孟买市场与摊主讨价还价时，系统能自动分离背景叫卖声，专注处理关键对话内容。

对于开发者而言，这项技术带来了三大核心升级：函数调用精准度提升、复杂指令执行率提高、多轮对话连贯性增强。在测试复杂多步骤操作的ComplexFuncBench Audio评测中，新模型以71.5%的得分领先行业，能无缝整合实时数据（如天气、航班信息）到语音回复中。指令遵循率从84%跃升至90%，可精准执行“用特定格式回答且语气严肃”等细化要求。上下文记忆能力显著优化，即使长达20轮的对话，AI仍能准确引用早期信息，配合低延迟响应，营造“真人对话”的沉浸感。

技术突破的背后，是谷歌对语音交互入口的战略布局。从Gemini Live到Search Live，再到耳机端的实时翻译，AI正从屏幕延伸至听觉维度。2026年，该功能将通过Gemini API扩展至更多产品，企业构建智能客服的门槛大幅降低——一个能理解复杂指令、记忆对话上下文、传递情感语气的AI助手，将成为标准配置。

技术迭代的速度远超预期。当Siri仍困于简单指令时，Gemini已能实现跨语言情感交流。这项技术已在Vertex AI平台全面上线，Google AI Studio同步开放试用。或许第一次听到AI用你的语气说出外语时，你会真切感受到：那个无需背诵单词、一个耳机走遍世界的未来，已悄然来临。

更多>同类资讯

小屏手机怎么选？2025年三款骁龙芯小屏旗舰，性能续航影像全拿捏

2025年，市场给出了新的答案：凭借高通骁龙旗舰芯片在性能和能效上的双重突破，新一代小屏旗舰已经能做到“小而强大”。如果你追求的是在经典小尺寸下获得最全面、最顶级的旗舰体验，那么首发第五代骁龙8至尊版的小米…

01-29

三款宝藏记事便签推荐！安全加密又实用，灵感与隐私双守护

今天分享3款我亲测好用、且自带加密功能的记事本app，希望能给大家做个参考。我经常在地铁上用手机记个大概，回公司打开电脑直接整理，内容互传丝毫不卡顿，换设备也不怕数据丢失，这点对经常切换设备的人来说太友好了。…

01-29

2026苹果手机去水印工具实测：5款适配ProRAW与Live Photo的优质之选

为此，我们针对苹果手机用户开展专属实测：测试设备覆盖iPhone 18 Pro（iOS 20.1）、iPhone 17（iOS19.5）；测试样本包含ProRAW图片、Live Photo、4K静态图、…

01-29

2026苹果手机去水印工具大揭秘！轻量安全适配iOS的TOP5及解析技巧

测评方法论（iOS专属优化版）本次测评严格遵循《移动应用iOS适配规范（2026）》及《个人信息安全评估指南》，测试环境统一为：设备：iPhone 15 Pro（A19芯片、NPU加速）、iPhone…

01-29

2026苹果设备去水印工具实测：微信小程序领衔，高效适配隐私无忧

测评方法论：苹果设备专属标准本次测评严格遵循《苹果生态应用性能测试规范》（2026版），核心维度包括： 1.A19芯片适配：是否利用NPU加速水印识别，Core ML模型本地化部署情况； 2. 处理效…

01-29

预算有限也能换好机！2026年这三款千元机高配低价超耐用

iQOO Z10Turbo才是真正的千元机，12GB+256Gb版本的首发价格为1799元，经过一年多的销售，现在12GB+512GB也才1741元。推荐理由：一加Turbo6是新出的中端手机，起步价格…

01-29

轻薄便携充电宝怎么选？八款实测揭秘EAK如何成“无感续航”优选

本次我们横向实测了八款国民一线品牌的轻薄便携充电宝（涵盖 EAK 超薄磁吸充电宝、小米 WPB0507S、华为 CP612、安克Air2、倍思 PicoGo、绿联能量湃 Pro、罗马仕 PHG10-211…

01-29

2026手机去水印工具实测：4款免费无广告利器，微信生态+海外平台全攻略

平台覆盖：支持130 + 国内外主流平台链接直解析，涵盖抖音、快手、小红书、B 站、TikTok、YouTube 等常用场景批量处理：单次可处理100 + 素材，10 张 1080P 图片仅需 8 秒完…

01-29

小米三款热门机型盘点：从性价比到高端旗舰，按需选机不纠结

选购小米机型无需为高端版本的高价纠结，按需选择适配自身需求的机型即可，当下这三款小米机型凭借出众的体验收获高口碑，配置表现足够扎实，流畅使用五年完全无压力。选购小米机型无需为高端版本的高价纠结，按需选择适配自…

01-29

红米K90 Pro Max降价来袭性能续航影像全在线性价比之选

对比同价位的其他机型，部分机型虽性能强劲但续航表现拉胯，一天需要多次充电；部分机型拍照表现出色但屏幕尺寸较小，视觉体验一般，而红米K90 Pro Max则在性能、续航、屏幕、音质、影像等多个维度都有着均衡且出…

01-29

苹果携手SpaceX：iPhone 18 Pro或直连星链开启通信新体验

01-29

氦星光联获近2亿A1轮融资推动天地一体化光通信网络迈向新高度

01-29

《GT赛车7》1.670更新来袭小米SU7 Ultra强势登场成游戏新亮点

01-29

菜鸟九识智能战略整合，双品牌运营共拓无人驾驶货运新蓝海

01-29

2026光谷AI峰会启幕：顶尖资源汇聚共绘武汉AI产业升级新蓝图

01-29

点击查看更多 +

全站最新

阿里自研AI芯片"真武"亮相 "通云哥"黄金三角浮出水面

贵州茅台放量飙升近7%，股价重回1400元上方

港A异动｜中国平安H股涨近4% 股价创2021年5月以来新高市值站上1.33万亿！

A股异动丨宇瞳光学跌逾6% 股价创逾2个月新低

白酒股集体飙升，酒鬼酒、舍得、泸州老窖等涨停，山西汾酒、茅台涨超8%

技术复用，知行科技(01274.HK)iDC700域控制器又获头部自主品牌无人物流车量产定点

热门内容

本栏最新

从实验室到车间家庭：机器人“进厂入家” 开启智能生活新图景

特斯拉2025年营收利润双降押注AI与机器人转型股价逆势上扬

特斯拉停产Model S与X车型，聚焦自动驾驶，弗里蒙特工厂转产Optimus机器人

特斯拉2025年营收利润双降转型AI与机器人领域股价逆势上扬

汽车工业140载辉煌路，中外车企共贺奔驰诞辰，奔驰暖心回应

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.