滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

Gemini 2.5原生音频升级：双向交互更智能，实时翻译保留语调新体验

时间：2025-12-16 13:24:11 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

谷歌近日对其人工智能语音技术展开重大升级，正式推出Gemini 2.5 Flash原生音频模型。这项更新不仅强化了语音交互的双向能力，更通过多项技术突破重新定义了实时语音翻译的应用场景。新模型现已接入Google AI Studio和Vertex AI平台，开发者可借此构建更智能的语音交互系统，普通用户也能在搜索等场景中体验更自然的对话服务。

核心升级聚焦于"双向交互"能力。相较于传统语音模型单向输出的模式，新版本在复杂工作流处理、用户意图理解及自然对话维持方面取得显著进展。技术测试数据显示，在多步骤函数调用评估中，该模型以71.5%的准确率领先行业，较前代提升近20个百分点。指令遵循率从84%跃升至90%，确保系统输出更贴合开发者预设要求。

对话流畅性方面实现三大突破：多轮对话上下文检索能力增强，使交流逻辑更连贯；自动语种检测功能免去手动设置步骤；抗噪算法升级后，即使在机场、街道等嘈杂环境，系统仍能精准识别有效语音。这些改进使得客服机器人、智能助手等应用场景的交互体验更接近真人对话。

最受关注的实时语音翻译功能采用流式语音对语音技术，突破传统机械朗读的局限。系统可保留说话人的语调、节奏甚至情感特征，支持70余种语言及2000多种语言对的互译。在持续监听模式下，用户佩戴耳机即可实时理解周围多种语言的对话内容；双向对话模式则自动切换翻译方向，实现无缝跨语言交流。

该功能特别优化了多语言混合场景处理能力。系统可同时识别会话中的多种语言，无需用户频繁切换设置。自动语种检测技术使交流双方无需预先知晓对方语言，直接开始对话即可触发翻译服务。这些特性在跨国商务谈判、国际旅游等场景中具有显著应用价值。

技术实现层面，谷歌通过三项关键改良支撑新功能落地。工具调用模块升级后，系统能更精准判断何时需要接入外部数据库获取实时信息，并将查询结果自然融入对话流程。指令解析引擎经过重构，对复杂指令的拆解执行能力大幅提升。上下文管理机制引入新型记忆架构，使长对话中的信息追溯效率提高40%。

目前开发者可通过Vertex AI平台获取完整版模型服务，Gemini API预览版也同步开放。谷歌透露，计划在2026年前将实时语音翻译技术扩展至更多产品线，包括集成至Gemini API生态体系。这项技术革新不仅重塑了语音交互的边界，更为跨语言沟通开辟了新的可能性空间。

更多>同类资讯

从被唱衰到集体改口：中国制造多领域突围，实力彰显无需多言

06-10

2026下半年车市盛宴：6款重磅新车来袭谁将引领新潮流？

06-10

谷歌Gemini3.5Live Translate发布：实时同传打破语言藩篱，沟通更自然流畅

06-10

星火医疗大模型V3.5发布：国产算力赋能，助力医疗AI专业化升级

06-10

字节跳动AI骨干西原离职创业，携超亿美元融资再战AI社交新赛道

06-10

字节跳动AI制药业务独立融资新进展：整合团队资源，字节控股推进产业化

06-10

5月车市新能源热燃油冷：燃油车降价潮起，新能源出口创新高

06-10

长春光博会：超6600优质岗位待揽，多维举措打造光电人才汇聚高地

06-10

从“银河”号屈辱到千帆星座崛起：中国低轨卫星组网加速冲刺

06-10

阿里云宣布2026年6月15日起下调ACS Agent Sandbox容器计算服务价格

06-10

Meta与信实工业强强联手，在印建AI数据中心，一期168MW用可再生能源

06-10

NASA揭晓阿耳忒弥斯三号四人乘组名单，为人类重返月球蓄力前行

06-10

阿里回应钉钉管理争议：尊重信任为底色共筑AI时代有情有义职场

06-10

拼多多助力国货美妆：从流量依赖到产品驱动，产业带迎新机遇

06-10

钉钉管理风波引关注阿里合伙人委员会发声：坚守“视人为人”文化初心

06-10

点击查看更多 +

全站最新

二十七载再启新程，2026款BMW X5智能豪华双进阶，回馈用户厚爱

一汽-大众ID.AURA T6：黄金风阻成就高效舒适纯电出行新体验

斯柯达柯迪亚克改款谍照流出：弃大众车机换安卓，或引合资SUV变革

2026下半年车市盛宴：6款重磅新车来袭谁将引领新潮流？

《网络测评新规落地：“水测评”“假广告”将受严管，消费者有福了！》

70万用户选择见证捷途方盒子以旅行+战略引领全球越野文化新潮流

热门内容

本栏最新

2026下半年车市盛宴：6款重磅新车来袭谁将引领新潮流？

5月车市新能源热燃油冷：燃油车降价潮起，新能源出口创新高

钉钉副总裁马锐拉离职发文《置身钉外》谈感悟，发声后遭抹黑引风波

抖音电商达人服务费新规落地：分级定费，直播电商迈入质量深耕新阶段

小红书推出RED Skill功能：创作者可挂载Skill，用户一键复制即用

字节Flow部门AI产品负责人西原离职创业，猫箱成绩亮眼，AI创业潮再添新军

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.