滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI双向语音模型新突破：对话被打断可实时调整交流更自然流畅

时间：2026-03-07 09:33:10 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

据行业消息，OpenAI正秘密推进一项革新性语音交互技术的研发，这项技术将彻底改变用户与AI对话的体验模式。核心突破在于实现真正的双向语音交互，使AI能够像人类一样在对话中灵活应对打断与插话，而非遵循当前主流的回合制响应机制。

现有语音交互系统普遍采用"先听后答"的线性模式，当用户尝试在AI输出过程中插入"嗯"、"好的"等语气词时，系统往往会直接中断响应。这种技术局限导致对话流畅度大打折扣，尤其在需要即时反馈的场景中表现尤为明显。以客服场景为例，当用户临时改变需求时，现有系统往往需要重新启动对话流程。

新研发的BiDi模型通过持续解析语音流的方式破解了这一难题。该技术采用动态响应架构，能够实时分析用户语音中的语义、语调甚至情感变化，在保持对话连贯性的同时智能调整回应策略。这种突破性设计使AI具备类似人类的对话适应能力，即使面对频繁打断也能保持逻辑连贯。

测试数据显示，原型系统在连续对话场景中仍存在技术瓶颈。当对话时长超过特定阈值时，系统偶尔会出现语音卡顿或语义衔接异常。研发团队透露，这些技术挑战主要源于语音流实时解析的算力需求，以及多模态语义理解的复杂性。

这项技术若能突破现有瓶颈，或将重塑语音交互的市场格局。行业分析指出，语音交互的便捷性使其成为主流交互方式的潜力巨大，但技术成熟度始终是制约因素。BiDi模型在工具调用层面的创新尤为引人注目，其支持的动态指令解析能力，可为智能家居、车载系统等场景提供更自然的交互体验。

在具体应用场景中，该技术展现出显著优势。以电商客服为例，当消费者在对话中突然改变退货诉求为换货时，系统能够即时理解意图转变并调整服务流程，避免传统系统中常见的对话中断或流程重置。这种即时响应能力在金融咨询、医疗问诊等需要连续对话的场景中同样具有应用价值。

据知情人士透露，OpenAI原计划在年初推出这项技术，但受制于稳定性问题不得不推迟发布时间表。当前研发重点集中在提升系统鲁棒性，特别是优化长对话场景下的语义连贯性。团队正在通过增加训练数据量和改进神经网络架构来突破技术瓶颈，预计正式版本将支持更复杂的对话场景和更长的连续交互时长。

更多>同类资讯

华院计算冲刺港交所IPO：业绩波动下机遇与挑战并存

06-18

锚定智能规模化九章云极AI工厂推动智算走向“价值交付”

06-18

"中国星谷"航天星驿项目主体封顶 2027年将提供297套安居房

目前，项目已进入装修阶段，整体工程预计2027年3月完工，建成后可提供297套保障性租赁住房，为扎根“中国星谷”的城市新市民、青年人才提供优质安居保障。据了解，该项目由武汉航天新城产业投资有限公司投资建设…

06-18

零跑2027款焕新：从“堆料”到细节打磨，未来能否续写传奇？

06-18

国星宇航冲刺港股“太空AI第一股”：营收增长强劲，但挑战与风险并存

06-18

Viture Helix工业安全眼镜亮相2026AWE：英伟达XR AI助力实景作业新体验

该企业透露，其长期合作方包括英伟达、斯坦福大学乐聪实验室以及普林斯顿大学王梦迪实验室，这款设备的人工智能辅助作业方案已在临床、生命科学研究场景完成实地测试。据消息称，Viture 与英伟达已联合研发这款全新…

06-18

每日互动落子武汉：以数据智能为翼助力华中产业新腾飞

每日互动联合创始人、首席数据官吕繁荣表示，湖北每日数仝科技是公司在华中设立的首个子公司，未来将立足武汉、覆盖湖北、辐射华中，推动数据智能及人工智能等核心业务在华中区域全面落地。在数据应用端，公司不仅为互联网…

06-18

中国电信“星海”赋能　筑牢数据安全防线护航数字经济新发展

作为国内信息通信行业的“国家队”，中国电信在数据安全领域构建了以“云网融合”为底座，涵盖合规治理、技术防护、流通服务、人才建设的全方位安全体系，全方位守护数据流通。通过全生命周期数据管控、分布式可信计算、…

06-18

国产大模型 GLM-5.2 体验：编码实力能打，多模态与算力短板待补

第二个问题是模型的上下文长度只支持到了 256k，这就导致但如果你用它干点稍微复杂的活，上下文一被塞满，模型的能力就会有所下降。当然，跑分再高也只能做个参考，为了看看它是不是一个只会刷题的小镇做题家，世超…

06-18

斯蒂芬·布劳尔浙江行：探寻人工智能向善赋能人权与合作的路径

例如，我们参访了杭州市杨绫子学校，人工智能技术被运用于帮助有特殊需求的青少年学习、成长和融入社会；在杭州文三数字生活街区，我看到了很多机器人和智能设备，涵盖健康科技、智能家居等前沿赛道。这一点非常重要，因为…

06-18

华为擎云“All in 鸿蒙”：商用生态拓展，政企办公迎来新变革

06-18

自动驾驶新国标公示：设安全“水平线” 车企需明晰告知用户使用说明

06-18

贾跃亭法拉第未来“跨界”发力，发布多款机器人拓展新赛道

06-18

第一届CCF大模型与AI工程大会：学术技术创业齐发力共绘AI发展新蓝图

06-18

京津冀首个万台级具身智能机器人超级工厂投用 2030年产能将达50万台套

06-18

点击查看更多 +

全站最新

HDC现场探秘鸿蒙数字内容：AI赋能，生态进化，体验感拉满

华为“五界”棋局：借车企探路布局汽车生态“新税点”

比亚迪全新旗舰大唐EV上市售价23.99万起续航最长950km配置拉满

零跑2027款焕新：从“堆料”到细节打磨，未来能否续写传奇？

绿电赋能低碳出行 “绿车充绿电”绘就绿色生活新画卷

从“高冷”到“亲民”：极狐贝塔系列崛起或改写阿尔法时代格局

热门内容

本栏最新

零跑2027款焕新：从“堆料”到细节打磨，未来能否续写传奇？

比亚迪大唐EV上市：23万级全尺寸SUV新标杆，950km续航+29项全球第一

HDC 2026聚焦鸿蒙生态：AI赋能数字内容，携手伙伴共探商业新路径

长沙启幕！吉利银河星耀7MAX携五大豪华颠覆实力开启美好出行新篇

第十届南博会：AI智能机器人引领服务创新科技助力传统制造业升级

长安启源Q06 9月上市！天枢领航加持，扶光美学外观，运动质感拉满

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

OpenAI双向语音模型新突破：对话被打断可实时调整 交流更自然流畅

OpenAI双向语音模型新突破：对话被打断可实时调整交流更自然流畅