滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI秘密研发新语音模型BiDi：可被打断对话，客服场景或成突破口

时间：2026-03-06 19:00:43 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

据科技行业内部消息，OpenAI正秘密推进一项名为“BiDi”（取自“Bidirectional”缩写）的音频模型研发项目。该模型旨在突破现有语音交互的机械感，使人工智能与用户的对话更接近人类自然交流模式。核心突破点在于实现双向实时响应——当用户中途插话或提出新观点时，系统能够动态调整回应内容，而非像传统模型那样被动等待完整语句输入或中断对话。

当前ChatGPT的语音功能采用轮次式交互设计：用户需完整表达意图后，系统才会解析内容并生成回复。这种模式在面对自然对话中的即时反馈时显得笨拙——例如用户用“明白”“确实”等短语回应时，模型常误判为对话结束而停止输出。更复杂的情况是，当用户试图在AI陈述过程中修正信息或转换话题时，系统往往无法无缝衔接，导致交流体验割裂。

BiDi模型的技术路径与此截然不同。研发团队通过持续分析音频流中的声学特征，构建了动态响应机制。当检测到用户语音中的停顿、语调变化或关键词插入时，系统会立即激活上下文重评估模块，在保持语义连贯性的前提下调整回应策略。这种设计使对话不再遵循固定的“输入-处理-输出”链条，而是形成类似人类交谈的反馈循环。

尽管技术前景令人期待，但项目推进面临显著挑战。测试数据显示，BiDi原型在持续对话超过5分钟后，会出现语义漂移或语音合成异常等问题。部分场景下，系统甚至会生成与上下文无关的回应片段。原计划于2024年初发布的版本因此推迟，研发团队正集中优化长对话稳定性与异常处理机制，最新时间表指向第二季度末。

OpenAI将语音交互视为扩大AI应用场景的关键入口。研究显示，全球超过70%的用户更倾向通过语音完成简单指令，这一比例在移动场景下高达85%。BiDi模型若能实现预期效果，将显著提升客服、教育、智能家居等领域的交互效率。特别是在多任务处理场景中，用户可在对话中途随时切换需求，系统需同步理解并调整服务流程，这对传统语音系统构成技术跨越。

该模型在工具调用能力上的突破同样值得关注。测试表明，BiDi可更精准地识别用户语音中的隐含指令，例如在讨论天气时自然衔接至日程安排查询，或在购物对话中无缝调用支付系统。这种跨应用协调能力，为未来语音交互设备的生态建设提供了技术基础。

OpenAI的硬件战略与语音模型研发形成协同效应。此前曝光的语音交互设备原型显示，公司正探索将BiDi技术集成至便携式终端，用户可通过自然对话完成邮件撰写、餐厅预订等复杂操作。实时响应与中断容忍能力被视为这类设备的核心竞争力，其技术成熟度将直接影响AI从“工具”向“助手”的角色转型速度。

更多>同类资讯

支付宝AI支付再突破：3亿笔交易达成，AI钱包与Token Pay引领支付新篇章

05-26

地平线拆分成立地瓜机器人专注消费级机器人底层计算平台研发

05-26

养老服务机器人产业迈关键期：今年市场规模有望突破百亿元大关

05-26

工信部明确2026汽车标准化重点：完善体系布局前沿推动产业升级

05-26

宇树科技6月1日上会冲刺A股“人形机器人第一股”，盈利与挑战并存

05-26

《中国首份“人工智能 + 能源”报告发布透视全球及国内产业新走向》

本文转自【央视新闻客户端】；今天，国家能源局组织编制的《中国“人工智能+”能源发展报告2026》正式发布。这是我国能源领域首份聚焦人工智能与能源融合发展的年度报告，系统梳理全球及国内产业发展现状、研判发展大…

05-26

《人工智能应用伦理安全指引1.0》发布助力AI规范健康发展

5月19日，在2026年中国网络文明大会人工智能赋能网络文明建设分论坛上，全国网络安全标准化技术委员会（以下简称“网安标委”）发布了《人工智能应用伦理安全指引1.0》（以下简称《指引》）。为进一步引导人工智…

05-26

海尔推出全球最轻AI运动外骨骼机器人W3，超轻设计助力多场景运动

05-26

国产Agent模型SkyClaw-v1.0来袭，性能强价格低，限时免费别错过

05-26

“神奇小子”霍茨警示：AI编程智能体或藏高维护成本与隐蔽风险

05-26

面壁智能联合清华等发布MiniCPM5-1B模型：小参数量大能量适配多终端

05-26

法规驱动4D毫米波雷达成新宠，车企与产业链共探智能驾驶新路径

05-26

地平线拆分成立地瓜机器人公司，以汽车“母生态”赋能多元机器人场景

05-26

联发科与元太科技携手，以技术融合开启生成式AI彩色电子阅读新篇章

05-26

昆仑万维天工AI推出SkyClaw-v1.0模型性能超越多款竞品且性价比突出

05-26

点击查看更多 +

全站最新

特斯拉布局自动驾驶网约车：得州欧文市建专属中心，审批流程进行中

零跑D99即将粤港澳车展首秀，舱驾一体设计+多样空间模式，中旬上市引期待

法拉利Luce EV纯电跑车亮相，35款车漆个性选配起售55万欧元

三星显示赋能法拉利Luce：四块OLED屏打造多层显示，引领行业新突破

华策影视否认解散电影部门传闻内容战略升级推进影视与AI融合

字节跳动申请注册“AGENT WORLD”商标，加速AI Agent功能产品化品牌化进程

热门内容

本栏最新

零跑D99即将粤港澳车展首秀，舱驾一体设计+多样空间模式，中旬上市引期待

华策影视否认解散电影部门传闻内容战略升级推进影视与AI融合

广汽传祺向往M8 PHEV L开启预订智能配置拉满续航动力表现亮眼

广汽传祺向往M8 PHEV L开启预订智能配置拉满纯电续航表现亮眼

本田CRX经典难续？设计师出手打造现代版数字概念车引回忆

通富微电：借先进封装东风，与AMD携手共进，业绩增长潜力无限

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.