滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI开发双向语音模型：被打断也能秒回让通话更自然顺畅

时间：2026-03-07 15:51:57 来源：快科技编辑：快讯 IP：北京 发表评论无障碍通道

3月7日消息，据媒体报道，OpenAI正在研发一种全新的语音模型，旨在让用户与ChatGPT的对话更加自然流畅。这项技术的核心突破在于，当用户在AI说话过程中打断系统时，AI能够实时调整回应，而不是像现在这样突然停止。

目前ChatGPT的高级语音模式采用的是回合式对话机制，用户必须先说完话，AI才会处理语音并生成回答。如果用户在AI发言时插入okay或mm-hm等简短回应，系统通常会直接停止，无法像正常对话那样继续推进交流。

为解决这一问题，OpenAI正在开发的BiDi（双向语音模型）能够持续处理说话者的语音输入，因此在被打断时可以立即调整回应。相比之下，现有的语音模型一旦开始生成回答，输出内容就基本固定，无法再根据新的输入进行变化。

这项技术目前仍处于开发阶段。据知情人士透露，原型模型在持续对话几分钟后容易出现故障，有时甚至会发出不自然的声音。OpenAI研究人员原本希望今年第一季度发布BiDi，但目前最新的发布时间可能推迟到第二季度或更晚。

OpenAI认为，如果语音模型能够在性能上接近文本模型，AI的使用范围将进一步扩大，因为大多数人更习惯与AI进行语音交流，而不是输入文字。BiDi模型在客服场景中可能尤其有价值。

例如，当顾客与零售商的AI客服通话时，如果顾客在对话过程中临时决定选择换货而非退货，BiDi模型理论上可以让AI客服顺畅调整对话，而不会突然停止或出现混乱。

知情人士还透露，BiDi模型在调用外部工具和应用方面也更灵活。OpenAI此前表示，公司计划为未来一款主要通过语音交互的AI设备改进语音模型，并考虑开发一款智能音箱，通过语音指令即可查看邮件或预订服务。

更多>同类资讯

中兴通讯去年净利下滑超三成

03-07

AI代码审计来了，开发者的安全助手

03-07

Anthropic报告揭示AI职业替代真实进度，这个高薪岗位受冲击最大

03-07

AI赋能自媒体运营：六步搭建“人工智能应用”资讯自动发文流水线

这一步相当于为您的自媒体账号搭建了一座桥梁，让系统产出的文章可以顺利“过桥”发bu。说明：如果您暂时不想自动发bu，只想把文章保存下来手动修改，这一步可以跳过。在“文章改写”中，选择“深度改写版”，这…

03-07

动动嘴就能改UI！三星Galaxy手机或迎“氛围编程”时代

03-07

英伟达黄仁勋：未来没有“笨”软件，AI将全面接管

03-07

OpenAI发布ChatGPT for Excel测试版

03-07

科技创业者的择偶观：王兴兴相亲事件的冷思考

03-07

OpenAI推出Codex Security工具：AI助力代码审计，漏洞修复更高效精准

月 7 日消息，OpenAI 现已推出 Codex Security AI 工具，主要面向代码安全审计场景。据介绍，CodexSecurity 主要使用前沿 AI 模型推理能力结合自动化验证机制解决安全审…

03-07

“猪茅”牧原股份港股上市布局海外，智能化与出海能否开启新增长？

03-07

OpenAI推Codex Security AI工具：助力开发团队高效精准审计代码安全

03-07

三星Galaxy手机将引入氛围编程技术，普通用户也能轻松定制专属UI

03-07

华为MWC26峰会聚焦移动AI：携手产业共筑目标网，开启高阶自智新篇章

与会嘉宾探讨了移动AI时代的产业生态发展趋势、业务体验标准建设，以及网络演进路径和优秀实践，提出“通过业务智能、网络智能及网元智能，使能商业及网络价值跃迁”理念；呼吁加速5G-A部署，建设以大上行为核心的多维…

03-07

MWC 2026现场直击：中国移动以科技为笔，绘就数智生活新画卷

纵观此次中国移动在MWC2026的生动展示，这不仅是一场技术与创新的集中呈现，更是一次对未来场景的深度诠释——它描绘了一幅以领先通信、泛在算力、强大AI为基石，科技与产业深度融合，智慧服务触手可及的数智生活…

03-07

春晚上机器人“出圈”背后：C端普及尚远，数据训练成关键难题

泛化算法的核心是让机器人理解物理世界的本质，比如湿滑的碗为何容易滑落、不同材质的衣物如何清洗才不会受损、如何根据老人的神态判断其需求，这种对物理规律与人文需求的双重理解，需要算法具备极强的自适应能力，而这一…

03-07

点击查看更多 +

全站最新

“猪茅”牧原股份港股上市布局海外，智能化与出海能否开启新增长？

AI时代斩杀线：甲骨文的“断舍离”与豪赌

境启春语共鉴蝶映 | 滨江深圳人居首作璀璨亮相

智能制造+电商+安防三重驱动，王力安防3天3板，后续上涨潜力几何？

2026香氛市场新动向：线上场景美食风起，平价奢华品牌竞逐

尚界Z7来袭：华为ADS加持，性能科技双在线，能否撼动BBA轿车地位？

热门内容

本栏最新

“猪茅”牧原股份港股上市布局海外，智能化与出海能否开启新增长？

华为中国合作伙伴大会2026 3月深圳启幕共绘千行万业数智化新蓝图

Anthropic再传喜讯：Claude日新增用户超百万收入增长但成本高企

宋Ultra EV预售开启：二代刀片电池加持，15.5万起重塑B级纯电SUV格局

零代码也能轻松建站？AI工具让网站搭建从技术活变简单操作

黄仁勋“最后一投”背后：AI投资逻辑生变，行业迈向务实新阶段

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

OpenAI开发双向语音模型：被打断也能秒回 让通话更自然顺畅

OpenAI开发双向语音模型：被打断也能秒回让通话更自然顺畅