OpenAI发布新一代语音模型，媲美真人音质，95后华人研究员参与研发

时间：2025-08-29 12:04:51 来源：新智元编辑：快讯 IP：北京 发表评论无障碍通道

在科技界的又一次重大突破中，OpenAI于今日凌晨震撼发布了其最新的语音技术和应用程序编程接口（API）。这一更新不仅推出了支持实时处理的Realtime API，还带来了音质与智能并重的语音到语音模型gpt-realtime，标志着AI语音技术迈入了一个崭新的阶段。

Realtime API以其革命性的设计，简化了语音智能体的构建流程。它不仅能与远程MCP服务器无缝连接，还支持图像输入，并通过SIP协议直接实现电话通信，极大地拓宽了语音智能体的应用场景。这一改变意味着开发者可以更加便捷地创建能够即时响应、跨平台协作的语音智能体。

与此同时，gpt-realtime模型的推出更是让人眼前一亮。这款模型在音质、理解力、指令遵循以及函数调用等多个方面实现了全面飞跃。其生成的语音几乎难以与真人区分，不仅自然流畅，还富有表现力，能够精准捕捉并表达细腻的情感与语调。更令人称奇的是，gpt-realtime支持多语种切换，能够在对话中无缝融入不同语言，展现出极高的语言驾驭能力。

在OpenAI提供的示例中，gpt-realtime所展现出的语音效果令人叹为观止。无论是逐字念出免责声明，还是准确复述字母数字序列，甚至是在对话中根据情境调整语气，它都能游刃有余地完成。这种近乎完美的语音表现，让人不禁联想到AGI（通用人工智能）的曙光初现。

gpt-realtime还推出了两款全新语音——Marin和Cedar，它们在自然度上实现了重大突破，为用户带来了更加愉悦的听觉体验。同时，现有的八款语音也得到了全面升级，进一步提升了语音智能体的整体表现。

在智能与理解力方面，gpt-realtime同样表现出色。它能够捕捉笑声等非语言线索，理解复杂指令，并根据要求灵活调整语气。该模型在识别多种语言中的字母数字序列时，也展现出了极高的准确性。在Big Bench Audio评测中，gpt-realtime的推理能力更是远超旧版模型，取得了令人瞩目的成绩。

为了构建更加强大的语音智能体，gpt-realtime在函数调用方面也进行了诸多改进。它能够更加精准地调用相关函数，在合适的时机以正确的参数执行操作，从而在生产环境中发挥更大的作用。gpt-realtime还支持异步函数调用，使得耗时较长的操作不再阻塞会话流程，保持了对话的流畅性。

Realtime API的新功能同样令人瞩目。除了支持远程MCP服务器和图像输入外，它还增加了SIP协议支持，使得应用能够轻松连接到公共电话网络、PBX系统等SIP端点。这一功能的加入，无疑为语音智能体的应用场景增添了更多可能性。

此次发布还带来了两张新面孔——Beichen Li和Liyu Chen，他们作为OpenAI的技术研究员，在计算机图形学与机器学习交叉领域以及多模态大语言模型方面有着深厚的研究背景。他们的加入无疑将为OpenAI的未来发展注入更多活力。

随着OpenAI在AI语音技术领域的不断探索与突破，我们有理由相信，未来的语音智能体将更加智能、更加人性化，为我们的日常生活带来更多便利与惊喜。

考虑到生产系统对稳定性和保密性的极高要求，网络系统采用独立网络架构，与其他网络完全隔离，有效避免了外部网络的干扰和潜在风险，确保了各网络能够稳定、可靠地运行。公司在全厂范围内进行了工业环网的铺设，这一举措为…

现场固化烘箱主要通过西门子PLC、台达PLC等控制器进行控制，通过实现PLC数据采集到数之能数据中台，随后通过MQTT、Modbus等协议对接到MES系统中，为生产和设备管理提供全面可靠的数据支持，从而不断…

这种技术不仅为各种工业设备提供了网络接入的可能，而且在电能质量管理中发挥着不可忽视的作用。ModbusTCP转Ethernet/IP网关在电能质量管理中的应用是多方面的，它不仅提高了数据通信的效率和准确性，而…

陕西冠杰定制光电转台以“硬件加速+协议优化+智能调度”为核心，构建多维度低延迟传输技术体系，将端到端控制延迟压缩至毫秒级，即使在复杂网络环境下仍保持稳定的低延迟性能。边缘计算节点部署在转台本地，可对采集的图像…

11 月 25 日消息，亚马逊 Amazon Leo（IT之家注：即原 Project Kuiper）卫星网络服务当地时间 24日公布了其面向企业用户的旗舰终端设备 Leo Ultra。 Leo Ultra…

随着数字化转型的加速推进，苏州某科技企业近期通过将整体机房运维外包给苏州胜网服务商模式重构了IT基础设施管理体系，将服务器维保、网络运维等核心业务交由专业服务商托管，实现了运维成本降低37%和系统可用性提升至…

同时，南凌科技覆盖全球的骨干网络及深圳、上海双运营中心（NOC&SOC），为服务的稳定交付与闭环管理提供了强大资源和运维保障。南凌科技通过创新的SD-WAN技术架构，为知名光伏企业构建覆盖全球的智能网络解决…

现在他的业务简直开了挂，专门帮那些在行业里摸爬滚打二三十年的CEO，在TikTok时代打造个人品牌，客户量级从刚起步的小公司，一路冲到估值十亿美元的大企业，不少客户还主动找上门，想定制专属AI智能体。其实…

全民拼购创新融合社交裂变与拼团模式，突破传统低价竞争思维，将"价值共享"融入规则设计——通过合理让渡产品利润，构建无风险参与机制。三、繁荣背后的挑战：低价策略的潜在风险全民拼购虽凭借低价策略快速聚集流量，却…

胖东来客流如织的秘诀，正在于其“真诚为本”的价值观，通过高品质高性价比的商品、以人为本的细节服务、员工与顾客双向幸福的经营逻辑，最终赢得了广泛的客户认同与深度信任。此次银川阅彩城店并非简单复制胖东来模式，而…

11 月 25 日消息，亚马逊 Amazon Leo（IT之家注：即原 Project Kuiper）卫星网络服务当地时间 24日公布了其面向企业用户的旗舰终端设备 Leo Ultra。 Leo Ultra…

在适应复杂环境方面，LeoUltra进行了针对性设计，产品具备坚固耐候特性，能够抵御高低温、降水及强风等多种自然条件考验，可满足不同场景下的企业使用需求。此次启动的Amazon Leo服务企业预览阶段，…

AI云平台领域的重要企业涂鸦智能（纽交所代码：TUYA；港交所代码：2391）公布了其2025年第三季度财务业绩。数据显示，该季度公司营收达8249万美元，较上年同期增长约1.1%，经营利润为380万美元，净利润为1500万美元，经调整后净利润为2010万美元。公司经营活动产生的现

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.