滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

OpenAI升级语音模型GPT-RealTime：功能增强，价格更亲民

时间：2025-08-30 02:55:00 来源：智东西编辑：快讯 IP：北京 发表评论无障碍通道

在科技界的一次重大突破中，OpenAI于近日凌晨震撼发布了专为开发人员设计的GPT-RealTime语音转语音模型。与此同时，该公司还对其API功能进行了全面升级，新增了远程MCP服务器支持、图像输入功能以及SIP电话呼叫支持。

据OpenAI官方介绍，GPT-RealTime是其迄今为止最为先进的语音合成模型。该模型在遵循复杂指令、精确调用工具以及生成自然流畅的语音方面实现了显著提升。GPT-RealTime不仅能够自然朗读包含重复字母和数字的文本，还能无缝切换语言，甚至能够捕捉到笑声等非语言信号，为用户带来更加真实、生动的对话体验。

为了进一步提升用户体验，OpenAI还推出了两个全新的语音——Cedar和Marin，它们将作为Realtime API的独家语音选项提供给用户。在定价方面，通用版Realtime API和全新的GPT-RealTime模型现已对所有开发者开放。相较于之前的预览版，GPT-RealTime的价格下调了20%，其中每百万token音频输入价格为32美元，缓存输入为0.4美元，每百万token音频输出价格为64美元。

OpenAI此次升级还特别增加了对对话上下文的细粒度控制功能。这一功能允许开发者设置智能token限制，并一次截断多个对话回合，从而显著降低长会话的成本。自去年10月OpenAI发布Realtime API的公开测试版以来，已有数千名开发者使用该API并提出了宝贵的建议。

然而，尽管GPT-RealTime模型受到了部分用户的热烈欢迎，认为它将使语音应用变得更加有趣，但仍有一些开发者表示担忧。他们认为，尽管模型的声音有所改进，但仍显得过于机械，而旧的语音角色也只是在表现力上略有提升。

在技术层面，GPT-RealTime在音频质量、理解用户指令以及遵循指令等方面均实现了显著改进。该模型能够产出更加自然的高质量语音，并能遵循细粒度的指令，如“以快速专业的语气说话”或“用法国口音富有同情心地表达”。在理解用户指令方面，GPT-RealTime能够捕捉笑声等非语言线索，在句子中切换语言，并调整语气。

GPT-RealTime在构建语音转语音应用时，能够更准确地遵循开发者的指令。在衡量指令遵循准确性的MultiChallenge音频基准测试中，GPT-RealTime的得分相较于旧模型有了显著提升。同时，在测量函数调用性能的ComplexFuncBench音频评估中，GPT-RealTime也取得了优异的成绩。

除了模型本身的改进外，Realtime API还新增了多项实用功能。开发者现在可以通过在会话配置中传入远程MCP服务器的URL来启用MCP支持，无需手动设置集成。开发者还可以在Realtime API会话中添加图像、照片和截图，使模型能够基于用户实际看到的内容来构建对话。这一功能将极大地提升用户体验，使用户能够提出更加具体、直观的问题。

为了防止实时语音对话被滥用，Realtime API还包含多层安全防护和缓解措施。OpenAI对Realtime API会话采用主动分类器，一旦检测到有害内容，将立即中止对话。同时，开发者还可以使用Agents SDK添加自己的额外安全防护措施，确保对话的安全性和合规性。

更多>同类资讯

全栈AI赋能电力交易！LuminFlex系统发布，助力行业迈向智能化新阶段

06-14

微纳星空6颗“东坡”卫星完成总装测试，即将搭乘引力一号Y4火箭升空

06-14

全球土壤科学盛会落幕中国智慧解锁可持续发展“土壤密码”

06-14

百利天恒创新生物药BL - M14D1联合用药获批开展小细胞肺癌临床试验

06-14

中信建投：SpaceX创纪录IPO重塑估值体系继续看好商业航天投资机会

06-14

GaussianDWM：3D高斯模型助力自动驾驶场景理解与多模态生成双突破

06-14

美国NASA选定“飞马”月球车，助力月球南极基地建设与资源开发

06-14

第二十四届海创会启幕，宁德时代携凝聚态、钠新等新型电池引领新能源新篇

06-14

AI算力浪潮下，中国四大硬科技龙头如何以技术突围实现业绩狂飙？

06-14

万亿市值光模块龙头中际旭创否认业绩爆雷传闻：汇兑影响不实

06-14

图解丨2026年以来美股涨幅TOP15

06-14

拓璞数控(07688.HK)悉数行使超额配股权、稳定价格行动及稳定价格期结束

06-14

长征五号再立新功送卫星入轨实力强劲为何难担载人登月重任？

而我国正在研制的梦舟载人飞船，整船重量可达27吨左右，这已经远远超出了长征五号在地月转移轨道上的承载能力，甚至连送入近地轨道都面临压力，更不用说直接送往月球轨道。正因如此，我国正在研发的梦舟载人飞船，…

06-14

中国载人航天跨越式发展：从短期驻留到一年期试验，筑牢太空探索坚实后盾

从神舟五号在轨飞行21小时23分钟，到神舟十一号实现33天中期驻留，再到多批次航天员乘组常态化半年驻留，直至近日神舟二十三号发射成功，将有一名航天员开展一年期在轨驻留试验，中国载人航天实现了航天员在轨驻留时长…

06-14

美智库报告：中美航天差距缩小，中国导航定位领先成新格局

报告中提炼出的三点判断尤为关键：其一，在可重复使用火箭领域，美国依旧保持领先地位，但中国近年来多次关键试验稳步推进，差距正在被快速压缩；其二，在导航定位与对地遥感观测方面，中国已经实现领先；其三，在空间站技术…

06-14

点击查看更多 +

全站最新

捷达车展“来电”转型，技术产品双驱动开启电动化新征程

理想汽车智源大会亮剑：自研马赫M100芯片破解AI推理难题性能跃升

霓星科技华南展秀实力：以「进化系AI」开启两轮车智能新体验

功夫佛山邂逅腾势闪充科技第二代腾势D9与N9佛山上市品鉴会完美收官

山城聚光，大众安徽三款纯电车型齐亮相开启智能出行新篇

重庆车展启幕，地平线携整车智能产品矩阵，解锁出行新“智”感

热门内容

本栏最新

宁德时代“一壳两芯”架构亮相，钠离子电池产业化迈出关键一步

保养后油耗飙升？别急着怪车！机油问题才是幕后真凶

北京地铁回应张雪事件：闸机防夹未关时插卡，无效票卡被退引误会

两年估值10.9亿订单爆满，张雪机车上市时机：是顺势而为还是再等等？

Ping64如何让即时通讯文件外发从“盲区”变“责任链”全解析

千诀科技A轮融资数亿元，京铭资本领投多家老股东持续加码共助发展

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.