滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

GPT-Realtime发布：OpenAI引领AI语音智能体进入逼真对话新纪元

时间：2025-08-29 08:30:46 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

OpenAI在近期的一次技术直播活动中，正式揭晓了其最新的语音模型——GPT-realtime。这款模型专为语音人工智能代理设计，旨在提供前所未有的自然语音交互体验。

GPT-realtime以其卓越的多模态特性脱颖而出，不仅能生成流畅自然的语音，还能精准模仿人类的语调、情感和语速变化。更重要的是，它能够理解图像内容，并将图像信息与语音或文本对话相结合，为客服、教育、金融、医疗等多个领域打造智能化语音交互体验。

GPT-realtime新增了Marin与Cedar两种特色语音，并对原有8种语音进行了全面优化，使得语音选择更加丰富多样。该模型还能在语音中自动切换三种情绪，为用户带来更加丰富的听觉享受。

与传统语音模型相比，GPT-realtime的最大亮点在于其智力、推理和理解能力。它能够敏锐捕捉笑声等非语言信号，自如地在句子中切换语言，并根据场景需求灵活调整语气，使对话更加自然真实。

在评估测试中，GPT-realtime展现出了强大的性能。在多种语言环境下，它对字母数字序列的检测准确率大幅提升。在BigBenchAudio评估中，该模型更是以82.8%的准确率，成为目前最强的智能语音模型。

GPT-realtime在指令遵循能力方面也取得了显著进步。开发者可以对模型进行指令自定义，包括说话方式、特定场景下的对话内容等。经过深度优化，GPT-realtime对细微指令也能产生显著的引导效果。在MultiChallenge音频基准测试中，其指令遵循准确率从旧模型的20.6%提升至30.5%。

GPT-realtime在函数调用能力方面也进行了全方位优化。在ComplexFuncBench测试中，其得分从旧模型的49.7%飙升至66.5%。异步函数调用功能也得到了极大改进，使得长时间运行的函数调用不再影响会话流程。

GPT-realtime还支持图像输入功能，开发者可以在Realtime API会话中自由添加图像、照片、截图等，与音频或文本结合使用。这一功能使得模型能够基于用户实际所见内容展开对话，大大提高了交互的个性化和精准度。

与GPT-realtime同步上线的还有Realtime API的一系列全新功能。开发者只需在会话配置中传入远程MCP服务器的URL，即可快速启用MCP支持。这种配置方式大大简化了智能体功能的扩展过程，提高了开发效率。

Realtime API还新增了会话初始协议支持和可复用提示功能，进一步提升了其集成便捷性和生产使用灵活性。会话初始协议支持使得Realtime API能够与公共电话网络、专用分组交换机系统等建立连接，拓展了应用连接范围。而可复用提示功能则允许开发者保存并在多个会话中重复使用提示，减少了重复性劳动。

在安全与隐私保障方面，Realtime API内置了多层严密的防护措施。通过实时监测对话内容，一旦检测到有害内容，会立即终止会话，确保使用环境的安全与健康。开发者还可以借助Agents SDK添加自定义安全防护措施，实现更加精细化的安全管理。

在定价与可用性方面，GPT-realtime和Realtime API均已正式开放给所有开发者使用。与预览版相比，GPT-realtime的价格降低了20%。同时，OpenAI还为对话上下文新增了精细控制功能，开发者可以灵活设置智能token限制，降低长会话成本。

更多>同类资讯

万马股份：公司220kV海缆用超净绝缘及屏蔽材料已实现工程化应用

06-13

东田微：目前公司光通信类滤光片订单饱满产能爬坡与订单交付同步推进

06-13

《荒野之地2:新大陆》Steam再开启免费领！62%好评中世纪奇幻冒险等你来

06-13

《最终幻想7》重制三部曲结局早有规划，滨口直树携手北濑佳范信心满满待反馈

06-13

屏蔽内容

06-13

上海试点收购存量二手房扩容保障性租赁住房供给

06-13

携程被罚1000万：未落实数据出境安全评估要求

06-13

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

06-13

携程因数据出境违规遭千万罚款个人信息保护警钟再响

06-13

智谱今晚5:21向GLM Coding Plan全量用户开放GLM-5.2 下周API上线并开源

06-13

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

06-13

携程被罚1000万：因未落实数据出境安全评估要求、违法出境个人信息

06-13

隧道施工安全新保障：咏思信息UWB定位系统助力交通水利能源隧道建设

选择指南与购买建议：选择隧道UWB定位系统时，需重点考虑以下因素：1. 产品适配性：定位精度需满足±15cm以内，支持复杂地质条件下的信号稳定传输，如咏思的UWB设备通过多频段自适应技术实现抗干扰能力。基于…

06-13

尺寸相似却“性格”各异我国科学家探明两类系外行星演化差异

06-13

斯里兰卡航空一客机起飞后遭雷击发动机受损紧急返航后乘客安全无虞

06-13

点击查看更多 +

全站最新

李书福布局新战略：关停冗余主体，聚焦资源助力吉利汽车0175HK腾飞

黄渤亮相重庆赛力斯工厂共庆全新一代问界M9全国首批用户交付盛典

2026年车市新势力崛起：新车型精准发力单月销量突破两万大关

长安智能化电动化双线并进：天枢领航首搭启源，蓝鲸超擎混动量产在即

全电作业新标杆！2026款长安猎手K50上市，14.19万起重塑皮卡体验

宝马M新世代概念车首秀：高性能电驱+100kWh电池，纯电也能有赛道灵魂

热门内容

本栏最新

保养后油耗飙升？别急着怪车！机油问题才是幕后真凶

北京地铁回应张雪事件：闸机防夹未关时插卡，无效票卡被退引误会

两年估值10.9亿订单爆满，张雪机车上市时机：是顺势而为还是再等等？

Ping64如何让即时通讯文件外发从“盲区”变“责任链”全解析

千诀科技A轮融资数亿元，京铭资本领投多家老股东持续加码共助发展

雨天刹车“失灵”？别急着怪自己，水膜作祟才是真凶！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.