滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI发布三款实时语音模型：GPT-Realtime-2推理强，翻译转录也高效

时间：2026-05-09 06:01:41 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

OpenAI 近日推出三款面向实时语音场景的专用模型，通过Realtime API向全球开发者开放调用。这三款模型分别聚焦语音推理、多语言翻译和低延迟转录三大核心需求，旨在破解传统语音交互中存在的延迟响应、打断处理困难及跨语言支持不足等痛点，为智能语音助手、实时会议系统等应用提供底层技术支撑。

作为此次发布的旗舰产品，GPT-Realtime-2首次将GPT-5级别的推理能力引入语音交互领域。该模型在保持对话自然流畅的同时，支持实时推理决策、工具调用及用户打断处理。例如当用户中途修正指令时，模型能立即调整响应策略，而非机械执行初始命令。这种能力使得开发者可构建具备复杂任务处理能力的语音助手，如自动订票系统中同时处理日期修改、座位升级等多步骤操作。

在定价体系方面，GPT-Realtime-2采用Token计费模式：音频输入每百万Token收费32美元（约合人民币218.1元），输出收费64美元（约合人民币436.2元），缓存输入费用则低至0.4美元。这种差异化定价策略既考虑了计算资源消耗差异，也为高频使用者提供了成本优化空间。

针对跨国沟通场景，GPT-Realtime-Translate支持70种语言输入与13种语言输出的实时互译。该模型通过动态调整翻译节奏，确保输出文本与说话者语速同步，特别适用于国际会议、远程医疗等需要即时理解的场景。测试数据显示，其翻译延迟控制在200毫秒以内，达到人类对话的自然节奏标准。

另一款专业模型GPT-Realtime-Whisper专注于流式转录服务，通过优化音频处理算法实现"边说边转"的零延迟体验。在会议记录、实时字幕等场景中，该模型可将转录等待时间减少70%，同时保持95%以上的准确率。其按分钟计费模式（翻译每分钟0.034美元，转录每分钟0.017美元）也降低了中小企业的使用门槛。

技术专家指出，这三款模型的发布标志着语音交互进入"实时智能"新阶段。通过将大语言模型的推理能力与语音处理技术深度融合，OpenAI正在重新定义人机语音交互的标准，为教育、医疗、客服等行业的数字化转型提供关键基础设施。

更多>同类资讯

折叠屏二次进化：从大屏到“大任务”，AI时代终端新范式来了

06-13

鸿蒙7引领Agent新篇，余承东豪言盘古大模型剑指全球第一

06-13

宇瞻GraTherX内存散热方案：0.17mm加厚设计，降故障率提散热效能

06-13

HarmonyOS 7开发者Beta版发布纯血鸿蒙自研突破性能与安全双提升

【CNMO科技消息】6月12日，华为开发者大会（HDC2026）在东莞松山湖拉开帷幕。华为常务董事、产品投资评审委员会主任、终端BG董事长余承东登台发表主题演讲，正式发布HarmonyOS 7（即Harmo…

06-13

鸿蒙7开发者Beta版亮相：全系统AI化升级，小艺成智慧大脑新标杆

【太平洋科技】在今日举办的华为开发者大会上，余承东正式发布全新HarmonyOS 7系统。 AI是本次版本升级的核心亮点，HarmonyOS 7完成全系统AI化改造。迭代升级后的小艺可调用两百余项系统数据…

06-13

2026华为开发者大会启幕 HarmonyOS 7 Beta开启 Agent时代新征程

围绕Agent时代的智能化创新，华为带来五大核心发布：HarmonyOS7首秀、鸿蒙智能向Agent架构全面演进、鸿蒙智能体框架升级至2.0、鸿蒙空间计算首次发布、开源盘古openPangu 2.0。与此…

06-13

余承东立下目标：带领大模型团队全速追赶，誓要登顶行业第一！

快科技6月12日消息，今天举办的华为开发者大会现场，华为常务董事、产品投资评审委员会主任、终端BG董事长余承东发表核心主题演讲，除了正式推出全新的HarmonyOS 7操作系统，还直接宣告整个鸿蒙生态正式踏入…

06-13

HDC 2026启幕：HarmonyOS 7 Beta亮相，鸿蒙生态迈向Agent智能新纪元

大会最新数据显示，HarmonyOS已携手超3500家生态伙伴共筑全场景新生态，联接生态设备总量突破13亿台，无论是城市治理、能源管理、政务办公，还是医疗健康、智能制造与无人机调度，开源鸿蒙已实现广泛覆盖，为…

06-13

上交会全球首发“六臂玄甲” 具身智能机器人展现高复杂度作业新实力

06-13

中大型轿跑SUV新选择昊铂S600上市纯电增程双动力限时权益价17.99万元起

06-13

HarmonyOS 7重磅发布，鸿蒙生态开启Agent时代新征程

06-13

AI重塑消费：从商品交易到情感联结，新消费时代已悄然开启

06-13

折叠屏进化新方向：AI赋能，大屏开启“大任务”时代

06-13

吴世春：把握四大创业方向 6月26日深圳参访解锁投资新机遇

06-13

全球商业航天迎资本新篇国内火箭卫星技术突破加速产业落地进程

全球商业航天产业将进入资本市场定价体系，“商业航天+卫星互联网+太空AI算力”三位一体的产业链价值量化，为全球供应链设定了公开市场的“估值锚”。6月1日，长征十二号乙成功首飞，标志着我国商业航天在中型运载火…

06-13

点击查看更多 +

全站最新

启境GT7预售进行时！6月中下旬动态试驾开启，多版本配置亮点抢先看

锂电产业链动态：宁德时代钠电储能将GWh级出货国轩高科入局问界M6供应链

余承东立下目标：带领大模型团队全速追赶，誓要登顶行业第一！

华为鸿蒙智行放大招！享界G9方盒子造型亮相智界RX运动风来袭

HDC 2026启幕：HarmonyOS 7 Beta亮相，鸿蒙生态迈向Agent智能新纪元

东风奕派EP7申报图亮相：双电机四驱配电动尾翼，中大型纯电轿车市场再添劲敌

热门内容

本栏最新

余承东立下目标：带领大模型团队全速追赶，誓要登顶行业第一！

HDC 2026启幕：HarmonyOS 7 Beta亮相，鸿蒙生态迈向Agent智能新纪元

中大型轿跑SUV新选择昊铂S600上市纯电增程双动力限时权益价17.99万元起

东风日产新能源加速跑：14个月产销破10万，花都基地冲刺全球市场

17.99万起享满配！昊铂S600动力舒适安全全拉满，20万级SUV新标杆

卓驭舱驾一体方案赋能极狐问道V9 开启未来出行“优美”新体验

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.