滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI发布三款实时语音模型：GPT-Realtime-2领衔，推理翻译转录全升级

时间：2026-05-08 21:31:00 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

OpenAI 近日正式推出三款针对实时语音场景优化的全新模型，通过 Realtime API 向全球开发者开放调用。这三款模型分别聚焦推理交互、多语言翻译和低延迟转录三大核心需求，旨在破解传统语音技术中存在的延迟响应、打断处理困难及多语言支持不足等痛点，为智能语音助手、实时会议系统等应用提供底层技术支撑。

作为本次发布的旗舰产品，GPT-Realtime-2 首次将 GPT-5 级别的推理能力引入语音交互领域。该模型在保持对话自然度的同时，支持实时工具调用和复杂逻辑推理，能够动态处理用户打断、修正等突发情况。例如在导航场景中，用户可随时更改目的地或调整路线偏好，系统将同步重新规划路径并语音反馈。开发者可基于此构建支持多步骤任务执行的智能助手，显著提升语音交互的复杂度与实用性。

在多语言支持方面，GPT-Realtime-Translate 实现了 70 种输入语言与 13 种输出语言的实时互译，翻译延迟控制在人类对话节奏范围内。该模型特别优化了跨国会议场景，支持发言者切换时自动识别语种并同步输出译文，确保参会者获得无感知的翻译体验。测试数据显示，其翻译准确率在专业术语密集的科技会议场景中达到 92% 以上。

针对实时字幕和会议记录需求，GPT-Realtime-Whisper 通过流式转录技术将音频处理延迟压缩至毫秒级。该模型支持边说边转的连续工作模式，转录文本可实时显示在终端设备，特别适用于直播字幕、远程医疗问诊等对时效性要求极高的场景。实测表明，在标准网络环境下，其转录延迟较前代产品降低 67%，错误率下降 41%。

商业化层面，OpenAI 采用差异化定价策略：GPT-Realtime-2 按 Token 计费，输入费用为每百万 Token 32 美元（约合人民币 218.1 元），输出费用 64 美元（约合人民币 436.2 元），缓存输入仅需 0.4 美元；翻译与转录模型则按使用时长计费，前者每分钟 0.034 美元，后者每分钟 0.017 美元。这种灵活的定价体系为不同规模的开发团队提供了成本可控的技术接入方案。

更多>同类资讯

折叠屏二次进化：从大屏到“大任务”，AI时代终端新范式来了

06-13

鸿蒙7引领Agent新篇，余承东豪言盘古大模型剑指全球第一

06-13

宇瞻GraTherX内存散热方案：0.17mm加厚设计，降故障率提散热效能

06-13

HarmonyOS 7开发者Beta版发布纯血鸿蒙自研突破性能与安全双提升

【CNMO科技消息】6月12日，华为开发者大会（HDC2026）在东莞松山湖拉开帷幕。华为常务董事、产品投资评审委员会主任、终端BG董事长余承东登台发表主题演讲，正式发布HarmonyOS 7（即Harmo…

06-13

鸿蒙7开发者Beta版亮相：全系统AI化升级，小艺成智慧大脑新标杆

【太平洋科技】在今日举办的华为开发者大会上，余承东正式发布全新HarmonyOS 7系统。 AI是本次版本升级的核心亮点，HarmonyOS 7完成全系统AI化改造。迭代升级后的小艺可调用两百余项系统数据…

06-13

2026华为开发者大会启幕 HarmonyOS 7 Beta开启 Agent时代新征程

围绕Agent时代的智能化创新，华为带来五大核心发布：HarmonyOS7首秀、鸿蒙智能向Agent架构全面演进、鸿蒙智能体框架升级至2.0、鸿蒙空间计算首次发布、开源盘古openPangu 2.0。与此…

06-13

余承东立下目标：带领大模型团队全速追赶，誓要登顶行业第一！

快科技6月12日消息，今天举办的华为开发者大会现场，华为常务董事、产品投资评审委员会主任、终端BG董事长余承东发表核心主题演讲，除了正式推出全新的HarmonyOS 7操作系统，还直接宣告整个鸿蒙生态正式踏入…

06-13

HDC 2026启幕：HarmonyOS 7 Beta亮相，鸿蒙生态迈向Agent智能新纪元

大会最新数据显示，HarmonyOS已携手超3500家生态伙伴共筑全场景新生态，联接生态设备总量突破13亿台，无论是城市治理、能源管理、政务办公，还是医疗健康、智能制造与无人机调度，开源鸿蒙已实现广泛覆盖，为…

06-13

上交会全球首发“六臂玄甲” 具身智能机器人展现高复杂度作业新实力

06-13

中大型轿跑SUV新选择昊铂S600上市纯电增程双动力限时权益价17.99万元起

06-13

HarmonyOS 7重磅发布，鸿蒙生态开启Agent时代新征程

06-13

AI重塑消费：从商品交易到情感联结，新消费时代已悄然开启

06-13

折叠屏进化新方向：AI赋能，大屏开启“大任务”时代

06-13

吴世春：把握四大创业方向 6月26日深圳参访解锁投资新机遇

06-13

全球商业航天迎资本新篇国内火箭卫星技术突破加速产业落地进程

全球商业航天产业将进入资本市场定价体系，“商业航天+卫星互联网+太空AI算力”三位一体的产业链价值量化，为全球供应链设定了公开市场的“估值锚”。6月1日，长征十二号乙成功首飞，标志着我国商业航天在中型运载火…

06-13

点击查看更多 +

全站最新

启境GT7预售进行时！6月中下旬动态试驾开启，多版本配置亮点抢先看

锂电产业链动态：宁德时代钠电储能将GWh级出货国轩高科入局问界M6供应链

余承东立下目标：带领大模型团队全速追赶，誓要登顶行业第一！

华为鸿蒙智行放大招！享界G9方盒子造型亮相智界RX运动风来袭

HDC 2026启幕：HarmonyOS 7 Beta亮相，鸿蒙生态迈向Agent智能新纪元

东风奕派EP7申报图亮相：双电机四驱配电动尾翼，中大型纯电轿车市场再添劲敌

热门内容

本栏最新

余承东立下目标：带领大模型团队全速追赶，誓要登顶行业第一！

HDC 2026启幕：HarmonyOS 7 Beta亮相，鸿蒙生态迈向Agent智能新纪元

中大型轿跑SUV新选择昊铂S600上市纯电增程双动力限时权益价17.99万元起

东风日产新能源加速跑：14个月产销破10万，花都基地冲刺全球市场

17.99万起享满配！昊铂S600动力舒适安全全拉满，20万级SUV新标杆

卓驭舱驾一体方案赋能极狐问道V9 开启未来出行“优美”新体验

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.