滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

OpenAI正式推出gpt-realtime模型：实时语音对话，支持情感与非语言信号感知

时间：2025-08-29 09:03:07 来源：IT之家编辑：快讯 IP：北京 发表评论无障碍通道

OpenAI近日宣布，其“Realtime API”正式脱离测试阶段，全面进入生产环境应用。这一消息标志着该API已经准备好为更多的企业和开发者提供服务。

据悉，Realtime API主要针对的是企业和开发者用户，旨在帮助他们打造能够应用于客户支持、教育、个人效率提升等多个领域的语音助手。其核心组件“gpt-realtime”模型采用了创新的端到端Speech-to-Speech架构，能够直接生成并处理语音，省去了繁琐的文本转换步骤。OpenAI强调，与之前的版本相比，gpt-realtime模型在响应速度、语音自然度以及复杂指令处理能力上均有显著提升。

值得注意的是，gpt-realtime模型不仅功能强大，还具备高度的灵活性。它能够捕捉笑声等非语言信号，支持对话过程中切换语言，并能根据需求调整语音语气，如实现带法国口音的友好语调或语速较快的专业语调。该模型还新增了“Cedar”和“Marin”两种语音，并对现有的8种语音效果进行了优化，使得语音输出更加丰富多样。

在性能基准测试中，gpt-realtime模型同样表现出色。在Big Bench Audio、MultiChallenge和ComplexFuncBench等多项测试中，其准确率均有大幅提升。这一成绩无疑为gpt-realtime模型在实际应用中的表现提供了有力保障。

除了核心模型的升级，Realtime API在工具集成流程上也进行了优化。该模型能够更精准地选择适用工具、在恰当时机触发工具，并正确配置工具参数，从而大幅提升了函数调用的可靠性。开发者可以通过会话初始协议（SIP）与远程媒体控制协议（MCP）服务器连接外部工具与服务，进一步提高了开发效率。同时，可复用的提示词功能使得开发者能够保存不同使用场景下的配置与工具设置，为开发工作带来了更多便利。

Realtime API还新增了图像输入功能。用户在对话过程中可以发送截图或照片，模型能够参考图像内容进行交互，如读取图像中的文字或回答与图像内容相关的问题。这一功能使得对话内容更加丰富多彩，也为开发者提供了更多的创新空间。

为了降低开发者的使用成本，Realtime API还新增了两项实用功能。开发者可以设置token使用上限，并对多轮对话内容进行精简处理。这两项功能有助于在较长会话中更好地控制成本，提高经济效益。同时，gpt-realtime模型的使用成本也降低了20%，当前定价为音频输入token每百万个32美元，音频输出token每百万个64美元，缓存输入token每百万个0.40美元。

在安全性方面，Realtime API具备检测问题内容的能力。若对话违反平台政策，该API可自动终止会话。然而，OpenAI也提醒开发者，这不应是唯一的安全保障手段，开发者仍需自行添加专属安全要求以确保对话内容的安全性和合规性。

针对欧盟用户，Realtime API还提供了数据本地化存储选项，并为企业用户制定了特殊隐私规则，以符合欧盟地区的数据保护法规。这一举措无疑增强了欧盟用户对Realtime API的信任度和使用意愿。

更多>同类资讯

华为2025年10月完成5G-A蜂窝无源物联关键技术测试表现优异助力商用

11-19

技术赋能玩具升级 2025年我国AI玩具市场规模或突破290亿元大关

11-19

宗馥莉辞职未失权？娃哈哈大会揭秘：她如何隐身掌控全局

11-19

光热产业“加速跑”：我国增速领跑全球，技术突破电价下行未来可期

11-19

技术派掌舵！中国最大焊接机器人出口商卡诺普冲刺港股IPO

11-19

11月天猫服饰趋势解码：从外套到靴履，解锁冬季穿搭新灵感与上新指南

11-19

外卖补贴“双刃剑”：瑞幸营收创新高，利润却被配送成本“吞噬”

11-19

股市强劲背景下，各规模组黑马主观多头私募产品纷纷崭露头角！

11-19

新国盛证券揭牌仅10天江西国资三大股东拟减持套现约10亿

11-19

奢侈品遇冷？Burberry靠战略调整与折扣策略成功逆袭引关注

11-19

小众职业新图景：机车约拍、收纳、搭配……年轻人用热爱“掘金”日薪过千

11-19

跨越山河的金融助力：稠州银行让香菇“双城记”焕发新活力

11-19

Manner咖啡被传2026年赴港IPO 回应“不予置评” 门店数近2500家

11-19

孚日股份70岁创始人孙日贵“清仓”转让股份给儿子，9年前女儿已获超千万股

11-19

山野火锅“沸点计划”启航：多维创新驱动，剑指三年全球万店布局

11-19

点击查看更多 +

全站最新

开放创新浪潮涌动：华为实践引领知识产权新生态与未来新图景

华为坤灵中国行2025广东站启幕共探中小企业智能化升级新路径

百度AI生态全面开花：技术筑基应用落地，开启高增长新篇章

农银投资、浦东创投成立企航私募投资基金出资额33.34亿

中广核工程公司增资至40.86亿增幅约5%

海航航空技术公司增资至约49.45亿增幅约32%

热门内容

本栏最新

国产大飞机首次“落户”宁波

全新坦克400多版本上市，潮酷设计引都市青年追捧，开启多元越野生活

全新坦克400正式登场，24.98万起售，四款动力满足多元需求！

起亚Telluride测试车披"艺术伪装"亮相，创意彩蛋致敬命名地

30万级6座SUV新角逐：2026款腾势N8L与理想L8，谁更合家庭心意？

远程湘潭基地智能制造赋能超级VAN，推动新能源商用车产业高质量发展

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.