ITBear旗下自媒体矩阵:

阶跃星辰Step-Audio-R1.1登顶权威榜单 准确率96.4%领跑语音推理赛道

   时间:2026-01-16 16:13:11 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在人工智能领域,原生语音推理模型的竞争愈发激烈。近日,全球知名的大模型评测榜单Artificial Analysis Speech Reasoning迎来更新,阶跃星辰推出的原生语音推理模型Step-Audio-R1.1凭借卓越表现登顶榜首,引发行业广泛关注。

Artificial Analysis Speech Reasoning榜单作为评估“原生语音模型”的权威第三方基准,重点考察模型直接处理音频并完成复杂逻辑推理的能力,准确率、首包延迟等关键指标是衡量模型性能的重要维度。在这样严格的评判标准下,Step-Audio-R1.1脱颖而出,以96.4%的准确率超越了Grok、Gemini、GPT-Realtime等主流一线模型,刷新了该榜单的历史最好成绩。

语音模型若要实现更高阶的智能交互,强大的推理能力必不可少。如同大语言模型需要深度理解语义并给出合理回应一样,语音模型也需具备类似能力,才能让用户感受到自然流畅的交流体验。Step-Audio-R1.1在性能与速度的综合权衡上表现突出,全面碾压同类语音模型。它由阶跃星辰发布,其前代Step-Audio-R1是全球首个开源的原生语音推理模型,能够在不增加额外时延的情况下,端到端地理解语音内容,实现“像人类一样听到对话即可思考”的效果。

Step-Audio-R1.1作为最新升级版本,在继承前代优势的基础上,进一步提升了实时对话和复杂语音推理能力。其核心能力涵盖深度语音推理、实时响应能力以及音频领域的可扩展CoT。这些能力使得该模型在处理语音任务时更加高效、精准,能够满足多样化的应用场景需求。

目前,Step-Audio-R1.1的权重已上传至HuggingFace,方便开发者进行研究和应用。同时,开放的chat模式已搭载R1.1核心,支持边想边说的流式推理,为用户带来更加流畅的交互体验。完整的实时语音API预计将于2月上线,届时将进一步拓展该模型的应用范围,推动原生语音推理技术在更多领域的落地。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version