滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

阶跃星辰发布Step-Audio2mini：开源语音大模型，理解精准，表达自然

时间：2025-09-01 19:56:20 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

阶跃星辰公司近期震撼发布了其最新的开源语音大模型Step-Audio2mini，这一创新成果在国际基准测试中大放异彩，斩获了最先进技术（SOTA）的殊荣。Step-Audio2mini不仅在语音理解和音频生成领域展现出强大的实力，更首次将音频推理与生成整合至同一模型中，为语音识别、跨语言交流及情感分析等多元化应用场景提供了卓越的解决方案。

该模型的一大亮点在于其出众的多模态音频理解能力。在备受瞩目的多模态音频理解测试集（MMAU）上，Step-Audio2mini以73.2分的优异成绩，稳居开源语音模型排行榜首位。在口语对话能力的权威测试URO Bench中，无论是在基础赛道还是专业赛道，Step-Audio2mini均取得了开源模型中的最高分数，彰显了其对话理解与表达方面的卓越才能。

在中英互译任务上，Step-Audio2mini同样表现出色。在CoVoST2和CVSS评测集上，该模型分别斩获了39.3和29.1的高分，显著超越了GPT-4o Audio等竞争对手，以及其他开源语音模型。在语音识别领域，Step-Audio2mini同样表现非凡，在开源中文测试集上的字错误率仅为3.19%，在开源英语测试集上的词错误率也仅为3.50%，相较于其他开源模型，领先幅度超过15%。

Step-Audio2mini的成功得益于其独特的架构设计。该模型摒弃了传统的自动语音识别（ASR）、大语言模型（LLM）和文本转语音（TTS）三级结构，实现了从原始音频输入到语音响应输出的无缝转换，极大地简化了模型架构，降低了处理延迟。同时，模型还融入了链式思维推理（CoT）与强化学习的联合优化技术，使其能够更精准地捕捉情绪、语调等副语言信息，并作出自然流畅的回应。

尤为Step-Audio2mini还具备音频知识增强功能，能够借助外部工具进行联网搜索，有效解决了传统模型中的幻觉问题。这一创新特性不仅提升了模型的实用性和可靠性，还进一步拓宽了其在各类应用场景中的潜力。

目前，Step-Audio2mini已在GitHub、Hugging Face等知名平台上架，诚邀广大开发者前来试用并贡献代码，共同推动语音技术的创新发展。

更多>同类资讯

360启动ADE认证全国渠道伙伴计划，加速AI智能体人才规模化培养

近日，360 ADE认证全国渠道伙伴计划启动会暨ISC.AI ADE师资训练营在北京举行。来自行业机构、教育领域及全国渠道合作伙伴代表齐聚现场，围绕人工智能智能体时代的人才培养展开深入交流。会上，360正式发布ADE认证渠道合作战略，标志着其在AI人才培养领域进入规模化发展

04-27

芯擎科技“龍鹰二号”5nm车规级AI座舱芯片亮相，算力强劲助力舱驾融合新体验

04-27

Gartner预测：2026年全球数据中心及IT支出将大幅增长，AI成关键驱动力

04-27

DeepSeek API输入缓存价格再降新低，V4系列优惠叠加更划算

04-27

蚂蚁灵光App新功能上线：上传图片秒变3D世界，手游式操控探索新体验

04-27

欣旺达北京车展秀实力：“欣星环”电池发布，“能量家生活馆”引领新能源生活

04-27

吉利第5代帝豪i-HEV智擎混动北京车展首秀动力节能安全全面升级

04-27

2026北京车展|日产汽车：以中国为支点，撬动全球新能源与智能化新布局

04-27

欣旺达携“欣星环”亮相北京车展：以全场景电池，开启新能源生活新体验

04-27

博越REV长续航增程SUV上市 375km纯电续航开启A+级出行新体验

04-27

江淮汽车2026车展亮剑：携多款新车与AI质检大模型开启科技新征程

04-27

大模型的“雅尔塔时刻”

04-27

傅鹏博价值成长双轮驱动睿远成长价值破新高背后的投资哲学

04-27

“AI老法师”上岗：大模型接管工厂，工业制造开启“生命化”进化

04-27

ComfyUI完成3000万美元融资:估值达5亿美元，用户数突破400万

04-27

点击查看更多 +

全站最新

第5代帝豪i-HEV智擎混动车展首秀，以2L级油耗引领国民家轿新体验

奔腾激光MFC2026展锋芒，三维切割技术赋能新能源汽车轻量化新征程

24980元起！极光C652V美式巡航来袭，长轴距大宽胎软尾，国产新选择

方程豹钛7 EV闪充版4月29日登场预售22万起硬派SUV新选择来袭

长城汽车赛车文化日盛大启幕，多款赛车亮相，发布高性能架构引期待

日产汽车2026北京车展发力：携新车型亮相，加速全球布局与电驱转型

热门内容

本栏最新

欣旺达北京车展秀实力：“欣星环”电池发布，“能量家生活馆”引领新能源生活

吉利第5代帝豪i-HEV智擎混动北京车展首秀动力节能安全全面升级

2026北京车展|日产汽车：以中国为支点，撬动全球新能源与智能化新布局

欣旺达携“欣星环”亮相北京车展：以全场景电池，开启新能源生活新体验

博越REV长续航增程SUV上市 375km纯电续航开启A+级出行新体验

江淮汽车2026车展亮剑：携多款新车与AI质检大模型开启科技新征程

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.