AI音频生成领域迎来重要突破,知名初创企业Stability AI正式发布Stability Audio 3.0系列模型,其中旗舰版本可生成超过六分钟的专业级音乐作品。该系列包含四款不同参数规模的模型,分别针对设备端部署与云端创作场景进行优化,标志着音频生成技术向长时长、高精度方向迈出关键一步。
技术架构方面,新系列包含45900万参数的轻量级SFX模型、同参数规模的基础版、14亿参数的中型模型以及27亿参数的旗舰模型。前两款小型模型专为移动设备设计,支持本地生成两分钟以内的音频片段,而中大型模型则具备完整的音乐结构控制能力,最长可创作6分20秒的完整乐曲。相较于2024年推出的Stable Audio 2.0,新模型的创作时长实现翻倍提升。
在开源策略上,该公司采取差异化开放模式。轻量级SFX模型、基础版及中型模型已向全球开发者开放源代码,允许自由下载和修改模型权重。但旗舰版本仅通过API接口和付费托管服务提供,且对年营收超100万美元的企业强制要求购买商业授权。这种分层开放模式既保障了技术普惠性,又为商业应用构建了保护机制。
版权合规体系成为本次发布的重要亮点。为规避潜在法律风险,企业提前与华纳音乐集团、环球音乐集团等顶级版权方建立战略合作,确保训练数据集全部获得合法授权。这种前瞻性布局为AI音乐生成技术的商业化应用扫清了关键障碍,也为行业树立了合规发展范本。
专业音乐人生态建设同步推进。据内部人士透露,企业正在秘密研发面向音乐创作者的专业工具链,涵盖从灵感生成到母带处理的完整工作流。为加速项目落地,前环球音频首席数字官伊桑·卡普兰已正式加盟,主导专业音乐产品线的战略规划与开发工作。这位拥有丰富行业资源的资深管理者,预计将推动AI技术与传统音乐产业的深度融合。










