随着生成式AI技术的持续突破,OpenAI在多媒体内容生成领域再启新布局。继推出现象级产品ChatGPT和AI视频生成工具Sora后,该公司正秘密研发一款能够自动生成音乐的AI模型,试图在音频内容创作领域开辟新赛道。
据知情人士透露,该项目已进入深度开发阶段。OpenAI团队与全球顶尖音乐学府茱莉亚音乐学院展开合作,招募音乐专业学生参与核心数据标注工作。研究人员通过解析大量经典乐谱的结构特征,为模型构建了包含旋律、节奏、和声等要素的精细化训练库,确保生成内容符合音乐理论规范。
该技术最直观的应用场景在于短视频创作领域。当用户使用Sora生成一段舞蹈视频后,系统可自动匹配风格契合的背景音乐,实现画面与音效的同步生成。更值得关注的是,这项功能将与OpenAI正在测试的AI社交平台形成联动,用户无需切换多个工具即可完成从创意构思到成品输出的全流程创作。
行业分析师指出,音乐模型的推出将显著强化OpenAI的生态竞争力。目前该公司已积累超8亿活跃用户,新增的音频生成能力不仅能满足内容创作者对多元化素材的需求,更可通过降低专业门槛吸引更多普通用户。这种"文字-图像-视频-音频"的全模态覆盖战略,正在重塑数字内容生产的行业标准。











