据海外科技媒体《The Information》披露,OpenAI正秘密推进一项音乐生成技术研发项目。这款新型工具突破了传统AI音乐的创作边界,支持通过文字描述或音频片段直接生成完整音乐作品。
内部人士透露,该技术具备强大的音乐适配能力。在影视制作场景中,创作者可通过输入视频画面特征,快速获得匹配氛围的原创配乐;音乐制作人则能利用人声录音,自动生成吉他、钢琴等乐器的实时伴奏。这种双向创作模式将显著提升音乐制作效率。
项目推进过程中,OpenAI与世界顶级音乐学府茱莉亚音乐学院展开深度合作。该校学生受邀参与音乐数据标注工作,通过解析经典乐谱的结构特征,为模型训练提供专业级音乐语料。这种产学研结合的模式,确保了生成音乐符合专业审美标准。
值得注意的是,OpenAI此前虽发布过音乐生成模型,但均早于ChatGPT时代。近期公司战略明显向音频领域倾斜,重点开发文本转语音、语音转文本等交互技术。此次音乐生成工具的研发,标志着其音频技术矩阵的进一步完善。
当前生成式音乐市场竞争激烈,谷歌、Suno等科技公司已推出类似产品。OpenAI此次技术突破能否后来居上,关键在于其多模态交互能力与专业音乐资源的结合程度。虽然具体发布时间尚未确定,但行业普遍关注其是否会整合进ChatGPT或视频生成工具Sora中。











