ITBear旗下自媒体矩阵:

谷歌Gemini集成Lyria 3音乐模型:文字照片秒变30秒歌曲引行业关注

   时间:2026-02-20 09:07:16 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

谷歌近日宣布,其Gemini应用已完成与DeepMind旗下前沿音乐生成模型Lyria 3的深度整合。这项技术突破允许用户通过文字描述或上传图片,在极短时间内生成包含完整人声、歌词及伴奏的30秒音乐片段,标志着消费级AI音乐创作进入全新阶段。

该模型的核心优势在于创作维度的多元化。用户既可输入"80年代复古迪斯科风格,带有夏日海滩氛围"等具体指令,也能上传旅行照片或短视频,系统将自动分析画面元素并生成匹配的配乐。特别设计的封面生成功能由Nano Banana团队开发,可根据音乐风格自动生成视觉艺术作品,形成完整的创作闭环。

YouTube创作者群体成为首批重点服务对象。通过专属的Dream Track功能,短视频制作者可为Shorts内容快速配乐,该服务已在美国启动测试并计划全球推广。这种应用场景的拓展,使得AI音乐生成从单纯的创作工具升级为内容生态的重要组成部分。

资本市场对这项技术革新作出迅速反应。消息公布当日,流媒体巨头Spotify股价盘中涨幅收窄近5个百分点,卫星广播服务商Sirius XM股价亦出现短暂波动。行业分析师指出,虽然现有平台短期内不会受到根本性冲击,但AI技术的渗透将迫使传统服务商加速布局智能混音、个性化推荐等创新功能。

在知识产权保护方面,谷歌构建了多重防护机制。当用户指令涉及真实音乐人时,系统仅将其作为风格参考,通过算法过滤确保输出作品不构成侵权。所有生成内容均采用SynthID技术嵌入隐形数字水印,为音乐版权追溯提供技术保障。这种"创新与规范并重"的策略,试图缓解行业对AI替代创作者的普遍担忧。

目前该服务已面向全球成年用户开放,支持英、德、西、法、日、韩等八种语言交互。开发团队透露,后续版本将扩展至更多语种,并通过持续优化神经网络架构提升音乐质量,特别是在复杂和声与情感表达方面寻求突破。

这场技术变革正在重塑音乐产业格局。传统创作流程中需要数周完成的编曲、录音工作,现在可通过移动设备即时实现。虽然专业音乐人仍掌握着长篇幅、高复杂度作品的创作主导权,但AI工具的普及无疑降低了音乐创作的门槛,为普通用户开辟了全新的艺术表达渠道。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version