ITBear旗下自媒体矩阵:

谷歌Gemini推AI音乐生成功能,Lyria 3模型引领音乐创作新潮流

   时间:2026-02-19 16:56:42 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

谷歌近日在旗下拥有7.5亿月活跃用户的Gemini应用中推出AI音乐生成功能,用户仅需输入文字描述或上传图片,即可在数秒内获得包含人声、歌词及封面的30秒完整歌曲。该功能基于DeepMind最新研发的Lyria 3模型,其训练数据规模超过200万首曲目,支持包括英语、日语、韩语在内的8种语言,目前以Beta版本向全球18岁以上用户开放。

相较于前代模型,Lyria 3实现了多项技术突破。用户无需手动编写歌词,模型可根据提示词自动生成内容,同时对音乐风格、人声类型及节奏速度的控制精度显著提升。输出音频采用48kHz立体声格式,人声自然度与歌词清晰度达到主流流媒体平台标准,音频位深升级至24-bit。配套的图像生成模型Nano Banana可自动为歌曲创作封面,若用户上传照片或视频,系统还能分析视觉情绪生成匹配的音乐。

在版权合规方面,谷歌采取多重防护措施。训练阶段严格遵循版权协议,输出内容通过SynthID技术嵌入数字水印,并新增音频鉴别功能——用户可上传音频文件检测是否为谷歌AI生成。官方声明强调,模型设计旨在激发原创表达,当提示词涉及特定艺术家时,仅将其作为风格参考而非声音复制。目前该功能已集成至YouTube Dream Track,为全球短视频创作者提供背景音乐生成服务。

行业分析指出,谷歌的入局将AI音乐竞争从技术层面推向生态级较量。尽管Suno等创业公司通过专业编辑功能占据细分市场,但其用户规模与Gemini存在量级差距。测试用户反馈显示,该功能更适用于日常场景创新,例如将购物清单转化为说唱歌曲或为旅行照片配乐。不过,30秒的时长限制与Beta阶段的稳定性仍待优化,谷歌选择此时推向海量用户,凸显其抢占AI音乐入口的战略意图。

随着技术普及,音乐创作的门槛进一步降低。从专业录音棚到手机应用,AI正在重塑人类与音乐的互动方式——当每个人都能随时化身作曲家,音乐或许将更多成为情感即时传递的载体,而非精心打磨的艺术品。这场变革背后,技术伦理与版权边界的博弈仍将持续,但用户对便捷创作工具的需求已不可逆转。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version