ITBear旗下自媒体矩阵:

谷歌Gemini携Lyria 3入局AI音乐,7.5亿用户开启音乐创作新日常

   时间:2026-02-19 15:58:27 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

谷歌近日在旗下拥有超7.5亿月活跃用户的Gemini应用中,正式上线了AI音乐生成功能。用户只需输入一段文字描述或上传一张照片,短短数秒内即可获得一首包含人声、歌词及AI生成封面的30秒完整歌曲,纯器乐创作同样支持。这一功能背后依托的是DeepMind最新研发的Lyria 3音乐生成模型,其训练数据规模超过200万首曲目,音频位深达24-bit,输出音质甚至超越主流流媒体平台标准。

与前代模型相比,Lyria 3实现了多项技术突破。用户无需手动编写歌词,模型可根据提示词自动生成;对音乐风格、人声类型、节拍速度等参数的控制精度显著提升;输出音频为48kHz立体声,人声自然度与歌词咬字清晰度大幅优化。该模型支持通过视觉内容生成音乐——用户上传照片或视频后,Gemini可分析画面情绪并创作匹配的歌曲,封面则由谷歌图像生成模型Nano Banana自动完成。

目前,该功能以Beta测试形式面向全球18岁以上用户开放,支持英语、德语、西班牙语等八种语言,桌面端已率先上线,移动端将于近期推送。谷歌AI高级订阅用户将获得更高使用额度。与此同时,Lyria 3被整合至YouTube Dream Track功能,全球创作者均可为Shorts短视频生成背景音乐,此前该功能仅限美国地区。

在版权争议持续发酵的AI音乐领域,谷歌采取了一系列谨慎措施。官方公告强调,Lyria 3的设计目标是“助力原创表达,而非模仿现有艺术家”。若用户提示词中提及特定艺术家,模型仅会以其风格或情绪为灵感创作相似作品,而非复制其声音。训练过程中,谷歌严格遵循版权协议与合作伙伴要求,并设置过滤器比对输出内容与已有作品。所有生成音乐均嵌入SynthID水印,用户还可通过Gemini的音频鉴别功能,上传文件检测是否为谷歌AI创作。

这一举措标志着AI音乐竞争从技术模型层面升级至平台生态层面。以Suno为代表的初创公司虽在2024年11月完成2.5亿美元融资,并推出虚拟音频工作站等专业工具,但其用户规模与Gemini的7.5亿月活存在量级差距。技术媒体Tom's Guide编辑体验后表示,她将丈夫的待办清单转化为朋克摇滚歌曲并通过短信分享,这种场景或许正是谷歌的目标——让音乐生成融入日常沟通,而非局限于专业创作场景。

尽管Lyria 3仍存在30秒时长限制、Beta阶段功能粗糙等问题,且版权争议尚未完全平息,但谷歌选择此时将其推向海量用户,释放出明确信号:AI音乐生成已从技术探索进入规模化应用阶段。当每个人都能通过口袋里的设备随时创作音乐,或许改变的不仅是音乐生产方式,更是人类与音乐互动的本质。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version