ITBear旗下自媒体矩阵:

谷歌 I/O 大会新动作:AI 创作工具升级,多模态生成更“听劝”

   时间:2026-07-01 12:31:32 来源:CHINAZ编辑:快讯 IP:北京 发表评论无障碍通道
 

在近期召开的 I/O 开发者大会上,谷歌正式对外发布了一系列针对 AI 创作工具的重要升级,核心目标非常明确:依托新一代 Gemini 模型家族,降低多媒体内容的创作门槛,让“创意落地”变得更高效。

此次升级的重头戏在于全新的 Gemini Omni 模型。作为谷歌在多模态领域的最新成果,该模型具备极强的跨模态理解与处理能力,能够无缝整合文本、图像、音频及视频等多种输入源,并直接生成连贯的视频内容。

最令创作者感到兴奋的,是其引入了“对话式编辑”功能。以往复杂的视频剪辑工作,如今只需通过自然语言进行描述即可完成。例如,用户如果想更换视频中的角色、调整画面光线,或者切换整体场景风格,只需向模型发出指令,AI 便能自动识别并执行相应的编辑任务,极大地简化了后期制作流程。

谷歌此举无疑是在向全球创作者释放信号:AI 工具正从单纯的“内容生成者”向“智能协作伙伴”转型。通过让模型学会“听懂”人类的语言需求,谷歌希望进一步提升多模态内容生成的专业度与创作灵活性。随着这一系列工具的逐步普及,创作者将能够更专注于创意本身,将繁琐的技术操作交给 AI 去完成。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version