滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

谷歌2026 I/O大会发布Gemini Omni模型轻松实现一句话编辑视频内容

时间：2026-05-20 06:04:29 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在近日举办的谷歌年度开发者盛会上，一款名为Gemini Omni的多模态生成模型正式亮相。该模型突破传统输入输出限制，宣称具备"全模态转换能力"，可实现文本、图像、视频等任意形式内容的相互生成与编辑。用户通过自然语言指令，即可完成视频角色替换、场景重构等复杂操作，例如将沙漠背景替换为雪山，或修改人物服饰细节。

技术演示环节展示了多个创新应用场景：在视频编辑场景中，用户仅需输入"让主角穿上红色外套"，系统即可自动识别目标人物并完成服装替换；通过"将背景改为巴黎街头"的指令，原本普通的生活片段瞬间转化为具有异域风情的画面。这种交互方式显著降低了专业内容创作门槛，为普通用户提供影视级编辑工具。

同步推出的Gemini Omni Flash作为家族首款商用模型，已实现多平台部署。该轻量化版本即日起可在Gemini移动应用、Google Flow协作平台及YouTube Shorts短视频服务中使用，支持实时内容生成与编辑。开发者社区将逐步开放API接口，允许第三方应用集成其核心功能，预计未来三个月内完成首批技术接入。

据现场技术文档披露，模型采用混合架构设计，结合自回归变换器与扩散模型优势，在保持生成质量的同时提升响应速度。特别优化的注意力机制可精准处理多模态数据关联，在视频编辑任务中实现帧间内容连贯性。谷歌工程师透露，后续版本将增加3D空间理解能力，支持更复杂的场景重建需求。

行业观察人士指出，该技术的商业化落地可能重塑数字内容生产流程。短视频创作者可摆脱专业软件束缚，通过对话式交互快速产出高质量作品；教育领域能开发互动式教学素材，医疗行业或用于构建动态病例模型。但数据隐私与生成内容监管等问题，仍需配套技术规范与法律框架同步完善。

更多>同类资讯

特斯拉在奥斯汀推出无安全员自动驾驶出租车服务

06-04

微信正与手机厂商合作推出Agent-to-Agent助手能力

06-04

苹果将调用英伟达Blackwell B200处理iOS 27部分Siri AI请求

06-04

奥尔特曼：OpenAI内部有人每月用掉约1000亿个词元

06-04

把半个Vision Pro塞进眼镜，Google这次真成了？

06-04

千寻智能3个月狂揽近50亿：马云、雷军现身其中

06-04

泡泡玛特告奈雪的茶获赔32万大字宣扬小字免责套路

06-04

小红书启动金融专业号治理专项行动处置违规内容

06-04

IDC：华为、荣耀位居Q1中国折叠屏手机市场份额前二

06-04

定档！赛豆科技全新汽车品牌将于6月9日发布

06-04

雷军「咬牙」让利，小米汽车卖爆却亏钱

06-04

狡诈！特斯拉被曝修改FSD购买协议

06-04

深圳具身公司获得汇川、中国电信亿元融资，「视触觉」传感器出货量行业第一

06-04

奥特曼：OpenAI内部有人每月用掉约1000亿个词元

06-04

计算该住在哪里，这是高通在 Computex 想回答的问题

06-04

点击查看更多 +

全站最新

华为智能光伏战略与新品发布：以技术创新引领新型电力系统构建新征程

OpenAI员工月耗token超千亿，AI成本攀升成企业新难题

小米“寻天”SUV谍照再泄露：提供五座七座双版本大号车型车顶可升降

小米“寻天”SUV谍照再曝光：七座五座双版本，七座版配备车顶升降装置

宝马M2四驱版官图亮相！2026夏末登场，480马力加四驱更带劲

路虎卫士中期改款谍照来袭！2+2四座布局登场动力排放再升级

热门内容

本栏最新

OpenAI员工月耗token超千亿，AI成本攀升成企业新难题

小米“寻天”SUV谍照再泄露：提供五座七座双版本大号车型车顶可升降

小米“寻天”SUV谍照再曝光：七座五座双版本，七座版配备车顶升降装置

混动“地球梦”引擎加持，新本田思域能否在车市掀起新热潮？

换机油后别急着离开！一句关键询问，让你的保养钱花得明明白白

华为系创业新势力崛起：王云鹤团队AI Agent项目获1亿美元估值背后

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

谷歌2026 I/O大会发布Gemini Omni模型 轻松实现一句话编辑视频内容

谷歌2026 I/O大会发布Gemini Omni模型轻松实现一句话编辑视频内容