滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

Google Gemini Omni发布：多模态融合新突破，AI视频创作迎变革新篇

时间：2026-05-20 10:46:05 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

谷歌正式推出了备受期待的Gemini Omni，这款新型生成式人工智能模型突破了传统单一模态的限制，能够处理文字、图像、视频等多种输入形式，并生成相应类型的输出内容。尽管此前外界普遍猜测其可能专注于视频生成领域，但谷歌将其定位为更广泛的多模态交互平台，视频生成仅是其中一项核心功能。

在发布会上，DeepMind首席执行官德米斯·哈萨比斯通过多个案例展示了该模型的强大能力。例如，用户上传一张个人照片后，Omni可以快速修改背景环境或调整艺术风格；简单的几何图形输入能被转化为复杂的视觉场景，如将圆圈转化为黑洞或渲染不同风格的黄昏漫步画面。这种灵活性源于模型对多种生成式技术的整合，包括图像生成工具Nano Banana、视频生成引擎Veo以及世界模拟模型Genie。

教育领域的应用案例尤为突出。当用户输入“制作一段蛋白质折叠的动画解说”时，Omni直接生成了包含α螺旋和β折叠结构演示的教学视频，而非传统的文字说明。这种能力得益于模型对科学概念的深度理解，以及将抽象知识转化为可视化内容的技术突破。测试中，模型甚至能根据“黏土动画风格的蛋白质折叠解说”这类复杂提示词，生成符合要求的动态影像。

视频编辑功能是Omni的另一大亮点。用户可通过自然语言指令对素材进行多轮修改，例如要求“当人物触摸镜子时，让镜面呈现液体涟漪效果，并将手臂材质改为反光金属”。实际演示显示，模型在保留原始动作的同时，精准替换了物理特性和材质表现。这种交互方式延续了Nano Banana图片编辑的逻辑，但扩展到了动态视频领域。

物理模拟能力代表了该模型的技术高峰。在演示中，Omni准确模拟了弹珠在连锁反应轨道上的运动轨迹，展现出对重力、动能等物理现象的深刻理解。更复杂的测试要求模型制作“字母表物品视频”，即每个英文字母对应一个非常规物体（如C对应水豚、D对应迪斯科球）。模型不仅完成了26个物品的对应展示，还协调了画面节奏、字幕样式、帧率要求（每物品9帧，24FPS）及背景音乐，最终以“THE END”字样收尾。

目前，Gemini Omni Flash已通过Gemini应用和Google Flow平台向AI Plus、Pro和Ultra订阅用户开放。网页端提供18种预设风格，包括80年代MV、蒙太奇、美漫等，Pro账户每日可生成3次视频。用户测试显示，输入“男性汽车博主穿JK制服梳双马尾在汽车前”的提示词后，系统快速生成了符合要求的风格化视频。

这款模型的推出标志着视频创作门槛的进一步降低。手机拍摄的素材、参考图片或音乐片段均可成为可编辑的原始材料，用户通过自然语言对话就能完成复杂修改。这种变革不仅影响内容生产效率，更将重新定义真实性验证、版权归属及平台治理等关键问题。

更多>同类资讯

投8000份简历无果美名校毕业生：AI成找工作拦路虎

06-30

高通首款2nm芯片登场！骁龙8E6定档9月22日

06-30

苹果与Optis 4G专利侵权诉讼拉扯七年，英最高法院开庭审理

06-30

首发2nm骁龙8E6 Pro！小米18系列预计9月24日发布

06-30

雷军回应小米SU7 Ultra纽北成绩：产品要媲美保时捷特斯拉

06-30

梁汝波发全员邮件：字节时隔4年更新领导力原则

06-30

消息称小红书启动“达尔文”创业孵化项目

06-30

豆包App上线导航功能：语音文字输入即启，支持悬浮小窗多任务并行

06-30

抖音“验证助手”升级啦！新增语音识图功能，助力老年用户轻松反诈

06-30

字节跳动更新领导力原则：强调实质产出，引领AI时代新使命

06-30

中国移动成立Token办公室战略布局，集团核心领导挂帅引领新发展

06-30

京东旗下公司在济南成立涉量子计算等多领域业务

06-30

昆虫体质检测新突破：北京斯佩德康技术赋能蛐蛐育种与具身智能研究

其核心适配价值体现在：拥有从硬件（微力检测仪、致密度分析设备）到算法（AI斗虫小程序）的完整方案，且已有具身智能领域的跨学科应用案例，能够为采购方提供技术演进的可能性。一是设备所采用的传感技术原理，如是否基于…

06-30

小红书内部“达尔文”项目启动，员工脱产孵化或能直接出任产品负责人

06-30

前百度自动驾驶专家杨睿刚领衔，纽娲机器人获5000万天使轮，攻克“具行智能”难题

06-30

点击查看更多 +

全站最新

地平线HSD V2.0：以迭代效率与双引擎驱动，开启智驾自主进化新篇章

短途电动车怎么选不踩坑？按需挑选这三类，轻松省下冤枉钱！

HSD V2.0迭代升级：以世界模型与强化学习开启智驾自主进化新篇

Jeep未来四年规划曝光：推三款新车布局欧洲与东风共铸大型SUV

晟兴电话机器人助力资料补全：小步试跑精准优化，让人机协作更高效自然

2026汽车音响低音炮升级指南：新能源与MPV低频优化服务商如何选？

热门内容

本栏最新

三十年技术路被冠“营销大师”名号，雷军直播直抒胸臆：听到“营销”就犯恶心

校地携手共谱美育新篇！河北科技学院“中国经典民歌展演校园公益行”引关注

小屏旗舰新突破！小米18工程机7200mAh大电池，9月或提前迎战iPhone 18 Pro

小米18工程机配置曝光：6.4英寸小屏配7200mAh电池，小屏旗舰或迎新突破

科大讯飞研究院2027届「飞星计划」正式启航邀你共赴AI新征程

2027款星海V9获国际名流青睐，以实力推动20万级MPV豪华体验新跨越

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.