滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

谷歌Gemini Omni多模态大模型发布：支持混合输入，对话实时编辑生成多元内容

时间：2026-05-20 13:33:02 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在谷歌2026 I/O开发者大会上，一款名为Gemini Omni的全模态大模型正式亮相，成为全场焦点。这款模型突破了传统AI在模态处理上的割裂状态，实现了文本、图像、音频、视频等多种信息形式的深度互通与自由生成。

Gemini Omni的核心能力被概括为“任意输入、任意输出”。无论是手绘草图、文字描述，还是图片、音频、视频素材，用户都可以自由组合输入模型。系统能够自主解析信息逻辑，并模拟真实物理规则，最终生成高精度、符合现实逻辑的多元化内容，包括视频、图像和文本等。

支撑这一强大功能的是谷歌的三大核心技术底座：世界模型Genie、图像模型Nano Banana和视频生成模型Veo。这三项技术共同构建了Gemini Omni的全模态AI框架，使其能够处理复杂的多模态任务。

在发布会上，Gemini Omni的对话式实时编辑能力成为最大亮点。与传统AI生成工具一次性输出、修改繁琐不同，这款模型支持用户在生成过程中通过自然语言对话进行交互式迭代优化。例如，用户可以精准调整视频场景、修改物体材质或调整动态特效，而修改过程不会破坏画面的整体逻辑和物理效果。

现场演示中，工作人员仅用手绘简易图形和文字指令，便生成了一段带有物理碰撞效果的完整特效视频。这一展示直观展现了Gemini Omni在内容创作领域的强大潜力，为AI技术的应用开辟了新的可能性。

更多>同类资讯

马斯克称Optimus人形机器人初期生产缓慢，需从零构建供应链

07-02

中视新科破产清算：旗下“新科娘少女形象”等17项著作权7月5日开拍

07-02

华硕a豆高速U盘京东上架，多规格可选读速达500MB/s，280元起售

07-02

水月雨羽翼Edge2无线头戴式耳机京东首销，499元享自适应降噪与长续航

07-02

TCL华星独家助力小米REDMI K90至尊版，高刷高亮屏带来极致视听体验

07-02

马斯克SpaceX展示AI原型机：外观似手机，比iPhone更薄，上市前景待察

07-02

字节Seed团队新论文：DanceOPD破解AI生图多能力融合难题

具体做法是，让当前学生模型先自己跑一遍生成轨迹，在这条轨迹上挑一个点，再把对应老师请过来，在这个点给出正确的箭头。跑完一看，让它生成圆环时，它给出的是四个角的点簇——文生图的能力被编辑带串了味，正好对上论文开…

07-02

97年复旦博士孙天祥加入百度任基础模型研发部负责人学术产业双契合

近日，大模型领域技术专家孙天祥正式加入百度，就任基础模型研发部（BMU）负责人。孙天祥此次同时进入百度模型委员会（BMC），从研发MOSS到提出MaaS再到其后续创业方向，他的学术与产业路径与百度基础模型…

07-02

特斯拉海外推送FSD V14中国车主能否升级？官方客服回应

07-02

苹果遭印度合作伙伴泄密：iPhone 18 Pro大量细节被曝光

07-02

97年的孙天祥加入百度，任基础模型研发部负责人

07-02

抖音电商上线“肖像保护功能”，防范“AI仿冒带货达人”行为

07-02

中国车企首次：理想汽车登台ISCA 2026，发表入选报告

07-02

华硕a豆高速U盘京东上架，128GB至1TB多规格可选，280元起售

07-02

FDE人才成“香饽饽”：亚马逊豪掷10亿入局，行业薪资水涨船高

07-02

点击查看更多 +

全站最新

摩托古兹破局之作：457cc并列双缸配“单侧”减震，能否重焕新生？

全球唯一法拉利Enzo设计原型亮相普陀邀市民共赏工业设计之美

安波福慕尼黑上海电子展发力：发布创新技术，赋能汽车与多元工业新未来

沈阳车主换车必看：如何挑选靠谱二手车服务机构保障交易？

大众ID. Tiguan谍照来袭！造型进化技术升级，或成ID系列新热门之选

上汽智己LS9 Hyper 7月16日登场，全线控转向+3秒破百，技术旗舰来袭

热门内容

本栏最新

字节Seed团队新论文：DanceOPD破解AI生图多能力融合难题

97年复旦博士孙天祥加入百度任基础模型研发部负责人学术产业双契合

2026年三款AI智能降噪助听器深度测评：精准匹配需求，开启清晰聆听新体验

MG07设计风波背后：品牌话语权之困与车圈舆论生态的双重审视

科技赋能出行新选择，小米克系列智能平衡车，带你畅享多元骑行乐趣

6月新势力销量揭晓：零跑破9万领跑鸿蒙理想小米各展风采

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.