滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

蚂蚁开源Ming-Flash-Omni 2.0：全模态突破，多项能力领先成新标杆

时间：2026-02-11 15:21:47 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

蚂蚁集团近日正式开源了新一代全模态大模型Ming-Flash-Omni 2.0，该模型在视觉语言理解、语音可控生成及图像编辑等核心领域展现出卓越性能，部分指标已超越国际主流模型Gemini 2.5 Pro，为开源社区树立了全模态技术的新标杆。

作为业界首个实现全场景音频统一生成的模型，Ming-Flash-Omni 2.0突破了传统音频处理的局限，可在单条音轨中同步生成语音、环境音效与背景音乐。用户通过自然语言指令即可精准调控音色、语速、语调、音量及情绪参数，甚至支持方言定制与零样本音色克隆，为影视配音、游戏音效等场景提供了高效解决方案。

在推理效率方面，该模型实现了3.1Hz的极低帧率，支持分钟级长音频的实时高保真生成，同时将计算成本控制在行业领先水平。这一突破得益于其基于Ling-2.0架构（MoE，100B-A6B）的优化设计，通过混合专家模型与亿级数据训练，在视觉、音频、图像三大模态上实现了系统性提升。

视觉领域，模型通过融合细粒度数据与难例训练策略，显著增强了对近缘物种、工艺细节及稀有文物的识别能力。图像编辑功能则支持光影调整、场景替换、人物姿态优化等复杂操作，即使在动态场景中也能保持画面连贯性与细节真实性，为专业设计提供了强大工具。

音频生成方面，除同轨合成技术外，模型还具备自然语言驱动的精细控制能力，可实时调整语音情感表达与音效层次。图像生成模块则通过增强稳定性算法，使一键修图、背景替换等功能更加可靠，降低了专业内容创作的门槛。

目前，Ming-Flash-Omni 2.0的模型权重与推理代码已在Hugging Face等开源平台全面开放，开发者可通过蚂蚁百灵官方平台Ling Studio进行在线体验与调用。此次开源标志着蚂蚁集团将多年积累的全模态技术以可复用底座的形式对外释放，为端到端多模态应用开发提供了统一的能力入口。

据悉，Ming-Omni系列模型已历经三次迭代，此次升级围绕"精准识别、细腻感知、稳定生成"三大目标展开，通过架构创新与数据工程结合，在复杂场景下的多模态交互能力上取得关键突破，为AI技术在内容创作、智能交互等领域的应用开辟了新路径。

更多>同类资讯

邹平市检察院座谈：共探AI赋能刑事检察助力办案质效提升

2月6日，“人工智能赋能刑事检察高质效办案”座谈会在邹平市检察院成功召开。会上，重点展示了由邹平市检察院自主研发的“案易”检察智能化系统，通过视频介绍、系统演示与一线干警经验分享，全面呈现其在文书生成、证…

02-11

DuckDuckGo AI语音聊天功能上线隐私优先架构让用户畅聊无担忧

IT之家 2 月 11 日消息，DuckDuckGo 昨日（2 月 10 日）发布公告，宣布其 AI 聊天机器人平台Duck.ai新增实时语音聊天功能，主打极致隐私保护。临时处理：音频流仅在说话时传输，…

02-11

杭州以勒：以智能制造为翼开启咖啡机源头工厂的产业升级新征程

作为咖啡机产业链中的重要源头工厂之一，位于杭州的以勒咖啡机及其关联制造体系，正通过其扎实的工业基础和持续的技术演进，为我们提供了一个观察智能制造如何深度融入传统设备制造的生动样本。这种将物联网、数据分析与硬件…

02-11

北斗三号NTP校时服务器：以精准时序赋能工业自动化升级之路

星间链路：卫星之间可以互相通信、校时，即使与地面站暂时失去联系，也能自主维持系统时间的高精度。云边端协同：在工业互联网云平台中，北斗时间将成为贯穿云、边、端所有数据与操作的唯一可信时序基准。总结来说，北…

02-11

智慧供水监测：以科技之力赋能供水行业，开启精细化管理新篇章

智慧供水监测系统的落地让供水管网数字化管理水平显著提升，水质异常实时预警为饮用水安全筑牢防线，管网压力与流量的动态监测，能精准捕捉运行问题，避免管网破损与供水压力不足等情况，同时及时发现漏损问题降低水资源无…

02-11

三星2月26日将发S26系列三款新机！AI升级、影像提升亮点满满

三星邀请函以“AI”为主题，暗示S26系列将在AI功能上有重大升级。S26Ultra则配备6.8英寸微曲屏，内置5000mAh电池，支持最高45W有线快充和25W无线充电。三星S26系列的最大亮点在于AI…

02-11

三星2月26日发布S26系列新机！三款机型齐亮相，AI功能成最大亮点

三星邀请函以“AI”为主题，暗示S26系列将在AI功能上有重大升级。S26Ultra则配备6.8英寸微曲屏，内置5000mAh电池，支持最高45W有线快充和25W无线充电。三星S26系列的最大亮点在于AI…

02-11

晶存科技以创新驱动高性能存储发展，2026年拓展全球市场再启新程

可以预见的是，随着AI、智能汽车等前沿应用在全球范围内爆发，其对高端存储芯片的需求正创造出一个巨大的全球性市场，晶存科技将紧抓机遇，在全球存储市场上更进一步，持续突破与迭代存储产品平台，满足多样化客户综合需求…

02-11

车险行业迎变革！ChatGPT“比价神器”上线，海量数据助力保费透明化

02-11

智谱GLM-5“身份”揭晓：复用DeepSeek架构参数翻倍，市值飙升坐实国产AI领跑者

02-11

具身原生大模型DM0问世：原力灵机以开源之力，推动机器人迈向“自学”新纪元

02-11

隆利科技越南工厂投产海康威视武汉科技园启用共拓LED应用新篇

02-11

物件会“说话”：从宇通年会故事里探寻企业创新发展密码

02-11

OpenAI升级ChatGPT深度研究工具：GPT-5.2赋能新增全屏查看器等多项实用功能

02-11

蚂蚁集团开源Ming-flash-omni 2.0：全模态能力升级，为多模态应用开发提供新引擎

02-11

点击查看更多 +

全站最新

澳股收涨1.66%，创去年10月以来新高

A股数字货币股走强，香港计划下个月发放稳定币牌照

雷军官宣初代小米SU7停产：上市两年交付超38.1万辆纯电轿跑新标杆落幕

台股收盘再创历史新高，年内累涨16.03%

A股黄金概念股走强，山东黄金涨超4%

麦格理：首予文远知行"跑赢大市"评级，目标价46港元/17.5美元

热门内容

本栏最新

长城魏牌V9X来袭！近5米3大身躯，2.0T插混续航超千公里，实力几何？

央视聚焦东风汽车：以创新智造引领，驱动中国汽车产业稳健迈向新征程

闵行新春沙龙：网络创作者共探优质内容创作，共绘闵行发展新画卷

理想汽车新突破：全新L9马赫100双芯片有效算力远超英伟达Thor U

问界星光之夜余承东解读品牌命名，大模型AI将升级老车主，销量目标再冲刺

长城补齐产品短板！魏牌V9X官图曝光，携新技术入局绿牌全尺寸SUV赛道

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.