滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

蚂蚁集团开源全模态大模型Ming-Flash-Omni 2.0 多项能力升级达开源领先水平

时间：2026-02-11 16:45:51 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

蚂蚁集团近日宣布，正式开源其全模态大模型Ming-Flash-Omni的2.0版本。作为Ming-Omni系列的最新迭代，该模型在视觉语言理解、语音生成控制以及图像生成与编辑等核心领域实现了显著提升，多项公开基准测试结果显示其性能已达到开源模型中的领先水平，部分指标甚至超越了Gemini 2.5 Pro。

在音频生成能力方面，Ming-Flash-Omni 2.0展现了强大的创新实力。模型支持在单一音轨中同步生成语音、环境音效和音乐，用户可通过自然语言指令灵活调整音色、语速、语调、音量、情绪以及方言等参数。官方数据显示，该模型在推理阶段可达到3.1Hz的帧率，能够高效生成长达数分钟的音频内容。

视觉能力的升级同样是此次更新的重点。通过引入更大规模的细粒度数据和难例训练策略，模型显著增强了对复杂对象和长尾类别的识别能力。图像生成与编辑功能也得到优化，支持光影调整、场景替换、人物姿态修改等操作，并在复杂或动态场景中保持了更高的稳定性。

从架构层面看，Ming-Flash-Omni 2.0基于Ling-2.0（MoE，100B-A6B）架构进行训练。官方介绍称，该版本在更大规模数据和系统化训练优化的基础上，实现了多模态理解与生成能力的统一整合，为模型性能的提升奠定了坚实基础。

近年来，多模态大模型逐渐向统一架构方向发展，但实际应用中往往面临通用性与单项能力难以兼顾的挑战。蚂蚁集团表示，Ming-Omni系列经过多代迭代，从构建统一多模态能力底座，到扩大规模与训练优化，再到2.0版本强化单项能力表现，逐步实现了综合性能的全面提升。

百灵模型负责人周俊指出，全模态技术的核心在于统一架构下的能力融合与调用效率。此次开源后，开发者可在同一框架下调用视觉、语音与生成能力，有效降低了多模型串联带来的工程复杂度，为实际应用提供了更大便利。

目前，Ming-Flash-Omni 2.0的模型权重与推理代码已在Hugging Face等开源社区发布，用户还可通过蚂蚁百灵平台Ling Studio进行在线体验，进一步探索模型的多样化应用场景。

02-11

央视财经联合天眼查：以数据为笔勾勒中国经济活力全景图

02-11

苹果积极应对内存涨价挑战 iPhone 18 Pro系列有望维持上代售价

02-11

极智嘉Gino 1亮相：仓储自动化新突破，引领全流程无人仓新未来

02-11

蚂蚁集团开源Ming-Flash-Omni 2.0：全模态突破，开启多模态应用新篇章

02-11

AI赋能下的“隐形枷锁”：高效背后工作强度悄然攀升的困局

02-11

蚂蚁开源Ming-Flash-Omni 2.0：全模态突破，多项能力领先成新标杆

02-11

邹平市检察院座谈：共探AI赋能刑事检察助力办案质效提升

2月6日，“人工智能赋能刑事检察高质效办案”座谈会在邹平市检察院成功召开。会上，重点展示了由邹平市检察院自主研发的“案易”检察智能化系统，通过视频介绍、系统演示与一线干警经验分享，全面呈现其在文书生成、证…

02-11

DuckDuckGo AI语音聊天功能上线隐私优先架构让用户畅聊无担忧

IT之家 2 月 11 日消息，DuckDuckGo 昨日（2 月 10 日）发布公告，宣布其 AI 聊天机器人平台Duck.ai新增实时语音聊天功能，主打极致隐私保护。临时处理：音频流仅在说话时传输，…

02-11

杭州以勒：以智能制造为翼开启咖啡机源头工厂的产业升级新征程

作为咖啡机产业链中的重要源头工厂之一，位于杭州的以勒咖啡机及其关联制造体系，正通过其扎实的工业基础和持续的技术演进，为我们提供了一个观察智能制造如何深度融入传统设备制造的生动样本。这种将物联网、数据分析与硬件…

02-11

北斗三号NTP校时服务器：以精准时序赋能工业自动化升级之路

星间链路：卫星之间可以互相通信、校时，即使与地面站暂时失去联系，也能自主维持系统时间的高精度。云边端协同：在工业互联网云平台中，北斗时间将成为贯穿云、边、端所有数据与操作的唯一可信时序基准。总结来说，北…

02-11

智慧供水监测：以科技之力赋能供水行业，开启精细化管理新篇章

智慧供水监测系统的落地让供水管网数字化管理水平显著提升，水质异常实时预警为饮用水安全筑牢防线，管网压力与流量的动态监测，能精准捕捉运行问题，避免管网破损与供水压力不足等情况，同时及时发现漏损问题降低水资源无…

02-11

三星2月26日将发S26系列三款新机！AI升级、影像提升亮点满满

三星邀请函以“AI”为主题，暗示S26系列将在AI功能上有重大升级。S26Ultra则配备6.8英寸微曲屏，内置5000mAh电池，支持最高45W有线快充和25W无线充电。三星S26系列的最大亮点在于AI…

02-11

三星2月26日发布S26系列新机！三款机型齐亮相，AI功能成最大亮点

三星邀请函以“AI”为主题，暗示S26系列将在AI功能上有重大升级。S26Ultra则配备6.8英寸微曲屏，内置5000mAh电池，支持最高45W有线快充和25W无线充电。三星S26系列的最大亮点在于AI…

02-11

晶存科技以创新驱动高性能存储发展，2026年拓展全球市场再启新程

可以预见的是，随着AI、智能汽车等前沿应用在全球范围内爆发，其对高端存储芯片的需求正创造出一个巨大的全球性市场，晶存科技将紧抓机遇，在全球存储市场上更进一步，持续突破与迭代存储产品平台，满足多样化客户综合需求…

02-11

点击查看更多 +

全站最新

麦格理：首予文远知行"跑赢大市"评级，目标价46港元/17.5美元

A股异动丨顺钠股份收跌5.37% 股东张明园拟减持不超1%公司股份

A股收评：创业板指跌超1%，短剧、影视院线概念回调

澳股收涨1.66%，创去年10月以来新高

A股数字货币股走强，香港计划下个月发放稳定币牌照

雷军官宣初代小米SU7停产：上市两年交付超38.1万辆纯电轿跑新标杆落幕

热门内容

本栏最新

长城魏牌V9X来袭！近5米3大身躯，2.0T插混续航超千公里，实力几何？

央视聚焦东风汽车：以创新智造引领，驱动中国汽车产业稳健迈向新征程

闵行新春沙龙：网络创作者共探优质内容创作，共绘闵行发展新画卷

理想汽车新突破：全新L9马赫100双芯片有效算力远超英伟达Thor U

问界星光之夜余承东解读品牌命名，大模型AI将升级老车主，销量目标再冲刺

长城补齐产品短板！魏牌V9X官图曝光，携新技术入局绿牌全尺寸SUV赛道

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.