滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

蚂蚁集团开源全模态大模型Ming-flash-omni 2.0，多模态能力再升级助力开发者

时间：2026-02-11 16:45:19 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

蚂蚁集团近日宣布，其自主研发的全模态大模型Ming-flash-omni 2.0正式面向全球开源。作为Ming-Omni系列的重要升级版本，该模型在视觉语言理解、语音生成控制、图像生成与编辑等核心领域实现突破性进展，多项性能指标在开源模型中位居前列，部分能力甚至超越行业标杆Gemini 2.5 Pro。

在音频生成领域，Ming-flash-omni 2.0展现出显著技术优势。模型支持单音轨同步生成语音、环境音效与背景音乐，用户可通过自然语言指令精准调控音色、语速、语调、音量、情绪表达及方言特征等参数。据实测数据显示，模型推理帧率达3.1Hz，可高效生成分钟级长音频内容，为有声内容创作提供全新解决方案。

视觉能力方面，研发团队通过引入海量细粒度标注数据和针对性训练策略，显著提升模型对复杂场景及长尾类别的识别精度。图像生成与编辑模块经过优化后，支持光影效果调整、场景元素替换、人物姿态修正等高级操作，特别强化了在动态场景下的生成稳定性，为影视制作、数字内容创作等领域提供强大工具支持。

该模型采用基于Ling-2.0架构的混合专家模型（MoE）设计，参数规模达1000亿级，其中激活参数60亿。通过系统化训练优化，模型实现了多模态理解与生成能力的有机整合，在保持架构统一性的同时，有效解决了通用性与专业性难以兼顾的行业难题。经过多代迭代，Ming-Omni系列已形成从基础能力构建到专项能力强化的完整技术路线。

蚂蚁百灵模型团队负责人周俊指出，全模态技术的核心挑战在于实现不同模态能力的有机融合与高效调用。此次开源的2.0版本通过统一架构设计，使开发者能够在单一框架内协同调用视觉、语音、生成等多种能力，大幅降低多模型集成带来的技术复杂度与开发成本。

目前，Ming-flash-omni 2.0的完整模型权重及推理代码已在Hugging Face等主流开源平台发布，开发者可自由下载使用。同时，蚂蚁集团通过百灵平台Ling Studio提供在线体验入口，用户无需本地部署即可直接测试模型各项功能，加速技术创新成果的转化应用。

更多>同类资讯

央视财经联合天眼查：以数据为笔勾勒中国经济活力全景图

02-11

苹果积极应对内存涨价挑战 iPhone 18 Pro系列有望维持上代售价

02-11

极智嘉Gino 1亮相：仓储自动化新突破，引领全流程无人仓新未来

02-11

蚂蚁集团开源Ming-Flash-Omni 2.0：全模态突破，开启多模态应用新篇章

02-11

AI赋能下的“隐形枷锁”：高效背后工作强度悄然攀升的困局

02-11

蚂蚁开源Ming-Flash-Omni 2.0：全模态突破，多项能力领先成新标杆

02-11

邹平市检察院座谈：共探AI赋能刑事检察助力办案质效提升

2月6日，“人工智能赋能刑事检察高质效办案”座谈会在邹平市检察院成功召开。会上，重点展示了由邹平市检察院自主研发的“案易”检察智能化系统，通过视频介绍、系统演示与一线干警经验分享，全面呈现其在文书生成、证…

02-11

DuckDuckGo AI语音聊天功能上线隐私优先架构让用户畅聊无担忧

IT之家 2 月 11 日消息，DuckDuckGo 昨日（2 月 10 日）发布公告，宣布其 AI 聊天机器人平台Duck.ai新增实时语音聊天功能，主打极致隐私保护。临时处理：音频流仅在说话时传输，…

02-11

杭州以勒：以智能制造为翼开启咖啡机源头工厂的产业升级新征程

作为咖啡机产业链中的重要源头工厂之一，位于杭州的以勒咖啡机及其关联制造体系，正通过其扎实的工业基础和持续的技术演进，为我们提供了一个观察智能制造如何深度融入传统设备制造的生动样本。这种将物联网、数据分析与硬件…

02-11

北斗三号NTP校时服务器：以精准时序赋能工业自动化升级之路

星间链路：卫星之间可以互相通信、校时，即使与地面站暂时失去联系，也能自主维持系统时间的高精度。云边端协同：在工业互联网云平台中，北斗时间将成为贯穿云、边、端所有数据与操作的唯一可信时序基准。总结来说，北…

02-11

智慧供水监测：以科技之力赋能供水行业，开启精细化管理新篇章

智慧供水监测系统的落地让供水管网数字化管理水平显著提升，水质异常实时预警为饮用水安全筑牢防线，管网压力与流量的动态监测，能精准捕捉运行问题，避免管网破损与供水压力不足等情况，同时及时发现漏损问题降低水资源无…

02-11

三星2月26日将发S26系列三款新机！AI升级、影像提升亮点满满

三星邀请函以“AI”为主题，暗示S26系列将在AI功能上有重大升级。S26Ultra则配备6.8英寸微曲屏，内置5000mAh电池，支持最高45W有线快充和25W无线充电。三星S26系列的最大亮点在于AI…

02-11

三星2月26日发布S26系列新机！三款机型齐亮相，AI功能成最大亮点

三星邀请函以“AI”为主题，暗示S26系列将在AI功能上有重大升级。S26Ultra则配备6.8英寸微曲屏，内置5000mAh电池，支持最高45W有线快充和25W无线充电。三星S26系列的最大亮点在于AI…

02-11

晶存科技以创新驱动高性能存储发展，2026年拓展全球市场再启新程

可以预见的是，随着AI、智能汽车等前沿应用在全球范围内爆发，其对高端存储芯片的需求正创造出一个巨大的全球性市场，晶存科技将紧抓机遇，在全球存储市场上更进一步，持续突破与迭代存储产品平台，满足多样化客户综合需求…

02-11

车险行业迎变革！ChatGPT“比价神器”上线，海量数据助力保费透明化

02-11

点击查看更多 +

全站最新

麦格理：首予文远知行"跑赢大市"评级，目标价46港元/17.5美元

A股异动丨顺钠股份收跌5.37% 股东张明园拟减持不超1%公司股份

A股收评：创业板指跌超1%，短剧、影视院线概念回调

澳股收涨1.66%，创去年10月以来新高

A股数字货币股走强，香港计划下个月发放稳定币牌照

雷军官宣初代小米SU7停产：上市两年交付超38.1万辆纯电轿跑新标杆落幕

热门内容

本栏最新

长城魏牌V9X来袭！近5米3大身躯，2.0T插混续航超千公里，实力几何？

央视聚焦东风汽车：以创新智造引领，驱动中国汽车产业稳健迈向新征程

闵行新春沙龙：网络创作者共探优质内容创作，共绘闵行发展新画卷

理想汽车新突破：全新L9马赫100双芯片有效算力远超英伟达Thor U

问界星光之夜余承东解读品牌命名，大模型AI将升级老车主，销量目标再冲刺

长城补齐产品短板！魏牌V9X官图曝光，携新技术入局绿牌全尺寸SUV赛道

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.