滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

蚂蚁集团开源全模态大模型Ming-Flash-Omni 2.0 推动多模态技术深度融合与应用

时间：2026-02-11 11:54:26 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

蚂蚁集团近日宣布开源其最新研发的全模态大模型——Ming-Flash-Omni 2.0。该模型在视觉语言理解、语音可控生成、图像生成与编辑等多个领域展现出卓越性能，成为开源社区中备受瞩目的技术突破。

作为业界首个全场景音频统一生成模型，Ming-Flash-Omni 2.0突破了传统模型在音频处理上的局限。它能够在单条音轨中同时生成语音、环境音效和音乐，并通过自然语言指令实现音色、语速、语调、音量、情绪和方言的精准控制。在推理效率方面，该模型达到3.1Hz的极低帧率，支持分钟级长音频的实时高保真生成，在成本控制和性能表现上均处于行业领先地位。

全模态大模型的发展面临通用性与专精性的平衡难题。开源模型在特定任务上往往难以媲美专用模型，但蚂蚁集团通过持续投入和技术迭代，使Ming-Omni系列逐步突破这一瓶颈。早期版本构建了多模态能力基础，中期版本验证了规模增长带来的性能提升，而2.0版本通过更大规模的数据训练和系统性优化，在全模态理解与生成能力上达到开源领域领先水平，甚至在部分场景超越专用模型。

该模型基于Ling-2.0架构（MoE，100B-A6B）开发，围绕"精准识别、精细控制、稳定生成"三大核心目标进行优化。在视觉领域，通过融合亿级细粒度数据和难例训练策略，显著提升了对近缘物种、工艺细节和稀有文物的识别能力；音频方面，支持语音、音效、音乐的同轨生成，并具备零样本音色克隆功能；图像编辑功能则强化了复杂场景的稳定性，支持光影调整、场景替换和一键修图等操作，即使在动态场景中也能保持画面连贯性。

百灵模型负责人周俊指出，全模态技术的核心在于通过统一架构实现多模态能力的深度融合。开源后，开发者可基于同一框架调用视觉、语音和生成能力，大幅降低多模型串联的复杂度和开发成本。目前，Ming-Flash-Omni 2.0的模型权重和推理代码已在Hugging Face等开源平台发布，用户也可通过蚂蚁百灵官方平台Ling Studio进行在线体验和调用。

这一技术突破不仅为端到端多模态应用开发提供了统一能力入口，更推动了AI技术在实际业务中的规模化落地。随着工具链和评测体系的不断完善，全模态大模型有望在更多领域展现其变革性潜力。

更多>同类资讯

AI让你更高效，为什么你却感觉更忙了？

02-11

OpenAI更新ChatGPT深度研究工具

02-11

黑石增持Anthropic股份至10亿美元，公司估值3500亿美元

02-11

OpenAI升级Responses API

02-11

央视财经携手天眼查：用大数据解码中国经济活力密码

02-11

OpenAI更新ChatGPT深度研究工具：GPT-5.2驱动，新增全屏查看器等功能

02-11

车险中介天塌了！ChatGPT 上线“比价神器”：1.9 亿条数据加持，保费透明时代来了

02-11

免费可用:DuckDuckGo AI 语音聊天上线，承诺不存储音频

02-11

智谱 GLM-5 意外“泄露”？复用 DeepSeek 架构性能炸裂，市值狂飙 200% 坐稳国产 AI 顶流

02-11

机器人进化“奇点”已至？原力灵机发布全球首个具身原生大模型 DM0：不仅全面开源，更要让机器人“自学成才”

02-11

保单中介天塌了!ChatGPT 首款保险应用上线，WTW 股价创18年最大跌幅

02-11

技术筑基市场拓局绿的谐波借人形机器人东风驶向增长新航道

02-11

央视财经联袂天眼查：以数据为钥解锁中国经济活力新图景

02-11

DuckDuckGo AI语音聊天功能上线，隐私保护升级，免费开放体验

02-11

AI代理浪潮下“互联网门神”崛起：Cloudflare Q4营收劲增34% 前景可期

02-11

点击查看更多 +

全站最新

中国1月核心CPI环比上涨0.3%，为近6个月最高

中国1月PPI环比继续上涨同比降幅收窄

港股异动丨上海小南国盘初再跌20%，旗下10间餐厅暂停营运

A股异动丨主流产品价格整体上行！稀土股集体走强，北方稀土、银河磁体涨超6%

AIGC概念股回调，新华网、粤传媒、引力传媒跌超8%

运满满：科技助力新春货运高峰

热门内容

本栏最新

长城魏牌V9X来袭！近5米3大身躯，2.0T插混续航超千公里，实力几何？

央视聚焦东风汽车：以创新智造引领，驱动中国汽车产业稳健迈向新征程

闵行新春沙龙：网络创作者共探优质内容创作，共绘闵行发展新画卷

理想汽车新突破：全新L9马赫100双芯片有效算力远超英伟达Thor U

问界星光之夜余承东解读品牌命名，大模型AI将升级老车主，销量目标再冲刺

长城补齐产品短板！魏牌V9X官图曝光，携新技术入局绿牌全尺寸SUV赛道

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.