滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

阿里国际发布Ovis2.5多模态大模型，经济型视觉推理解决方案再升级

时间：2025-08-18 16:09:17 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

阿里国际数字贸易集团旗下的AI研发团队AIDC-AI，近期隆重推出了其最新的多模态大语言模型——Ovis2.5。此次发布包含了9B和2B两种参数规模版本，专为经济型视觉推理应用而生，树立了多模态AI领域的新典范。

Ovis2.5在性能表现上尤为突出，得益于其独特的核心功能设计。首先，该模型引入了NaViT视觉编码器，实现了原生分辨率感知，无需牺牲图像细节即可捕捉全局结构，保证了视觉处理的高品质。这一特性使得Ovis2.5在处理复杂图像信息时游刃有余。

Ovis2.5还具备深度推理能力，其可选的“思考模式”可能借鉴了阿里Qwen3的先进技术。该模式不仅支持线性思维链推理，还能进行自我校验和修正，用户可根据需求配置思考预算，从而提高了问题解决的准确性和效率。这一创新设计，无疑为Ovis2.5增添了强大的智力支持。

在OCR领域，Ovis2.9B和2B版本均展现出卓越性能，尤其在复杂图表分析、文档理解（涵盖表格和表单）方面，达到了业界领先水平。这一特性为众多实际应用场景提供了强有力的技术支撑，如文档自动化处理、数据分析等。

Ovis2.5在图像推理、视频理解和视觉定位等多个基准测试中同样表现优异，充分展示了其强大的通用多模态处理能力。这一全面而强大的功能集，使得Ovis2.5在多模态AI应用中具有极高的实用价值。

AIDC-AI此次发布Ovis2.5，不仅彰显了其在多模态AI技术领域的持续创新能力，也为开发者和企业用户带来了一种高效且易于部署的解决方案。尤其对于那些需要结合视觉与文本推理的应用场景，Ovis2.5无疑是一个理想的选择。

目前，Ovis2.5已在GitHub和Hugging Face等平台开源，这一举措将进一步促进全球AI社区的协作与创新，推动多模态大语言模型技术的快速发展。

Ovis2.5的发布，标志着AIDC-AI在Ovis系列模型研发上取得了又一重大突破，为多模态大语言模型的发展注入了强劲动力。

作为ChatGPT和Codex等产品的背后推手，该公司致力于掌控其模型与产品所依赖的完整技术栈，从而降低对英伟达等外部供应商的依赖，并通过垂直整合在性能或效率上获得潜在优势。 A：根据OpenAI和Broad…

06-28

Adobe强化AI布局：收购Topaz Labs，整合技术提升创意软件生态竞争力

此次收购完成后，Adobe计划将Topaz的AI模型进一步整合至FireflyAI应用及其他图像与视频编辑产品中，同时也将通过官网继续提供Topaz旗下产品的独立服务。 A：收购完成后，Topaz Labs…

06-28

苹果Vision Pro项目核心高管保罗·米德下周离职，将转投OpenAI硬件部门

最近一段时间，他主要负责推进 AI 智能眼镜项目，并领导 AR 眼镜开发团队。现任 Vision Pro 与智能眼镜产品设计负责人弗莱彻 ·罗斯科夫（IT之家注：Fletcher Rothkopf）将接手他…

06-28

深圳“智造者大会”展新篇：微型传感器赋能机器人“触觉”升级

华力创科学的方案，就是把传感器“微缩”到了8.5毫米直径、最薄仅5毫米，像一颗纽扣大小，却能感知多维力变化。最新的Photon Finger tip则更进一步，把“刚性力觉”和“柔性电子皮肤”融合在一起，真正…

06-28

荣耀Robot Phone机器人手机8月将至研发历经一年打磨且后续计划迭代升级

IT之家 6 月 28 日消息，博主 @旺仔百事通昨晚发文透露，称荣耀 Robot Phone 机器人手机将在 8 月上市。有网友询问这台手机后续是否还会迭代，博主明确表示：“会。” 荣耀机器人手机 Ro…

06-28

开源程序新创意：Steam手柄“变身”自动充电小能手震动寻底座超便捷

IT之家 6 月 28 日消息，一名航空航天从业者兼程序员在 GitHub 上发布了一款程序，只要把 Steam手柄放在桌面，它就能自动朝着充电底座缓慢移动。此前已有其他程序员制作过同类创意网页工具，利用…

06-28

共启AI Token新生态：中国电信国际伙伴大会聚力，共绘全球智能新蓝图

本次大会标志着OneGrowth全球合作计划完成了从生态搭建到细分赛道深耕的战略进阶，中国电信将持续发挥云网融合、跨境广覆盖的独特优势，秉持“共创、共享、共治、共赢”核心合作理念，筑算力根基、拓云网骨干、创…

06-28

AI浪潮席卷通信业：从“卖连接”到“卖智能”，新价值如何破局？

一位通信设备厂商的技术负责人对第一财经记者表示，从经营流量到经营Token，包括运营商在内的通信产业链玩家不再甘于只做个连接服务商。“过去几年，5G提供了差异化服务的机会，但真正完成5G独立组网、能够把网络能…

06-28

吉林建科携手华为共探数智人才培养新路径助力区域数字经济高质量发展

央广网长春6月27日消息（记者张学龙）26日，由华为技术有限公司主办、吉林建筑科技学院承办的“数智赋能·人才兴吉——2026产教融合创新发展论坛暨华为院校人才培养论坛”在吉林建筑科技学院国际会议交流中心举行。…

06-28

神舟二十三乘组在轨满月：科研稳步推进，太空生活丰富还吃上了烤南瓜

06-28

荣耀Robot Phone机器人手机8月将至研发艰辛后续迭代引期待

06-28

程序员脑洞大开！开源程序助力Steam手柄“震动爬行”自动归位充电

06-28

神舟二十三乘组在轨满月：太空实验稳步推进航天员享烤南瓜美食

06-28

DeepSeeK突然发布DSpark，让AI的回答不再“挤牙膏”

06-28

Anthropic调研：约半数Claude用户称AI已可承担一半以上工作

06-28

点击查看更多 +

全站最新

新能源商用车+智能运营：物流行业绿色数智转型的苏州探索

智美大五座豪华SUV来袭！阿维塔07L明日直播揭秘鸿蒙座舱内饰

AI浪潮席卷通信业：从“卖连接”到“卖智能”，新价值如何破局？

吉林建科携手华为共探数智人才培养新路径助力区域数字经济高质量发展

科大讯飞P30 Turbo学习机：护眼AI双加持，助力孩子高效学习新选择

启境GT7入局车市内卷红海，性价比与配置能否助其破局突围？

热门内容

本栏最新

尊界S800典藏大观亮相：余承东“双态”发布，中国超豪华车新征程启幕

敦煌大漠燃情夜：许巍助阵捷途“方盒子”燃油插混双车闪耀登场

360潘剑锋：智能体时代安全新范式，聚焦驾驭AI不确定性难题

华为赵振龙：AI驱动自智网络双核心演进，无线网络智能体引领行业新未来

国产存储系统闪耀ISC2026：国家超算互联网ParaStor双榜夺冠领跑全球

领益智造港股上市募资超82亿港元加速布局AI硬件新赛道

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.