ITBear旗下自媒体矩阵:

上海AI实验室重磅发布:多模态大模型书生・万象3.5全面升级开源

   时间:2025-09-05 02:02:42 来源:93913虚拟现实编辑:快讯团队 IP:北京 发表评论无障碍通道
 

上海人工智能实验室(简称上海AI实验室)近期宣布了一项重大进展,正式向全球开源其通用多模态大模型——书生・万象3.5(InternVL3.5)。此次开源不仅标志着InternVL系列在技术上的全面升级,更预示着多模态人工智能领域的一次重要飞跃。

InternVL3.5在推理能力、部署效率及通用性方面均实现了显著提升。为了满足不同场景下的多样化需求,此次开源涵盖了从10亿到2410亿参数的9种不同尺寸的模型。尤为值得一提的是旗舰模型InternVL3.5-241B-A28B,在多学科推理基准MMMU测试中取得了77.7分的高分,位居所有开源模型之首,其多模态通用感知能力甚至超越了GPT-5,文本处理能力同样在主流开源多模态大模型中领先。

与之前的版本InternVL3.0相比,InternVL3.5在多个特色任务上均展现出显著优势。特别是在图形用户界面(GUI)智能体、具身空间感知以及矢量图像理解与生成方面,其性能有了质的飞跃。在GUI交互测试中,InternVL3.5在ScreenSpot-v2元素定位任务中获得了92.9分的高分,超越了同类模型,并支持Windows和Ubuntu系统的自动化操作。在具身智能体测试中,该模型展现出对物理空间关系的深刻理解,规划导航路径的能力在VSI-Bench测试中超越了Gemini-2.5-Pro。在矢量图形理解与生成方面,InternVL3.5在SGP-Bench测试中刷新了开源纪录。

InternVL3.5的跨平台操作能力尤为引人注目。它能够在Windows、Mac、Ubuntu、Android等多个平台上识别界面元素,并自主执行鼠标和键盘操作,实现诸如恢复已删除文件、导出PDF、邮件添加附件等任务的自动化。这一特性极大地拓展了其应用场景,使得InternVL3.5在办公自动化、智能机器人等领域具有广泛的应用潜力。

InternVL3.5还具备更强的grounding能力,能够在全新的复杂小样本具身场景中实现泛化。配合抓取算法,它支持可泛化的长程物体抓取操作,为机器人提供了更高效的物品识别、路径规划与物理交互能力。这一特性使得InternVL3.5在智能制造、仓储物流等领域同样具有巨大的应用价值。

作为上海AI实验室书生大模型体系的重要组成部分,InternVL系列自推出以来便受到广泛关注。目前,InternVL全系列的全网下载量已突破2300万次,显示出其在全球范围内的广泛应用和深远影响。此次开源InternVL3.5,上海AI实验室旨在进一步推动多模态大模型技术的发展,促进全球科研人员和开发者之间的合作与创新。

通过提供这一强大的开源工具,上海AI实验室希望加速人工智能在各个领域的应用进程,为解决现实世界的复杂问题提供更多可能性。这一举措无疑将为全球人工智能领域的发展注入新的活力。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version