滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

阿里千问视觉模型SpatialBench夺魁：Qwen3-VL空间推理登顶，3D检测与编程能力双突破

时间：2025-11-28 01:33:10 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在第三方空间推理评测平台SpatialBench公布的最新榜单中，阿里旗下千问视觉模型系列包揽前两名。其中Qwen3-VL以13.5分领跑，Qwen2.5-VL以12.9分紧随其后，较第三名Gemini3.0 Pro Preview的9.6分和第四名GPT-5.1的7.5分形成显著优势，距离人类基准线80分再获突破性进展。

该榜单聚焦2D/3D空间认知、结构解析与路径规划能力，涵盖电路故障诊断、CAD工程图纸解析、分子三维构型预测等20余类复杂任务，被业界视为评估具身智能发展水平的核心指标。测试场景不仅包含静态空间分析，更延伸至动态环境下的实时推理需求。

技术突破方面，Qwen3-VL通过三项核心升级构建竞争优势。其3D检测模块新增旋转框输出与深度估计双任务头，在遮挡场景下的平均精度（AP）提升18%，可精准识别物体空间方位并感知视角变化。视觉编程功能支持用户输入手绘草图或10秒短视频，自动生成可执行的Python+OpenCV代码，实现从视觉输入到功能实现的闭环。模型矩阵方面，除提供2B至235B参数的密集模型外，还推出30B-A3B、235B-A22B等混合专家（MoE）架构版本，其中推理版在32项核心能力测试中平均领先Gemini2.5 Pro达6.4分。

开源策略上，Qwen2.5-VL已实现全量代码与模型权重开源，开发者可自由调用基础能力。Qwen3-VL计划于2025年第二季度开放完整工具链，同步在千问官方应用中提供免费体验入口。这种阶梯式开放模式既保障技术生态建设，又为中小企业提供低成本验证机会。

商业化落地进程加速推进。阿里云披露，Qwen3-VL已在物流分拣机器人、AR设备装配指导、自动化港口调度等场景完成概念验证（POC），其空间定位精度达到厘米级（误差＜2cm）。特别在动态环境适应性测试中，模型可实时处理多摄像头输入并生成控制指令，较传统方案效率提升40%。2026年将推出"视觉-动作"端到端模型，通过整合视觉感知与运动控制模块，为工业机器人提供毫秒级响应的视觉伺服能力，重点突破复杂环境下的自主操作瓶颈。

更多>同类资讯

夸克AI眼镜明日登场：首款内置阿里千问配置强功能多引期待

11-28

小米Xiaomi HAD增强版推送：纵向丝滑横向果断路径选择更精准

11-28

阿里巴巴2026财年Q2营收2478亿电商业务领跑蚂蚁集团贡献利润

11-28

必胜客6年客单价降40元，下沉市场与萨莉亚“贴身肉搏”

11-28

短剧《还珠》收官引热议：经典IP入局能否成短剧破局新方向？

11-28

2025“AI眼镜元年”来袭，芯片厂商多元布局竞逐新赛道

11-28

行业调整期下酒类流通企业的突围：资本助力与同业抱团双线并行

11-28

山姆“阿里化”引信任危机，大润发“断奶”后求变自救

11-28

金富科技跨界并购蓝原科技，从瓶盖迈向新赛道寻增长新机遇

11-28

马斯克放狠话：Grok5挑战LOL顶尖战队，AI能否跨越认知难关？

11-28

阿里财报电话会实录：AI投入与电商布局双轮驱动，未来战略方向明确

11-28

阿里AI战略新动作：夸克AI眼镜携千问入局开启物理世界入口争夺

11-28

谷歌Android Canary测试版更新：Wi-Fi热点新增双频选项兼顾高速与兼容性

11-28

夸克AI眼镜S1、G1登场：以AI赋能，开启智能眼镜新体验时代

11-28

京东物流迅速响应香港火灾：首批物资连夜送达，多批次救援已签收

11-27

点击查看更多 +

全站最新

吉利第三代豪越L上市，多重权益加持，空间智能动力亮点纷呈

广州车展看仰望：技术堆砌之后，如何筑起品牌豪华护城河？

阿斯顿·马丁DB12 Volante：优雅与性能并存，敞篷GT市场新选择

宝马全新燃油与纯电3系谍照流出，外观内饰差异明显，动力配置有亮点

纽约现身！仅约2700台的帕杰罗Evo，21.8万公里仍受越野收藏者追捧

fudi牵手京东开启即时零售新篇，打造“30分钟新鲜生活圈”

热门内容

本栏最新

fudi牵手京东开启即时零售新篇，打造“30分钟新鲜生活圈”

2025数据智能体落地全攻略：技术拆解、场景适配与分阶实施路径

广州车展长安马自达展实力，EZ-60与EZ-6共绘电动化新画卷

长安马自达携EZ-60与EZ-6亮相广州车展新能源矩阵开启电动新篇

性能与舒适双突破！小米YU7以硬核实力重塑高端SUV市场新格局

小米汽车新突破：YU7 Max紫水晶版登场，开启个性化定制新旅程

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.