滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek“识图模式”灰度测试，视觉推理能力初显锋芒

时间：2026-04-29 19:13:23 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

人工智能领域迎来新突破，某知名AI平台近日低调开启多模态能力灰度测试，部分用户发现其首页新增"识图模式"功能入口。这项升级标志着该平台突破传统文本交互局限，正式具备视觉认知能力，能够像人类一样理解图像中的物体、场景及空间关系。

研发团队通过技术博客展示了新功能的实际应用效果。在基础测试中，系统准确识别出上传的兔子品种并描述其姿态特征；面对杭州灵隐寺的复杂场景照片，仅凭路灯上的草书字样和建筑风格，便快速锁定地理位置并给出精确经纬度坐标。更令人印象深刻的是，当面对包含视觉错觉的图片时，系统成功识别出墙面修补痕迹和杂物堆放区域，未受错觉干扰。

深度测试环节展现了更强大的推理能力。研究人员上传一张无文字提示的随手拍照片，开启深度思考模式后，系统分步骤解析画面信息：从前景的植被特征，到中景的建筑样式，再到背景的山脉轮廓，最终锁定燕山山脉地理特征，并推断拍摄地位于北京昌平或海淀郊区。实际位置与系统判断结果误差不足十公里，展现出惊人的空间推理能力。

趣味测试环节则暴露了当前技术的局限性。在尝试手相分析时，系统初始误判左右手方向，但后续对掌纹形态的描述和性格分析却展现出专业水准。这种"专业错误"的矛盾表现，恰好反映出视觉识别与语义理解结合过程中仍需优化的空间。

据技术文档披露，该功能的视觉解析框架整合了多尺度特征提取和跨模态注意力机制。在处理复杂场景时，系统会先进行像素级语义分割，再通过图神经网络建立物体间关系模型，最终结合地理信息数据库完成场景重建。这种分层处理方式既保证了识别精度，又显著提升了推理效率。

此次升级并非偶然。该团队早在三年前就发布了开源多模态模型Janus，在视觉编码器与语言模型的对齐研究方面积累深厚。此次产品化落地，标志着其技术路线从学术研究向工程应用的成功转化。虽然当前功能仍处于测试阶段，但已展现出在医疗影像分析、工业质检等领域的潜在应用价值。

行业观察人士指出，多模态交互正在重塑人机协作范式。当AI能够同时处理文本、图像、语音等多种信息形态时，其认知维度将更接近人类感知世界的方式。这种进化不仅提升用户体验，更为复杂决策场景提供了新的技术路径。随着视觉-语言模型的持续优化，未来或将出现能理解动态视频、三维空间的更高级认知系统。

更多>同类资讯

从“智驾大陆”到“智驾新程”：neueHCT以成本重构开启智驾普惠新篇

04-29

宝马领悦携手火山引擎深化合作，共探AI赋能豪华客户旅程新路径

04-29

SentiCat亮相：AI Agent“有脸有骨”，陪伴与效率闭环开启新篇

04-29

DeepSeek多模态新进展：识图模式小范围灰度，图像理解能力上线

04-29

DeepSeek“识图模式”登场多模态交互新体验开启新征程

04-29

北京车展全球首秀！面壁智能携手英特尔推出量产AI Box，共拓端侧AI新蓝海

04-29

芯驰科技战略进阶：汽车“芯”突破，跨界赋能具身智能新赛道

04-29

芯驰科技战略进阶：汽车芯片领航，跨界布局具身智能新赛道

04-29

中国科大引领教育新篇：2026年将迎全国首个“商业人工智能”本科新生

04-29

中用科技超级玛丽7.0发布：AI驱动工业运维全链路自主智能新跨越

04-29

贾跃亭十二年造车路：从困境到新融资，豪华电动车赛道未来可期

04-29

2025年我国词元日均调用量飙升年末达100万亿全年累计约21100万亿

04-29

宇树科技全国首家直营店落地北京王府井开启消费新体验

04-29

魔法原子硅谷大会发布新品规划2036年营收140亿并投10亿建生态

04-29

英伟达推出Nemotron 3 Nano Omni 多模态AI模型效率成本双突破

04-29

点击查看更多 +

全站最新

魏建军化身“哎哟魏”深度联动电竞，长城汽车与年轻人共赴潮酷之约

乐道L80杭州亮相预售24.58万起！李斌现场秀空间与玩法，亮点满满

仁芯科技32Gbps车载SerDes芯片亮相北京车展引领国产高速传输芯片上车潮

2026年汽车业淘汰赛正酣赵明携游心入局欲以智驾破局争先

东方美学邂逅智慧出行 “荣光艺境万象共赏”品鉴会共启高定生活新篇

问道V9开启预售！大尺寸配华为增程续航超1300公里剑指20万级MPV市场

热门内容

本栏最新

芯驰科技战略进阶：汽车“芯”突破，跨界赋能具身智能新赛道

芯驰科技战略进阶：汽车芯片领航，跨界布局具身智能新赛道

吉利银河2026北京车展首发银河之光第2代，以AI与美学重塑汽车新体验

吉利银河M7远航家上市：续航操控安全全升级打造家用电混SUV新标杆

红旗品牌北京车展“焕新”登场 27台展车尽显智能豪华新魅力

吉利银河M7：以技术破局，重塑10-15万电混SUV价值新标杆

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.