滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek“识图模式”大范围上线，以创新框架开启图文交互新体验

时间：2026-05-09 11:49:37 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

近期，人工智能领域迎来一项重要进展——DeepSeek正式面向用户开放“识图模式”功能。此前，该功能已进行多轮灰度测试，目前测试账号已能普遍看到相关入口，但官方仍标注为“图片理解功能内测中”。这一模式突破了传统文字OCR的局限，实现了对图片内容的深度理解与分析。

在实际体验中，“识图模式”展现出强大的多维度能力。在文物识别场景下，用户上传博物馆拍摄的文物照片后，系统不仅能描述其纹理与材质特征，还能结合历史背景推断出具体年代与风格。例如，某件玉器被准确识别为18世纪清代乾隆时期的“痕都斯坦风格”作品。面对复杂的空间推理题时，该模式通过深度思考机制，在耗时约4分钟后成功解答了立方体拼合类难题，展现出严谨的逻辑推导能力。

针对网络流行文化内容，系统表现出敏锐的“网感”。测试中，它不仅能精准识别表情包中的人物角色——包括从合影中区分现实人物与动漫角色，还能解读动物表情背后的情绪，准确捕捉网民的转发笑点。在生产力场景应用方面，该模式可高效解析技术报告截图，自动提取代码与界面元素，甚至能反向生成可交互的HTML代码，完整还原原始网页的跳转功能。

技术层面，DeepSeek同步公开了其核心框架“Thinking with Visual Primitives”（视觉原语思考）。该框架通过将点、边界框等空间定位元素直接融入推理链条，解决了传统模型在处理密集场景时存在的“指代鸿沟”问题。这种创新机制使模型在推理过程中能像人类一样“边想边指”，显著提升了复杂空间布局的解析能力。运算效率测试显示，处理800×800分辨率图片时，该模型仅消耗约90个tokens，仅为其他主流模型消耗量的十分之一。

尽管取得突破性进展，该功能仍存在明显局限。知识库更新滞后导致识别结果出现偏差，例如将2025年底发布的新款手机误判为旧型号。在处理反直觉图形题目时，系统表现不稳定，长时间深度思考后甚至出现逻辑混乱的情况。当前版本仅支持纯视觉理解，尚未集成图像生成、视频分析等跨模态交互功能，功能边界仍局限于静态图片分析领域。

更多>同类资讯

成都生成式AI大模型再扩容！新增5款完成备案，总量达23款显创新活力

近日，四川省互联网信息办公室发布备案通告，成都市新增5款生成式人工智能大模型，顺利完成国家生成式AI服务备案。至此，全市获国家备案大模型总量达23款，较2025年备案数量增长53%。本次新增备案模型赛道…

06-19

浩鲸科技鲸智大模型Token运营平台：斩获双认证，引领行业高质量发展新征程

未来，浩鲸科技将持续深耕大模型Token领域，迭代优化平台性能与服务能力，携手信通院等行业伙伴共建高质量Token生态，为全球企业智能化升级与AI应用落地提供更可靠、高效、安全的支撑，助力全球数字经济建设高质…

06-19

工业场景适配为王：具身智能机器人选型逻辑与落地保障全解析

通用型机器人主打展示交互，很难扛住工业严苛工况；而工业专属具身智能机器人，立足真实产线需求研发，在复杂环境适配、柔性工位切换、非标精密作业、量产落地保障上优势显著。对于制造企业而言，选择垂直工业场景打磨的智…

06-19

英伟达ENPIRE框架助力：机器人自学完成高精度任务开启AI现实应用新篇

IT之家 6 月 18 日消息，英伟达 GEAR 实验室联合负责人 Jim Fan 昨日（6 月 17日）晒出一段视频，宣布首次在物理世界中启用了 AutoResearch。 ENPIRE 是英伟达 GE…

06-19

济南起步区场景对接会：技术与场景“牵手” 共绘机器人产业新蓝图

山东铁投智科、山东科创集团、山东国数、区消防救援大队黄河消防救援站，以及山东优宝特智能机器人、山东芯脑机器人、先投资运集团等7家企业负责同志围坐一起，开了一场特殊的会——不秀技术、不拉投资，说清三件事：我有什…

06-19

安顺学院在第二十八届中国机器人及人工智能大赛贵州省赛中斩获佳绩

近日，第二十八届中国机器人及人工智能大赛贵州省赛在遵义师范学院圆满落幕。安顺学院共斩获一等奖10项、二等奖12项、三等奖12项，交出了一份亮眼答卷。安顺学院学生在第二十八届中国机器人及人工智能大赛贵州省赛中…

06-19

精度达0.2微米！天津探秘：具身智能视觉如何赋能机器人“看”世界

在天津就有这样一家企业，深耕具身智能视觉系统研发，为机器人打造精准“视觉大脑”，这项前沿技术将为日常生产生活带来哪些全新变化？除了具身智能的眼睛，在天津还有“灵巧手”的研究，依靠传感器能够感知物体的软硬，连…

06-19

万天控股与数字华夏强强联合共绘具身智能机器人商业落地新蓝图

6月18日，中国万天控股有限公司（股份代号：1854.HK，以下简称“中国万天控股”）旗下的关联控股子公司深圳万天人工智能科技有限公司与具身交互智能领域领先企业数字华夏（深圳）科技有限公司（以下简称“数字华…

06-19

北京亦庄万台级具身智能机器人超级工厂投用构建完整制造能力体系

北京超级工厂围绕“全制程、高柔性、精益化、数字化”，构建了具身机器人硬件制造的完整能力体系，致力于打造全球具身智能标杆型超级工厂。在制造能力上，工厂覆盖从核心零部件、模组到整机组装与测试的全链条制造服务，…

06-19

Epic本周福利来袭！《深空梦里人》《ROBOBEAT》两款佳作免费畅领

06-19

刚刚，Momenta完成IPO备案

06-19

郝景芳AI创作引热议：我们更应关注审美、公平与权责之问

06-19

果汁巨头豪掷8亿跨界半导体：是破局新路还是盲目豪赌？

06-19

A股首开亏损上市新径：AI大模型凭何获此“特殊待遇”？

06-19

魔法原子联合安行能源、憬驰智能共筑智慧社区机器人全链生态新图景

06-19

点击查看更多 +

全站最新

江苏用户必看！选电动车专用锂电池，这些要点助你精准避坑

2026贵州电动车锂电池定制企业盘点：从需求出发选靠谱合作方

钉钉新CEO陈宇森首封全员信：调整组织架构，多位业务负责人确定

Momenta港股IPO备案获批，以物理AI基座模型开启自动驾驶新篇章

传音控股赴港交所递表，2025年营收超655亿，多地区智能机市占领先

苹果CEO库克确认产品将涨价，内存芯片成本飙升成主因

热门内容

本栏最新

科技赋能社区温情，人文引领生态共建|亲邻科技以创新服务重塑现代社区价值

零跑2027款焕新：从“堆料”到细节打磨，未来能否续写传奇？

比亚迪大唐EV上市：23万级全尺寸SUV新标杆，950km续航+29项全球第一

HDC 2026聚焦鸿蒙生态：AI赋能数字内容，携手伙伴共探商业新路径

长沙启幕！吉利银河星耀7MAX携五大豪华颠覆实力开启美好出行新篇

第十届南博会：AI智能机器人引领服务创新科技助力传统制造业升级

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.