DeepSeek近期在网页端与移动应用端悄然启动了一项新功能测试——识图模式。这一功能目前处于灰度发布阶段,允许部分用户上传图片,并借助人工智能技术对图片内容进行深度解析、描述及分析,标志着该平台在多模态交互领域迈出了重要一步。
据观察,识图模式在产品架构中被赋予了与快速模式、专家模式同等重要的地位,作为独立的一级功能入口呈现。这一设计策略表明,DeepSeek正积极将视觉理解能力从辅助工具升级为核心服务,以满足用户日益增长的多元化需求。
在实际使用中,已获得测试资格的用户反馈显示,进入识图模式后,界面会明确提示“使用识图模式开始对话”,并在输入框旁增设图片上传按钮,操作流程简洁直观。不过,也有部分用户虽能看到功能入口,但在尝试使用时却收到“识图模式暂不可用,请稍后再试”的系统提示,显示该功能仍在逐步优化中。
从功能范围来看,当前识图模式主要聚焦于图片理解能力的开发,包括视觉问答、图片内容解读以及截图分析等场景。用户可上传各类图片,系统将自动识别并分析图片中的关键信息,提供详细的文字描述或解答相关问题。然而,目前尚未开放图像生成、视频理解或跨模态内容生成等更高级的功能。
基于现有功能表现,有技术分析师指出,DeepSeek的识图模式更接近于视觉语言模型(VLM)的应用范畴,即通过整合视觉与语言处理技术,实现对图片内容的精准理解与交互。尽管尚未达到完整多模态生成工具的水平,但这一功能的推出无疑为用户提供了更加丰富的交互体验,也为平台未来的功能拓展奠定了坚实基础。










