ITBear旗下自媒体矩阵:

DeepSeek灰度测试识图模式 视觉理解成核心布局新动向

   时间:2026-04-30 00:08:47 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

DeepSeek近期在网页端与移动应用端悄然启动了一项新功能测试——识图模式。这一功能目前处于灰度发布阶段,允许部分用户上传图片,并借助人工智能技术对图片内容进行深度解析、描述及分析,标志着该平台在多模态交互领域迈出了重要一步。

据观察,识图模式在产品架构中被赋予了与快速模式、专家模式同等重要的地位,作为独立的一级功能入口呈现。这一设计策略表明,DeepSeek正积极将视觉理解能力从辅助工具升级为核心服务,以满足用户日益增长的多元化需求。

在实际使用中,已获得测试资格的用户反馈显示,进入识图模式后,界面会明确提示“使用识图模式开始对话”,并在输入框旁增设图片上传按钮,操作流程简洁直观。不过,也有部分用户虽能看到功能入口,但在尝试使用时却收到“识图模式暂不可用,请稍后再试”的系统提示,显示该功能仍在逐步优化中。

从功能范围来看,当前识图模式主要聚焦于图片理解能力的开发,包括视觉问答、图片内容解读以及截图分析等场景。用户可上传各类图片,系统将自动识别并分析图片中的关键信息,提供详细的文字描述或解答相关问题。然而,目前尚未开放图像生成、视频理解或跨模态内容生成等更高级的功能。

基于现有功能表现,有技术分析师指出,DeepSeek的识图模式更接近于视觉语言模型(VLM)的应用范畴,即通过整合视觉与语言处理技术,实现对图片内容的精准理解与交互。尽管尚未达到完整多模态生成工具的水平,但这一功能的推出无疑为用户提供了更加丰富的交互体验,也为平台未来的功能拓展奠定了坚实基础。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version