ITBear旗下自媒体矩阵:

DeepSeek识图模式上线实测:多模态能力升级,鲸鱼“睁眼”新体验

   时间:2026-04-30 05:13:47 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

人工智能领域迎来新突破,DeepSeek正式推出图像识别功能,目前处于灰度测试阶段。这一进展标志着备受关注的多模态能力终于落地,用户通过网页端或移动应用更新后,均有机会体验这项新功能。

研究人员在社交平台发布"Now, we see you"的配图后,测试团队立即展开验证。实验显示,该系统不仅能识别图像表面元素,更能结合上下文进行深度解读。例如面对某张未标注品牌信息的图片,系统通过分析发布者身份与视觉符号,准确推断出这是关于多模态功能更新的隐喻,并给出"沉睡的鲸鱼睁开双眼"的生动比喻。

与传统AI的机械式分析形成鲜明对比,该系统展现出独特的问题拆解能力。当处理某张网络梗图时,它没有停留在"两只鲸鱼"的简单描述,而是连续追问发布者意图、符号象征意义等深层问题。测试过程中甚至出现自我修正的有趣场景:系统先联想到动漫角色配饰,随即自我否定并重新推导,最终得出更合理的解释。

最引人注目的是其思维验证机制。在分析接近完成时,系统会主动发起"内部答辩",通过三个递进问题完成逻辑校验:先确认基础事实,再评估事件性质,最后形成综合判断。这种模拟人类反思过程的机制,有效提升了分析结果的可靠性。

在基础能力测试中,系统展现出高效响应优势,常规识别任务可在0.5秒内完成。对于经典电影剧照、抽象艺术作品等复杂内容,系统能准确识别核心元素并给出语境化解读。商品图片识别测试中,系统正确识别出服装品牌与款式特征,证明其具备商业应用潜力。

不过测试也暴露出部分局限。面对需要联网验证的新事物(如某科技公司新吉祥物),系统因无法实时搜索而无法识别。文件格式支持方面,目前仅兼容主流图片格式,HEIF等新型格式暂未开放。在极限测试中,系统对非常规视觉内容(如特定手势计数)的识别准确率仍有提升空间,但通过二次引导可修正错误。

这项功能的推出被视为国产AI发展的重要里程碑。随着多模态能力的持续完善,行业格局可能面临新一轮洗牌。测试团队表示将持续跟进功能迭代,并邀请用户分享使用体验,共同探索人工智能的更多可能性。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version