腾讯优图实验室荣获CVPR 2023视觉异常检测挑战赛冠军，助力工业AI高质量发展

时间：2023-06-14 19:15:11 来源：互联网编辑：汪淼 发表评论无障碍通道

近日，腾讯优图实验室在CVPR 2023(IEEE国际计算机视觉与模式识别会议)中斩获了视觉异常检测(Visual Anomaly and Novelty Detection，VAND)挑战赛的冠军，这一荣誉标志着腾讯优图在工业人工智能领域的技术实力和创新能力得到了权威机构的认可。

无监督图像异常检测是计算机视觉领域的重要研究方向，其目标是通过仅使用正常图像进行模型训练，在测试时能够准确地区分正常和异常图像。在工业外观质检、产品零件安装检测和智能安全视频等领域，无监督异常检测技术具有巨大的研究意义和应用价值。工业领域对于视觉异常检测的需求日益增长。在工业生产过程中，异常情况可能导致质量问题、安全隐患甚至设备故障。传统的异常检测方法往往需要人工参与，效率低下且易受主观因素影响。而基于人工智能的视觉异常检测技术能够通过高效的自动化方式，快速识别和定位异常情况，从而提高生产效率和产品质量。

技术解析：

腾讯优图实验室与浙江大学合作，在Zero-shot异常检测赛道中提出了创新的解决方案。通过结合文本提示和图像特征对比的方法，该方案在测试集上取得了优异的成绩，综合F1-max指标达到0.4589，超越了其他参赛队伍。这意味着提出的模型能够在未见过异常样本的情况下，准确地识别和分割异常图像。以下可分为三点;

（一）异常分类

基于WinCLIP[3]异常分类框架，我们提出了一种文本提示集成策略，在不使用复杂的多尺度窗口策略的基础上显著提升了baseline的异常分类精度。具体地，该集成策略包含template-level和state-level两部分：

1) 对于前者，我们从CLIP Surgery[4]中选定的85个模板提示中删掉了一些不适合AD任务的模板，如“a photo of the weird [obj.]“，最终筛选35个模板提示。

2) 对于后者，我们采用通用文本来描述正常/异常对象，如“flawless，damaged“等，而没有提供过于详细的描述以保证方法的普适性，如”chip around edge and corner“。最终使用7个正常提示和5个异常提示。

模板和状态提示与样本类别名称结合后，使用CLIP文本编码器提取文本特征，并对正常和异常特征分别求平均值。最终，将正常与异常特征各自的平均值与图像特征进行对比，经过softmax后得到异常类别概率作为分类得分，见下图中蓝色Zero-shot Anomaly Score流程。

自研Zero-shot/Few-shot异常检测统一框架

（二）异常分割

类比图像级别的异常分类方法到异常分割，一个自然而然的想法是将Backbone提取到的不同层级特征与文本特征进行相似度度量。然而，CLIP模型是基于分类的方案进行设计的，即除了用于分类的抽象图像特征外，没有将其它图像特征映射到统一的图像/文本空间。因此我们提出了一个简单但有效的方案来解决这个问题：使用额外的线性层将不同层级的图像特征映射到图像/文本联合嵌入空间中，见上图中蓝色Zero-shot Anomaly Map流程。具体地，不同层级的特征分别经由一个线性层进行联合嵌入特征空间变换，将得到的变换后的特征与文本特征进行对比，得到不同层级的异常图。最后，将不同层级的异常图简单加和求得最终结果，具体实现可参考技术报告和源代码。官方的测试数据集上提出的方法在综合F1-max指标上达到0.4589，相较于其他众多参赛队伍具有明显的优势，获得了该赛道冠军，证明了所提方法的优越性和泛化性。

（三） Few-shot扩展

得益于简单的结构，我们结合基于memory的PatchCore[5]思路将方法扩展到Few-shot赛道，在不进行任何调参的基础上获得了积极竞争的结果，获得了该赛道荣誉提名奖，我们会在后续工作中进一步探究该方法在Few-shot上的应用潜力与价值。

该解决方案不仅在Zero-shot异常检测赛道表现出色，腾讯优图实验室还将其扩展到Few-shot异常检测赛道，并获得了该赛道的荣誉提名奖。在Few-shot异常检测赛道中，该方案在异常检测准确率方面表现优异，展现出出色的适应能力和泛化能力。

腾讯优图实验室在工业人工智能领域的相关成就，为工业质检、产品安全和智能视频等领域的发展提供了新的可能性。未来，腾讯优图将继续致力于推动计算机视觉和人工智能技术的创新，为工业应用带来更多突破和进步，为各行业提供更智能、高效的解决方案。

关于CVPR

CVPR是由IEEE主办的一年一度的全球学术型顶级会议，全称“IEEE国际计算机视觉与模式识别会议”(IEEE Conference on Computer Vision and Pattern Recognition)，今年将于6月18日到22日在温哥华会议中心举办。

关于腾讯优图实验室

腾讯优图实验室成立于2012年，是腾讯公司旗下顶级人工智能实验室。优图聚焦计算机视觉，专注人脸识别、图像识别、OCR等领域开展技术研发和行业落地，在推动产业数字化升级过程中，优图始终专注基础研究、产业落地两条腿走路的发展战略，与腾讯云与智慧产业深度融合，挖掘客户痛点，切实为行业降本增效。与此同时，优图关注科技的社会价值，践行科技向善理念，致力于通过视觉AI技术解决社会问题，帮助弱势群体。

腾讯优图实验室的研究成果已被CVPR 2023 VAND研讨会收录。将于6月18日的11:50 AM - 12:00 PM进行相关Talk和QA可以点击阅读原文了解详情。

阅文原文链接：(https://sites.google.com/view/vand-cvpr23/schedule )。

参考文献

[1] Radford, Alec, et al. "Learning transferable visual models from natural language supervision."International conference on machine learning. PMLR, 2021.

[2] Dosovitskiy, Alexey, et al. "An image is worth 16x16 words: Transformers for image recognition at scale."arXiv preprint arXiv:2010.11929(2020).

[3] Jeong, Jongheon, et al. "Winclip: Zero-/few-shot anomaly classification and segmentation." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2023.

[4] Li, Yi, et al. "Clip surgery for better explainability with enhancement in open-vocabulary tasks."arXiv preprint arXiv:2304.05653(2023).

[5] Roth, Karsten, et al. "Towards total recall in industrial anomaly detection."Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022.

2024 IIC Shanghai3月29日,2024国际集成电路展览会暨研讨会(IIC Shanghai)在上海张江科学会堂成功举办。本届大会由AspenCore主办,汇聚全球半导体领域众多专业人士,共同探索产业前沿发展。凭借在AI芯片领域优秀的研发能力以及落地应用成果,爱芯元智AX620Q荣获“中国IC设

人在哪里,流量就在哪里,流量在哪里,生意就在哪里。互联网时代,流量在不同平台间流转,商家的经营也随着流量走向数字化。而在互联网的流量红利见顶,进入存量时代后,消费者的需求趋向多样化和个性化,商家数字化也进入“深水区”。有的商家寻求拉新与流量,有的寻求用爆款带

数智技术风起云涌，产业转型升级正当其时!作为全球领先的企业数智化软件与服务提供商，用友已成为众多行业领先企业推进数智化转型的首选合作伙伴。为探索新环境下成长型企业降本增效新思路，用友将于4月19日举办【“益企京彩数智转型”一走进用友产业园暨数智化助力成

以前买电动车的需求是能代步就行。现在买电动车不止要骑得舒服，最好再给生活加点新鲜感。如何以一辆小小的电动车让生活更有乐趣呢?新日电动车选择了拉高产品的科技含量来提升骑行体验，从而让出行的乐趣进阶。新日凯迪拉氪就是这样一辆科技属性拉满的电动车，以动力科

近日，在首届“百度智能云GENERATE全球生态大会”上，百度智能云与全球知名咨询服务机构毕马威签署战略合作协议。根据协议，双方将强强联合，依托毕马威各行业多年的咨询和产品交付经验，以及百度智能云在人工智能、大数据和物联网等领域丰富的资源和优势，在大模型服务

4月12日，英特尔极限大师赛(IEM)于成都开赛，宏碁中国区总经理暨执行董事蓝绍文先生出席了本次活动。宏碁作为IEM全球独家PC合作伙伴，携手英特尔将本届赛事落地成都，在为期3天的赛程中，将会有来自全球不同国家和地区的16支顶级《CS2》的战队角逐25万美元的总奖金。强

4月12日，英特尔极限大师赛(IEM)于成都开赛，时隔四年，在宏碁掠夺者和英特尔的推动下，这项第一个具备全球规模的电竞精英锦标赛再次落地中国区，在为期3天的赛程中，来自全球不同国家和地区的16支顶级《反恐精英2》和《CS2》的战队角逐25万美元的总奖金。作为全球唯一

4月12日，在《绿色家电以旧换新联盟》发布会暨福建家电百杰交流会上，天猫优品携手30+家电品牌、150多位福建家电区县百杰代表，正式成立了“绿色家电以旧换新联盟”，同时针对消费者以旧换新福利上，天猫优品在福建的500多家线下门店全年补贴投入过亿元，单品换新最高减

4月8日，东芝电视Z700NF系列正式开放预售。其搭载1300nits Mini LED，从控光、峰值亮度、屏幕、音响等各方面，解决用户观影时因亮度不够导致的细节过少、模糊等痛点，让用户体验细节更清晰的电视音画表现，从而拥有更沉浸舒适的观影体验。专注技术打磨，让画质细节更进

4月11日，海信智慧交通新产品亮相第十四届交博会。紧扣交通事故预防“减量控大”的工作目标，海信全新发布道路交通安全风险防控系统。安全是发展的前提，公安交管工作面临的第一挑战是安全风险。正如海信网络科技公司副总裁张四海所说，海信以风险隐患为业务抓手，以大

亚信科技AntDB数据库，医疗行业再下一城!近日，亚信科技(中国)有限公司「简称“亚信科技”」与用友网络科技股份有限公司「简称“用友”」携手推出的“U8C+AntDB”联合产品正式落地东北某龙头制药企业，助其完成“业务+数据”双底座建设，向“数智制药”全面迈进。龙头药

4月9日,在百度智能云GENERATE全球生态大会上,IDC中国区副总裁兼首席分析师武连峰作了以《抓住大模型应用与生态的无限商机》为主题的分享。武连峰在演讲中分享了当前生成式AI 和大模型发展的几个关键趋势:1、IT行业迎来AI大转型时代。全球37.4%的企业认为生成式AI将会颠

在家用投影仪日益普及的今天，激光投影仪以其出色的画质、色彩表现和使用寿命成为了市场上的热门选择。然而，面对众多的品牌和型号，消费者往往感到困惑：如何在三千元的预算内选择一款性价比高的激光投影仪呢?本文将为您提供详细的选购指南。一、如何挑选一款高性价比

随着人工智能技术的迅速发展，智能手机厂商们正竞相将AI技术融入其产品中，以提供更智能、更便捷的用户体验。三星以其卓越的技术优势，在新一代高端旗舰智能手机三星Galaxy S24系列中推出了融合端侧和云侧综合能力的Galaxy AI，旨在全面提升产品体验，以丰富的AI应用进

日前，为推广科学养老和健康生活方式，让长者积极参与全民运动，维达在其参与投资建设的养老机构举办了首届趣味马拉松活动，再次展现了维达对于人民群众幸福晚年的重视和社会责任感。养老产业作为维达旗下业务的一部分，一直备受管理层与维达股东们关注。而维达健康安养

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
合作咨询QQ：642361(微信同号) 争议稿件处理QQ：42503264
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1
Copyright © 小熊科技资讯 2007-2021 ITBEAR.COM.CN All rights reserved.