A Deep Residual − Feature Pyramid Network Framework for Scattered Point Cloud Semantic Segmentation
-
摘要: 针对当前基于深度学习的散乱点云语义特征提取方法通用性差以及特征提取不足导致的分割精度和可靠性差的难题, 提出了一种散乱点云语义分割深度残差−特征金字塔网络框架. 首先, 针对当前残差网络在卷积方式上的局限性, 定义一种立方体卷积运算, 不仅可以通过二维卷积运算实现三维表示点的高层特征的抽取, 还可以解决现有的参数化卷积设计通用性差的问题;其次, 将定义的立方体卷积计算与残差网络相结合, 构建面向散乱点云语义分割的深度残差特征学习网络框架; 进一步, 将深度残差网络与特征金字塔网络相结合, 实现三维表示点高层特征多尺度学习与散乱点云场景语义分割. 实验结果表明, 本文提出的立方体卷积运算具有良好的适用性, 且本文提出的深度残差−特征金字塔网络框架在分割精度方面优于现存同类方法.Abstract: Aiming at the problem that the current scattered point cloud semantic segmentation based on the deep learning method is poor in generality and the problem of poor segmentation accuracy and reliability caused by insufficient feature extraction, a scattered point cloud depth residual-feature pyramid network framework is proposed. Firstly, for the limitation of the current residual network in the convolution mode, a cube convolution operation is defined, which can not only extract the high-level features of the three-dimensional representation point through the two-dimensional convolution operation, but also solve the problem of poor generality of current parameterized convolution design. Secondly, a deep residual feature learning network framework is constructed for scattered point cloud semantic segmentation through integrating the defined cube convolution operation into the residual network. Additionally, the proposed deep residual network is combined with the feature pyramid network to enable multi-scale learning of high-level features of three-dimensional representation points and semantic segmentation of scattered point cloud. The experimental results show that the cube convolution proposed in this paper has good applicability and the depth residual-feature pyramid network framework is superior to the existing similar methods in terms of segmentation accuracy.
-
表面缺陷检测是机器视觉领域中非常重要的一项研究内容, 也称为AOI (Automated optical inspection)或ASI (Automated surface inspection), 它是利用机器视觉设备获取图像来判断采集图像中是否存在缺陷的技术. 目前, 基于机器视觉的表面缺陷装备已经在各工业领域广泛替代人工肉眼检测, 包括3C、汽车、家电、机械制造、半导体及电子、化工、医药、航空航天、轻工等行业. 传统的基于机器视觉的表面缺陷检测方法, 往往采用常规图像处理算法或人工设计特征加分类器方式. 一般来说, 通常利用被检表面或缺陷的不同性质进行成像方案的设计, 合理的成像方案有助于获得光照均匀的图像, 并将物体表面缺陷明显地体现出来. 一种方式是针对被检表面颜色选择光源, 例如文献[1]中选择复合白色光源成像彩色布匹表面缺陷. 另一种常见的方式是依据被检测表面反射性质选择不同成像方案, 主要包括明场成像、暗场成像和混合成像等. 例如, Chen等[2]针对金属易拉罐凹凸底部的表面缺陷检测, 设计了两个同心放置的圆锥环形明场光源, 用于同时照亮易拉罐底部的中央和外围区域. Tao等[3]采用了暗场成像对大口径光学元件表面微弱划痕进行检测. 虽然精心构造的成像方案能够大大减轻经典检测算法设计的难度, 但也增加了检测系统的应用成本. 同时在很多开放式的工业环境下(如图1(b)和图1(d)所示的自然场景), 期待设计的成像系统完全消除场景或者被检材料等变化对检测系统的影响, 往往不太现实. 在真实复杂的工业环境下, 表面缺陷检测往往面临诸多挑战, 例如存在缺陷成像与背景差异小、对比度低、缺陷尺度变化大且类型多样, 缺陷图像中存在大量噪声, 甚至缺陷在自然环境下成像存在大量干扰等情形, 如图1所示, 此时经典方法往往显得束手无策, 难以取得较好的检测效果.
近年来, 随着以卷积神经网络(Convolutional neural network, CNN)为代表的深度学习模型在诸多计算机视觉(Computer vision, CV)领域成功应用, 例如人脸识别、行人重识别、场景文字检测、目标跟踪和自动驾驶等, 不少基于深度学习的缺陷检测方法也广泛应用在各种工业场景中, 甚至国内外一些公司开发出多种基于深度学习的商用工业表面缺陷检测软件, 如表1所示. 全球传统工业视觉及其部件的市场规模在2025年将达到192亿美元[4], 其中中国占比约为30%, 并保持14%的年度平均增长率, 这一领域正在逐步被新一代基于深度学习的工业视觉技术替代. 同时我国在 《中国制造2025》 白皮书中提出“推广采用先进成型和加工方法、在线检测装置、智能化生产和物流系统及检测设备等, 使重点实物产品的性能稳定性、质量可靠性、环境适应性、使用寿命等指标达到国际同类产品先进水平”. 因此, 基于深度学习的表面缺陷检测方法不仅具有重要的学术研究价值, 同时有着非常广阔的市场应用前景.
表 1 商用基于深度学习的缺陷检测软件Table 1 Commercial deep learning based defect detection software软件名称 公司 国家 年份 VIDI 已被康耐视收购 瑞士 2016 Halcon17 以上版本 MVTec 德国 2017 SuaKIT 数优−AI 深度
学习缺陷检测软件已被康耐视收购 韩国 2017 ALFA 深度学习外观
缺陷检测软件东莞埃法智能科技有限公司 中国 2018 AiDitron 人工智能软件 杭州谛创科技有限公司 中国 2018 鉴于目前国内还没有全面细致论述基于深度学习表面缺陷检测方法的综述文献, 本文通过对2014年 ~ 2019年相关文献进行归纳梳理, 旨在帮助研究人员快速和系统地了解该领域相关方法与技术. 本文内容安排如下: 第1节给出缺陷检测问题的定义. 第2节重点对最近几年相关方法进行详细介绍、细分和对比. 第3节分析基于深度学习的表面缺陷检测中三个关键问题. 第4节介绍工业领域公开的缺陷检测数据集. 最后, 对未来可能的研究焦点和发展方向进行了展望.
1. 缺陷检测问题的定义
1)缺陷的定义. 在机器视觉任务中, 缺陷倾向于是人类经验上的概念, 而不是一个纯粹的数学定义. 对缺陷模式认知的不同, 会导致两种截然不同的检测手段. 以布匹表面缺陷检测为例, 如图2 所示, 第1种是有监督的方法,体现在利用标记了标签(包括类别、矩形框或逐像素等)的缺陷图像输入到网络中进行训练. 此时“缺陷”意味着标记过的区域或者图像. 因此, 该方法更关注缺陷特征, 例如在训练阶段将包含大片黑色范围的区域或者图像标记为“异色”缺陷用于网络训练. 在测试阶段, 当布匹图像中检测到大片黑色的特征时, 即认为出现了“异色”缺陷. 第2种是无监督的缺陷检测方法, 通常只需要正常无缺陷样本进行网络训练, 也称为one-class learning. 该方法更关注无缺陷(即正常样本)特征, 当缺陷检测过程中发现未见过的特征(异常特征)时, 即认为检测出缺陷. 此时“缺陷”意味着异常, 因此该方法也称作异常检测(Anomaly detection).
2)缺陷检测的定义. 对比计算机视觉中明确的分类、检测和分割任务, 缺陷检测的需求非常笼统. 实际上, 其需求可以划分为三个不同的层次, 即“缺陷是什么”、“缺陷在哪里”和“缺陷是多少”. 第1阶段: “缺陷是什么”, 对应计算机视觉中的分类任务, 如图2中分类三种缺陷类别: 异色、空洞和经线, 这一阶段的任务可以称为“缺陷分类”, 仅仅给出图像的类别信息. 第2阶段: “缺陷在哪里”, 对应计算机视觉中的定位任务, 这一阶段的缺陷定位才是严格意义上的检测. 不仅获取图像中存在哪些类型的缺陷, 而且也给出缺陷的具体位置, 如图2中将异色缺陷用矩形框标记出来. 第3阶段: “缺陷是多少”, 对应计算机视觉中的分割任务, 如图2中缺陷分割的区域所示, 将缺陷逐像素从背景中分割出来, 并能进一步得到缺陷的长度、面积、位置等等一系列信息, 这些信息能辅助产品高一级的质量评估, 例如优劣等级的判断. 虽然缺陷检测的这三个阶段的功能需求和目标不同, 但实际上三个阶段互相包含且能相互转换. 例如第2阶段“缺陷定位”包含第1阶段“缺陷分类”这一过程, 第3阶段“缺陷分割”同时也能完成第2阶段“缺陷定位”. 第1阶段“缺陷分类”也能通过一些方法实现第2阶段和第3阶段的目标. 因此, 在后文中还是按照传统工业习惯统称为缺陷检测, 只是在针对不同网络结构和目标功能时, 才有所区分.
2. 表面缺陷检测深度学习方法
本节总结概述基于深度学习的表面缺陷检测方法. 如图3所示, 依据数据标签的不同, 将其整体分为全监督学习模型、无监督学习模型和其他方法(半监督学习模型和弱监督学习模型). 在全监督模型中, 依据输入图像方式和损失函数的差异, 分为基于表征学习和度量学习的方法. 在表征学习中, 根据网络结构的不同可以进一步细分为分类网络、检测网络和分割网络. 目前大量的研究工作都是着眼于全监督学习方向, 但无监督学习同样是一个值得研究的方向. 从图3中可以看出, 本文按照每类方法的处理特点又细分为若干种不同的子方法.
2.1 表征学习
现阶段大部分基于深度学习的表面缺陷检测是基于有监督的表征学习方法. 表征学习的本质是将缺陷检测问题看作计算机视觉中的分类任务, 包括粗粒度的图像标签分类或区域分类, 以及最精细的像素分类. 由于实现的目标与计算机视觉任务完全一致, 因此基于表征学习的缺陷检测方法可以看作是其相关经典网络在工业领域的一个应用.
2.1.1 分类网络
在真实的工业生产中, 检测对象形状、尺寸、纹理、颜色、背景、布局和成像光照的巨大差异使复杂环境下的缺陷分类成为一项艰巨的任务. 由于CNN强大的特征提取能力, 采用基于CNN的分类网络目前已成为表面缺陷分类中最常用的模式. 通常CNN分类网络的特征提取部分由级联的卷积层 + pooling层组成, 后面连接全连接层(或average pooling层) + softmax结构用于分类. 一般来说, 现有表面缺陷分类的网络常常采用计算机视觉中现成的网络结构, 包括AlexNet[5], VGG[6], GoogLeNet[7], ResNet[8], DenseNet[9], SENet[10], ShuffleNet[11], MobileNet[12]等. 或者针对实际问题搭建简易的网络结构, 通过输入一幅测试图像到分类网络中, 网络输出该图像的类别和其类别的置信度. 依据分类网络方法实现任务的差异, 我们将其细分为三个小类: 直接利用网络做分类、利用网络做缺陷定位和利用网络作为特征提取器.
1) 直接利用网络进行分类
直接利用分类网络做缺陷的分类任务是CNN最早应用于表面缺陷检测中常用的手段. 根据研究工作的特点, 可以进一步将其细分为原图分类、定位感兴趣区域(Region of interest, ROI) 后分类和多类别分类三种. a) 原图分类. 即直接将收集的完整缺陷图像放入网络进行学习训练. 2014年, 奥地利科技研究所[13]最早采集光度立体图像训练CNN网络来实现轨道表面空洞缺陷分类, 整个网络共包含两个卷积层和两个池化层以及最后一个全连接层, 在钢轨表面数据集上最终达到的错误识别率为1.108%. Park等[14]设计了一种简易CNN分类网络, 用于自动检测表面零件上的污垢、划痕、毛刺和磨损等缺陷. 该方法在实验缺陷数据集上的平均检测正确率为98%, 其检测速度为5 285样本/min(图像分辨率为32×32像素). Kyeong等[15]提出了一种卷积神经网络框架对半导体行业的晶圆仓图(Wafer bin map, WBM)中的混合类型缺陷模式进行分类. 文献[16]采用修改的VGG19网络用于识别300×300分辨率的太阳能面板图像缺陷, 网络的准确率达到88.42%, 超过多种手工设计特征(包括KAZE[17]、SIFT (Scale-invariant feature transform)[18]、SURF (Speeded-up robust feature)[19])和支撑向量机(Support vector machine, SVM)方法的效果. Liang等[20]提出了一种基于ShuffleNetV2网络分类复杂背景下的瓶子喷墨码缺陷, 所提出的方法在塑料容器行业的在线喷墨码检测设备上获得了99.88%的分类正确率. 直接利用原图分类的方法应用非常广泛, 可用于多个领域的缺陷分类, 例如焊接缺陷分类[21]、聚合物锂电池水泡缺陷的分类[22]和印刷电路板(Printed circuit board, PCB)缺陷的分类[23]等. b)定位ROI后分类. 这种分类方法在许多工业应用中较为常见. 通常来说, 针对获取到的整幅图像, 人们常常只关注某个固定区域中是否存在缺陷, 因此往往预先获取到感兴趣的区域(ROI), 然后将ROI输入网络进行缺陷类别的判断. Shang等[24]提出了一种两阶段的铁轨缺陷识别算法, 首先利用Canny算子和直线拟合算法在整个原始图像上对铁轨区域进行裁剪. 然后将裁剪的图像放入Inception V3网络中提取特征以进行轨道图像分类. 文献[25]中通过级联的目标检测网络对高铁接触网螺栓区域进行获取, 然后将裁剪的螺栓图像输入到CNN网络中进行缺陷分类. Li等[26]首先利用基于局部二值模式(Local binary pattern, LBP)特征的级联目标检测器实现扫描隧道显微镜成像材料待检测区域定位, 然后采用CNN模型来获取表面缺陷的具体类型. c)多类别分类. 当待分类的缺陷类型超过两类时, 常规的缺陷分类网络与原图分类方法一样, 即网络的输出节点为缺陷类型的数目+1 (包括正常类别). 但多类别分类方法往往先采用一个基础网络进行缺陷与正常样本二分类, 然后在同一个网络上共享特征提取部分, 修改或者增加缺陷类别的分类分支. 通过该方式相当于给后续的多目标缺陷分类网络准备了一个预训练权重参数, 这个权重参数通过正常样本与缺陷样本之间二分类训练得到. Xie等[27]首先训练第1个ND (normal-defective)-CNN模型进行二分类(正常图像和所有其他缺陷图像), 缓解了数据不平衡的问题. 在训练好ND-CNN模型后, 将输出向量更改为6维向量来训练ID (interdefect)-CNN模型, 以使其适合于多类缺陷标签问题. 该模型在ND-CNN权重的基础上使用缺陷图像进行微调, 从而减少了样本量需求并节省了训练时间. Nagata等[28]提出了一种seeNet (Net with SVMs to classify sample images)网络, 该网络有两个分类分支, 第1个二分类分支用来分类正常样本和NG样本, 网络的模型采用AlexNet进行特征提取, 其分类器采用SVM; 第2个分支用于7类别的缺陷分类. 多类别分类采用这种二分支结构, 可以充分利用缺陷样本与正常样本数目不均衡的特点, 挖掘两者特征之间的差异.
2) 利用网络进行缺陷定位
一般认为, 分类网络只能完成图像标签级别的分类, 实际上结合不同的技巧和方式, 分类网络也可以实现缺陷的定位与逐像素的分类. 根据采用的手段不同, 可进一步将其分为滑动窗口、热力图(heatmap)和多任务学习网络三种形式. a)滑动窗口. 是最简单和直观的实现缺陷粗定位的方法. 一般工业表面缺陷检测处理的图像分辨率较大, 通过较小尺寸的窗口在原始图像上进行冗余滑动, 将滑动窗口中的图像输入到分类网络中进行缺陷识别. 最后将所有的滑动窗口进行连接, 即可获得缺陷粗定位的结果. 2017年, Cha等[29]最早采用基于滑动窗口的CNN分类网络实现了裂纹表面缺陷定位, 两种滑动窗口冗余路径结合实现图像全覆盖, 如图4所示, 图4(a)为滑动窗口路径示意图, 图4(b)为裂纹定位的结果图. 文献[30-32]采用相同的方法应用于金属表面裂纹、路面表面裂纹和城市建筑物表面缺陷定位. b)热力图(heatmap). 是一种反映图像中各区域重要性程度的图像, 颜色越深代表越重要. 在缺陷检测领域, 热力图中颜色越深的区域代表其属于缺陷的概率越大. 2018年, Ren等[33]采用图像分块和特征迁移方式获取每个分块所对应属于缺陷的置信度, 并将其转换为热力图. 在热力图基础上运用Otsu法[34]和图割算法进一步得到准确的缺陷轮廓区域. 在计算机视觉领域, 常采用CAM (Class activation mapping)[35]和Grad-CAM[36]方法获得热力图, 其本质上是通过加权特征图, 确定网络模型是通过哪些像素作为依据来判断输入图片所属的类别. Lin等[37]采用CAM获取热力图, 并利用Otsu二值化方法分割热力图, 实现LED灯图像中划痕或线缺陷的定位. Zhou等[38]采用grad-CAM方法获取热力图, 并采用Otsu算法分割得到表面缺陷的准确区域. c)多任务学习网络. 单纯的分类网络若不加入其他技巧, 一般只能实现图像级别的分类. 因此, 为了精细定位缺陷位置, 往往设计的网络会加上额外的分割分支, 两个分支共享特征提取的骨架(backbone)结果, 这样网络一般有分类和分割两个输出, 构成多任务学习网络. 它兼顾两个网络特点, 对于分割网络分支, 图像中每个像素都能被当作训练样本来训练网络. 因此, 多任务学习网络不仅利用分割分支输出缺陷具体的分割结果, 而且可以大大减少分类网络对样本的需求. Racki等[39]设计了一个紧凑的一体化多任务CNN结构用于表面缺陷的分割和分类. 所提出的网络在各种表面纹理缺陷数据集DAGM 2007上取得了最好的效果. Tabernik等[40]也提出了一个融合分类和分割分支的多任务缺陷检测网络, 整个网络只用了50幅1 408×512分辨率的缺陷图像进行训练, 取得的缺陷准确识别率超过了商业Cognex ViDi Suite软件.
3) 利用网络做特征提取器
在早期基于深度学习的缺陷分类方法中, 不少文献利用CNN特征提取的强大功能, 先将图像输入到预训练网络中获取图像表征特征, 再将获取的特征输入到常规的机器学习分类器(例如SVM等)中进行分类. 例如Zhao等[41]采用CNN对电力航拍绝缘子图像块进行特征抽取, 将特征输入到SVM中进行二分类, 同时作者还比较了从不同全连接层抽取特征分类效果的差异. Malekzadeh等[42]采用由VGG-DNN中的fc6层的输出作为特征, 输入到SVM中实现飞机表面缺陷分类, 缺陷分类精度达到96%以上.
综上, 基于分类网络的方法在实际应用中非常广泛, 同时, 不同的子方法本身也各有其自身优劣, 具体如表2所示.
表 2 分类网络各子方法优缺点对比Table 2 Comparison of advantages and disadvantages of each sub-method of classification network代表子方法 优点 缺点 直接分类 结构经典, 也是其他分类网络子方法
的基础, 可参考诸多现成网络缺陷在图像中需要占一定比例, 否则其特征容易被池化掉, 同时一般
一幅图像中只容许存在一种类别的缺陷 (多标签分类除外)定位 ROI 后分类 获取 ROI 的缺陷信息 需借助其他方法获取 ROI 多类别分类 一定程度上解决样本不平衡问题 网络采用二级训练 滑动窗口 在大图中实现缺陷的粗定位 滑动窗口尺寸需要准确选择, 且只能获得较粗位置, 遍历滑动速度慢 热力图 得到较为精准的缺陷区域 缺陷精确定位效果依赖网络分类性能 多任务学习 联合其他网络同时获取缺陷精确位置
和类别, 也能减少所需训练样本数目网络结构相对复杂, 在添加分割分支时, 需要逐像素的标签 做特征提取器 获取有效的缺陷特征 依赖其他分类器才能获得最终分类结果 2.1.2 检测网络
目标定位是计算机视觉领域中最基本的任务之一, 同时它也是与传统意义上缺陷检测最接近的任务, 其目的是获得目标精准的位置和类别信息. 目前, 基于深度学习的目标检测方法层出不穷, 一般来说, 基于深度学习的缺陷检测网络从结构上可以划分为: 以Faster R-CNN (Region-CNN)[43]为代表的两阶段(Two stage)网络和以SSD (Single shout multibax detector)[44]或YOLO (You only look once)[45]为代表的一阶段(One stage)网络. 两者的主要差异在于两阶段网络需要首先生成可能包含缺陷的候选框(Proposal), 然后再进一步进行目标检测. 一阶段网络则直接利用网络中提取的特征来预测缺陷的位置和类别.
1) 基于两阶段的缺陷检测网络
两阶段检测网络(Faster R-CNN)的基本流程是首先通过Backbone网络获取输入图像的特征图, 利用区域生成网络(Region proposal network, RPN)计算锚框(anchor box)置信度, 获取Proposal区域. 然后对Proposal区域的特征图进行ROIpooling后输入网络, 通过对初步检测结果进行精细调整, 最终得到缺陷的定位和类别结果. 因此, 针对缺陷检测的特点, 常用方法往往针对Backbone结构或其特征图、锚框比例、ROIpooling和损失函数等方面进行改进. 2018年, Cha等[46]最早将Faster R-CNN直接应用在桥梁表面缺陷定位, 其Backbone网络被替换为ZF-net, 在包含2366幅500×375像素大小的5类桥梁建筑数据集中, 其mAP(Mean average precision)值达到87.8%. Zhong等[47]提出了一种基于三阶段PVANET++ 的部件缺陷定位系统, 用于高速铁路的悬链支撑装置—开口销的松动和缺失检测, PVANET++ 是一个改进版的Faster R-CNN, 相比于原版Faster R-CNN, 在最高层特征图进行Proposal提取, 其改进点在于将低层两组特征图进行降采样与高层特征图上采样后联结形成新的超特征图用于Proposal提取. 另外, 作者采用了54个不同比例的锚框, 而不是原始的9个锚框. 2020年, Tao等[48]设计了一个两阶段的Faster R-CNN网络用于无人机电力巡检中绝缘子缺陷定位, 第1阶段用于自然场景下的绝缘子区域定位; 第2阶段实现绝缘子区域中的缺陷定位. Xue等[49]基于改进的Faster R-CNN实现盾构隧道中衬砌缺陷的检测, 其Backbone采用改进的Inception全卷积网络得到特征图, 同时增加两个锚框比例, 使用位置敏感ROIpooling替代传统的ROIpooling, 所提出模型在单幅图像48 ms的测试时间速度下, 实现了检测精度超过95%. Ding等[50]提出了一种针对PCB表面缺陷检测网络(TDD (Ting defect detection)-Net), 该方法通过使用K均值聚类设计合理的锚框大小; 其次引入多尺度金字塔网络(Feature pyramid networks, FPN)到Faster R-CNN中, 加强了来自底层结构信息的融合, 使得网络适应微小的缺陷检测. 最后, 考虑到小数据集和样本不平衡的特点, 在训练阶段采用了在线困难样本挖掘(Online hard example mining, OHEM)技术. 该方法在PCB缺陷数据集上达到了98.90%的mAP. He等[51]提出了基于Faster R-CNN的带钢表面缺陷检测网络, 该网络的改进在于将Backbone中多级特征图组合为一个多尺度特征图. 在缺陷检测数据集NEU-DET上, 提出的方法在采用ResNet-50的Backbone下实现了82.3%的mAP. 利用Faster R-CNN的检测方法也广泛应用在隧道[52]、液晶面板偏振片表面[53]、热成像绝缘子缺陷[54]、铝型材表面[55]和轮胎轮毂[56]等缺陷检测领域.
2) 基于单阶段的缺陷检测网络
单阶段检测网络分为SSD和YOLO两种, 两者都是利用整幅图作为网络的输入, 直接在输出层回归边界框(Bounding box)的位置及其所属的类别. SSD的特点在于引入了特征金字塔检测方式, 从不同尺度的特征图中预测目标位置与类别. 它使用6个不同特征图检测不同尺度的目标, 一般底层特征图用于预测小目标, 高层特征图预测大目标. Chen等[25]采用改进的SSD网络进行接触网支撑装置上的紧固件缺陷区域定位, 其主要改进部分在于采用不同层的特征图进行目标检测. Li等[57]提出了一种基于MobileNet-SSD的灌装生产线容器密封表面缺陷检测方法, 通过MobileNet优化了SSD的Backbone结构, 以简化检测模型参数. Liu等[58]同样采用基于MobileNet-SSD网络来定位高铁接触网支撑组部件, 相比于原始SSD网络, 其改进点在于: 1) 采用 MobileNet 为 Backbone; 2) 只使用4个不同的特征图来加速目标检测. 在测试的数据集上, 其目标达到25 帧/s的检测速度和94.3%的mAP. Zhang等[59]采用最新YOLOv3版本应用于桥梁表面缺陷定位, 相比于原始YOLOv3网络, 引入了预训练权重、批再规范化(Batch renormalization)和Focal loss, 进一步提高了缺陷检测率.
随着计算机视觉中目标检测网络的发展, 相信在今后会有越来越多新的检测模型应用于表面缺陷检测中. 综上, 在现阶段追求检测速度的缺陷检测领域中, 基于一阶段的模型应用较多, 在强调检测精度的缺陷检测领域中, 基于两阶段的模型采用较多.
2.1.3 分割网络
分割网络将表面缺陷检测任务转化为缺陷与正常区域的语义分割甚至实例分割问题, 它不但能精细分割出缺陷区域, 而且可以获取缺陷的位置、类别以及相应的几何属性(包括长度、宽度、面积、轮廓、中心等). 按照分割功能的区别, 其大致可以分为: 全卷积神经网络 (Fully convolutional networks, FCN)[60]方法和Mask R-CNN[61]方法.
1) FCN方法
FCN 是图像语义分割的基础, 目前几乎所有的语义分割模型都是基于FCN. FCN首先利用卷积操作对输入图像进行特征提取和编码, 然后再通过反卷积操作或上采样将特征图逐渐恢复到输入图像尺寸大小. 依据FCN网络结构的差异, 其缺陷分割方法可以进一步细分为常规FCN、Unet[62]和SegNet[63]三种方法. a)常规FCN方法. Wang等[64]提出一种基于FCN的轮胎X射线图像缺陷分割方法, 相比于原始FCN方法, 该方法通过融合多尺度采样层的特征图来细化分割轮胎图像中的缺陷. Yu等[65]提出了一个基于FCN的两阶段表面缺陷分割模型, 第1阶段采用一个轻量级的FCN快速获取粗略缺陷区域, 然后, 第1阶段的输出作为第2阶段FCN的输入用于细化缺陷分割结果, 该方法在公共数据集DAGM2007上取得了95.9934%的平均像素准确率. Dung等[66]采用基于VGG16编码器的FCN网络对混凝土表面裂缝进行分割, 其平均像素准确率达到90%. b) Unet方法. Unet不仅是一种经典的FCN结构, 同时也是典型的编码器—解码器(Encoder-decoder)结构. 它的特点在于引入了跳层连接, 将编码阶段的特征图与解码阶段的特征图进行融合, 有利于分割细节的恢复. Huang等[67]提出了一个MCuePush Unet的模型用于磁瓦表面缺陷的显著性检测. 其Unet网络的输入为MCue模块生成三通道图像, 包括一个显著性图像和两个原始图像. Li等[68]提出了一种基于改进Unet网络的混凝土结构表面缺陷分割方法. 在编码器采用Dense Block模块, 同时跳层连接没有采用原始的Concat操作, 而是逐像素求和. 该方法在包含2750幅图像(504
$ \times $ 376像素) 4种缺陷的混凝土结构数据库上取得了91.59%的平均像素准确率和84.53%的平均交并比(Intersection over union, IoU). Liu等[69]提出了一种基于ResNet模块的Unet分割网络, 用于TFT-LCD (Thin film transistor liquid crystal display)制造过程中导电颗粒的检测. c) SegNet方法. 它也是一种经典的编码器—解码器结构. 其特点在于解码器中的上采样操作利用了编码器中最大池化操作的索引. Dong等[70]提出的FL-SegNet方法将原始的SegNet网络与Focal loss损失函数进行结合应用于分割隧道衬砌中的多种缺陷. Roberts等[71]设计了一种基于SegNet的网络, 用于扫描隧道显微镜成像下材料晶体缺陷的语义分割. 在少量高质量的钢缺陷图像上三种缺陷的像素分类正确率为: 位错为91.60±1.77%, 沉淀物为93.39±1.00%, 空隙为98.85±0.56%. Zou等[72]在SegNet的编码器—解码器体系结构上构建DeepCrack网络, 用于地面裂纹检测. 在该模型中, 将分层卷积阶段学习的多尺度深度卷积特征融合在一起, 以捕获精细的裂纹结构. DeepCrack在三个具有挑战性的数据集上获得了平均87%以上的F值.目前, 基于深度学习的分割网络还在不断地提出, 例如, LinkNet[73]、DeepLabv3[74]、PSPNet[75]等. 很多最新模型中的模块, 例如空洞卷积[76-77]和金字塔Pooling[78]也被添加到FCN框架中, 广泛应用于各种场景的缺陷分割. 近年来, 生成对抗网络(Generative adversarial network, GAN[79])在计算机视觉领域得到广泛应用, 常常用来生成图像. GAN由生成器和判别器模型构成. 在结合GAN的缺陷分割方法中, 生成器往往直接采用FCN网络, 判别器通过分类模型来区分生成器的结果和Groundtruth, 通过生成器和判别器的不断博弈, 让生成器的输出结果逐渐接近Groundtruth. 结合GAN的分割方法已经用于在手机盖板玻璃信号孔缺陷分割[80]和道路裂纹缺陷分割[81]中.
2) Mask R-CNN方法
Mask R-CNN是目前最常用的图像实例分割方法之一, 可以看作是一种基于检测和分割网络相结合的多任务学习方法. 当多个同类型缺陷存在粘连或重叠时, 实例分割能将单个缺陷进行分离并进一步统计缺陷数目, 然而语义分割往往将多个同类型缺陷当作整体进行处理. 目前大部分文献都是直接将Mask R-CNN框架应用于缺陷分割, 例如路面缺陷分割[82]、工业制造缺陷[83]、螺栓紧固件缺陷[84]和皮革表面缺陷[85].
相比分类和检测网络方法, 分割方法在缺陷信息获取上有其优势. 但与检测网络一样, 需要大量的标注数据, 其标注信息是逐像素, 因此往往需花费大量的标注精力和成本.
2.2 度量学习
度量学习是使用深度学习直接学习输入的相似性度量. 在缺陷分类任务中, 往往采用孪生网络(Siamese network)进行度量学习. 不同于表征学习输入单幅图像转化为分类任务, 孪生网络的输入通常为两幅或多幅成对图像, 通过网络学习出输入图片的相似度, 判断其是否属于同一类. 孪生网络损失函数的核心思想是让相似的输入距离尽可能小, 不同类别的输入距离尽可能大.
一般原始孪生网络的输入是两幅成对的图像, 网络的“连体”是通过共享权值来实现的. Kim等[86]设计了一个基于CNN结构的孪生网络对钢表面缺陷图像进行分类, 首先将两幅图像输入到共享权值的CNN中完成特征提取, 然后利用基于相似度函数的对比损失计算两个特征之间的差异程度. 在NEU钢表面缺陷数据集[51]上, 该方法只通过5幅和10幅少量样本图像进行网络学习, 在9种缺陷类别上网络的分类准确度分别为85.1%和86.5%. Wu等[87]提出了一种基于孪生网络的相似度度量方法来分类纽扣缺陷. 网络设计了新的损失函数用于自动特征提取和样本的相似性度量, 所提出的方法在包括凹痕、裂纹、污点、孔洞、凹凸不平等多种缺陷的纽扣数据集上进行了评估, 达到的分类精度为98%. Liu等[88]基于改进的孪生网络对大型紧固件缺陷进行同时定位和缺陷分类. 其孪生网络后接两个分支: 第1个分支利用对比损失来实现紧固件定位; 第2个分支采用softmax损失对紧固件缺陷进行分类. 在测试的数据集上, 紧固件定位的平均检测率达到99.36%, 紧固件分类的平均检测率达到92.69%. Staar等[89]将原始的孪生网络扩展为Triplet 网络, 它具有三个输入, 包括两个相同类别和一个不同类别, 其原理与孪生网络一致. 除了缺陷分类, 孪生网络也能用于缺陷定位与检测. Tang等[90]提出了一个基于深度学习模型的PCB缺陷检测模型, 模型的前端将无缺陷的正常样本和有缺陷的图像对输入到孪生网络后进行特征差分, 将差分结果采用群组金字塔合并模块进行缺陷定位. 在DeepPCB数据集上, 该方法以62 帧/s达到98.6%的mAP. Liu等[91]将孪生网络输出的特征图与其他子网络输出的结果进行特征融合来提高缺陷目标的显著性.
度量学习可以近似看作为学习样本在特征空间进行聚类; 表征学习可以近似看作为学习样本在特征空间的分界面. 相比于表征学习, 度量学习的方法应用在表面缺陷定位中不太多, 目前大部分都是应用在缺陷分类任务中. 在缺陷定位方面, 输入孪生网络的图像对需要具有统一的内容形式, 要求比较严格, 现阶段还无法适应复杂的工业环境.
2.3 正常样本学习
目前, 最常用于表面缺陷检测的无监督学习模型是基于正常样本学习的方法. 由于只需要正常无缺陷样本进行网络训练, 该方法也常称为One-class learning. 正常样本学习的网络只接受正常(无缺陷)样本进行训练, 使得其具备强大的正常样本分布的重建和判别能力. 因此, 当网络输入的样本存在缺陷时, 往往会产生与正常样本不同的结果. 相比于有监督学习模型, 它能够检测到偏离预期的模式或没有见过的模式, 这些模式都可以称为缺陷或者异常. 依据处理空间的不同, 本文将该缺陷检测方法分为基于图像空间和特征空间两种. 通常该方法采用的网络模型为自编码器(Autoencoder, AE)和GAN.
2.3.1 基于图像空间的方法
基于图像空间的方法是在图像空间上对缺陷进行检测. 因此, 该方法不仅能实现图像级别的分类和识别, 也可以获取到缺陷的具体位置. 该方法常用的手段主要有以下两种.
1)利用网络实现样本重建与补全. 其原理类似去噪编码器, 当输入任意样本图像到网络中, 都可以得到其重建后对应的正常(无缺陷)样本, 因此, 网络可以看作具备自动修复或者补全缺陷区域的能力. 用输入图像分别减去这些重建或修复图像可以获得残差图像, 这些残差图像也称为重建误差. 它能作为判断待检测样本是否异常的指标. 当重建误差过大时, 可以认为输入图像存在缺陷, 差异过大的区域即为缺陷区域. 当重建误差很小时, 即认为输入图像是正常样本. Mei等[92]通过使用卷积自编码器网络在不同的高斯金字塔等级上重建图像子块, 并合成来自这些不同分辨率通道的重建结果, 其网络的重建误差采用均方误差(mean-square error, MSE)损失. 该方法在多个数据集上取得了相比传统图像处理方法好的效果. Haselmann等[93]设计了一个基于全卷积的自动编码器网络, 基于正样本图像补全和重建的误差实现装饰性塑料零件表面缺陷检测. Kang等[94]设计了一个深度去噪编码器, 基于其重建误差来检测绝缘子图像中的缺陷, 其重建损失采用L2损失. Youkachen等[95]使用卷积自动编码器(Convolutional autoencoder, CAE)用于图像重建, 通过锐化处理重建误差获取最终的热轧带钢表面缺陷分割结果, 其重建误差采用MSE. Zhao等[96]利用GAN和CAE实现表面缺陷图像的重建, 该方法将输入图像和重建图像输入到LBP算法处理后再做差. Bergmann等[97]首次将传统图像处理中的结构相似度(Structural similarity, SSIM)指标作为重建损失, 引入到基于自动编码器的图像重建中, 实验结果表明相比于传统L2损失, SSIM损失能大幅提高表面缺陷检测的效果. Yang等[98]提出了一种基于无监督多尺度特征聚类的全卷积自动编码器(Multi-scale feature-clustering-based fully convolutional autoencoder, MS-FCAE)方法, 该方法利用处于不同比例等级的多个FCAE子网来重建若干纹理背景图像. 为了最大程度地提高效率和编码特征图的判别能力, 每个FCAE子网采用全卷积神经网络和特征聚类方法, 所提出的MS-FCAE方法在多个纹理表面检测数据集上进行了评估, 缺陷检测精度达到92.0%.
2)利用网络实现异常区域分类. 这类网络通常采用GAN的判别器. 该方法原理是训练生成对抗网络GAN以生成类似于正常表面图像的伪图像, 这意味着训练好的GAN可以在潜在特征空间中很好地学习正常样本图像. 因此, GAN的判别器可以自然地用作分类器, 用于分类缺陷和正常样本. Zhai等[99]采用多尺度融合策略融合GAN鉴别器的三个卷积层的响应, 然后利用Otsu方法在融合特征响应图上进一步分割出缺陷位置. 该方法与文献[33]的原理类似, 但是利用了正常样本进行训练, 且其网络模型是GAN的判别器. Hu等[100]提出了一种基于深度卷积生成对抗网络(Deep convolutional GAN, DCGAN) 的自动检测织物缺陷的新型无监督方法. 该模型包括两个部分: 第1部分利用模型中GAN的判别器生成一个缺陷分布似然图, 其中每个像素值都表示该位置出现缺陷的概率; 第2部分通过引入编码器到标准DCGAN, 实现重检测图像的重建. 当从原始图像中减去重建图像时, 可以创建残差图以突出显示潜在的缺陷区域. 联合残差图和似然图以形成增强的融合图. 在融合图上采用阈值分割算法进一步获取准确的缺陷位置, 该方法在各种真实纺织物样品上进行了评估和验证.
2.3.2 基于特征空间的方法
基于特征空间的方法是在特征空间中, 通过正常样本与缺陷样本特征分布之间的差异来进行缺陷检测. 特征之间的差异也称为异常分数, 当异常分数高于某个值时, 即可认为出现缺陷. 2017年, Schlegl等[101]最早提出了深度卷积生成对抗网络AnoGAN, 实现检测图像从图像空间到潜在空间的映射, 其异常分数由图像空间中的差异和GAN网络中判别器最后一层特征图之间的差异来计算. Lai等[102]基于上述映射方法, 在潜在空间中直接采用Fréchet距离来实现缺陷与正常样本的区分, 在太阳能面板数据集上取得了93.75%的分类正确率. Soukup等[103]采用变分自编码器(Variational auto-encoder, VAE)网络在潜在空间中实现缺陷检测. Liu等[104]设计了一个基于GAN和单类分类器(One-class classifier)的表面缺陷分类模型, GAN中生成器G采用编码解码器, 其编码得到隐空间的特征输入到SVM分类器中进行缺陷分类, 提出的方法在钢材表面多缺陷数据集上获得的平均分类精度为94%. 2019年, Schlegl等[105]针对之前的AnoGAN工作提出了改进f-AnoGAN, 其异常分数由引入编码器模块实现的图像样本重建损失和GAN网络中判别器最后一层特征图之间的差异来计算. Akcay等[106]提出了一种GANomaly用于图像异常检测, 该模型的创新点在于引入了编码解码和再编码模块. 其异常分数由三个部分组成: 图像样本重建差异和GAN网络中判别器最后一层特征图之间的差异, 以及编码器隐空间的特征与再编码后的特征之间的差异. 虽然文献[101, 105-106]应用对象不是表面缺陷, 但是其方法完全适用于表面缺陷检测. 传统上认为基于特征空间的方法往往只能实现图像级别的分类或识别, 无法获取像素级别的缺陷位置, 实际上, 通过AE和GAN模块也能实现与图像空间检测方法类似的缺陷精确定位.
综上, 目前基于正常样本学习方法常用于简单统一的纹理表面缺陷检测, 在复杂的工业检测环境下, 相比于监督学习的方法, 其检测效果还不太理想.
2.4 弱监督与半监督学习
相对于全监督和无监督的方法, 目前弱监督和半监督方法在表面缺陷检测中的应用相对较少.
通常基于弱监督的方法是指采用图像级别类别标注(弱标签)来获取分割/定位级别的检测效果. Marino等[107]采用一种基于峰值响应图(Peak response maps, PRM)的弱监督学习方法[108]来对马铃薯表面缺陷进行分类、定位和分割, 从而实现质量控制任务的自动化. Mayr等[109]在原始ResNet-50分类网络上, 通过删除原始全连接层和平均池化层, 在网络最后添加两个1
$ \times $ 1卷积来获取缺陷响应特征图, 实现只用图像标签完成太阳能板上裂纹缺陷初步检测. Niu等[110]提出一种基于GAN的弱监督学习缺陷检测方法. 通过CycleGAN[111]实现输入测试图像到其对应无缺陷图像的转化, 比较输入图像和生成的无缺陷图像的差异, 进而实现表面缺陷检测. 半监督学习通常会使用大量的未标记数据和少部分有标签的数据用于表面缺陷检测模型的训练. He等[112]提出一个基于半监督GAN网络的方法[113]应用于钢材表面缺陷分类, 在设计的CAE-GAN缺陷检测网络中, 采用一个基于CAE的编码器并馈入softmax层以形成鉴别器. 鉴别器不是直接预测输入图像的真假二分类, 而是预测N + 1类, 其中N代表缺陷种类的数量, 额外的类表示输入图像是来自真实数据集还是来自生成器. 该方法在热轧板图像分类上取得了96.5%正确率. He等[114]提出一种多重训练的半监督学习方法应用于钢表面缺陷分类. 该方法使用cDCGAN生成大量未标记的样本. 为了利用未标记的样本, 该模型提出了利用cDCGAN和ResNet-18的多训练融合算法用于未标记样本的类别标签预测. 将预测分配类别标签的样本加入训练集中进一步训练. 重复上述操作来逐步优化模型. 在NEU-CLS缺陷数据集[51]上的大量实验表明, 即使原始样本有限, 该方法对于缺陷分类也非常有效. Gao等[115]也提出了一种使用卷积神经网络的半监督学习方法来分类钢表面缺陷, 通过采用伪标签改进了分类CNN的性能. 在钢表面缺陷识别基准数据集上的实验结果表明, 所提出的方法在有限的标记数据下可以实现良好的性能, 达到90.7%的精度. 目前, 基于半监督的方法大部分用于解决缺陷分类或识别任务, 还没有广泛应用到定位与分割任务中.3. 关键问题
3.1 小样本
目前深度学习方法广泛应用于各种计算机视觉任务中, 表面缺陷检测一般被看作是其在工业领域的具体应用. 在传统的认识中, 深度学习方法无法直接应用在表面缺陷检测中的原因是在真实的工业环境中, 所能提供的工业缺陷样本太少. 相比于ImageNet数据集中1400多万张样本数据, 表面缺陷检测中面临的最关键的问题是小样本问题, 在很多真实的工业场景下甚至只有几张或几十张缺陷图片. 实际上, 针对工业表面缺陷检测中关键问题之一的小样本问题, 目前有以下4种不同的解决方式:
1)数据扩增、合成与生成. 最常用的缺陷图像扩增方法是对原始缺陷样本采用镜像、旋转、平移、扭曲、滤波、对比度调整等多种图像处理操作来获取更多的样本. 例如Tao等[116]、Wei等[117]和Huang等[67]采用上述方法将扩增缺陷数据应用到深孔零件铜丝、纺织物表面和磁瓦缺陷检测中. 另外一种较为常见的方法是数据合成, 常常将单独缺陷融合叠加到正常(无缺陷)样本上构成缺陷样本. 文献[48]利用分割网络将带缺陷的绝缘子从自然背景中分割出来, 然后通过图像融合将其叠加到正常样本上. Haselmann等[118]采用骨架和纹理生成的方式得到逼真的缺陷并融合到正常样本上, 形成对应的缺陷图像. 最近, 由于GAN在图像生成上强大的能力, 不少基于GAN的工作也应用于表面缺陷样本生成上, 如Liu等[119]、Huang等[120]、Zhang等[121]和Chou等[122]的方法.
2)网络预训练或迁移学习. 一般来说, 由于深度学习网络参数较多, 直接采用小样本训练网络很容易导致过拟合, 但在预训练模型中存在一些比较共性的特征数据与权重信息. 因此, 基于预训练网络或迁移学习是目前针对样本少最常用的方法之一. 2018年, Ren等[33]最早将迁移学习应用于表面缺陷检测, 其预训练模型采用ImageNet预训练模型. Yang等[123]、Zhang等[124]、Badmos等[125]和Sun等[126]都采用迁移学习方法分别应用于液晶面板Mura缺陷、PCB板缺陷、锂电池电极缺陷和金属零件表面缺陷检测. Kim等[127]在DAGM缺陷数据集上对比了基于微调(Fine-tuning)的迁移学习和从头开始训练网络的效果, 证明基于迁移学习方法的性能优于从头开始训练网络的性能.
3)合理的网络结构设计. 通过设计合理的网络结构也可以大大减少样本的需求. 例如在文献[40]中, Tabernik等设计了一个融合分类和分割分支的多任务缺陷检测网络, 两个分支共享特征提取的Backbone, 在分割网络分支, 图像中每个像素都能被当作训练样本来训练网络. 因此, 该方式大大减少了网络对样本的需求. 整个网络仅采用50张缺陷样本训练就能取得很好的效果. Wei等[117]提出了一种将压缩感知与卷积神经网络相结合的缺陷检测方法, 基于压缩采样定理来压缩和扩充小样本数据, 使用CNN直接对压缩采样的数据特征进行分类. 相比于原始的图像输入, 通过对输入进行压缩采样能大大降低网络对样本的需求. 此外, 基于孪生网络的表面缺陷检测方法也可以看作是一种特殊的网络设计, 能够大幅减少样本需求.
4)采用无监督与半监督模型方法. 这两种方式都可以减少样本的需求. 在无监督模型中, 只利用正常样本进行训练, 因此不需要缺陷样本. 半监督方法可以利用没有标注的样本来解决小样本情况下的网络训练难题.
3.2 实时性
基于深度学习的缺陷检测方法在工业应用中包括三个主要环节: 数据标注、模型训练与模型推断. 在实际工业应用中的实时性更关注模型推断这一环节. 目前大多数缺陷检测方法都集中在分类或识别的准确性上, 而很少关注模型推断的效率. 有不少方法用于加速模型, 例如模型权重量化[128]和模型剪枝[129]等. 在文献[130]的工作中, 提出了一种端到端的手机屏幕表面缺陷检测模型. 为了提高模型计算过程的效率以满足实际的工业需求, 在建立低精度版本网络而又不损失准确性的前提下, 对提出的模型中的权重执行权重量化, 其缺陷分析的效率提高了16%. 在传统的基于图像处理的表面缺陷检测方法中, FPGA并行加速架构常用于加速图像处理算子. Pan等[131]将FPGA加速傅里叶重构算子用于纹理表面缺陷分割, 其FPGA并行加速架构比同类服务器CPU快三倍, 从而将整个8.5代LCD面板的扫描检测时间缩短至8.5 s. 文献[132]开发了一种实时热轧扁钢双表面检测系统, 提出的算法在FPGA上并行实现, 其并行图像处理技术将轧制速度从5 m/s提升为20 m/s. 虽然现有深度学习模型使用GPU作为通用计算单元, 但随着技术发展, 相信FPGA会成为一个具有吸引力的替代方案.
3.3 与传统基于图像处理的缺陷检测方法对比
为了更好地说明基于深度学习的缺陷检测方法的特点, 本小节将基于深度学习的缺陷检测方法与传统基于图像处理的缺陷检测方法进行对比分析, 从方法、本质、所需条件和适应性等四个方面进行比较. 其中传统基于图像处理的缺陷检测的相关方法参考文献[133]. 详细对比结果如表3所示.
表 3 传统图像处理与基于深度学习的缺陷检测方法的比较Table 3 Comparison between traditional image processing and deep learning-based defect detection methods对比项目 传统基于图像处理的方法 深度学习方法 方法 1) 结构法: 边缘、骨架、形态学等 基于卷积神经网络 CNN 2) 统计法: 直方图、局部二值化特征 LBP、纹理特征、灰度共生矩阵 GLCM 等 3) 滤波法: 空间滤波、频域滤波 (傅里叶、gabor、小波) 等 4) 模型法: 随机场模型、反散射模型和分形体等 本质 人工设计特征 + 分类器 (或规则) 从大量数据中自动学习特征 所需条件 相对苛刻的成像环境要求, 缺陷和非缺陷区域之间的高对比度, 少噪声 足够的学习数据和高性能运算单元 适应性 差 (成像环境变化或缺陷类型变化时往往需要更改阈值或重新设计算法) 相对强 (能够应对一定的工业检测环境变化) 4. 缺陷检测数据集
缺陷检测数据集是开展研究工作的基础, 相比于计算机视觉任务中的ImageNet[134]、PASCAL-VOC2007/2012[135]和COCO[136]等数据集, 缺陷检测并没有一个大量和统一的数据集, 在不同的检测对象和场景下, 研究往往基于不同的缺陷数据集.
本节按照缺陷检测方法进行分类, 提供了多种表面缺陷检测数据集的相关链接. 如表4所示, 涵盖多个工业应用领域, 具体包括: 金属表面[40]、太阳能板[109]、木材表面[137]、磁瓦表面[67]、铸件X射线图像[138]、钢材和钢轨表面[51, 139]、建筑物和桥梁表面缺陷[140-141]、PCB板[90]、两个无监督学习的缺陷检测数据集: MVTec AD[142]和NanoTWICE[143], 以及DGAM2007纹理缺陷数据集[144].
表 4 工业表面缺陷检测常用数据集Table 4 Common data sets for industrial surface defect detection方法 应用场景 数据集名称 链接 分类 钢材表面 NEU-CLS[51] http://faculty.neu.edu.cn/yunhyan/NEU_surface_defect_database.html 太阳能板 elpv-dataset[109] https://github.com/zae-bayern/elpv-dataset 金属表面 KolektorSDD[40] http://www.vicos.si/Downloads/KolektorSDD 木材表面 wood defect database[137] http://www.ee.oulu.fi/olli/Projects/Lumber.Grading.html 定位 钢材表面 NEU-DET[51] http://faculty.neu.edu.cn/yunhyan/NEU_surface_defect_database.html 铸件X射线图像 GDXray Casting[138] https://domingomery.ing.puc.cl/material/gdxray/ 分割 磁瓦表面 Magnetic-tile-defect-datasets[67] https://github.com/abin24/Magnetic-tile-defect-datasets. 钢轨表面 RSDDs dataset[139] http://icn.bjtu.edu.cn/Visint/resources/RSDDs.aspx 地面裂纹 Crack_Dataset[140] https://drive.google.com/drive/folders/1cplcUBmgHfD82YQTWnn1dssK2Z_xRpjx 桥梁裂缝 Bridge Cracks[141] https://github.com/maweifei/BridgeCrack_Image_Data 孪生网络 PCB 板 PCB Dataset[90] https://github.com/tangsanli5201/DeepPCB 无监督学习 多种材质缺陷 MVTec AD[142] http://www.mvtec.com/company/research/datasets 扫描隧道显微镜成像
SEM 材料表面NanoTWICE[143] http://www.mi.imati.cnr.it/ettore/NanoTWICE/ 弱监督学习 纹理缺陷 DAGM 2007[144] https://hci.iwr.uni-heidelberg.de/node/3616 由于目前基于深度学习的表面缺陷检测方法大多数是在特定的数据集上进行应用, 很多数据集没有公开, 难以统一比较. 为了更好地比较一些典型算法在同一缺陷数据上的应用效果, 我们选取了两个非常典型的数据集作为示例数据集: DAGM和GDXray Casting.
DAGM为纹理缺陷数据集, 它包含6个类别的图像样本, 大小为512×512像素. 每个类别包括1 000个无缺陷图像和150个有缺陷图像, 常用于缺陷分类的应用场景中. 典型缺陷分类方法在DAGM上的效果对比如表5所示, 表5按照时间顺序进行排序, 可以看出滑动窗口使用较多, 同时基于CNN的方法在纹理缺陷分类上取得很好的性能. 基于滑动窗口和多类别分类相结合的网络已经达到了99.8%的分类准确率, 也是目前基于深度学习的缺陷分类方法在该数据集上的最高水平. Yu等[65]采用的两阶段FCN方法是比较具有代表性的分割方法, 其在DAGM数据集上取得了95.334%像素分类准确率.
表 5 典型缺陷分类方法在DAGM数据集上性能比较Table 5 Effect comparison of defect classification methods on DAGMGDXray Casting数据集包含2727个X射线图像, 这些图像主要来自汽车零件, 包括铝制车轮和转向节. 每个图像中的铸件缺陷都用边界框(Bounding box)标记. 数据集中图像的大小范围为256
$ \times $ 256像素到768$ \times $ 572像素. 不同的缺陷定位方法在DAGM上的效果对比如表6所示, 其中一阶段以VGG-16为Backbone的SSD网络在单幅图像获得了最快的检测速度, 达到了0.025 s/幅(单GPU); 而以ResNet-101为Backbone的两阶段网络Faster R-CNN则取得了最高的检测正确率.表 6 典型缺陷定位方法在GDXray casting数据集上性能比较Table 6 Effect comparison of defect location methods on GDXray casting5. 总结与展望
缺陷检测是一个宽泛的应用领域, 具体包括缺陷分类、缺陷定位和缺陷分割等环节, 相比于传统图像处理方法分多个步骤和环节处理缺陷检测任务, 基于深度学习的方法将其统一为端到端的特征提取和分类. 虽然表面缺陷检测技术已经不断地从学术研究走向成熟的工业应用, 但是依然有一些需要解决的问题.
1)网络结构设计. 第2节综述的方法大部分具有不同的网络结构, 这些网络都是人工设计的, 从模型包含多少层到每一层的详细结构都是一个漫长设计和调参的过程. 这种网络很难说是最优的, 只能说这些手工设计的网络在当前缺陷检测数据集上大致满足需求. 类似于传统手工设计的缺陷检测特征, 例如文献[16]中提到的三种手工特征(KAZE[17]、SIFT[18]、SURF[19]), 相比CNN网络自身学到的特征, 其缺陷分类效果逊色不少. 因此, 随着自动机器学习和网络架构搜索技术的兴起, 相信会有越来越多机器搜寻和自动生成的网络逐步替代人工设计的网络, 这些网络不仅能够大幅度的减少手工设计网络参数, 同时在检测的正确率上也会领先.
2)网络训练学习. 人工在进行工业缺陷的目视检测时, 很难收集到所有缺陷类型的样本, 很多时候只有良品数据(正样本). 然而目前大部分基于深度学习的表面缺陷检测方法是基于大量的缺陷样本的有监督学习. 深度学习的网络学习是一个“黑匣子”, 需要大量标注好的训练样本端到端进行学习, 可解释性差. 因此, 如何利用类脑(受脑启发的)计算与仿人视觉认知模型这些先验知识来指导缺陷检测网络的训练和学习, 也是一个值得思考的方向.
3)异域数据联邦学习. 单个表面缺陷检测数据集往往都很少, 虽然小样本问题可以通过第3节介绍的方法缓解相关问题, 但是实际上不同工业行业和领域中, 真实工业表面缺陷数据是非常多的, 一些缺陷种类也是共同的, 例如划痕广泛存在于金属、液晶屏幕、太阳能电池板、玻璃等等一系列材质表面. 同时, 人类也会将统一类型的缺陷进行标记, 并不会因为检测领域的不同而产生差异. 但是由于涉及隐私敏感, 不同检测领域之间数据并没有有效结合和利用. 如何利用不同工业领域的缺陷数据集来进行网络学习, 也是表面缺陷检测的一种重要研究方向. 因此, 基于异域数据的联邦学习将会成为一个趋势, 它能够打破不同应用场景之间的壁垒, 充分学习不同领域之间数据来提升网络性能.
随着人工智能技术的发展, 目前基于机器视觉的表面缺陷检测的研究焦点已经从经典的图像处理和机器学习方法转移到深度学习方法, 在很多工业场景下解决了以往传统方法无法解决的难题. 本文系统地总结、对比和分析了深度学习算法在表面缺陷检测领域的研究进展, 同时对基于深度学习的表面缺陷检测的研究趋势进行了展望, 以期为相关研究人员提供详实和有效参考.
-
表 1 参数设计
Table 1 The parameter design
层 卷积核大小 立方体边长 (m) 输出点个数 输出特征通道数 立方体卷积 $1\times27,64$ 0.1 8 192 64 立方体最大池化 $1\times27,64$ 0.1 2 048 64 残差块1 $\left[\begin{aligned} 1\times1,64\;\\ 1\times27,64\\ 1\times1,256 \end{aligned}\right]\times3$ 0.2 2 048 256 残差块2 $\left[\begin{aligned} 1\times1,12\;8\\ 1\times27,128\\ 1\times1,512\; \end{aligned}\right]\times4$ 0.4 512 512 残差块3 $\left[ \begin{aligned}1\times1,256\;\\ 1\times27,256\\ 1\times1,1024\end{aligned}\right]\times6$ 0.8 128 1 024 卷积层1 $1\times1,256$ — 128 256 卷积层2 $1\times1,256$ — 512 256 卷积层3 $1\times1,256$ — 2 048 256 卷积层4 $1\times1,256$ — 8 192 256 全连接层 — — 8 192 20 表 2 S3DIS数据集分割结果比较 (%)
Table 2 Segmentation result comparisons on the S3DIS dataset (%)
表 3 S3DIS数据集各类别IoU分割结果比较 (%)
Table 3 Comparison of IoU for all categories on the S3DIS dataset (%)
类别 PointNet[7] RSNet[9] PointCNN[10] ResNet-FPN_C (本文) U-Net_C (本文) ceiling 88.0 92.48 94.78 91.99 91.46 floor 88.7 92.83 97.30 94.99 94.12 wall 69.3 78.56 75.82 77.04 79.00 beam 42.4 32.75 63.25 50.29 51.92 column 23.1 34.37 51.71 39.40 40.35 window 47.5 51.62 58.38 65.57 65.63 door 51.6 68.11 57.18 72.38 72.60 table 54.1 60.13 71.63 72.20 71.57 chair 42.0 59.72 69.12 77.10 77.56 sofa 9.6 50.22 39.08 54.87 55.89 bookcase 38.2 16.42 61.15 59.24 59.10 board 29.4 44.85 52.19 53.44 54.54 clutter 35.2 52.03 58.59 63.11 62.11 表 4 ScanNet数据集分割结果比较 (%)
Table 4 Segmentation result comparisons on the ScanNet dataset (%)
表 5 ScanNet数据集各类别IoU分割结果比较 (%)
Table 5 Comparison of IoU for all categories on the ScanNet dataset (%)
类别 PointNet[7] PointNet++[8] RSNet[9] PointCNN[10] ResNet-FPN_C (本文) U-Net_C (本文) wall 69.44 77.48 79.23 74.5 77.1 77.8 floor 88.59 92.50 94.10 90.7 90.6 90.8 chair 35.93 64.55 64.99 68.8 76.4 76.6 table 32.78 46.60 51.04 55.3 52.5 50.8 desk 2.63 12.69 34.53 28.8 29.1 25.8 bed 17.96 51.32 55.95 56.1 57.0 57.4 bookshelf 3.18 52.93 53.02 38.9 42.7 42.3 sofa 32.79 52.27 55.41 60.1 61.5 60.9 sink 0.00 30.23 34.84 41.9 41.8 41.7 bathtub 0.17 42.72 49.38 73.5 61.0 68.6 toilet 0.00 31.37 54.16 73.4 69.8 73.2 curtain 0.00 32.97 6.78 36.1 35.4 41.9 counter 5.09 20.04 22.72 22.5 20.0 19.7 door 0.00 2.02 3.00 7.5 26.0 28.4 window 0.00 3.56 8.75 11.0 15.9 18.8 shower curtain 0.00 27.43 29.92 40.6 38.1 42.6 refrigerator 0.00 18.51 37.90 43.4 47.3 52.3 picture 0.00 0.00 0.95 1.3 5.8 8.6 cabinet 4.99 23.81 31.29 26.4 27.5 27.5 other furniture 0.13 2.20 18.98 23.6 25.8 24.5 -
[1] Anguelov D, Taskarf B, Chatalbashev V, Koller D, Gupta D, Heitz G, et al. Discriminative learning of Markov random fields for segmentation of 3D scan data. In: Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Diego, USA: IEEE, 2005. 169−176 [2] Wu Z R, Song S R, Khosla A, Yu F, Zhang L G, Tang X O, et al. 3D ShapeNets: A deep representation for volumetric shapes. In: Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston, USA: IEEE, 2015. 1912−1920 [3] Maturana D, Scherer S. VoxNet: A 3D convolutional neural network for real-time object recognition. In: Proceedings of the 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems. Hamburg, Germany: IEEE, 2015. 922−928 [4] Riegler G, Ulusoys A, Geiger A. OctNet: Learning deep 3D representations at high resolutions. In: Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, USA: IEEE, 2017. 6620−6629 [5] Wang P S, Liu Y, Guo Y X, Sun C Y, Tong X. O-CNN: Octree-based convolutional neural networks for 3D shape analysis. ACM Transactions on Graphics, 2017, 36(4): Article No. 72 [6] Klokov R, Lempitsky V. Escape from cell: Deep kd-networks for the recognition of 3D point cloud models. In: Proceedings of the 2017 International Conference on Computer Vision. Venice, Italy: IEEE, 2017. 863−872 [7] Qi C R, Su H, Mo K C, Guibas L J. Pointnet: Deep learning on point sets for 3D classification and segmentation. In: Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, USA: IEEE, 2017. 77−85 [8] Qi C R, Yi L, Su H, Guibas L J. Pointnet++: Deep hierarchical feature learning on point sets in a metric space. In: Proceedings of the 2017 Advances in Neural Information Processing Systems. Long Beach, USA: Curran Associates, 2017. 5100−5109 [9] Huang Q G, Wang W Y, Neumann U. Recurrent slice networks for 3D segmentation of point clouds. In: Proceedings of the 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, USA: IEEE, 2018. 262−2635 [10] Li Y Y, Bu R, Sun M C, Wu W, Di X H, Chen B Q. PointCNN: Convolution on X-transformed points. In: Proceedings of the 2018 Advances in Neural Information Processing Systems. Montreal, Canada: Curran Associates, 2018. 828−838 [11] Ronneberger O, Fischer P, Brox T. U-Net: Convolutional networks for biomedical image segmentation. In: Proceedings of the 18th International Conference on Medical Image Computing and Computer-Assisted Intervention. Munich, Germany: MICCAI, 2015. 234−241 [12] He K M, Zhang X Y, Ren S Q, Sun J. Deep residual learning for image recognition. In: Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA: IEEE, 2016. 770−778 [13] Szegedy C, Vanhoucke V, Ioffe S, Shlens J, Wojna Z. Rethinking the inception architecture for computer vision. In: Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA: IEEE, 2016. 2818−2826 [14] Huang G, Liu Z, Maaten L V D, Weinberger K Q. Densely connected convolutional networks. In: Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, USA: IEEE, 2017. 2261−2269 [15] Lin T Y, Dollar P, Girshick R, He K M, Hariharan B, Belongie S. Feature pyramid networks for object detection. In: Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, USA: IEEE, 2017. 936−944 [16] Girshick R, Donahue J, Darrell T, Malik J. Rich feature hierarchies for accurate object detection and semantic segmentation. In: Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, USA: IEEE, 2014. 580−587 [17] Girshick R. Fast R-CNN. In: Proceedings of the 2015 IEEE International Conference on Computer Vision. Santiago, Chile: IEEE, 2015. 1440−1448 [18] Ren S Q, He K M, Girshick R, Sun J. Faster R-CNN: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149 doi: 10.1109/TPAMI.2016.2577031 [19] He K M, Gkioxari G, Dollar P, Girshick R. Mask R-CNN. In: Proceedings of the 2017 IEEE International Conference on Computer Vision. Venice, Italy: IEEE, 2017. 2980−2988 [20] Liu S, Qi L, Qin H F, Shi J P, Jia J. Path aggregation network for instance segmentation. In: Proceedings of the 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, USA: IEEE, 2018. 8759−8768 [21] Armeni I, Sener O, Zamir A R, Jiang H L, Brilakis L, Fischer M, Savarese S. 3D semantic parsing of large-scale indoor spaces. In: Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA: IEEE, 2016. 1534−1543 [22] Dai A, Chang A X, Savva M, Halber M, Funkhouser T, Nieβner M. ScanNet: Richly-annotated 3D reconstructions of indoor scenes. In: Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, USA: IEEE, 2017. 2432−2443 期刊类型引用(200)
1. 王军敏,宁超魁. 基于多尺度残差特征匹配的纹理缺陷检测. 制造业自动化. 2025(01): 82-88 . 百度学术
2. 董豪,李少波,杨静,王军. 基于特征融合与语义引导的药用胶囊表面缺陷检测. 计算机集成制造系统. 2025(01): 158-170 . 百度学术
3. 董兰,潘嶙,王红侠,彭述明. 吸氘钛膜表面损伤缺陷检测研究进展. 核电子学与探测技术. 2025(01): 61-71 . 百度学术
4. 王玲,向北平,张晓勇. 改进YOLOv7的PCB缺陷检测算法. 机械科学与技术. 2025(01): 9-18 . 百度学术
5. 庞国涛,邓晓平,于海洋,刘福磊. 基于改进YOLOv5s的预制叠合板生产质量视觉检测研究. 土木建筑工程信息技术. 2025(01): 37-42 . 百度学术
6. 于晓亮,吴承亮,董武振,黄炜星,江少进. 一种基于空间注意力优化的机载成附件紧固件缺陷分类算法. 智能制造. 2025(01): 124-128 . 百度学术
7. 张岳,张上,王恒涛,张朝阳,许欢,熊偌炎. 基于跨尺度特征提取的锻件表面裂纹检测算法. 计算机集成制造系统. 2025(02): 499-511 . 百度学术
8. 杨奡飞,续欣莹,谢刚,刘华平. 印刷电路板缺陷持续检测与定位方法研究. 智能系统学报. 2025(01): 219-229 . 百度学术
9. 刘克平,刘博浩,李岩,宋誉. 基于LSDANet的手机芯片屏蔽壳表面缺陷检测方法. 光电子·激光. 2024(01): 67-74 . 百度学术
10. 朱咏梅,李玉玲,奚峥皓,盛鸿宇. 注意力可变形卷积网络的木质板材瑕疵识别. 西南大学学报(自然科学版). 2024(02): 159-169 . 百度学术
11. 杨玮,钟名锋,杨根,侯至丞,王卫军,袁海. 基于NVAE和OB-Mix的小样本数据增强方法. 计算机工程与应用. 2024(02): 103-112 . 百度学术
12. 任学龙. 基于计算机视觉的电子元件表面缺陷检测算法. 科学技术创新. 2024(06): 116-119 . 百度学术
13. 罗月童,李超,周波,张延孔. 面向工业缺陷分类的交互式易混淆缺陷分离方法研究. 计算机工程与科学. 2024(03): 463-470 . 百度学术
14. 黄子杰,欧阳,江德港,郭彩玲,李柏林. 面向牵引座焊缝表面质量检测的轻量型深度学习算法. 计算机应用. 2024(03): 983-988 . 百度学术
15. 刘桂雄,闫奕樸,邢星奥. 视觉表面缺陷无监督学习检测方法研究进展. 中国测试. 2024(03): 1-12 . 百度学术
16. 董永峰,孙松毅,王振,刘晶. 融合注意力机制与联合优化的表面缺陷检测. 计算机辅助设计与图形学学报. 2024(01): 102-111 . 百度学术
17. 李键,李华,胡翔坤,李少波,乔静. 基于深度学习的表面缺陷检测技术研究进展. 计算机集成制造系统. 2024(03): 774-790 . 百度学术
18. 朱政,陈平. 基于特征嵌入的无监督火花塞表面缺陷检测. 自动化与仪器仪表. 2024(03): 30-34 . 百度学术
19. 赵慧,钮焱,李军. 基于改进YOLOv4的钢材表面缺陷检测. 计算机仿真. 2024(03): 188-194+213 . 百度学术
20. 李亚森,李晔,李赵辉. 基于深度学习的焊缝缺陷检测方法综述. 焊接技术. 2024(04): 6-13 . 百度学术
21. 纪家平,贺福强,谢丹,周阳,史广. 基于特征嵌入的小样本涡轮叶片缺陷识别研究. 智能计算机与应用. 2024(03): 98-103 . 百度学术
22. 崔康,陈平. 基于孪生网络的自监督太阳能电池板裂纹检测方法. 国外电子测量技术. 2024(03): 177-182 . 百度学术
23. 朱志鹏 ,陈腾飞 ,廖杜杰 ,张国云 ,赵林 . 基于Halcon的手机背板表面缺陷快速检测方法. 湖南理工学院学报(自然科学版). 2024(01): 20-26 . 百度学术
24. 陈腾飞,戴元杰,廖杜杰,朱志鹏,吴健辉. 基于泊松图像融合的自监督缺陷检测方法. 湖南理工学院学报(自然科学版). 2024(01): 27-33 . 百度学术
25. 任经琦,张团善,赵浩铭. 基于改进YOLOv7的织物表面疵点检测技术. 沈阳大学学报(自然科学版). 2024(02): 112-120+185 . 百度学术
26. 周宇博,沈岳,匡迎春. 基于多尺度融合的一次性竹筷表面缺陷检测方法. 现代计算机. 2024(05): 61-66 . 百度学术
27. 孙胜华,何建强,陈伟锡,任哲,霍楚. 基于机器视觉的电源适配器外观质量检测装置设计与实现. 电子制作. 2024(09): 71-73+57 . 百度学术
28. 王愉锦,黄惠玲,付磊,韩军. 基于改进U-Net的皮革表面缺陷精细化分割方法. 计算机辅助设计与图形学学报. 2024(03): 413-422 . 百度学术
29. 陈法法,刘咏,潘瑞雪,陈保家. 多尺度特征融合改进Faster RCNN的铝材表面缺陷辨识. 组合机床与自动化加工技术. 2024(05): 166-170 . 百度学术
30. 苏盈盈,何亚平,邓圆圆,刘兴华,阎垒,斯洪云. 基于改进YOLOv5s轻量化带钢表面缺陷检测方法. 光电子·激光. 2024(07): 723-730 . 百度学术
31. 赵文晶. 融合滑动注意力机制的钢带缺陷检测算法. 太原科技大学学报. 2024(03): 263-270 . 百度学术
32. 张相胜,杨骁. 基于改进YOLOv7-tiny的橡胶密封圈缺陷检测方法. 图学学报. 2024(03): 446-453 . 百度学术
33. 齐浩宇,谭爱国,梁会军,钟建伟,杨永超,陈文涛. 基于RID-YOLOv7的雨天场景绝缘子缺陷检测模型. 湖北民族大学学报(自然科学版). 2024(02): 233-240 . 百度学术
34. 刘纯武,方青云,王兆魁. 基于小样本数据增强的航天器表面损伤智能检测方法. 上海航天(中英文). 2024(03): 150-158+175 . 百度学术
35. 蔡志兴,覃平平,黄正其. 基于机器视觉的冲压开卷线在线板料缺陷检测系统设计. 机电工程技术. 2024(06): 261-264 . 百度学术
36. 刘凤春,张靖,薛涛,张猛,张春英,王立亚. YOLO-VDCW:一种新的轻量化带钢表面缺陷检测算法. 中国冶金. 2024(06): 125-135 . 百度学术
37. 林文迪,周睿阳,邸志雄. 基于YOLOv3的芯片缺陷检测模型设计与优化. 半导体技术. 2024(07): 660-665 . 百度学术
38. 郝亚东,万博,张钟庆,徐如远,张生鹏. 基于图像处理的金属腐蚀等级评价方法. 腐蚀与防护. 2024(06): 103-110 . 百度学术
39. 张玥,王世豪,李英健,刘帅波,张宏伟. 基于U型注意力门自编码器的色织物缺陷检测方法. 光电子·激光. 2024(08): 851-860 . 百度学术
40. 卢开喜,段先华,陶宇诚,倪东海. KThin-YOLOV7:轻量级的焊接件表面缺陷检测. 电子测量技术. 2024(07): 9-18 . 百度学术
41. 尹胜利,任洁. 基于深度学习的变电设备缺陷检测与识别算法研究. 自动化应用. 2024(12): 244-246 . 百度学术
42. 杨露露,马萍,王聪,李新凯,孟月,张宏立. 结合特征重用与重建的YOLO绝缘子检测方法. 计算机工程. 2024(07): 303-313 . 百度学术
43. 陈俊英,李朝阳,席月芸,刘冲. ViT和注意力融合的类别不均衡PCB缺陷检测方法. 仪器仪表学报. 2024(04): 294-306 . 百度学术
44. 陈俊英,李朝阳,黄汉涛,董戌泽. 并行特征提取和渐进特征融合的计算机主板装配缺陷检测. 光学精密工程. 2024(10): 1622-1637 . 百度学术
45. 苟军年,杜愫愫,王世铎,张昕悦. 轻量化特征融合的CenterNet输电线路绝缘子自爆缺陷检测. 北京航空航天大学学报. 2024(07): 2161-2171 . 百度学术
46. 伍麟,郝鸿宇,宋友. 基于计算机视觉的工业金属表面缺陷检测综述. 自动化学报. 2024(07): 1261-1283 . 本站查看
47. 马智华,曾凯,陈波,肖鹏程,朱立光. 基于改进YOLOv7的连铸坯表面缺陷检测算法. 中国冶金. 2024(07): 101-112 . 百度学术
48. 耿伟涛. 基于深度学习的机械表面缺陷检测. 自动化应用. 2024(13): 173-175 . 百度学术
49. 岳忠牧,张喆,吕武,赵瑞祥,马杰. De-DDPM:可控、可迁移的缺陷图像生成方法. 自动化学报. 2024(08): 1539-1549 . 本站查看
50. 徐薪羽,沈通,吕佳. 基于改进YOLOv8算法的钢材表面缺陷检测. 自动化应用. 2024(15): 6-10 . 百度学术
51. 刘文犀,张家榜,李悦洲,赖宇,牛玉贞. 基于边界特征融合和前景引导的伪装目标检测. 电子学报. 2024(07): 2279-2290 . 百度学术
52. 廖志伟,高龙,曹军,李晓围. 基于深度学习的刮板输送机异物检测方法研究. 中国煤炭. 2024(08): 165-170 . 百度学术
53. 张上,许欢,张岳. 轻量级锻件表面裂纹检测算法. 电子测量技术. 2024(11): 123-130 . 百度学术
54. 郑太雄,黄鑫,尹纶培,朱意霖,江明哲. 基于深度学习的表面微小缺陷检测方法综述. 重庆邮电大学学报(自然科学版). 2024(05): 954-965 . 百度学术
55. 姜晓恒,段金忠,卢洋,崔丽莎,徐明亮. 融合先验知识推理的表面缺陷检测. 图学学报. 2024(05): 957-967 . 百度学术
56. 赵乾,冶培培. 基于机器视觉的工件缺陷检测系统构建. 信息记录材料. 2024(11): 76-78 . 百度学术
57. 张涛. 机器视觉在机械表面加工缺陷诊断中的研究. 自动化应用. 2024(21): 40-42+47 . 百度学术
58. 刘昊. 基于深度学习的飞机表面缺陷检测. 航空维修与工程. 2024(11): 52-56 . 百度学术
59. 于瀚文,吴一全. 基于机器视觉的锂电池缺陷检测研究进展. 仪器仪表学报. 2024(09): 1-23 . 百度学术
60. 贺耀宜,代左朋,杨耀,屈世甲,张清,孙旭峰,张涛. 采煤工作面CH_4大样本数据感知关键技术及监测模式研究. 工矿自动化. 2024(11): 17-25+91 . 百度学术
61. 张军,张洋,石陆魁,潘斌,史进. 基于缺陷引导与差异映射的级联网络用于表面缺陷检测. 计算机辅助设计与图形学学报. 2024(10): 1538-1548 . 百度学术
62. 陆芸婷,康绍鹏,吴双,何川. 融合选择核注意力的无纺布缺陷检测. 计算机工程与应用. 2024(24): 331-339 . 百度学术
63. 郭渊,许伟佳,董振标. 基于深度学习的PCB表面缺陷检测研究进展. 机床与液压. 2024(23): 188-198 . 百度学术
64. 杨志明,黄天仑,薛艳,刘家欢,钟震宇,张云. 不平衡样本条件下的注塑产品缺陷高精度检测方法. 自动化与信息工程. 2024(06): 53-58+72 . 百度学术
65. 马居坡,陈周熠,吴金建. 基于动态视觉传感器的铝基盘片表面缺陷检测. 自动化学报. 2024(12): 2407-2419 . 本站查看
66. 吴凯. 基于深度学习的柔性智能外观质检算法平台. 通讯世界. 2024(12): 163-165 . 百度学术
67. 杜焱铭,袁子厚,郑兴任,张红伟. 基于深度学习的纺织物缺陷检测技术研究. 纺织工程学报. 2024(06): 55-65 . 百度学术
68. 张宏飞,冯永利,黄金凤. 改进YOLOv5的输送带缺陷检测. 电子测量技术. 2024(22): 161-168 . 百度学术
69. 郝铁文. 基于DeepLabv3+的轻量化铝带表面缺陷分割方法. 信息技术与信息化. 2024(12): 83-87 . 百度学术
70. 黄振荣,黄瑶,涂旺,王飞,陈斌. 多模态焊缝图像像素级配准技术. 计算机应用. 2024(S2): 229-233 . 百度学术
71. 史涔溦,刘炳昊,邱建琪,史婷娜. 一种不依赖缺陷数据的扁线绕组焊点缺陷检测方法. 电工技术学报. 2024(S1): 141-149 . 百度学术
72. 谭立志. 基于卷积神经网络的火花塞表面缺陷检测研究. 自动化与仪表. 2023(01): 64-69 . 百度学术
73. 王佑芯,陈斌. 基于深度对比网络的印刷缺陷检测方法. 计算机应用. 2023(01): 250-258 . 百度学术
74. 夏桂方,于正林. 基于深度学习的油封缺陷检测方法研究. 机电工程. 2023(01): 69-75 . 百度学术
75. 方宗昌,吴四九. 基于软注意力机制的图像分类算法在缺陷检测中的应用. 现代信息科技. 2023(03): 151-154 . 百度学术
76. 姜军强,张旭辉,徐奎奎,董明,马宏伟. 基于ECA-UNet的GH4169高温合金组织缺陷检测. 西安科技大学学报. 2023(01): 201-208 . 百度学术
77. 张鹏飞,王淑青,王年涛,顿伟超,黄剑锋. 基于改进MobileNetV3的PCB裸板缺陷检测. 湖北工业大学学报. 2023(01): 27-32 . 百度学术
78. 王军生,宋宝宇. 基于5G工业专网的云化带钢表面质量检测系统研究与开发. 冶金自动化. 2023(02): 117-123 . 百度学术
79. 韩佳轩,王鲜芳. 基于机器视觉的智能制造缺陷检测平台研究. 现代电子技术. 2023(08): 49-53 . 百度学术
80. 杨泽青,张明轩,陈英姝,平恩旭,方勇,吕雅丽,高岩. 基于机器视觉的表面缺陷检测方法研究进展. 现代制造工程. 2023(04): 143-156 . 百度学术
81. 李阳,蒋三新. 基于改进生成对抗网络的无监督晶圆缺陷检测. 电子测量技术. 2023(06): 91-99 . 百度学术
82. 胡小兵,朱莉香,高天,郑力新,吴哲. 一种医用口罩缺陷的机器视觉在线检测系统. 工业控制计算机. 2023(05): 51-53+57 . 百度学术
83. 贺军义,冯嘉莘,焦华喆,李远航,吴梦翔,韩一杰. 基于改进UNet的混凝土CT孔隙裂隙分割方法. 中国矿业大学学报. 2023(03): 615-624 . 百度学术
84. 杨松,王宝金,沈锦桃. 单板缺陷自动化修补技术研究进展. 世界林业研究. 2023(03): 63-68 . 百度学术
85. 王淑青,张子言,朱文鑫,刘逸凡,王娟,李青珏. 基于改进YOLOv5的PCB板表面缺陷检测. 仪表技术与传感器. 2023(05): 106-111 . 百度学术
86. 郑亚睿,蒋三新. 基于双动态头Sparse R-CNN的表面缺陷检测算法. 仪表技术与传感器. 2023(05): 97-105+111 . 百度学术
87. 孙志超,王博,张晓玲. 基于可变形残差卷积与伸缩式特征金字塔算法的PCB缺陷检测. 电讯技术. 2023(06): 798-805 . 百度学术
88. 张力丹,余方剑,董婉祾,崔宸. 基于深度学习的核电设备缺陷检测算法的实现与应用. 中国新技术新产品. 2023(08): 5-8 . 百度学术
89. 熊节,殷建,刘劲松,周秋俊. 基于机器视觉的ITO导电玻璃缺陷检测系统设计. 黑龙江工业学院学报(综合版). 2023(06): 94-102 . 百度学术
90. 蒋万胜,杨倩. 基于深度学习的产业智能化对经济发展的变革性影响. 榆林学院学报. 2023(04): 62-68 . 百度学术
91. 刘宜轩,程志江,吴动波,梁嘉炜,王辉. 基于改进YOLOv5的航空发动机叶片表面缺陷检测方法研究. 激光杂志. 2023(07): 57-61 . 百度学术
92. 孙博言,王洪元,刘乾,冯尊登,唐郢. 基于多尺度和注意力机制的混合监督金属表面缺陷检测. 智能系统学报. 2023(04): 886-893 . 百度学术
93. 李跃,王子铭,李鑫林,岳强. 带钢表面缺陷检测方法研究进展. 钢铁研究学报. 2023(08): 950-962 . 百度学术
94. 范瑶瑶,王兴芬,刘亚辉. 改进DeepLabv3+网络的钢板表面缺陷检测研究. 计算机工程与应用. 2023(16): 150-158 . 百度学术
95. 黄紫彤,刘尧猛,李瑞. 基于改进U-Net的电子换向器表面缺陷分割方法. 天津科技大学学报. 2023(04): 41-47 . 百度学术
96. 刘应桃,郭世伟,付孟新,张青松. 基于改进Faster RCNN的轮对踏面缺陷检测. 电子测量技术. 2023(12): 34-41 . 百度学术
97. 程风雯,甘进,李星,吴卫国. 基于DCGAN的水下结构物表面缺陷图像生成. 长江科学院院报. 2023(09): 155-161 . 百度学术
98. 尹玲,叶正伟,陈新度,张斐,吴鹏,赵健州,陈湘尹,宋业明. 基于深度学习的曲面玻璃表面缺陷检测方法. 机床与液压. 2023(16): 120-125+132 . 百度学术
99. 赵佰亭,吴俊东,贾晓芬. 融合特征增强的轻量化罐道缺陷检测算法. 电子测量与仪器学报. 2023(06): 159-168 . 百度学术
100. ZHANG Changfan,HUANG Congcong,HE Jing. Defects Recognition of Train Wheelset Tread Based on Improved Spiking Neural Network. Chinese Journal of Electronics. 2023(05): 941-954 . 必应学术
101. 陈大鹏,姚剑敏,严群,林志贤. 基于自编码器结构改进的无监督图像异常检测. 信息技术与信息化. 2023(08): 4-7 . 百度学术
102. 张建国,高飞,莘明星,左春梅,刘用文. 基于改进YOLOv5s的铝型材表面弱缺陷识别方法. 船舶工程. 2023(06): 161-166 . 百度学术
103. 吴俊华,闫小宇,葛芦生. 基于改进YOLOv5的PCB缺陷快速检测方法(英文). Journal of Measurement Science and Instrumentation. 2023(03): 340-349 . 百度学术
104. 李巍,梁斯昕,张建州. 基于梯度引导加权-延迟负梯度衰减损失的长尾图像缺陷检测. 计算机应用. 2023(10): 3267-3274 . 百度学术
105. 费佳杰,李宏胜,任飞,吴敏宁,王光荣. 基于深度学习的钢表面缺陷检测方法综述. 现代信息科技. 2023(19): 107-112 . 百度学术
106. 刘晓艳. 基于机器视觉和深度学习的矿用电机换向器检测系统设计研究. 安徽职业技术学院学报. 2023(03): 29-35 . 百度学术
107. 李冰,白云山,赵宽,郭聪彬,翟永杰. 基于HSCA-YOLOv7的风电机组叶片表面缺陷检测算法. 中国电力. 2023(10): 43-52 . 百度学术
108. 吴福培,谢晓扬,黄耿楠,吴涛,李昇平. 基于Anchors设计和模型迁移的钢轨内部伤损检测方法. 铁道学报. 2023(10): 112-119 . 百度学术
109. 赵祥涛,刘银华. 基于改进YOLOv5的带钢表面缺陷检测. 自动化与仪器仪表. 2023(10): 6-9 . 百度学术
110. 周曼,吴天钊,代宝鑫,许新统,孔令兵,梁立新. 深度学习在陶瓷表面缺陷检测方面的研究进展. 陶瓷学报. 2023(05): 874-884 . 百度学术
111. 侯灿阳,朱北辰,吴清. 基于迁移学习和集成神经网络的皮革缺陷检测. 东华大学学报(自然科学版). 2023(05): 70-77+87 . 百度学术
112. 李文博,王琦,高尚. 基于深度学习的红外小目标检测算法综述. 激光与红外. 2023(10): 1476-1484 . 百度学术
113. 张靖,俞锡光,郑东旭,施定威,潘洲民. 基于GAN-UNet++的汽车铝铸件图像缺陷分割算法研究. 模具工业. 2023(11): 6-11 . 百度学术
114. 吴吉灵,金玉珍. 基于改进Faster R-CNN的铝型材表面缺陷检测研究. 计算机时代. 2023(11): 52-57 . 百度学术
115. 张瀚丹,吴一全. 基于视觉的汽车装配件缺陷检测研究进展. 仪器仪表学报. 2023(08): 1-20 . 百度学术
116. 吴家飞. 双排针电连接器异常检测技术研究. 福建电脑. 2023(12): 56-59 . 百度学术
117. 张玥,陈锡伟,陈梦丹,周新龙,张宏伟. 基于对比学习生成对抗网络的无监督工业品表面异常检测. 电子测量与仪器学报. 2023(10): 193-201 . 百度学术
118. 王飞州,程凡永,张明艳,张红. 自监督瓷砖表面异常检测与定位. 电子测量技术. 2023(17): 180-188 . 百度学术
119. 王亦君,蒋首超. 基于计算机视觉的钢构件防腐涂层缺陷检测. 建筑钢结构进展. 2023(12): 85-93+101 . 百度学术
120. 陈万志,阴晓阳,方圆,房娜. 基于深度学习的国产工业相机PCB缺陷检测算法. 辽宁工程技术大学学报(自然科学版). 2023(06): 756-762 . 百度学术
121. 李俊祺,成苗,张绍兵,何莲,石向文. 基于投票筛选增强自编码器的纺织品缺陷分割算法. 计算机应用. 2023(S2): 229-237 . 百度学术
122. 魏德志,杜志勇,滕春阳,辛吴天,李泽坤. 露天矿破碎站链条断裂安全监测技术研究. 中国安全科学学报. 2023(S2): 170-175 . 百度学术
123. 顾旭,郭锐锋,王鸿亮,张晓星. 一种结合机器视觉的工件喷涂质量检测方法. 小型微型计算机系统. 2022(02): 343-348 . 百度学术
124. 孙永鹏,钟佩思,刘梅,曹爱霞,李梁. 基于YOLOv4算法的冲压件缺陷检测. 锻压技术. 2022(01): 222-228 . 百度学术
125. 梁程,薛建彬. 基于云-边缘协同计算的表面缺陷检测系统研究. 机械与电子. 2022(02): 65-70 . 百度学术
126. 徐天伦,李波,胡文杰,姚为. 基于CA-EfficientDet的棉布瑕疵检测方法. 中南民族大学学报(自然科学版). 2022(02): 243-250 . 百度学术
127. 王紫玉,张果,杨奇,尹丽琼. 基于YOLOv4的铜带表面缺陷识别研究. 光电子·激光. 2022(02): 163-170 . 百度学术
128. 哈马友吉,任万春,张秤,张华. 基于轻量级网络MobileNet V2的二极管玻壳缺陷识别. 传感器与微系统. 2022(04): 153-155+160 . 百度学术
129. 赵朗月,吴一全. 基于机器视觉的表面缺陷检测方法研究进展. 仪器仪表学报. 2022(01): 198-219 . 百度学术
130. 米春风,卢琨,汪文艳,王兵. 基于机器视觉的带钢表面缺陷检测研究进展. 安徽工业大学学报(自然科学版). 2022(02): 180-188 . 百度学术
131. 刘佳,刘孝保,阴艳超,孙海彬. 面向不均衡样本空间的工件表面缺陷检测方法. 机械科学与技术. 2022(05): 755-763 . 百度学术
132. 周宣,沈希忠. 基于多模型级联的轻量级缺陷检测算法. 电子测量技术. 2022(07): 125-130 . 百度学术
133. 邹易清,苏建功,夏晓华,李玉强,蒋立军,韦耀淋. 基于改进YOLO V4的桥梁缆索表面损伤识别方法. 电子设计工程. 2022(10): 172-176+182 . 百度学术
134. 陆顺成,姜小峰,石奇. 基于改进DCGAN的汽车冷凝器图像生成方法. 微电子学与计算机. 2022(05): 71-77 . 百度学术
135. 王雅琳,邹江枫,王凯,袁小锋,谢胜利. 基于本体引导的注塑知识图谱构建及缺陷溯因应用. 电子与信息学报. 2022(05): 1521-1529 . 百度学术
136. 李泽辉,陈新度,黄佳生,吴磊,练洋奇. 基于改进YOLOv3的纹理瓷砖缺陷检测. 激光与光电子学进展. 2022(10): 294-302 . 百度学术
137. 于海涛,李福龙,刘亚姣,王江,于利峰,张春晖,刘宝顺,马永福. 改进注意力机制的型钢表面微小缺陷检测方法. 计算机工程与应用. 2022(11): 250-259 . 百度学术
138. 王新宇,蒋三新. 基于深度神经网络的无人机智能巡检系统——绝缘子检测应用研究. 信息技术与信息化. 2022(05): 217-220 . 百度学术
139. 胡金良,李俊峰. 基于改进YOLOv3的大尺寸导光板缺陷检测. 计算机系统应用. 2022(06): 279-286 . 百度学术
140. 罗东亮,蔡雨萱,杨子豪,章哲彦,周瑜,白翔. 工业缺陷检测深度学习方法综述. 中国科学:信息科学. 2022(06): 1002-1039 . 百度学术
141. 王新宇,蒋三新. 芯片缺陷检测综述. 现代制造技术与装备. 2022(05): 94-98 . 百度学术
142. 吕承侃,沈飞,张正涛,张峰. 图像异常检测研究现状综述. 自动化学报. 2022(06): 1402-1428 . 本站查看
143. 刘孝保,刘佳,阴艳超,高阳. 基于超分辨率特征融合的工件表面细微缺陷数据扩增方法. 计算机集成制造系统. 2022(06): 1844-1853 . 百度学术
144. 张宏伟,张伟伟,熊文博,陆帅,陈霞. 基于记忆去噪卷积自编码器的色织物缺陷检测. 纺织高校基础科学学报. 2022(02): 64-71 . 百度学术
145. 陶志勇,杜福廷,任晓奎,林森. 基于T-VGG的太阳电池片缺陷检测. 太阳能学报. 2022(07): 145-151 . 百度学术
146. 陆家林,程颖,冯赛,李明哲,张宁华,孙家宇. 基于机器视觉的钢材表面缺陷检测. 机电工程技术. 2022(07): 159-163 . 百度学术
147. 柴利,任磊,顾锞,陈佳鑫,黄博,叶琦,曹玮. 基于视觉感知的表面缺陷智能检测理论及工业应用. 计算机集成制造系统. 2022(07): 1996-2004 . 百度学术
148. 袁思邈,方春,孙福振. 基于改进残差网络的热轧带钢表面缺陷研究. 计算机仿真. 2022(07): 243-247+420 . 百度学术
149. 李小强. 基于深度图像的精密零件加工问题研究. 自动化与仪器仪表. 2022(07): 62-66+73 . 百度学术
150. 任秋霖,任德均,李鑫,闫宗一,曹林杰,唐洪. 基于卷积自编码器的医用玻璃瓶口缺陷检测方法. 计算机与现代化. 2022(08): 114-120 . 百度学术
151. 刘亚姣,于海涛,王江,于利峰,张春晖. 基于深度学习的型钢表面多形态微小缺陷检测算法. 计算机应用. 2022(08): 2601-2608 . 百度学术
152. 付思琴,邱涛,王权顺,黄德丰,余华云. 基于改进YOLOv4的焊接件表面缺陷检测算法. 包装工程. 2022(15): 23-32 . 百度学术
153. 李梦,尹宗军. 一种零件综合质量评定方法研究. 工程设计学报. 2022(04): 410-418 . 百度学术
154. HOU Yupeng,ZHANG Lei,WANG Yuanquan,ZHAO Xiaosong,FENG Guoce,ZHANG Yirui. Field rapid detection method of wind turbine blade fixing bolt defects based on FPGA. Optoelectronics Letters. 2022(09): 541-546 . 必应学术
155. 朱立明,王伟,范霞萍,王文博,徐鑫,许小双. 基于无监督深度神经网络的卷烟小包拉线缺陷视觉智能检测方法. 包装工程. 2022(17): 273-281 . 百度学术
156. 陈波,袁志龙,陈龙,王月明. 基于生成对抗网络的车轮踏面缺陷图像生成算法研究. 冶金自动化. 2022(05): 56-64 . 百度学术
157. 丛明,卢长奇,刘冬,肖庆阳,李荣东. 基于Refine-ACTDD的铸件外观微小缺陷检测方法. 计算机集成制造系统. 2022(09): 2815-2824 . 百度学术
158. 李东,梁家睿,马鹏涛. 基于知识蒸馏的轻量化残差网络在塑料颗粒高速检测中的运用. 机电工程技术. 2022(09): 32-36+47 . 百度学术
159. 王峰,胥光申,黄乾玮,余海洋. 基于超分辨率模型与YOLO-V4的织物疵点检测. 轻工机械. 2022(05): 60-66 . 百度学术
160. 李明泽,侯溪,赵文川,王洪,李梦凡,胡小川,赵远程,周杨. 非球面光学表面缺陷检测技术现状和发展趋势(特邀). 红外与激光工程. 2022(09): 11-30 . 百度学术
161. 李雪露,杨永辉,储茂祥. 基于机器视觉和深度学习的钢板表面缺陷检测研究综述. 辽宁科技大学学报. 2022(03): 193-202 . 百度学术
162. 黄怡,董荣胜. 基于多尺度特征融合和注意力的钢表面缺陷检测. 桂林电子科技大学学报. 2022(05): 398-404 . 百度学术
163. 黄振宁,赵永贵,许志亮,温飞,张成. 基于判别式深度置信网络的智能电缆隧道缺陷检测技术研究. 电子设计工程. 2022(20): 103-107 . 百度学术
164. Meng DING,Boer WU,Juan XU,Abdul Nasser KASULE,Hongfu ZUO. Visual inspection of aircraft skin: Automated pixel-level defect detection by instance segmentation. Chinese Journal of Aeronautics. 2022(10): 254-264 . 必应学术
165. 蔡剑锋,柏俊杰,向洪成,胡林,周涛琪,高帅. 基于异域数据联邦学习的金属板表面划痕检测. 安阳工学院学报. 2022(06): 40-44 . 百度学术
166. 郑旭平. 公路病害智能检测分析解决方案研究. 西部交通科技. 2022(10): 184-186+199 . 百度学术
167. 吴凤和,崔健新,张宁,张志良,张会龙,郭保苏. 基于改进YOLOv4算法的轮毂表面缺陷检测. 计量学报. 2022(11): 1404-1411 . 百度学术
168. 阎昊,刘奕阳. 基于深度森林的人机协同工业制品表面缺陷识别. 计算机系统应用. 2022(12): 280-286 . 百度学术
169. 宋秋凡,杜亚江,李宗刚,高溥. 基于机器视觉的箱体类金属工件铆接质量检测方法研究. 仪表技术与传感器. 2022(11): 75-81 . 百度学术
170. 王新宇,蒋三新. 应用于产品表面缺陷检测的神经网络IBS-Net. 仪表技术与传感器. 2022(11): 101-107 . 百度学术
171. 宋华军,陈子维,武田凯. 井下钻杆表面螺纹缺陷智能检测系统. 实验技术与管理. 2022(12): 55-61+68 . 百度学术
172. 王修善,谢方平,刘大为,陈子林,钟嘉雄. 基于深度学习的稻谷内部损伤无损检测装置. 实验技术与管理. 2022(12): 112-117 . 百度学术
173. 成科扬,丁杨柳,詹永照,严浏阳. 基于回顾蒸馏学习的无监督工业品缺陷检测方法. 南京大学学报(自然科学). 2022(06): 1030-1040 . 百度学术
174. 刘金海,赵真,付明芮,左逢源,王雷. 基于主动小样本学习的管道焊缝缺陷检测方法. 仪器仪表学报. 2022(11): 252-261 . 百度学术
175. 李翔,于铭瑞,贾永奕,吕康晨,宋士吉. 高危化工环境机器人应用研究进展. 新兴科学和技术趋势. 2022(01): 107-121 . 百度学术
176. 邓泽林,刘行,董云龙,袁烨. 无纺布疵点实时检测技术与系统设计. 自动化学报. 2021(03): 583-593 . 本站查看
177. 赵鹤,杨晓洪,杨奇,尹丽琼. 融合注意力机制的金属缺陷图像分割方法. 光电子·激光. 2021(04): 403-408 . 百度学术
178. 董静毅,吕文涛,包晓敏,骆淑云,王成群,徐伟强. 基于机器视觉的PCB板表面缺陷检测方法研究进展. 浙江理工大学学报(自然科学版). 2021(03): 379-389 . 百度学术
179. 苏程程,万新军,陈红豆,董韶,杨浩哲. 结合暗场散射与曲率成像的镜面缺陷检测方法. 光学仪器. 2021(03): 1-8 . 百度学术
180. 姚明海,沈颖琦,柳嘉敏. 面向工件表面缺陷的无监督域适应方法. 小型微型计算机系统. 2021(06): 1256-1261 . 百度学术
181. 肖振远,王逸涵,罗建桥,熊鹰,李柏林. 基于部分加权损失函数的RefineDet. 计算机应用. 2021(07): 1928-1932 . 百度学术
182. 张志达,黄鹏,刘洋,毛翔宇,孙永文,杨立美. 基于YOLO算法与深度学习的证件质量检测系统. 单片机与嵌入式系统应用. 2021(07): 67-70 . 百度学术
183. 胡广华,王宁,何文亮,唐辉雄. 基于图像修复的无监督表面缺陷检测方法. 华南理工大学学报(自然科学版). 2021(07): 76-85+124 . 百度学术
184. 李俊峰,何炎森,戴文战. 结合轻量化与级联深度学习网络的导光板缺陷检测方法. 激光与光电子学进展. 2021(14): 196-206 . 百度学术
185. 李彬,汪诚,吴静,刘吉超,童立甲,郭振平. 改进YOLOv4算法的航空发动机部件表面缺陷检测. 激光与光电子学进展. 2021(14): 414-423 . 百度学术
186. 韩强,张喆,续欣莹,谢新林. 基于FF R-CNN钢材表面缺陷检测算法. 太原理工大学学报. 2021(05): 754-763 . 百度学术
187. 张堃,李子杰,瞿宏俊,吴建国,华亮. 基于注意力机制和隐马尔科夫的高精密螺纹全自动精确测量. 南通大学学报(自然科学版). 2021(03): 57-66 . 百度学术
188. 翁玉尚,肖金球,夏禹. 改进Mask R-CNN算法的带钢表面缺陷检测. 计算机工程与应用. 2021(19): 235-242 . 百度学术
189. 王月明,李世翔,翟容清,吴永刚. 基于YOLOv3算法的烧结厂台车箅条缺失检测研究. 烧结球团. 2021(05): 30-34+53 . 百度学术
190. 张红民,李顺远,周豪. 一种改进YOLOv3的绝缘子检测方法. 重庆理工大学学报(自然科学). 2021(10): 187-193 . 百度学术
191. 孟奇,苗华,李琳,国博,刘婷婷,米士隆. 基于双通道生成对抗网络的镜片缺陷数据增强. 激光与光电子学进展. 2021(20): 356-364 . 百度学术
192. 夏禹,肖金球,翁玉尚. 基于改进Faster-RCNN的偏光片表面缺陷检测. 光学技术. 2021(06): 695-702 . 百度学术
193. 唐纲浩,周骅,赵麒,魏相站. 基于改进YOLOv3_Tiny的压敏电阻表面缺陷检测. 光电子·激光. 2021(11): 1147-1154 . 百度学术
194. 钱雪,李军,唐球,钱晓雨. 基于YOLOV5的药品表面缺陷实时检测方法. 信息技术与网络安全. 2021(12): 45-50 . 百度学术
195. 王标,周雅兰,王永红. 改进型Faster R-CNN网络在电子元件LED气泡缺陷检测中的应用. 电子测量与仪器学报. 2021(09): 136-143 . 百度学术
196. 王晓东,赵志诚,叶泽甫. 基于机器视觉的浇口杯定位研究. 铸造. 2021(12): 1447-1452 . 百度学术
197. 李森,万刚,魏梓原,安岗,张文博. 5G+AI机器视觉技术在PCB行业应用. 信息通信技术. 2021(06): 56-60 . 百度学术
198. 董泽宇,叶芸,姚剑敏,严群,李德财,林坚普. 基于特征空间的无监督换向器表面缺陷检测. 电视技术. 2021(12): 104-109+119 . 百度学术
199. 孙连山,魏婧雪,朱登明,石敏. 基于AM-YOLOv3模型的铝型材表面缺陷检测算法. 激光与光电子学进展. 2021(24): 360-370 . 百度学术
200. 杨笑千,郑炯,张力丹,马浩轩,崔宸. 大数据算法在核工业领域的应用研究. 现代信息科技. 2021(24): 130-132 . 百度学术
其他类型引用(336)
-