2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

图像理解中的卷积神经网络

常亮 邓小明 周明全 武仲科 袁野 杨硕 王宏安

常亮, 邓小明, 周明全, 武仲科, 袁野, 杨硕, 王宏安. 图像理解中的卷积神经网络. 自动化学报, 2016, 42(9): 1300-1312. doi: 10.16383/j.aas.2016.c150800
引用本文: 常亮, 邓小明, 周明全, 武仲科, 袁野, 杨硕, 王宏安. 图像理解中的卷积神经网络. 自动化学报, 2016, 42(9): 1300-1312. doi: 10.16383/j.aas.2016.c150800
CHANG Liang, DENG Xiao-Ming, ZHOU Ming-Quan, WU Zhong-Ke, YUAN Ye, YANG Shuo, WANG Hong-An. Convolutional Neural Networks in Image Understanding. ACTA AUTOMATICA SINICA, 2016, 42(9): 1300-1312. doi: 10.16383/j.aas.2016.c150800
Citation: CHANG Liang, DENG Xiao-Ming, ZHOU Ming-Quan, WU Zhong-Ke, YUAN Ye, YANG Shuo, WANG Hong-An. Convolutional Neural Networks in Image Understanding. ACTA AUTOMATICA SINICA, 2016, 42(9): 1300-1312. doi: 10.16383/j.aas.2016.c150800

图像理解中的卷积神经网络

doi: 10.16383/j.aas.2016.c150800
基金项目: 

国家自然科学基金 61473276

国家自然科学基金 61402040

详细信息
    作者简介:

    常亮 北京师范大学信息科学与技术学院副教授.主要研究方向为计算机视觉与机器学习.E-mail:changliang@bnu.edu.cn

    周明全 北京师范大学信息科学与技术学院教授.主要研究方向为计算机可视化技术,虚拟现实.E-mail:mqzhou@bnu.edu.cn

    武仲科 北京师范大学信息科学与技术学院教授.主要研究方向为计算机图形学,计算机辅助几何设计,计算机动画,虚拟现实.E-mail:zwu@bnu.edu.cn

    袁野 中国科学院软件研究所硕士研究生.主要研究方向为计算机视觉.E-mail:yuanye13@mails.ucas.ac.cn

    杨硕 中国科学院软件研究所硕士研究生.主要研究方向为计算机视觉.E-mail:yangshuo114@mails.ucas.ac.cn

    王宏安 中国科学院软件研究所研究员.主要研究方向为实时智能,自然人机交互.E-mail:hongan@iscas.ac.cn

    通讯作者:

    邓小明 中国科学院软件研究所副研究员.主要研究方向为计算机视觉.本文通信作者.E-mail:xiaoming@iscas.ac.cn

Convolutional Neural Networks in Image Understanding

Funds: 

National Natural Science Foundation of China 61473276

National Natural Science Foundation of China 61402040

More Information
    Author Bio:

    Associate professor at the College of Information Science and Technology, Beijing Normal University. Her research interest covers computer vision and machine learning.

    Professor at the College of Information Science and Technology, Beijing Normal University. His research interest covers information visualization and virtual reality.

    Professor at the College of Information Science and Technology, Beijing Normal University. His research interest covers computer graphics, computer-aided design, computer animation, and virtual reality.

    Master student at the Institute of Software, Chinese Academy of Sciences. His main research interest is computer vision.

    Master student at the Institute of Software, Chinese Academy of Sciences. His main research interest is computer vision.

    Professor at the Institute of Software, Chinese Academy of Sciences. His research interest covers real-time intelligence and natural human-computer interactions.

    Corresponding author: DENG Xiao-Ming Associate professor at the Institute of Software, Chinese Academy of Sciences. His main research interest is computer vision. Corresponding author of this paper.
  • 摘要: 近年来,卷积神经网络(Convolutional neural networks,CNN)已在图像理解领域得到了广泛的应用,引起了研究者的关注. 特别是随着大规模图像数据的产生以及计算机硬件(特别是GPU)的飞速发展,卷积神经网络以及其改进方法在图像理解中取得了突破性的成果,引发了研究的热潮. 本文综述了卷积神经网络在图像理解中的研究进展与典型应用. 首先,阐述卷积神经网络的基础理论;然后,阐述其在图像理解的具体方面,如图像分类与物体检测、人脸识别和场景的语义分割等的研究进展与应用.
  • 1986年, Rumelhart等[1]提出人工神经网络的反向传播算法(Back propagation, BP), 掀起了神经网络在机器学习中的研究热潮. 神经网络中存在大量的参数, 存在容易发生过拟合、训练时间长的缺陷, 但是与基于规则的学习相比已经具有优越性. 基于统计学习理论的支持向量机[2]、Boosting、Logistic回归方法可以被看作具有一层隐节点或者不含隐节点的学习模型, 被称为浅层机器学习模型. 浅层学习模型通常需要由人工方法获取好的样本特征, 在此基础上进行识别和预测, 因此方法的有效性很大程度上受到特征提取的制约[3].

    2006年, Hinton等[4]Science上提出了深度学习. 这篇文章的两个主要观点是: 1) 多隐层的人工神经网络具有优异的特征学习能力, 学习到的数据更能反映数据的本质特征, 有利于可视化或分类; 2) 深度神经网络在训练上的难度, 可以通过逐层无监督训练有效克服. 理论研究表明为了学习到可表示高层抽象特征的复杂函数, 需要设计深度结构. 深度结构由多层非线性算子构成, 典型设计是具有多层隐节点的神经网络. 随着网络层数的加大, 如何搜索深度结构的参数空间成为具有挑战性的任务. 近年来, 深度学习取得成功的主要原因有: 1) 在训练数据上, 大规模训练数据的出现(如ImageNet[5]), 为深度学习提供了好的训练资源; 2) 计算机硬件的飞速发展(特别是GPU的出现)使得训练大规模神经网络成为可能. 与浅层学习模型相比, 深度学习构造了具有多隐层的学习模型, 设计了有效的学习算法并能够加速计算, 从而能够对大数据进行处理; 通过深度学习能够得到更高层的特征, 从而提高样本的识别率或预测的准确率.

    卷积神经网络(Convolutional neural networks, CNN)是一种带有卷积结构的深度神经网络, 卷积结构可以减少深层网络占用的内存量, 也可以减少网络的参数个数, 缓解模型的过拟合问题. 1989年, LeCun等[6]在手写数字识别中采用神经网络误差反向传播算法, 在网络结构设计中加入下采样(Undersampling)与权值共享(Weight sharing). 1998年, LeCun等[7]提出用于文档识别的卷积神经网络, 为了保证一定程度的平移、尺度、畸变不变性, CNN设计了局部感受野、共享权重和空间或时间下采样, 提出用于字符识别的卷积神经网络LeNet-5. LeNet-5由卷积层、下采样层、全连接层构成, 该系统在小规模手写数字识别中取得了较好的结果. 2012年, Krizhevsky等[8]采用称为AlexNet的CNN在ImageNet竞赛图像分类任务中取得了最好的成绩, 是CNN在大规模图像分类中的巨大成功. AlexNet网络具有更深层的结构, 并设计了ReLU (Rectified linear unit)作为非线性激活函数以及Dropout来避免过拟合. 在图像分类中, 一个重要的图像数据库是ImageNet[5]. 针对具有80000个同义词的词汇网络(WordNet), ImageNet旨在分别使用500~1000个清晰的全分辨率图像来表示其中的大部分词汇, 这样就形成了上百万张有标记的图像, 它们通过词汇网络的语义结构组织起来. ImageNet总共包括12个子树、5247个同义词集、320万图像, 是目标检测、图像分类、图像定位研究的优越资源, ImageNet在大规模、准确度、分层结构方面为计算机视觉研究者提供了前所未有的机会. 表 1是ImageNet 竞赛历年来图像分类任务的部分领先结果. 在AlexNet之后, 研究者又进一步改善网络性能, 提出能有效分类检测的R-CNN (Region-based CNN)[9]、SPP (Spatial pyramid pooling)-net[10]、GoogLeNet[11]、VGG (Visual geometry group)[12]等. 为了更好地改进卷积神经网络, 使其在应用中发挥更大的功效, 研究者不仅从应用的特殊性、网络的结构等方面进一步探讨卷积神经网络, 而且从其中的网络层设计、损失函数的设计、激活函数、正则项等多方面对现有网络进行改进, 取得了一系列成果.

    表 1  ImageNet竞赛历年来图像分类任务的部分领先结果
    Table 1  Representative top ranked results in image classification task of "ImageNet Large Scale Visual Recognition Challenge"
    公布时间 机构 Top-5错误率
    2015.12.10 MSRA 3.57[15]
    2014.8.18 Google 6.66[11]
    2014.8.18 Oxford 7.33[12]
    2013.11.14 NYU 11.7
    2012.10.13 U.Toronto 16.4[8]
    下载: 导出CSV 
    | 显示表格

    计算机视觉的中心任务就是通过对图像或图像序列的分析, 得到景物的尽可能完全正确的描述[13]. 图像理解与计算机视觉紧密相关, 研究内容交叉重合, 图像理解侧重在图像分析的基础上, 理解图像内容的含义以及解释原来的客观场景, 从而指导和规划行动[14]. 图像理解是深度学习应用最早的领域, 也是其应用最广的领域之一. 随着互联网大数据的兴起, 深度学习在大规模图像的处理中显示了不可替代的优越性. 卷积神经网络的研究已经在图像理解中广泛应用[3]. 本文着重阐述卷积神经网络的理论和面向图像理解几个不同方面的卷积神经网络的提出、进展和应用, 包括: 图像分类和物体检测、人脸识别和验证、场景的语义分割和深度恢复、人体关节检测, 通过这些介绍希望能帮助读者了解相关工作的方法和思路并启发新的研究思路.

    卷积神经网络是深度学习的一种, 已成为当前图像理解领域的研究热点[6, 16-17] 它的权值共享网络结构使之更类似于生物神经网络, 降低了网络模型的复杂度, 减少了权值的数量. 这个优点在网络的输入是多维图像时表现得更为明显, 图像可以直接作为网络的输入, 避免了传统识别算法中复杂的特征提取和数据重建过程. 卷积网络是为识别二维形状而特殊设计的一个多层感知器, 这种网络结构对平移、比例缩放以及其他形式的变形具有一定不变性. 在典型的CNN中, 开始几层通常是卷积层和下采样层的交替, 在靠近输出层的最后几层网络通常是全连接网络(如图 1所示). 卷积神经网络的训练过程主要是学习卷积层的卷积核参数和层间连接权重等网络参数, 预测过程主要是基于输入图像和网络参数计算类别标签. 卷积神经网络的关键是: 网络结构(含卷积层、下采样层、全连接层等)和反向传播算法等.

    图 1  卷积神经网络示例
    Fig. 1  Illustration of convolutional neural networks

    在本节中, 我们先介绍典型CNN的网络结构和反向传播算法, 然后概述常用的其他CNN网络结构和方法. 神经网络参数的中文名称主要参考文献[18] 卷积神经网络的结构和反向传播算法主要参考文献[17].

    1.1.1   卷积层

    在卷积层, 上一层的特征图(Feature map)被一个可学习的卷积核进行卷积, 然后通过一个激活函数(Activation function), 就可以得到输出特征图. 每个输出特征图可以组合卷积多个特征图的值[17]:

    $ \begin{equation} \label{eq1} \begin{array}{l} {x}_j^l = f({u}_j^l ) \\ {u}_j^l = \sum\limits_{i \in M_j } {{x}_i^{l - 1} \ast {k}_{ij}^l } + {b}_j^l \\ \end{array} \end{equation} $

    (1)

    其中, ${u}_j^l$称为卷积层l的第j个通道的净激活(Net activation), 它通过对前一层输出特征图${x}_i^{l - 1}$进行卷积求和与偏置后得到的, ${x}_j^l$是卷积层l的第j个通道的输出. $f(\cdot)$称为激活函数, 通常可使用sigmoid和tanh等函数. $M_j$表示用于计算${u}_j^l$的输入特征图子集, ${k}_{ij}^l$是卷积核矩阵, ${b}_j^l$是对卷积后特征图的偏置. 对于一个输出特征图${x}_j^l$, 每个输入特征图${x}_i^{l - 1}$对应的卷积核$k_{ij}^l$可能不同, "*"是卷积符号.

    1.1.2   下采样层

    下采样层将每个输入特征图通过下面的公式下采样输出特征图[17]:

    $ \begin{equation} \label{eq2} \begin{array}{l} {x}_j^l = f({u}_j^l ) \\ {u}_j^l = \beta _j^l {\rm down}({x}_j^{l - 1} ) + {b}_j^l \\ \end{array} \end{equation} $

    (2)

    其中, ${u}_j^l$ 称为下采样层l的第j通道的净激活, 它由前一层输出特征图${x}_i^{l - 1}$进行下采样加权、偏置后得到, β是下采样层的权重系数, ${b}_j^l$是下采样层的偏置项. 符号${\rm down}(\cdot)$表示下采样函数, 它通过对输入特征图${x}_j^{l - 1}$通过滑动窗口方法划分为多个不重叠的$n\times n$图像块, 然后对每个图像块内的像素求和、求均值或最大值, 于是输出图像在两个维度上都缩小了n倍.

    1.1.3   全连接层

    在全连接网络中, 将所有二维图像的特征图拼接为一维特征作为全连接网络的输入. 全连接层l的输出可通过对输入加权求和并通过激活函数的响应得到[17]:

    $ \begin{equation} \label{eq3} \begin{array}{l} {x}^l = f({u}^l) \\ {u}^l = w^{l}{x}^{l-1} + {b}^l \\ \end{array} \end{equation} $

    (3)

    其中, ${u}^l$称为全连接层l的净激活, 它由前一层输出特征图${x}^{l - 1}$进行加权和偏置后得到的. $w^l$是全连接网络的权重系数, ${b}^l$是全连接层l的偏置项.

    神经网络有两类基本运算模式: 前向传播和学习. 前向传播是指输入信号通过前一节中一个或多个网络层之间传递信号, 然后在输出层得到输出的过程. 反向传播算法是神经网络有监督学习中的一种常用方法, 其目标是根据训练样本和期望输出来估计网络参数. 对于卷积神经网络而言, 主要优化卷积核参数k、下采样层网络权重β、全连接层网络权重w和各层的偏置参数b等. 反向传播算法的本质在于允许我们对每个网络层计算有效误差, 并由此推导出一个网络参数的学习规则, 使得实际网络输出更加接近目标值[18].

    我们以平方误差损失函数的多分类问题为例介绍反向传播算法的思路. 考虑一个多分类问题的训练总误差, 定义为输出端的期望输出值和实际输出值的差的平方[17]:

    $ \begin{equation} \label{eq4} E(w, \beta, {k}, {b}) = \frac{1}{2}\sum\limits_{n = 1}^N {\left\| {{t}_n - {y}_n } \right\|^2} \end{equation} $

    (4)

    其中, ${t}_n$是第n个样本的类别标签真值, ${y}_n$是第n个样本通过前向传播网络预测输出的类别标签. 对于多分类问题, 输出类别标签常用一维向量表示, 即输入样本对应的类别标签维度为正数, 输出类别标签的其他维为0或负数, 这取决于选择的激活函数类型, 当激活函数选为sigmoid, 输出标签为0, 当激活函数为tanh, 输出标签为-1.

    反向传播算法主要基于梯度下降方法, 网络参数首先被初始化为随机值, 然后通过梯度下降法向训练误差减小的方向调整. 接下来, 我们以多个"卷积层--采样层"连接多个全连接层的卷积神经网络为例介绍反向传播算法.

    首先介绍网络第l层的灵敏度(Sensitivity)[17-18]:

    $ \begin{equation} \label{eq5} {\delta}^l \mbox{ = }\frac{\partial E}{\partial {u}^l } \end{equation} $

    (5)

    其中, ${\delta}^l$描述了总误差E怎样随着净激活${u}^l$而变化. 反向传播算法实际上通过所有网络层的灵敏度建立总误差对所有网络参数的偏导数, 从而得到使得训练误差减小的方向.

    1.2.1   卷积层

    为计算卷积层l的灵敏度, 需要用下一层下采样层l+1的灵敏度表示卷积层l的灵敏度, 然后计算总误差E对卷积层参数(卷积核参数k、偏置参数b)的偏导数.

    由于下采样层的灵敏度尺寸小于卷积层的灵敏度尺寸, 因此需要将下采样层l+1的灵敏度上采样到卷积层l的灵敏度大小, 然后将第l层净激活的激活函数偏导与从第l+1层的上采样得到的灵敏度逐项相乘. 分别由式(1)和(2), 通过链式求导可得第l层中第j个通道的灵敏度[17]:

    $ \begin{equation} \label{eq6} \delta_j ^l = \frac{\partial E}{\partial {u}_j^l} = \beta_j ^{l + 1}(f^{'}({u}_j^{l}) \circ {\rm up}(\delta_j ^{l + 1})) \end{equation} $

    (6)

    其中, ${\rm up}(\cdot)$表示一个上采样操作, 符号$\circ$表示每个元素相乘. 若下采样因子为n, 则${\rm up}(\cdot)$将每个像素在水平和垂直方向上复制n次, 于是就可以从l+1层的灵敏度上采样成卷积层l的灵敏度大小. 函数${\rm up}(\cdot)$可以用Kronecker乘积${\rm up}(x)\equiv x \otimes 1_{n\times n}$来实现.

    然后, 使用灵敏度对卷积层l中的参数计算偏导. 对于总误差E对偏移量${b}_j^l$的偏导, 可以对卷积层l的灵敏度中所有节点进行求和来计算:

    $ \begin{equation} \label{eq7} \frac{\partial E}{\partial {b}_j^l } = \sum\limits_{u, v} {(\delta_j ^l)_{u, v} } \end{equation} $

    (7)

    对于总误差关于卷积核参数的偏导, 由式(1), 使用链式求导时需要用所有与该卷积核相乘的特征图元素来求偏导:

    $ \begin{equation} \label{eq8} \frac{\partial E}{\partial {k}_{ij}^l} = \sum\limits_{u, v} {(\delta_j ^l)_{u, v}({p}_i^{l- 1})_{u, v} } \end{equation} $

    (8)

    其中, $({p}_i^{l - 1})_{u, v}$是在计算${x}_j^{l}$时, 与${k}_{ij}^{l}$逐元素相乘的${x}_i^{l-1}$元素.

    1.2.2   下采样层

    为计算下采样层l的灵敏度, 需要用下一层卷积层l+1的灵敏度表示下采样层l的灵敏度, 然后计算总误差E对下采样参数权重系数β、偏置参数b的偏导数.

    为计算我们需要下采样层l的灵敏度, 我们必须找到当前层的灵敏度与下一层的灵敏度的对应点, 这样才能对灵敏度δ进行递推. 另外, 需要乘以输入特征图与输出特征图之间的连接权值, 这个权值实际上就是卷积核的参数. 分别由式(1)和(2), 通过链式求导可得第l层第j个通道的灵敏度[17]:

    $ \begin{equation} \label{eq9} \delta _j ^l = f^{'}({u}_j^l) \circ {\rm conv}2(\delta_j^{l + 1}, {\rm rot}180({k}_j^{l + 1})', \ {\rm full}') \end{equation} $

    (9)

    其中, 对卷积核旋转180度使用卷积函数计算互相关(在Matlab中, 可用conv2函数实现), 对卷积边界进行补零处理.

    然后, 总误差对偏移量b的偏导与前面卷积层的一样, 只要对灵敏度中所有元素的灵敏度求和即可:

    $ \begin{equation} \label{eq10} \frac{\partial E}{\partial {b}_j^l } = \sum\limits_{u, v} {(\delta _j ^l)_{u, v} } \end{equation} $

    (10)

    对于下采样权重β, 我们先定义下采样算子$d_j^l = {\rm down}({x}_j^{l - 1})$, 然后可通过下面的公式计算总误差Eβ的偏导:

    $ \begin{equation} \label{eq12} \frac{\partial E}{\partial \beta _j^l } = \sum\limits_{u, v} {(\delta _j ^l \circ d_j^l )_{u, v} } \end{equation} $

    (11)

    这里我们假定下采样层的下一层为卷积层, 如果下一层为全连接层, 也可以做类似的推导.

    1.2.3   全连接层

    全连接层l的灵敏度可通过下式计算:

    $ \begin{equation} \label{eq13} {\delta}^l = (w^{l + 1})^{\rm T}\delta ^{l + 1} \circ f^{'}({u}^l) \end{equation} $

    (12)

    输出层的神经元灵敏度可由下面的公式计算:

    $ \begin{equation} \label{eq14} {\delta}^L = f^{'}({u}^L) \circ ({y}^n - {t}^n) \end{equation} $

    (13)

    总误差对偏移项的偏导如下:

    $ \begin{equation} \label{eq15} \frac{\partial E}{\partial {b}^l } = \frac{\partial E}{\partial {u}^l }\frac{\partial {u}^l }{\partial {b}^l } = {\delta}^l \end{equation} $

    (14)

    接下来可以对每个神经元运用灵敏度进行权值更新. 对一个给定的全连接层l, 权值更新方向可用该层的输入${x}^{l - 1}$和灵敏度$\delta^l$的内积来表示:

    $ \begin{equation} \label{eq16} \frac{\partial E}{\partial w^l} = {x}^{l - 1}({\delta}^l)^{\rm T} \end{equation} $

    (15)
    1.2.4   网络参数更新过程

    卷积层参数可用下式更新:

    $ \begin{equation} \label{eq17} \Delta {k}_{ij}^l = - \eta \frac{\partial E}{\partial {k}_{ij}^l } \end{equation} $

    (16)

    $ \begin{equation} \label{eq18} \Delta {b}^l = - \eta \frac{\partial E}{\partial {b}^l} \end{equation} $

    (17)

    下采样层参数可用下式更新:

    $ \begin{equation} \label{eq19} \Delta {\beta}^l = - \eta \frac{\partial E}{\partial {\beta}^l} \end{equation} $

    (18)

    $ \begin{equation} \label{eq20} \Delta {b}^l = - \eta \frac{\partial E}{\partial {b}^l} \end{equation} $

    (19)

    全连接层参数可用下式更新:

    $ \begin{equation} \label{eq21} \Delta w^l = - \eta \frac{\partial E}{\partial w^l} \end{equation} $

    (20)

    其中, 对于每个网络参数都有一个特定的学习率η. 若学习率太小, 则训练的速度慢;若学习率太大, 则可导致系统发散. 在实际问题中, 如果总误差在学习过程中发散, 那么将学习率调小;反之, 如果学习速度过慢, 那么将学习率调大.

    1.3.1   卷积层

    传统卷积神经网络的卷积层采用线性滤波器与非线性激活函数, 一种改进的方法在卷积层使用多层感知机模型作为微型神经网络, 通过在输入图像中滑动微型神经网络来得到特征图, 该方法能够增加神经网络的表示能力, 被称为Network in network[19]. 为了解决既能够保证网络的稀疏性, 又能够利用稠密矩阵的高性能计算, Szegedy等[11]提出Inception网络. Inception网络的一层含有一个池化操作和三类卷积操作: $1\times1$、$3\times3$、$5\times5$卷积.

    1.3.2   池化

    池化(Pooling)是卷积神经网络中一个重要的操作, 它能够使特征减少, 同时保持特征的局部不变性. 常用的池化操作有: 空间金字塔池化(Spatial pyramid pooling, SPP)[10]、最大池化(Max pooling)、平均池化(Mean pooling)、随机池化(Stochastic pooling)[20]等. 本文第1.1.2节介绍的下采样层实际上也属于池化.

    1.3.3   激活函数

    常用激活函数有: ReLU[8]、Leakly ReLU[21]、Parametric ReLU、Randomized ReLU、ELU等.

    1.3.4   损失函数

    损失函数的选择在卷积神经网络中起重要作用, 代表性的损失函数有:平方误差损失、互熵损失(Cross entropy loss)、Hinge损失等.

    1.3.5   优化方法和技巧

    卷积神经网络常用的优化方法包含随机梯度下降方法(Stochastic gradient descent, SGD), 常用的技巧有权值初始化[8]、权值衰减(Weight decay)[18]、Batch normalization[22]等.

    卷积神经网络在下采样层可以保持一定局部平移不变形, 在卷积层通过感受野和权值共享减少了神经网络需要训练的参数的个数. 每个神经元只需要感受局部的图像区域, 在更高层将这些感受不同局部区域的神经元综合起来就可以得到全局的信息. 因此, 可以减少网络连接的数目, 即减少神经网络需要训练的权值参数的个数. 由于同一特征通道上的神经元权值相同, 所以网络可以并行学习, 这也是卷积网络相对于神经元彼此相连网络的一大优势. 卷积神经网络以其权值共享的特殊结构在图像理解领域中有着独特的优越性, 通过权值共享降低了网络的复杂性.

    总之, 卷积神经网络相比于一般神经网络在图像理解中有其特殊的优点: 1)网络结构能较好适应图像的结构; 2)同时进行特征提取和分类, 使得特征提取有助于特征分类; 3)权值共享可以减少网络的训练参数, 使得神经网络结构变得更简单、适应性更强.

    本节将介绍卷积神经网络在图像分类与物体检测、人脸识别和验证、语义图像分割等方面的进展与应用.

    图像分类和物体检测是图像理解中的核心问题之一. 图像分类是指给定图像, 对图像的类别进行预测; 物体检测是指对于图像中的同一物体或者同一类别物体进行检测, 找到可能出现物体的区域.

    在图像分类和物体检测中, 传统的方法包含基于词袋(Bag of words, BOW)的方法和基于变形模板模型(Deformable part models, DPM)[23]的方法等. 这些方法虽然在某些特定应用(如人脸检测、行人检测等)中取得了很好的效果, 但在准确性方面仍存在较大提升空间. 随着深度学习的兴起, 人们将深度学习应用于图像分类和物体检测问题中, 并在许多应用中取得明显好于传统方法的结果. 在图像分类中, Krizhevsky等[8]提出了新型卷积神经网络结构(AlexNet), GoogLeNet[11]和VGG[12]通过加深网络层数同时保证优化性能, 设计了更深层次的卷积神经网络. 在物体检测中, 研究者使用区域选择性搜索[9]等技术提升检测的准确率, 通过加入感兴趣区域池化层(Region of interest (ROI) pooling layer)[24]和空间金字塔池化[10]等技术加速网络计算速度. 此外, 也有一部分工作将卷积神经网络特征与传统视觉识别模型结合起来. Girshick等[25]利用深度学习的特征代替原有人工设计的方向梯度直方图(Histogram of oriented gradient, HOG)特征[26]建立变形模板, 提升了传统变形模板方法(DPM)的识别率, 并且在取得了与完全使用深度学习方法可比结果的同时, 提升了检测速度. 表 2给出部分具有代表性的图像分类和物体检测模型对比.

    表 2  部分具有代表性的图像分类和物体检测模型对比
    Table 2  Comparison of representative image classification and object detection models
    方法 输入 优点 缺点
    AlexNet[8] 整张图像(需要对图像放缩到固定大小) 网络简单易于训练, 对图像分类有较强的鉴别力 网络输入图像要求固定大小, 容易破环物体的纵横比和上下文信息
    GoogLeNet[11] 整张图像(需要对图像放缩到固定大小) 对图像分类拥有非常强的鉴别力, 参数相对AlexNet较少 网络复杂, 对样本数量要求较高, 训练耗时
    VGG[12] 整张图像(需要对图像放缩到固定大小) 对图像分类拥有非常强的鉴别力 网络复杂, 对样本数量要求较高, 训练耗时, 需要多次对网络参数的微调
    DPM[23] 整张图像 对物体检测拥有较强的鉴别力, 对形变和遮挡具有一定的处理能力 使用人工设计的HOG特征[26]; 对物体检测的精度通常比本表中其他的CNN网络低
    R-CNN[9] 图像区域 对物体检测拥有很强的鉴别力; 比在图像金字塔上逐层滑动窗口的物体检测方法效率高;使用包围盒回归(Bounding box regression)提高物体的定位精度 依赖于区域选择算法; 网络输入图像要求固定大小, 容易破环物体的纵横比和上下文信息; 训练是多阶段过程:在特定检测数据集上对网络参数进行微调、提取特征、训练SVM (Sup-port vector machine)分类器、包围盒回归(Bounding box regression);训练时间耗时、耗存储空间
    SPP-net[10] 整张图像(不要求固定大小) 对物体检测拥有很强的鉴别力, 输入图像可以任意大小, 可保证图像的比例信息训练速度比R-CNN快3倍左右, 测试比R-CNN快10~100倍 网络结构复杂时, 池化对图像造成一定的信息丢失; SPP层前的卷积层不能进行网络参数更新[24]; 训练是多阶段过程:在特定检测数据集上对网络参数进行微调、提取特征、训练SVM分类器、包围盒回归; 训练时间耗时、耗存储空间
    Fast R-CNN[24] 整张图像(不要求固定大小) 训练和测试都明显快于SPP-net (除了候选区域提取以外的环节接近于实时), 对物体检测拥有很强的鉴别力, 输入图像可以任意大小, 保证图像比例信息, 同时进行分类与定位 依赖于候选区域选择, 它仍是计算瓶颈
    Faster R-CNN[29] 整张图像(不要求固定大小) 比Fast R-CNN更加快速, 对物体检测拥有很强的鉴别力; 不依赖于区域选择算法; 输入图像可以任意大小, 保证图像比例信息, 同时进行区域选择算法、分类与定位 训练过程较复杂; 计算流程仍有较大优化空间; 难以解决被遮挡物体的识别问题
    下载: 导出CSV 
    | 显示表格

    接下来, 我们分别介绍面向图像分类和物体检测任务的AlexNet及代表性的改进方法、其他代表性的改进方向.

    2.1.1   AlexNet及代表性的改进方法

    Krizhevsky等[8]提出新型卷积神经网络结构(简称为AlexNet, 其网络结构如图 2所示), 并在ImageNet ILSVRC-2012图像分类问题中取得最好成绩(Top-5 错误率为15.3%), 其结果明显好于使用传统方法的第二名取得的结果(Top-5错误率为26.2%). 该方法训练了一个端对端(End to end)的卷积神经网络实现图像特征提取和分类, 网络结构共7层, 包含5层卷积层和2 层全连接层. AlexNet在训练阶段使用了Dropout技巧, 并通过图像平移、图像水平翻转、调整图像灰度等方法扩充训练数据集, 后者一方面通过扩充样本缓解了神经网络的过拟合以及对网络参数优化时陷入局部最优的问题, 也使得训练得到的网络对局部平移和光照变化具有一定的不变性. 为了加快网络训练的速度, AlexNet采用ReLU代替传统神经网络常用的激活函数tanh/sigmod, ReLU是一种非饱和非线性(Non-saturating nonlinearity)变换.

    图 2  AlexNet卷积神经网络结构示意图[8]
    Fig. 2  Network architecture of AlexNet convolutional neural networks[8]

    Overfeat[27]首次使用同一个模型完成图像分类、定位和物体检测三个任务, 其主要观点是通过共享部分网络完成这三个任务, 能相互促进每个任务的结果. Overfeat继承了AlexNet的网络结构, 主要区别在于: AlexNet在提出时主要面向图像分类任务, Overfeat可以完成图像分类、定位和物体检测三个任务; Overfeat在训练时输入固定大小的图像, 测试时用多尺度输入, 没有使用AlexNet中的对比度归一化, 采用无重叠区域的最大池化, 前两层的特征图更大. 对于分类与检测问题, 常采用滑动窗口对每一个图像块进行检测, 从而确定目标物体的类别与位置, 即都需要一个滑动窗口对整幅图像进行密集采样. 为提高计算效率, Overfeat舍弃在图像层级的滑动, 转而在特征层级进行滑动, 明显减少了滑动窗口个数. 为了避免特征层级采样带来的稀疏问题, Overfeat采用多次采样插值的方法解决. 对于图像分类、定位和物体检测问题的统一, Overfeat采用复用权重的方式, 即在每一个尺度上同时运行分类网络和定位回归网络. 对于每一个尺度, 分类网络给出了图像块的类别概率分布, 回归网络进一步为每一类给出了包围盒和置信度. 最后, 综合这些信息, 给出分类与检测结果. Overfeat虽然提出了将分类、定位、检测任务一起解决的思想, 但这三个任务在训练阶段仍是分开进行的[24].

    AlexNet用于物体检测时, 需要在图像金字塔上采用滑动窗口的方式逐个判断, 随着图像的增大待检测区域的数目呈平方上升. 为了解决这一问题, Girshick等将候选框(Region proposals)方法与卷积神经网络相结合(Girshick等称之为R-CNN), 采用仅对候选框逐个使用卷积神经网络判断的方式, 不仅提高了物体检测的效率, 也提高了检测的精度, 在VOC2012上取得了当时最好的检测平均精度mAP (Mean average precision), 把在该数据集上的历史最好检测平均精度提高了约30%[9]. R-CNN通过选择性搜索方法(Selective search)[28]对图像进行过分割(Over-segmentation)得到大量分割块, 根据分割图像块之间的纹理相似性和位置关系对分割图像块进行合并, 可以得到许多连通的稳定区域. 由于这些稳定区域通常包含待检测物体, 也称之为候选区域. 对于这些候选区域R-CNN, 通过AlexNet网络可以得到具有较强分辨力的特征, 最后用这个特征进行分类. 该方法用于物体检测时, 为了提高物体定位精度, 采用了类似于DPM方法[23]中使用的包围盒回归方法(Bounding box regression). 与基于滑动窗口的物体检测方法相比, 使用候选框将显著减少判断的窗口个数, 提高物体检测效率; 此外通过调整候选框方法, 可以在保证召回率的同时, 减少虚警(False alarm), 进而提高物体检测精度. 在网络优化方面, R-CNN采用AlexNet网络参数作为初值, 利用训练图像的候选区域数据对网络参数进行微调(Fine-tuning), 这种方式比随机选取网络参数初值具有更快的收敛速度, 所需样本也更少. 在物体检测问题中, R-CNN比AlexNet有明显的优势, 但仍存在一些不足: 1) 全连接层(Full-connected layer)只能接受固定尺寸的输入, R-CNN 要求对候选框进行缩放或裁减填充到固定大小, 这不仅会破坏物体的纵横比和图像大小信息, 也会破坏物体的上下文信息; 2) R-CNN使用包围盒回归有助于提高物体的定位精度, 但如果待检测物体存在遮挡或交叉时, 该方法很难提高定位精度.

    He等[10]针对之前卷积神经网络仅能接受固定尺寸的图像输入, 提出基于空间金字塔池化(Spatial pyramid pooling, SPP)的网络层, SPP层放在最后一个卷积层后, 通过SPP层可得到固定长度的输出, 然后送入并重新学习全连接网络层(这样的网络称为SPP-net). 使用的网络结构类似于AlexNet的7层网络, 包含5层卷积层和2个全连接层网络, 主要区别是通过空间金字塔池化层连接卷积层与全连接层. 在该方法中, 对卷积第5层conv5输出的特征图分别进行1等分、4等分、9等分, 然后在每个分块进行池化操作(如Max pooling)可得到定长的特征. SPP既可保证特征包含图像的整体信息(1等分), 也保留了图像的局部信息(4等分、9等分及更多等分), 由于特征是定长的, 无需关心空间金字塔池化前的上层网络输出特征图尺寸, 可以直接传递给全连接网络层. 因此, SPP可以解除对输入图像大小固定的限制, 图像可以保留原有大小直接进入网络进行训练与测试. 由于每张图像只需通过一次5层前向卷积, 避免了R-CNN用于物体检测时每个候选区域都需要通过5层前向卷积的耗时计算, 该方法于2014年在VOC2007, Caltech101数据集上取得当时最好成绩, 并在速度上比R-CNN提高了24~64倍.

    与SPP-net类似, Fast R-CNN[24]也能用于不同大小的图像上的物体检测, 提出感兴趣区域池化(RoI pooling). Fast R-CNN可以完成提取特征, 分类和包围盒回归的端对端联合训练. 首先, 通过选择性搜索(Selective search)得到图像中的候选区域(文中称为ROI), 对图像建立图像金字塔并通过前向传播可得到conv5特征金字塔; 然后, 对于特征金字塔每个尺度的每个ROI, 在conv5特征中取出对应的区域, 用一个称为RoI pooling的特殊单层SPP来统一到同样的大小的特征. 最后, 经过全连接层输出两任务的优化目标: 第一个任务是分类, 第二个任务是包围盒回归. Fast R-CNN相比SPP-net的优势在于: SPP-net中SPP层前的卷积层不能进行网络参数更新[24], 而Fast R-CNN可以; SPP-net为进行包围盒回归, 需要使用额外的回归模型(如线性SVM等), 包围盒回归不能融入整个网络训练. Fast R-CNN在除了候选区域提取以外的环节接近于实时, 候选区域提取是计算中的瓶颈问题.

    鉴于候选区域提取是Fast R-CNN的计算瓶颈, Ren等[29]提出了用于实时目标检测的候选框网络(Region proposal network, RPN), RPN是一个全卷积网络(Fully convolutional network, FCN), 它可以从任意尺寸的图像中得到一系列的带有分数(Objectness score)的物体候选区域. RPN 能够生成高质量的候选区域, 并可以嵌入卷积神经网络中进行端对端的训练. RPN与Fast R-CNN结合并共享卷积层特征的网络称为Faster R-CNN, 它在PASCAL VOC 2007、2012和MS COCO数据集上取得了当时最好的检测结果, 并且整个计算过程接近于实时(使用较深的VGG 模型也可达到5fps).

    2.1.2   其他代表性的改进方向

    AlexNet网络提出后, 许多工作开始关注改进CNN的结构, 如在最初的若干个卷积层使用更小的卷积窗口[19]与卷积步长, 使用多尺度的训练与测试数据等, 但仍基于浅层网络. Zeiler等[30]对网络中层特征和分类器进行可视化分析, 得到在ImageNet上分类效果优于AlexNet的网络结构ZF-net. ZF-net把AlexNet中第一层卷积核的大小由11×11缩小为7×7, 把卷积步长由4减小2, 可得到更丰富的特征. VGG模型[12]是对深层卷积神经网络的一次系统尝试, 在ILSVRC-2014 比赛中获得第二名的成绩. 相比于传统浅层网络问题(5~7层), 网络随着层数的加深, 参数呈现指数级增长, VGG模型采用多层小窗口卷积核代替一个大卷积核的方式减少参数的增长. 如使用三层具有3×3卷积核的卷积层代替一层具有7×7卷积核的卷积层, 如果通道数为C, 那么一层具有7×7卷积核的卷积层共有7×7×C×C=49C×C个参数, 而三层具有3×3卷积核的卷积网络共有3×(3×3)×C×C=27C×C个参数, 明显地减少了参数数目, 并且三层网络比一层网络更具有判别性. 该方法还使用1×1的卷积核[19], 可以在不影响卷积层感受野的情况下增加决策函数的非线性.

    将卷积神经网络与传统视觉识别模型融合. Felzenszwalb等[23]提出的变形模板模型DPM将物体分解为多个可形变的基础语义组件, 这种目标检测方法融合物体整体信息, 语义组件信息与形变信息进行目标检测. 该方法结合了整体上下文信息与局部信息, 对形变、遮挡都有很好的鲁棒性. 该方法采用HOG特征[26], 但这种人工设计的特征不能保证对物体检测有很好的鉴别力. Girshick等[25]使用卷积神经网络的特征代替HOG这种人工设计的特征, 应用于可形变的组件模型DPM, 该方法被称为DP-DPM (Deep pyramid DPM). 由于可形变的组件模型本身的复杂性, 不能很好嵌入卷积神经网络中, DP-DPM采用截断训练的方式, 使用AlexNet前5层网络得到具有强鉴别力的特征, 然后把这些特征输入DPM中进行训练. DP-DPM与传统DPM模型相比平均精度mAP有着大幅提升, 与R-CNN相比mAP相近, 速度却明显快于R-CNN.

    已有视觉目标识别方法通常依赖于含有大量标注图像的训练数据, 基于包围盒的图像标注方法通常代价昂贵并且具有主观性. 近来, 提出了仅依赖于图像级类别标注的弱监督卷积神经网络[31]. 该方法研究了CNN是否能够从仅标注目标信息而不标注目标位置的混杂图像场景中, 学习得到目标的定位模型. 该方法对全监督网络结构进行了改进, 构造了基于图像级别标注数据构造端对端的弱监督卷积神经网络结构. 该网络的特点是: 在输出端增加全局最大池化层来搜索最高得分的目标位置; 设计了对图像中多个目标建模的损失函数. 基于PASCAL VOC2012和MS COCO数据的大量实验表明该弱监督网络具有以下优点: 1)能够输出精确的图像类别标记; 2)能够预测目标的近似位置; 3)与基于目标包围盒标注训练的方法相比可得到相近的结果.

    对预处理部分进行了改进, 采用新的网络结构[10, 24, 29]、训练策略、提出有形变约束的池化层[32]等改进方法. 在物体检测问题中, R-CNN等算法依赖于额外的候选区域检测过程. 在SPP-net[10]与Fast R-CNN[24]中, 虽然候选区域检测的计算是一个瓶颈问题, 通过共享整张图像的卷积层特征图, 物体检测时间已明显缩减. 在Fast R-CNN的基础上, Ren等[29]提出了候选框网络(Region proposal network, RPN), 可以用于实时目标检测. 王晓刚等[33]研究了如何不依赖于人工设计特征和滑动窗口来提取感兴趣的目标, 该方法同时求解了两个任务: 在图像中对感兴趣的目标快速定位; 基于定位的快速目标分割. 该方法提出一种联合学习框架, 在该框架下每一个任务由一个多层卷积神经网络进行求解, 两个网络合作来增强性能. 此外, Yan等[34]提出了面向视觉识别的层次深度卷积神经网络. 将卷积神经网络嵌入到一个两层分类结构中: 粗分类器和精细分类器. 首先得到基于部件的预训练, 然后由多项式Logistic损失正则项进行全局调优. 可选性精细分类器以及卷积神经网络参数的缩减使得层次深度卷积神经网络对于大规模视觉识别可伸缩. 实验设计了两层次的深度卷积神经网络, 得到了较高的识别率. Liu等[35]提出了稀疏卷积神经网络, 解决了卷积神经网络中需要大量的参数计算、计算复杂度高的问题; 通过使用稀疏分解, 有效地缩减参数冗余. 在ILSVRC2012数据进行实验, 缩减了90%参数, 仅仅损失1%的准确性.

    随着待处理图像数据规模和场景复杂程度的增加, 卷积神经网络可以演化出各种图像理解模型. 如面向局部对应点匹配的模型3DMatch[36] (局部小规模数据), 面向物体检测的模型Deep sliding shapes[37](物体级别中等规模数据), 和面向复杂场景理解的新颖计算模型DeepContext[38] (场景级别大规模数据)等.

    此外, 许多工作将卷积神经网络应用在与图像分类和物体检测目标相近的新问题或应用上, 如细粒度识别[39]、图像属性检测、实例检索、医学影像检测[40], 并且取得了良好的效果, 卷积神经网络已成为许多视觉识别问题的首选.

    已有的卷积神经网络在图像分类和物体检测领域取得一定的进展, 但仍面临许多的挑战: 1) 不断加深的深层神经网络保证了图像分类和物体检测的精度, 但也带来了巨大的计算压力, 如何快速精确地解决问题是一个不小的挑战; 2) 在对于多物体相互交叉或相互遮挡时, 大多数方法都不能很好地处理; 3) 运动模糊也会降低图像分类和物体检测的精度.

    人脸识别是指对输入图像的身份进行分类, 人脸验证是指区分一对图像是否属于同一身份(可转化为一个二分类问题). 代表性的人脸识别方法包含Eigenface、Fisherface等子空间分析法[41], 通过比较人脸图像在低维空间的投影进行识别. 基于卷积神经网络的人脸识别方法使用了多层非线性特征变换进行识别, 通常可取得明显优于传统方法的实验结果[33].

    DeepID是一种用于人脸辨识的深度学习提取高层特征方法[42], 将深度卷积网络最后隐层神经元的输出作为DeepID特征. 在训练中区分10000个类别的人脸并缩减特征抽取层的神经元数量, 深度卷积网络将由一小部分隐层神经元逐步形成顶层辨识相关特征. DeepID在LFW数据上可得到97.45%的识别率. 传统人脸识别分为4步: 人脸检测、配准、表示、分类;在DeepFace[43] 中, 配准和表示采用三维人脸模型用分段仿射变换得到, 分类器采用了一个9层神经网络. 该方法在包含4000类的人脸图像数据库上进行训练, 在LFW数据得到97.35%准确率, 在YouTube人脸数据(YTF)上能够缩减50%错误率. 人脸识别的关键是提出有效的特征来缩减同一人的差异并增大不同人之间差异, 将人脸识别和人脸验证信号作为监督, 由设计的深度卷积网络可以学习到深度识别--验证特征(DeepID2)[44]. 由于学习到的DeepID2特征对于不同的身份具有差异而对同一身份一致, 使得人脸识别更加容易. 由学习得到的特征表示以及人脸识别模型, 在LFW数据上达到了最高99.15%的人脸识别准确性.

    尽管基于卷积神经网络的人脸识别方法在LFW等测试数据上得到了较高的识别率, 但是与基于传统方法的人脸识别方法类似, 基于CNN 的人脸识别方法仍存在许多挑战性的问题, 如面部特征点定位、人脸、姿态等对人脸识别效果的影响, 都是需要深入研究的问题[45].

    场景的语义分割是指对于一幅图像中的每一个像素给出其所属于的场景类别[46-48], 场景深度恢复是基于彩色或灰度图像恢复每个像素对应深度值的问题, 两者实质都是对输入图像的每个像素进行分类或回归, 已有方法集中在如何同时考虑单个像素的预测以及场景蕴含的上下文约束.

    场景语义分割的参数化方法通常学习不同标注区域的外观(Appearance)和结构关系(Structural relationship)[49-52], 这些方法扩展性往往不够好, 对新数据需要重新训练[53]. 场景语义分割的非参数化方法通常学习测试数据和训练数据间的差异模型, 将训练数据的语义标注转化为测试数据的预测[54-56], 逐个像素(Per-pixel)或者超像素(Superpixel)分割, 使得最终结果依赖于超像素分割和假设的结果.

    Farabet等[46]使用多尺度的卷积神经网络对输入图像进行特征提取, 并结合超像素划分和条件随机场(Conditional random fields, CRF), 得到像素语义的类别. 这种方法减小了对人工设计特征的需求, 生成对于纹理、形状、上下文信息的有效表示. Pinheiro等[57]将场景分割与目标检测相结合, 联合训练两个目标. Mohan[58]在卷积神经网络中加入了反卷积层, 从而实现了一种端对端的场景语义分割方法, 但是需要固定大小的输入. Long等[59]在此基础上提出一种端对端的全卷积神经网络FCN (Fully convolutional networks), 将全连接层变为核大小为1 的全卷积层, 使得FCN可以接受任意大小的输入. 该网络使用了池化--反卷积结构来保证输出图像和输入图像具有相同的大小, 通过融合低层特征和高层特征得到具有更多细节的分割结果. Zheng等[60] 将条件随机场转变成为一种递归神经网络(Recurrent neural networks, RNN) 网络层, 连接在FCN 之后, 对FCN 的结果进行平滑和优化, 得到细节更具体更平滑的分割效果.

    Liu等[53]研究了一种半参数化人体服饰分割方法. 该方法不需要对数据进行预处理, 而且对新的标注数据(如新类别数据)具有良好的扩展性. 在基于K近邻的非参数方法框架下, 参数化的匹配卷积神经网络(Matching convolutional neural network, MCNN)根据K近邻图像标注的语义区域, 在测试图像上能够找到最佳匹配区域, 并预测出匹配的置信度和位置偏移. 具体来说, 提取出输入图像中的人体区域, 使用K近邻方法从训练库里找出K个近邻, 得到K个图像对, 每个图像对使用卷积神经网络学习两者之间的相似性和位置偏差, 融合所有的结果得到最终的划分结果. 最后采用超像素间平滑性等方法对划分结果进行平滑处理.

    Eigen等[61]提出基于单幅图像的深度图和法向图恢复以及场景语义分割的CNN网络. 该网络由三部分构成: 第一部分网络提取图像特征, 第二部分网络得到低分辨率的预测结果, 第三部分网络得到高分辨率的预测结果, 第一部分和第二部分网络的结果经过上采样并结合卷积后的原始图像输入至第三部分网络. 对于深度图和法向图恢复任务, 同时恢复深度图和法向图的效果优于分别恢复这两个任务, 完成对深度图和法向图的预测后, 输入原始图像、深度图和法向图即可进行语义分割. 对于语义分割, 基于多通道输入(彩色图像、深度图和法向图)的预测结果优于基于单通道(彩色图像)输入得到的结果.

    Liu等[62]研究了将CNN和条件随机场CRF结合起来从单目图像预测深度的方法. 网络前面几层网络用CNN提取特征, 然后用条件随机场计算网络的损失并反馈至前面几层网络. 将输入图像划分为超像素, 以每个超像素为中心的一个图像块作为CNN的输入, 得到预测的深度. 每组相邻的超像素对$(S_p, S_q)$计算K个相似度度量$(S_{pq1}, S_{pq2}, \cdots, S_{pqk})$, 将这些相似度度量输入一个全连接层得到相似度值$R_{pq}$; 将所有超像素预测的深度值和所有的超像素对的相似度值$R_{pq}$输入CRF损失层计算网络损失, 该损失函数的优化可直接使用反向传播方法求解.

    已有的卷积神经网络已经能在一定程度上解决图像语义分割和深度恢复的问题, 为了得到更加精细和准确的结果, 需要根据特定的问题设计出能够更好满足上下文约束的网络结构.

    本节主要介绍使用卷积神经网络从图像中估计人体关节位置的方法. 基于人体关节点位置, 可以较为容易地恢复人体姿态信息. 已有方法通常使用关节的空间位置约束、上下文约束来减少不合理的关节位置识别结果.

    Tompson等[63]直接从深度图像学习人手关节位置进而重建模型(网络结构见图 3), 将卷积神经网络应用于人手关节检测问题. 该方法提出了一个针对人手等链状物体的实时连续姿态估计系统, 通过可端对端训练的卷积神经网络得到人手关节点的二维位置, 然后结合原始的深度图像重构人手姿态. 该方法分为三个阶段: 随机森林分类器分割出人手区域; 卷积神经网络学习关节点位置; 使用逆向运动学(Inverse kinematic, IK)方法进行姿态恢复. Jain等[64]在Tompson等方法[63] 的基础上加入关节位置的空间约束, 提出一种新的人体姿态估计方法. 该方法结合了底层特征和高层弱结构模型, 由卷积神经网络来找出图像中身体关节的位置, 并加上身体各个部位的位置关系约束, 构成了一个对身体姿态的描述. 训练多个卷积神经网络, 每个卷积神经网络输出关节位置的空间分布概率图. 采用滑动窗口方法, 将图像输入卷积神经网络可得到各个关节的空间概率分布, 然后结合身体多个关节的位置约束优化关节位置, 该方法可减少不合理的关节位置. Oberweger等[65]对比了不同层数和结构的卷积神经网络对关节位置的识别效果, 在多尺度卷积神经网络、深的卷积神经网络、浅的卷积神经网络中加上三维姿态的先验信息, 可以显著提升关节位置识别效果. 该方法还通过加入关节点的上下文信息迭 代优化关节点的位置, 能使得关节估计结果更准确. 这类方法的主要挑战在于如何解决人体肢体自遮挡导致的关节检测误差以及如何提高检测精度.

    图 3  基于卷积神经网络的关节检测方法[63]
    Fig. 3  Hand joint detection with convolutional neural networks[63]

    本文阐述了卷积神经网络在图像理解, 特别是图像分类、物体检测、人脸识别、语义图像分割等领域的研究进展与典型应用. 图像理解也推动了卷积神经网络在网络结构、训练方法等方面的完善. 卷积神经网络虽然在一些数据上, 如ImageNet上取得了成功, 但是如何针对实际特定问题、特定图像训练库设计更有效的网络结构, 融合问题先验信息、从理论和应用上评估网络性能等都是需要深入研究的问题. 我们觉得可能的研究方向有:

    1) 卷积神经网络将卷积、池化与神经网络结合, 有效地利用了图像的结构信息. 进一步, 如何有效利用领域知识, 改进网络结构来获取视觉上的不变性值得引起关注;

    2) 在理论上, 如何在算法中利用深度模型的选择性、稀疏性, 如何设计算法保证收敛性;

    3) 目前, GoogLeNet, VGG的网络结构已超过20层, 如何针对更大规模数据、更深结构网络设计高效的数值优化、并行计算方法和平台.

    随着理论和应用的深入研究, 卷积神经网络在图像理解中将会得到更好的应用.

    致谢: 感谢张寅达博士、白延成博士、王文中博士的帮助和讨论, 感谢审稿人的宝贵意见以及NVIDIA提供的Hardware Grant Program.
  • 图  1  卷积神经网络示例

    Fig.  1  Illustration of convolutional neural networks

    图  2  AlexNet卷积神经网络结构示意图[8]

    Fig.  2  Network architecture of AlexNet convolutional neural networks[8]

    图  3  基于卷积神经网络的关节检测方法[63]

    Fig.  3  Hand joint detection with convolutional neural networks[63]

    表  1  ImageNet竞赛历年来图像分类任务的部分领先结果

    Table  1  Representative top ranked results in image classification task of "ImageNet Large Scale Visual Recognition Challenge"

    公布时间 机构 Top-5错误率
    2015.12.10 MSRA 3.57[15]
    2014.8.18 Google 6.66[11]
    2014.8.18 Oxford 7.33[12]
    2013.11.14 NYU 11.7
    2012.10.13 U.Toronto 16.4[8]
    下载: 导出CSV

    表  2  部分具有代表性的图像分类和物体检测模型对比

    Table  2  Comparison of representative image classification and object detection models

    方法 输入 优点 缺点
    AlexNet[8] 整张图像(需要对图像放缩到固定大小) 网络简单易于训练, 对图像分类有较强的鉴别力 网络输入图像要求固定大小, 容易破环物体的纵横比和上下文信息
    GoogLeNet[11] 整张图像(需要对图像放缩到固定大小) 对图像分类拥有非常强的鉴别力, 参数相对AlexNet较少 网络复杂, 对样本数量要求较高, 训练耗时
    VGG[12] 整张图像(需要对图像放缩到固定大小) 对图像分类拥有非常强的鉴别力 网络复杂, 对样本数量要求较高, 训练耗时, 需要多次对网络参数的微调
    DPM[23] 整张图像 对物体检测拥有较强的鉴别力, 对形变和遮挡具有一定的处理能力 使用人工设计的HOG特征[26]; 对物体检测的精度通常比本表中其他的CNN网络低
    R-CNN[9] 图像区域 对物体检测拥有很强的鉴别力; 比在图像金字塔上逐层滑动窗口的物体检测方法效率高;使用包围盒回归(Bounding box regression)提高物体的定位精度 依赖于区域选择算法; 网络输入图像要求固定大小, 容易破环物体的纵横比和上下文信息; 训练是多阶段过程:在特定检测数据集上对网络参数进行微调、提取特征、训练SVM (Sup-port vector machine)分类器、包围盒回归(Bounding box regression);训练时间耗时、耗存储空间
    SPP-net[10] 整张图像(不要求固定大小) 对物体检测拥有很强的鉴别力, 输入图像可以任意大小, 可保证图像的比例信息训练速度比R-CNN快3倍左右, 测试比R-CNN快10~100倍 网络结构复杂时, 池化对图像造成一定的信息丢失; SPP层前的卷积层不能进行网络参数更新[24]; 训练是多阶段过程:在特定检测数据集上对网络参数进行微调、提取特征、训练SVM分类器、包围盒回归; 训练时间耗时、耗存储空间
    Fast R-CNN[24] 整张图像(不要求固定大小) 训练和测试都明显快于SPP-net (除了候选区域提取以外的环节接近于实时), 对物体检测拥有很强的鉴别力, 输入图像可以任意大小, 保证图像比例信息, 同时进行分类与定位 依赖于候选区域选择, 它仍是计算瓶颈
    Faster R-CNN[29] 整张图像(不要求固定大小) 比Fast R-CNN更加快速, 对物体检测拥有很强的鉴别力; 不依赖于区域选择算法; 输入图像可以任意大小, 保证图像比例信息, 同时进行区域选择算法、分类与定位 训练过程较复杂; 计算流程仍有较大优化空间; 难以解决被遮挡物体的识别问题
    下载: 导出CSV
  • [1] Rumelhart D E, Hinton G E, Williams R J. Learning representations by back-propagating errors. Nature, 1986, 323(6088): 533-536 doi: 10.1038/323533a0
    [2] Vapnik V N. Statistical Learning Theory. New York: Wiley, 1998.
    [3] 王晓刚. 图像识别中的深度学习. 中国计算机学会通讯, 2015, 11(8): 15-23

    Wang Xiao-Gang. Deep learning in image recognition. Communications of the CCF, 2015, 11(8): 15-23
    [4] Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks. Science, 2006, 313(5786): 504-507 doi: 10.1126/science.1127647
    [5] Deng J, Dong W, Socher R, Li L J, Li K, Li F F. ImageNet: a large-scale hierarchical image database. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition. Miami, FL: IEEE, 2009. 248-255
    [6] LeCun Y, Boser B, Denker J S, Henderson D, Howard R E, Hubbard W, Jackel L D. Backpropagation applied to handwritten zip code recognition. Neural Computation, 1989, 1(4): 541-51 doi: 10.1162/neco.1989.1.4.541
    [7] LeCun Y, Bottou L, Bengio Y, Haffner P. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 1998, 86(11): 2278-2324 doi: 10.1109/5.726791
    [8] Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks. In: Proceedings of Advances in Neural Information Processing Systems 25. Lake Tahoe, Nevada, USA: Curran Associates, Inc., 2012. 1097-1105
    [9] Girshick R, Donahue J, Darrell T, Malik J. Rich feature hierarchies for accurate object detection and semantic segmentation. In: Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, USA: IEEE, 2014. 580-587
    [10] He K M, Zhang X Y, Ren S Q, Sun J. Spatial pyramid pooling in deep convolutional networks for visual recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(9):1904-1916 doi: 10.1109/TPAMI.2015.2389824
    [11] Szegedy C, Liu W, Jia Y Q, Sermanet P, Reed S, Anguelov D, Erhan D, Vanhoucke V, Rabinovich A. Going deeper with convolutions. In: Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston, MA: IEEE, 2015. 1-9
    [12] Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition [Online], available: http://arxiv.org/abs/1409.1556, May 16, 2016
    [13] Forsyth D A, Ponce J. Computer Vision: A Modern Approach (2nd Edition). Boston: Pearson Education, 2012.
    [14] 章毓晋. 图像工程(下册): III-图像理解. 第3版. 北京: 清华大学出版社, 2012.

    Zhang Yu-Jin. Image Engineering (Part 2): III-Image Understanding (3rd Edition). Beijing: Tsinghua University Press, 2012.
    [15] He K M, Zhang X Y, Ren S Q, Sun J. Deep residual learning for image recognition [Online], available: http://arxiv.org/abs/1512.03385, May 3, 2016
    [16] LeCun Y, Bottou L, Bengio Y, Haffner P. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 1998, 86(11): 2278-324 doi: 10.1109/5.726791
    [17] Bouvrie J. Notes On Convolutional Neural Networks, MIT CBCL Tech Report, Cambridge, MA, 2006.
    [18] Duda R O, Hart P E, Stork DG [著], 李宏东, 姚天翔 [译]. 模式分类. 北京: 机械工业出版社, 2003.

    Duda R O, Hart P E, Stork D G [Author], Li Hong-Dong, Yao Tian-Xiang [Translator]. Pattern Classification. Beijing: China Machine Press, 2003.
    [19] Lin M, Chen Q, Yan S C. Network in network. In: Proceedings of the 2014 International Conference on Learning Representations. Banff, Canada: Computational and Biological Learning Society, 2014.
    [20] Zeiler M D, Fergus R. Stochastic pooling for regularization of deep convolutional neural networks [Online], available: http://arxiv.org/abs/1301.3557, May 16, 2016
    [21] Maas A L, Hannun A Y, Ng A Y. Rectifier nonlinearities improve neural network acoustic models. In: Proceedings of ICML Workshop on Deep Learning for Audio, Speech, and Language Processing. Atlanta, USA: IMLS, 2013.
    [22] Ioffe S, Szegedy C. Batch normalization: accelerating deep network training by reducing internal covariate shift. In: Proceedings of the 32nd International Conference on Machine Learning. Lille, France: IMLS, 2015. 448-456
    [23] Felzenszwalb P, McAllester D, Ramanan D. A discriminatively trained, multiscale, deformable part model. In: Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition. Anchorage, USA: IEEE, 2008. 1-8
    [24] Girshick R. Fast R-CNN. In: Proceedings of the 2015 IEEE International Conference on Computer Vision. Santiago, Chile: IEEE, 2015. 1440-1448
    [25] Girshick R, Iandola F, Darrell T, Malik J. Deformable part models are convolutional neural networks. In: Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston, MA: IEEE, 2015. 437-446
    [26] Dalal N, Triggs B. Histograms of oriented gradients for human detection. In: Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Diego, CA, USA: IEEE, 2005. 886-893
    [27] Sermanet P, Eigen D, Zhang X, Mathieu M, Fergus R, LeCun Y. Overfeat: integrated recognition, localization and detection using convolutional networks [Online], available: http://arxiv.org/abs/1312.6229, May 16, 2016
    [28] Uijlings J R R, van de Sande K E A, Gevers T, Smeulders A W M. Selective search for object recognition. International Journal of Computer Vision, 2013, 104(2): 154-171 doi: 10.1007/s11263-013-0620-5
    [29] Ren S, He K, Girshick R, Sun J. Faster R-CNN: towards real-time object detection with region proposal networks. In: Proceedings of Advances in Neural Information Processing Systems 28. Montréal, Canada: MIT, 2015. 91-99
    [30] Zeiler M D, Fergus R. Visualizing and understanding convolutional networks. In: Proceedings of the 13th European Conference on Computer Vision. Zurich, Switzerland: Springer, 2014. 818-833
    [31] Oquab M, Bottou L, Laptev I, Sivic J. Is object localization for free?-weakly-supervised learning with convolutional neural networks. In: Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston, USA: IEEE, 2015. 685-694
    [32] Ouyang W L, Wang X G, Zeng X Y, Qiu S, Luo P, Tian Y L, Li H S, Yang S, Wang Z, Loy C C, Tang X O. Deepid-net: deformable deep convolutional neural networks for object detection. In: Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston, USA: IEEE, 2015. 2403-2412
    [33] 王晓刚, 孙袆, 汤晓鸥. 从统一子空间分析到联合深度学习: 人脸识别的十年历程. 中国计算机学会通讯, 2015, 11(4): 8-14

    Wang Xiao-Gang, Sun Yi, Tang Xiao-Ou. From unified subspace analysis to joint deep learning: progress of face recognition in the last decade. Communications of the CCF, 2015, 11(4): 8-14
    [34] Yan Z C, Zhang H, Piramuthu R, Jagadeesh V, DeCoste D, Di W, Yu Y Z. HD-CNN: hierarchical deep convolutional neural networks for large scale visual recognition. In: Proceedings of the 2015 IEEE International Conference on Computer Vision. Boston, USA: IEEE, 2015. 2740-2748
    [35] Liu B Y, Wang M, Foroosh H, Tappen M, Pensky M. Sparse convolutional neural networks. In: Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston, USA: IEEE, 2015. 806-814
    [36] Zeng A, Song S, Nießner M, Fisher M, Xiao J. 3DMatch: learning the matching of local 3D geometry in range scans [Online], available: http://arxiv.org/abs/1603.08182, August 11, 2016
    [37] Song S, Xiao J. Deep sliding shapes for amodal 3D object detection in RGB-D images. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA: IEEE, 2016. 685-694
    [38] Zhang Y, Bai M, Kohli P, Izadi S, Xiao J. DeepContext: context-encoding neural pathways for 3D holistic scene understanding [Online], available: http://arxiv.org/abs/1603.04922, August 11, 2016
    [39] Zhang N, Donahue J, Girshick R, Darrell T. Part-based R-CNNs for fine-grained category detection. In: Proceedings of the 13th European Conference on Computer Vision. Zurich, Switzerland: Springer, 2014. 834-849
    [40] Shin H C, Roth H R, Gao M C, Lu L, Xu Z Y, Nogues I, Yao J H, Mollura D, Summers R M. Deep convolutional neural networks for computer-aided detection: CNN architectures, dataset characteristics and transfer learning. IEEE Transactions on Medical Imaging, 2016, 35(5): 1285-1298 doi: 10.1109/TMI.2016.2528162
    [41] Belhumeur P N, Hespanha J P, Kriegman D J. Eigenfaces vs. fisherfaces: recognition using class specific linear projection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(7): 711-720 doi: 10.1109/34.598228
    [42] Sun Y, Wang X G, Tang X O. Deep learning face representation from predicting 10, 000 classes. In: Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, USA: IEEE, 2014. 1891-1898
    [43] Taigman Y, Yang M, Ranzato M A, Wolf L. Deepface: closing the gap to human-level performance in face verification. In: Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, USA: IEEE, 2014. 1701-1708
    [44] Sun Y, Wang Y H, Wang X G, Tang X O. Deep learning face representation by joint identification-verification. In: Proceedings of Advances in Neural Information Processing Systems 27. Montreal, Canada: Curran Associates, Inc., 2014. 1988-1996
    [45] 山世光, 阚美娜, 李绍欣, 张杰, 陈熙霖. 深度学习在人脸分析与识别中的应用. 中国计算机学会通讯, 2015, 11(4): 15-21

    Shan Shi-Guang, Kan Mei-Na, Li Shao-Xin, Zhang Jie, Chen Xi-Lin. Face image analysis and recognition with deep learning. Communications of the CCF, 2015, 11(4): 15-21
    [46] Farabet C, Couprie C, Najman L, LeCun Y. Learning hierarchical features for scene labeling. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(8): 1915-29 doi: 10.1109/TPAMI.2012.231
    [47] 余淼, 胡占义. 高阶马尔科夫随机场及其在场景理解中的应用. 自动化学报, 2015, 41(7): 1213-1234 http://www.aas.net.cn/CN/abstract/abstract18696.shtml

    Yu Miao, Hu Zhan-Yi. Higher-order Markov random fields and their applications in scene understanding. Acta Automatica Sinica, 2015, 41(7): 1213-1234 http://www.aas.net.cn/CN/abstract/abstract18696.shtml
    [48] 郭平, 尹乾, 周秀玲. 图像语义分析. 北京: 科学出版社, 2015.

    Guo Ping, Qian Yin, Zhou Xiu-Ling. Image semantic analysis. Beijing: Science Press, 2015.
    [49] Yamaguchi K, Kiapour M H, Ortiz L E, Berg T L. Parsing clothing in fashion photographs. In: Proceedings of the 2012 IEEE Conference on Computer Vision and Pattern Recognition. Providence, RI: IEEE, 2012. 3570-3577
    [50] Liu S, Feng J S, Domokos C, Xu H, Huang J S, Hu Z Z, Yan S C. Fashion parsing with weak color-category labels. IEEE Transactions on Multimedia, 2014, 16(1): 253-265 doi: 10.1109/TMM.2013.2285526
    [51] Dong J, Chen Q, Shen X H, Yang J C, Yan S C. Towards unified human parsing and pose estimation. In: Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, OH: IEEE, 2014. 843-850
    [52] Dong J, Chen Q, Xia W, Huang Z Y, Yan S C. A deformable mixture parsing model with parselets. In: Proceedings of the 2013 IEEE International Conference on Computer Vision. Sydney, Australia: IEEE, 2013. 3408-3415
    [53] Liu S, Liang X D, Liu L Q, Shen X H, Yang J C, Xu C S, Lin L, Cao X C, Yan S C. Matching-CNN meets KNN: quasi-parametric human parsing. In: Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston, MA: IEEE, 2015. 1419-1427
    [54] Yamaguchi K, Kiapour M H, Berg T L. Paper doll parsing: retrieving similar styles to parse clothing items. In: Proceedings of the 2013 IEEE International Conference on Computer Vision. Sydney, Australia: IEEE, 2013. 3519-3526
    [55] Liu C, Yuen J, Torralba A. Nonparametric scene parsing via label transfer. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(12): 2368-2382 doi: 10.1109/TPAMI.2011.131
    [56] Tung F, Little J J. CollageParsing: nonparametric scene parsing by adaptive overlapping windows. In: Proceedings of the 13th European Conference on Computer Vision. Zurich, Switzerland: Springer, 2014. 511-525
    [57] Pinheiro P O, Collobert R, Dollar P. Learning to segment object candidates. In: Proceedings of Advances in Neural Information Processing Systems 28. Montréal, Canada: Curran Associates, Inc., 2015. 1981-1989
    [58] Mohan R. Deep deconvolutional networks for scene parsing [Online], available: http://arxiv.org/abs/1411.4101, May 3, 2016
    [59] Long J, Shelhamer E, Darrell T. Fully convolutional networks for semantic segmentation. In: Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston, MA: IEEE, 2015. 3431-3440
    [60] Zheng S, Jayasumana S, Romera-Paredes B, Vineet V, Su Z Z, Du D L, Huang C, Torr P H S. Conditional random fields as recurrent neural networks. In: Proceedings of the 2015 IEEE International Conference on Computer Vision. Santiago, Chile: IEEE, 2015. 1529-1537
    [61] Eigen D, Fergus R. Predicting depth, surface normals and semantic labels with a common multi-scale convolutional architecture. In: Proceedings of the 2015 IEEE International Conference on Computer Vision. Santiago, Chile: IEEE, 2015. 2650-2658
    [62] Liu F Y, Shen C H, Lin G S. Deep convolutional neural fields for depth estimation from a single image. In: Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston, MA: IEEE, 2015. 5162-5170
    [63] Tompson J, Stein M, Lecun Y, Perlin K. Real-time continuous pose recovery of human hands using convolutional networks. ACM Transactions on Graphics (TOG), 2014, 33(5): Article No.169 http://cn.bing.com/academic/profile?id=2075156252&encoded=0&v=paper_preview&mkt=zh-cn
    [64] Jain A, Tompson J, Andriluka M, Taylor G W, Bregler C. Learning human pose estimation features with convolutional networks. In: Proceedings of the 2014 International Conference on Learning Representations. Banff, Canada: Computational and Biological Learning Society, 2014. 1-14
    [65] Oberweger M, Wohlhart P, Lepetit V. Hands deep in deep learning for hand pose estimation. In: Proceedings of the 20th Computer Vision Winter Workshop (CVWW). Seggau, Austria, 2015. 21-30
  • 期刊类型引用(427)

    1. Ri Zhao,Li?Ye Liu,Xin Liu,Zhao?Xing Liu,Run?Cheng Liang,Ren?Jing Ling?Hu,Jing Zhang,Fa?Guo Chen. Continuum estimation in low?resolution gamma?ray spectra based on deep learning. Nuclear Science and Techniques. 2025(02): 29-41 . 必应学术
    2. Wanqiong Wang,Jie Wang,Xinchen Ye,Yazhou Zhang,Jia Li,Xu Du,Wenna Cai,Han Wu,Ting Zhang,Yuyue Jiao. Application of AI technology in pulsar candidate identification. Astronomical Techniques and Instruments. 2025(01): 27-43 . 必应学术
    3. 舒展,秦亚洲. 基于图神经网络的基坑内支撑布置自动化设计与适配性分析. 上海大学学报(自然科学版). 2025(01): 171-181 . 百度学术
    4. 方春华,周固,邵斌,胡冻三,夏荣,欧阳本红,普子恒. 高压电缆终端铅封缺陷超声图像卷积神经网络识别. 应用声学. 2025(01): 80-87 . 百度学术
    5. 何银,何宇,聂祥论. 基于CWT-CNN-LSTM的配电网单相接地故障选线方法分析. 集成电路应用. 2024(01): 418-421 . 百度学术
    6. 唐文娟,戴群. 红外图像去雾领域研究方法综述. 红外与激光工程. 2024(02): 214-224 . 百度学术
    7. 柴子怡. 基于计算机视觉的钢构件尺寸测量应用研究. 建筑施工. 2024(02): 186-189 . 百度学术
    8. 潘美莲,陈洁. 深度学习算法的图像识别技术在电子元件分拣中的应用. 电脑编程技巧与维护. 2024(02): 140-142+169 . 百度学术
    9. 刘彦虹,刘合兵,尚俊平. 基于深度学习的农产品期货价格预测研究. 河南科学. 2024(03): 430-439 . 百度学术
    10. 郭海涛,汤健,丁海旭,乔俊飞. 基于混合数据增强的MSWI过程燃烧状态识别. 自动化学报. 2024(03): 560-575 . 本站查看
    11. 李晨睿,赖雨诗,吴燕杰,夏召强. 基于最优尺度的遥感影像土地覆盖分类仿真. 计算机仿真. 2024(04): 187-192+511 . 百度学术
    12. 覃琼花,张春燕,徐百宁. 基于深度学习的微信小程序图像识别系统. 信息与电脑(理论版). 2024(01): 73-75 . 百度学术
    13. 田娟,方国强,何星庭,谢银海. 基于网络安全态势感知的四川气象信息网络检测防御技术研究. 成都信息工程大学学报. 2024(02): 178-182 . 百度学术
    14. 王盼孺,杨学志,刘雪南,李龙伟,王定良. 基于权重优化卷积神经网络的非接触心率检测. 合肥工业大学学报(自然科学版). 2024(04): 479-487 . 百度学术
    15. 何逢广,李朝阳,张华赢,艾磊,胡海涛. 基于实测数据的牵引供电系统并联谐波谐振概率识别方法. 电网技术. 2024(05): 2084-2094 . 百度学术
    16. 王睿,裴瑶瑶. 基于卷积神经网络的噪声抑制算法优化. 电声技术. 2024(04): 28-30 . 百度学术
    17. 何志亚,刘闯,武官府,刘云贵,马建强. 基于HP-EMD数据分解与CNN-LSTM深度学习的蔬菜价格预测模型. 上海农业学报. 2024(02): 109-117 . 百度学术
    18. 郭建政,童成彪. 基于深度卷积神经网络的单向阀泄漏模式识别. 湖南农业大学学报(自然科学版). 2024(02): 100-104+126 . 百度学术
    19. 姚志成,张冠华,王海洋,杨剑,范志良. 干扰背景下基于改进AlexNet的无人机信号识别方法. 电光与控制. 2024(06): 14-18+80 . 百度学术
    20. 韩煦,姜强,杨宏伟,俞荣君,祁琳. TOPAZ-2型热离子反应堆电源中子物理代理模型开发. 电子技术应用. 2024(S1): 212-215 . 百度学术
    21. 杨波. 基于卷积神经网络的实时语音分割优化研究. 电声技术. 2024(05): 46-48 . 百度学术
    22. 黄炜,罗谢飞. 基于MFCC与CNN的机械故障声音自动识别. 电声技术. 2024(06): 129-131 . 百度学术
    23. 祝传振,王璇,郑强. 基于元素分离与整体注意力的图卷积网络框架. 计算机研究与发展. 2024(08): 2008-2019 . 百度学术
    24. 周锐,刘海军,邢丽莉,崔春杰,王高远. 基于卷积神经网络的儿童自闭症面部特征分类. 电脑与电信. 2024(05): 38-41 . 百度学术
    25. 崔明勇,董文韬,卢志刚. 基于密度聚类模态分解的卷积神经网络和长短期记忆网络短期风电功率预测. 现代电力. 2024(04): 631-641 . 百度学术
    26. 王善杰. 基于对比学习及背景挖掘的少样本语义分割. 计算机系统应用. 2024(09): 261-268 . 百度学术
    27. 文思佳,张栋,赵伟强,孙瑞,尚佳童,雷涛. 融合CNN-Transformer的医学图像分割网络. 计算机与数字工程. 2024(08): 2452-2456 . 百度学术
    28. 张益. 基于卷积神经网络算法的海水循环冷却污损生物分类模型. 工业水处理. 2024(12): 160-165 . 百度学术
    29. 王守军,汪新凯,王炜,王月恒,陈树雷,林枫,王晶,李志国. 海关旅检“人”“物”准确关联及拦截监督体系研究. 中国口岸科学技术. 2024(12): 83-89 . 百度学术
    30. 陈振江,张垒,杜志峰,陈立新,李建华,张喆. 基于视频分析的煤矿钻孔深度估计方法. 煤矿机械. 2023(01): 145-148 . 百度学术
    31. 张鹏程,吐松江·卡日,伊力哈木·亚尔买买提,刘萍,邸强,李振恩. 基于YOLOv5与改进VGG-CTC的数字仪表自动读数方法. 现代电子技术. 2023(02): 107-112 . 百度学术
    32. 孙昊,郑建明. 卷积神经网络在矿石识别中的应用. 福建电脑. 2023(01): 31-34 . 百度学术
    33. 郭锋,柳骏,王裘潇,徐海,万广雷. 一种低功耗的电网巡检故障图像识别方法. 沈阳工业大学学报. 2023(01): 6-11 . 百度学术
    34. 丛眸,张平,王宁. 改进YOLOv3算法及其在航拍图像车辆检测中的应用. 计算机应用与软件. 2023(01): 228-233 . 百度学术
    35. 刘思恒,李佳,杨武晨,赵锣,彭贤贵. 人工智能识别骨髓细胞可应用于诊断急性白血病微小残留病. 中华检验医学杂志. 2023(03): 280-285 . 百度学术
    36. 林旭梅,胡川,朱广辉,陈一戈,苗芳荣. 一种改进ADAM-CNN模型的钢筋混凝土腐蚀检测方法. 中国测试. 2023(02): 8-14 . 百度学术
    37. 周进祥,李志伟,邱火旺,任远红,周武能. 基于图网络的改进卷积单幅图像去雨算法. 激光与光电子学进展. 2023(04): 222-228 . 百度学术
    38. 胡昊,李擎,马鑫,陈军朋,孙爽,徐鹏. 基于影像的道路积水监测研究. 华北水利水电大学学报(自然科学版). 2023(01): 62-70 . 百度学术
    39. 鲁夕瑶,张成彬,皋军,徐燕萍,邵星. 基于卷积神经网络与CatBoost的轴承故障诊断算法. 机电工程. 2023(05): 715-722 . 百度学术
    40. 周凤林,崔璐璐,陶贵鑫. 徐州中心区街道景观、功能与活力关系研究. 中外建筑. 2023(05): 93-98 . 百度学术
    41. 王程远,赵俊莉,计晓斐,李劲华,王常颖. 基于改进的VGG网络的烟柜状态识别模型. 计算机工程与设计. 2023(06): 1796-1803 . 百度学术
    42. 李尚明,洪成雨,姬凤玲,陈伟斌,朱旻. 深基坑的机器视觉监测与变形预测研究. 地下空间与工程学报. 2023(03): 992-1000 . 百度学术
    43. 赵译文,刘云鹏. 基于子空间流形的图像集识别方法. 计算机应用. 2023(S1): 207-211 . 百度学术
    44. 徐冬梅,廖安栋,王文川. 基于VMD-EEMD-CNN-LSTM混合模型的月径流预测. 水利规划与设计. 2023(07): 57-63 . 百度学术
    45. 王德力,黄博凯,闵建彬. 高分子防水卷材面层缺陷识别清洁装置及图像处理技术. 中国建筑防水. 2023(07): 52-54+64 . 百度学术
    46. 欧莉莉,杜芳芳. 基于半监督编码的深度卷积对抗网络模型研究. 软件工程. 2023(08): 53-57 . 百度学术
    47. 张仲杭,蔡超志,徐辉,白金鑫,池耀磊. 基于纹理图像的强抗干扰性轴承故障诊断方法. 轴承. 2023(08): 79-86 . 百度学术
    48. 梁晓智,晋文静,金超. 基于图谱增强和CNN的旋转机械智能故障诊断. 设备管理与维修. 2023(13): 172-177 . 百度学术
    49. 冯奇斌,张新,郑琛,王梓,吕国强. 基于卷积神经网络的双层液晶显示方法. 光子学报. 2023(08): 146-155 . 百度学术
    50. 黄志鸿,肖剑,徐先勇,张辉. 基于谱残差变换的电力设备热缺陷识别技术. 红外技术. 2023(08): 884-889 . 百度学术
    51. 李士刚,李思佳,隋钧铖,宋敏敏. 基于混合深度特征的红外目标抗干扰识别算法. 飞控与探测. 2023(02): 79-86 . 百度学术
    52. 刘立,董先敏,刘娟. 顾及地学特征的遥感影像语义分割模型性能评价方法. 自然资源遥感. 2023(03): 80-87 . 百度学术
    53. 赵佰亭,贾晓芬. 课堂教学效果的深度评估及分析. 电气电子教学学报. 2023(04): 160-165 . 百度学术
    54. 张加春,石金伟,赵兴炳,吴伟斌. 宝光自动观测技术的设计与应用. 高原山地气象研究. 2023(03): 145-150 . 百度学术
    55. 李佳琳,武淑琴,张伟鹏,王美鸥,王佳. 基于机器视觉的套印精度检测方法研究. 北京印刷学院学报. 2023(09): 44-51 . 百度学术
    56. 李康楠,吴雅琴,杜锋,张翔,王乙桥. 基于卷积神经网络的岩爆烈度等级预测. 煤田地质与勘探. 2023(10): 94-103 . 百度学术
    57. 郑晓玲,郑永钊. 基于神经网络的无人机农药喷洒区域智能识别. 黎明职业大学学报. 2023(02): 94-101 . 百度学术
    58. 张倬,汤灏,罗高,彭峥,姚武,凌富,曾渭贤,罗斌,叶于龙. 基于深度学习的自校准雷达测速系统的研究. 计量科学与技术. 2023(10): 8-18+76 . 百度学术
    59. 孙克强,张义伟,沈宝诚. 一种基于深度学习的软管空管异物检测方法. 安徽电子信息职业技术学院学报. 2023(04): 6-9+14 . 百度学术
    60. 李冠霖,胡陈晨,蓝天虹. 基于图像识别技术的无人机巡线系统设计. 信息记录材料. 2023(12): 168-170 . 百度学术
    61. 黎强,陈惠贤. BW-Net:用于视网膜血管图像分割的W-Net扩展框架. 电子测量技术. 2023(21): 23-29 . 百度学术
    62. 刘通,胡亮,王永军,初剑峰. 基于卷积神经网络的卫星遥感图像拼接. 吉林大学学报(理学版). 2022(01): 99-108 . 百度学术
    63. 王艳兵. 深度学习算法在颗粒状农产品品质分选中的应用研究. 兰州文理学院学报(自然科学版). 2022(01): 37-42 . 百度学术
    64. 李百寿,唐瑞鹏,张琼,谢跃辉,张越. 滑坡提取卷积神经网络层深结构与显著性特征. 测绘科学. 2022(01): 154-164 . 百度学术
    65. 侯思祖,郭威,王子奇,刘雅婷. 基于小波AlexNet网络的配电网故障区段定位方法. 电测与仪表. 2022(03): 46-57 . 百度学术
    66. 许龙铭,麦启明,卢家俊,陈苇浩. 基于TensorFlow的图像识别水果秤设计与实现. 电子设计工程. 2022(06): 174-178 . 百度学术
    67. 刘雪峰,刘佳明,付民. 生成对抗网络扩充样本用于高光谱图像分类. 电子测量技术. 2022(03): 146-152 . 百度学术
    68. 王茜. 图像风格迁移技术研究. 吕梁学院学报. 2022(02): 37-39 . 百度学术
    69. 屈晓渊,崔青. 基于梅尔频率倒谱系数的音频分类研究. 电子设计工程. 2022(09): 82-87+92 . 百度学术
    70. 陆雪松,闫书豪. 基于迭代卷积神经网络的肝脏MRI图像分割. 中南民族大学学报(自然科学版). 2022(03): 319-325 . 百度学术
    71. 王晗鹏,平鹏,杲先锋,刘伟浦. 针对电瓶车骑手头盔佩戴情况的无人机巡检方法研究. 科学技术创新. 2022(15): 74-77 . 百度学术
    72. 张焕,张庆,于纪言. 卷积神经网络中激活函数的性质分析与改进. 计算机仿真. 2022(04): 328-334 . 百度学术
    73. 田月媛,邓淼磊,高辉,张德贤. 基于深度学习的人群计数算法综述. 电子测量技术. 2022(07): 152-159 . 百度学术
    74. 彭涛,唐经,何凯,胡新荣,刘军平,何儒汉. 基于多步态特征融合的情感识别. 广西师范大学学报(自然科学版). 2022(03): 104-111 . 百度学术
    75. 魏万珍,田建艳,姜茜,杨胜强. 基于图像技术的零件表面粗糙度支持向量机检测模型. 现代制造工程. 2022(05): 100-109+114 . 百度学术
    76. 张军锋,尚展垒. 基于深度学习卷积神经网络的花生籽粒完整性检测. 食品与机械. 2022(05): 24-29+36 . 百度学术
    77. 黄思维,李志丹,程吉祥,刘安东. 基于多特征融合的轻量化无锚人脸检测方法. 计算机工程与应用. 2022(11): 242-249 . 百度学术
    78. 杨金成,王永超,费守江,张伟,曾婧,李娜. 基于Faster R-CNN的非侵入式负荷识别方法. 分布式能源. 2022(02): 26-33 . 百度学术
    79. 赵腾飞,胡国玉,周建平,刘广,陈旭东,董娅兰. 卷积神经网络算法在核桃仁分类中的研究. 中国农机化学报. 2022(06): 181-189 . 百度学术
    80. 谢泽祺,徐巍,邹光明,姜佳,闵达. 基于卷积神经网络的玻璃瓶口缺陷检测. 制造业自动化. 2022(06): 104-108+160 . 百度学术
    81. 张波,陆云杰,秦东明,邹国建. 一种卷积自编码深度学习的空气污染多站点联合预测模型. 电子学报. 2022(06): 1410-1427 . 百度学术
    82. 刘光辉,王秦蒙,陈宣润,孟月波. 多元信息聚合的人群密度估计与计数. 光学精密工程. 2022(10): 1228-1239 . 百度学术
    83. 孙超平,梅怡嘉,黄康. 基于卷积神经网络的数字万用表读数识别方法研究. 中国计量. 2022(06): 85-89 . 百度学术
    84. 仝卫国,李芝翔,翟永杰,侯哲. 基于中心差分卷积的自监督学习方法研究. 安徽大学学报(自然科学版). 2022(04): 24-29 . 百度学术
    85. 武万浩,吴明飞,王慧康,贾惠,马月坤. 基于卷积神经网络的智慧康养系统的设计与实现. 信息记录材料. 2022(05): 113-115 . 百度学术
    86. 余伟. 基于卷积神经网络的车牌图像识别技术实现. 信息记录材料. 2022(05): 154-156 . 百度学术
    87. 金守峰,侯一泽,焦航,张鹏,李宇涛. 基于改进AlexNet模型的抓毛织物质量检测方法. 纺织学报. 2022(06): 133-139 . 百度学术
    88. 姜山,龚国成,马腾远,肖龙. 基于“5G+AI”的智能温度检测系统. 电信科学. 2022(S1): 194-202 . 百度学术
    89. 陈嘉昊. 人工智能支持下的新增建设用地监测图斑提取研究. 江西测绘. 2022(02): 10-12+32 . 百度学术
    90. 凌里杨,徐天吉,冯博,许宏涛,魏水建. 基于深度学习的多波地震信号智能匹配方法与应用. 石油地球物理勘探. 2022(04): 768-776+735-736 . 百度学术
    91. 康长青,杭波,周哲,杨明,朱丽娟. 基于卫星图像的道路检测系统的设计与实现. 长江信息通信. 2022(07): 69-71 . 百度学术
    92. 梁文龙. 基于口罩遮挡情况下的人脸识别算法研究. 信息记录材料. 2022(06): 139-141 . 百度学术
    93. 黄志鸿,洪峰,黄伟. 形状自适应低秩表示的电力设备热故障诊断方法研究. 红外技术. 2022(08): 870-874 . 百度学术
    94. 李欢,曾烁. 诊断、评估与干预:近五年卷积神经网络在特殊教育中的实证研究述评. 中国特殊教育. 2022(07): 10-22 . 百度学术
    95. 何梓林. 基于Tensorflow的车型识别系统研究. 农业装备与车辆工程. 2022(08): 135-138 . 百度学术
    96. 张嘉鑫. 论商业人脸识别中隐私权和个人信息的双重保护. 行政与法. 2022(08): 78-87 . 百度学术
    97. 钱虹,王建棋,刘刚. 基于深度卷积神经网络的转子轴心轨迹智能识别. 热能动力工程. 2022(08): 204-212 . 百度学术
    98. 高云华,刘奔. 基于卷积神经网络的军棋判定系统. 电子测试. 2022(15): 60-62 . 百度学术
    99. 陈兵,蒋行国. 卷积神经网络用于人脸特征提取. 现代电子技术. 2022(18): 182-186 . 百度学术
    100. 刘思恒,李佳,彭贤贵,张诚. 探索Morphogo在多发性骨髓瘤MRD检测中的应用. 重庆医科大学学报. 2022(08): 948-952 . 百度学术
    101. 郭晟,余乐,朱立东. 星地场景下基于CNN的OTFS系统信道估计方法. 天地一体化信息网络. 2022(03): 37-45 . 百度学术
    102. 岑鹏,郑德生,陆超. 基于差分隐私的航空发动机喘振故障检测. 燃气涡轮试验与研究. 2022(01): 48-51 . 百度学术
    103. 张功勋,姚方,曹赟. 基于CNN-SVR城市日负荷预测机制. 电气自动化. 2022(05): 38-40 . 百度学术
    104. 康缪建. 自然语义分析与机器学习在大数据安全中的应用. 电子技术与软件工程. 2022(18): 202-207 . 百度学术
    105. 赵妍,唐文石,聂永辉,王泽通. 基于格拉姆角差场和卷积神经网络的宽频振荡分类方法. 电网技术. 2022(11): 4364-4372 . 百度学术
    106. 郑旭平. 公路病害智能检测分析解决方案研究. 西部交通科技. 2022(10): 184-186+199 . 百度学术
    107. 麻连伟,宁卫远,焦利伟,薛帅栋. 基于U-Net卷积神经网络的遥感影像变化检测方法研究. 能源与环保. 2022(11): 102-106 . 百度学术
    108. 梁剑,黄志鸿,张可人. 基于多尺度引导滤波和决策融合的电力设备热故障诊断方法研究. 红外技术. 2022(12): 1344-1350 . 百度学术
    109. 段芸杉,吴献文,王瑞瑞,石伟,李怡燃. 基于深度学习的异源立体影像对匹配方法. 测绘通报. 2022(12): 131-135 . 百度学术
    110. 黄丰,莫辉强,王伟,欧阳慧,于富洋,张城,叶明. 一种基于深度学习的视频客流密度计算方法. 计算机与数字工程. 2022(10): 2149-2152+2165 . 百度学术
    111. 李霞丽,陈彦东,杨子熠,张焱垠,吴立成. 藏族久棋的一种两阶段计算机博弈算法. 重庆理工大学学报(自然科学). 2022(12): 110-120 . 百度学术
    112. 徐彬森,李宁,肖立志,武宏亮,冯周,王兵,王克文. 串行结构多任务学习的储层参数预测方法(英文). Applied Geophysics. 2022(04): 513-527+604 . 百度学术
    113. 徐小强,张瑞琦,冒燕,陈旭. 基于卷积神经网络的水面火焰倒影滤波方法. 江苏大学学报(自然科学版). 2021(01): 105-110 . 百度学术
    114. 张玉红,白韧祥,孟凡军,王思斯,吴彪. 图像识别中的卷积神经网络应用研究. 新技术新工艺. 2021(01): 52-55 . 百度学术
    115. 高瑞明,李明星. 基于调制谱图卷积神经网络的空中目标识别技术. 电光与控制. 2021(02): 59-64 . 百度学术
    116. 陆宁云,陈闯,姜斌,邢尹. 复杂系统维护策略最新研究进展:从视情维护到预测性维护. 自动化学报. 2021(01): 1-17 . 本站查看
    117. 孙月驰,平伟,徐明磊. 基于优化卷积神经网络结构的人体行为识别. 计算机应用与软件. 2021(02): 198-204+269 . 百度学术
    118. 贾坡,田建艳,杨英波,彭宏丽,杨胜强. 基于机器视觉的滚抛磨块缺陷检测方法. 金刚石与磨料磨具工程. 2021(01): 76-82 . 百度学术
    119. 李明达,姜静. 基于深度学习的轮胎缺陷检测算法. 信息技术与信息化. 2021(02): 52-53 . 百度学术
    120. 方双,赵凤霞,楚松峰,吴振华. 基于多尺度卷积神经网络的缺陷红枣检测方法. 食品与机械. 2021(02): 158-163+168 . 百度学术
    121. 贾瑶,靳雁霞,马博,陈治旭,芦烨. 基于机器学习合成高分辨率布料褶皱. 计算机技术与发展. 2021(03): 106-110 . 百度学术
    122. 王倩,高向军,葛方振,沈龙凤,李想,刘怀愚. 基于多颜色空间的太阳能电池片智能分类. 计算机与数字工程. 2021(03): 556-561 . 百度学术
    123. 梁忠壮,孟令奎,谢文君,张文. 基于卷积神经网络的城市水体提取方法研究. 测绘地理信息. 2021(02): 36-39 . 百度学术
    124. 欧莉莉,邵峰晶,孙仁诚,隋毅. 基于半监督方法的脑梗死图像识别. 计算机应用. 2021(04): 1221-1226 . 百度学术
    125. 易超,张清河,刘广旭,时李萍,张士惠. 基于卷积神经网络的色散介质电磁参数重构. 微波学报. 2021(02): 70-75+84 . 百度学术
    126. 高滔. 基于CNN池化和进化策略的一般神经网络图像分类研究. 智能计算机与应用. 2021(02): 179-182+186 . 百度学术
    127. 王雷,闫红蕾,张自力. 收益率曲面预测及其在信用债投资组合管理中的应用. 统计研究. 2021(04): 145-160 . 百度学术
    128. 向本华,王徽. 基于AlexNet的手写希腊字母识别研究. 通信技术. 2021(05): 1103-1108 . 百度学术
    129. 包苑村,解建仓,罗军刚. 基于VMD-CNN-LSTM模型的渭河流域月径流预测. 西安理工大学学报. 2021(01): 1-8 . 百度学术
    130. 张天放,张先玲,韩涛,施泽杰,郭永强,王惠永. 人工智能图像识别技术在高炉风口监测中的应用. 冶金自动化. 2021(03): 58-66 . 百度学术
    131. 沈锐,陈亚军. 一种基于批量归一化的LeNet网络改进方法. 四川文理学院学报. 2021(02): 136-140 . 百度学术
    132. 闫飞,张华,冯春成,李小霞. 基于迁移学习的卷积神经网络印刷汉字字体识别模型研究. 数字印刷. 2021(02): 36-45 . 百度学术
    133. 程冠琦. 深度学习人脸识别算法在课堂考勤中的应用研究. 电脑知识与技术. 2021(13): 182-183+190 . 百度学术
    134. 陈强,戴军. 农机驾驶人员疲劳驾驶行为检测研究. 中国农机化学报. 2021(05): 148-152 . 百度学术
    135. 张雷乐,田军委,刘雪松,王沁. 一种改进的残差网络手势识别方法. 西安工业大学学报. 2021(02): 206-212 . 百度学术
    136. 徐小奇,刘海波. 基于神经网络的光伏电池红外热图热斑识别. 科学技术创新. 2021(16): 92-94 . 百度学术
    137. 李东升,何远成,彭翔,杨艳,叶毓廷,王先培. CNN入侵检测算法在电力营销系统中的应用. 计算机工程与设计. 2021(06): 1585-1591 . 百度学术
    138. 李奇,龙奇勇,赵东旭. 基于深度学习的疑似违法图斑快速检测研究. 城市勘测. 2021(03): 88-91 . 百度学术
    139. 林锦涵,陈芸芝,汪小钦. 基于绿视率的福州市鼓楼区道路绿化水平评价. 中国城市林业. 2021(03): 73-77+84 . 百度学术
    140. 安国臣,袁宏拓,韩秀璐,王晓君,侯雨佳. 基于FPGA的通用卷积层IP核设计. 河北科技大学学报. 2021(03): 241-247 . 百度学术
    141. 刘海涛,伊丽丽,兰玉彬,韩鑫,崔立华. 机器视觉在棉花智能打顶领域的应用研究进展. 中国农机化学报. 2021(06): 159-165 . 百度学术
    142. 黄晓琪,王莉,李钢. 融合胶囊网络的文本-图像生成对抗模型. 计算机工程与应用. 2021(14): 176-180 . 百度学术
    143. 刘宝稳,汤容川,马钲洲,马宏忠,许洪华. 基于S变换D-SVM AlexNet模型的GIS机械故障诊断与试验分析. 高电压技术. 2021(07): 2526-2538 . 百度学术
    144. 张鑫,缪楠,高继勇,李庆盛,王志强,孙霞,李彩虹,袁文浩. 基于电子舌和WGAN-CNN模型的小麦贮存年限快速检测. 电子测量与仪器学报. 2021(06): 176-183 . 百度学术
    145. 阴祖军,蒋博文,野莹莹. 基于改进LeNet-5卷积神经网络的发票识别研究. 装备制造技术. 2021(05): 148-150+163 . 百度学术
    146. 徐鹏飞,程乾,金平斌. 基于神经网络模型的千岛湖清洁水体叶绿素a遥感反演研究. 长江流域资源与环境. 2021(07): 1670-1679 . 百度学术
    147. 陆卫忠,黄宏梅,杨茹,曹燕. 基于深度学习的智能花卉养护系统设计. 计算机应用与软件. 2021(08): 72-77 . 百度学术
    148. 王岩,钱巨. 基于视觉特征的非侵入式用户界面输入项识别. 计算机与现代化. 2021(08): 46-51+120 . 百度学术
    149. 徐焕良,孙云晓,曹雪莲,季呈明,陈龙,王浩云. 基于光子传输模拟与卷积神经网络的苹果品质检测. 农业机械学报. 2021(08): 338-345 . 百度学术
    150. 张丽达,谢宸湘. 深度卷积神经网络对领导干部自然资源资产离任审计疑点提取的应用. 统计与信息论坛. 2021(08): 75-83 . 百度学术
    151. 张焕,张庆,于纪言. 激活函数的发展综述及其性质分析. 西华大学学报(自然科学版). 2021(04): 1-10 . 百度学术
    152. 逄岩,许枫,刘佳. 基于Gammatone滤波器组时频谱和卷积神经网络的海底底质分类. 应用声学. 2021(04): 510-517 . 百度学术
    153. 冷佳,刘镇,张笑非,汤浩宇. 多特征融合CNN网络的旋转机械故障诊断研究. 软件导刊. 2021(09): 44-50 . 百度学术
    154. 黄志鸿,吴晟,肖剑,张可人,黄伟. 基于引导滤波的电力设备热故障诊断方法研究. 红外技术. 2021(09): 910-915 . 百度学术
    155. 王琳,张素兰,杨海峰. 基于CNN和加权贝叶斯的最近邻图像标注方法. 计算机技术与发展. 2021(10): 63-69 . 百度学术
    156. 程睿喆. 基于卷积神经网络的无人机道路巡检系统设计. 电子技术与软件工程. 2021(19): 143-145 . 百度学术
    157. 林宗缪,陈宁. 基于卷积神经网络算法的纺织品毛球评定研究. 计算机与数字工程. 2021(10): 2150-2154 . 百度学术
    158. 马玉莹,黄成章,黄静颖,王伟丞. 基于SSD框架的红外弱小目标检测技术研究. 激光与红外. 2021(10): 1342-1347 . 百度学术
    159. 王道元,王俊,孟志斌,张雪峰,李敬兆. 煤矿安全风险智能分级管控与信息预警系统. 煤炭科学技术. 2021(10): 136-144 . 百度学术
    160. 封筠,赵颖,毕健康,赖柏江,胡晶晶. 多级卷积神经网络的沥青路面裂缝图像层次化筛选. 图学学报. 2021(05): 719-728 . 百度学术
    161. 胡徐胜,陶彬彬,曾胜. 基于STM32的测温与身份识别系统设计. 天津理工大学学报. 2021(04): 36-39 . 百度学术
    162. 王金,李颜娥,冯海林,王安澜. 基于改进的Faster R-CNN的小目标储粮害虫检测研究. 中国粮油学报. 2021(09): 164-171 . 百度学术
    163. 孟月波,陈宣润,刘光辉,徐胜军. 多特征信息融合的人群密度估计方法. 激光与光电子学进展. 2021(20): 276-287 . 百度学术
    164. 白又达,刘纪平,黄龙,白敬辉,车向红. 面向地图图片识别的两种卷积神经网络分析. 测绘科学. 2021(11): 126-134 . 百度学术
    165. 汤礼颖,贺利乐,何林,屈东东. 一种卷积神经网络集成的多样性度量方法. 智能系统学报. 2021(06): 1030-1038 . 百度学术
    166. 曹建芳,贾一鸣,田晓东,闫敏敏,陈泽宇. 基于多通道可分离网络的古代壁画分类方法. 计算机应用研究. 2021(11): 3489-3494 . 百度学术
    167. 曾文雯,杨阳,钟小品. 基于改进Mask R-CNN的在架图书书脊图像实例分割方法. 计算机应用研究. 2021(11): 3456-3459+3505 . 百度学术
    168. 刘近贞,叶方方,熊慧. 基于卷积神经网络的多类运动想象脑电信号识别. 浙江大学学报(工学版). 2021(11): 2054-2066 . 百度学术
    169. 孙晓朋,侯立群,渠怀胜. 基于卷积神经网络的渐进式指针表自动读数方法. 传感技术学报. 2021(10): 1326-1333 . 百度学术
    170. 韩存地,朱兴攀,符立梅,董立红,刘安强,李远成,许犇,汪梅. 改进空间通道注意力与残差融合的煤矸石识别. 西安科技大学学报. 2021(06): 1113-1121 . 百度学术
    171. 袁培森,薛铭家,熊迎军,翟肇裕,徐焕良. 基于无人机高通量植物表型大数据分析及应用研究综述. 农业大数据学报. 2021(03): 62-75 . 百度学术
    172. 鲜开军,丁新虎,朱城超,朱钟华,徐东伟. 基于遗传算法的神经网络等价模型构建. 高技术通讯. 2021(11): 1136-1144 . 百度学术
    173. 周福林,刘飞帆,杨瑞轩,任慧乔. 电气化铁路车网电气耦合异常辨识. 中国电机工程学报. 2021(23): 7937-7950 . 百度学术
    174. 赵卫东,施实伟,周婵. 基于ImageNet预训练卷积神经网络的图像风格迁移. 成都大学学报(自然科学版). 2021(04): 367-373 . 百度学术
    175. 牛鑫鑫,孙阿猛,王钎沣,夏萍. 基于深度学习的遥感图像分类研究. 激光杂志. 2021(05): 10-14 . 百度学术
    176. 任珊珊. 基于CNN处理疾病数据的技术对疾病预测研究. 价值工程. 2020(02): 248-249 . 百度学术
    177. 蒋梦莹,林小竹,柯岩,魏战红. 基于权值分布的多模型分类算法研究. 计算机应用研究. 2020(01): 313-316 . 百度学术
    178. 张风雷. 基于姿态机和卷积神经网络的手的关键点估计. 计算机与数字工程. 2020(01): 242-246 . 百度学术
    179. 费东炜,孙涵. 基于深度哈希网络的车型识别方法. 计算机技术与发展. 2020(01): 7-12 . 百度学术
    180. 朱煜峰,许永鹏,陈孝信,盛戈皞,江秀臣. 基于卷积神经网络的直流XLPE电缆局部放电模式识别技术. 电工技术学报. 2020(03): 659-668 . 百度学术
    181. 徐崇良,胡毅. 基于数字化车间的改进图像识别系统. 组合机床与自动化加工技术. 2020(02): 70-73 . 百度学术
    182. 董博华,韩笑,宋毅洲,安宁宁,刘韵婷. 基于卷积神经网络的植物图像识别APP开发——“植鉴”. 科技与创新. 2020(04): 134-135 . 百度学术
    183. 李阳,王璞,刘扬,刘国军,王春宇,刘晓燕,郭茂祖. 基于显著图的弱监督实时目标检测. 自动化学报. 2020(02): 242-255 . 本站查看
    184. 张乃夫,谭峰,范禹希,辛元明,孙政波,田生睿. 基于卷积神经网络的农作物病害识别方法研究. 安徽农业科学. 2020(05): 242-245 . 百度学术
    185. 张芳,赵东旭,肖志涛,徐旭,耿磊,吴骏,刘彦北,王雯. 眼底图像质量分类综述. 计算机辅助设计与图形学学报. 2020(03): 501-512 . 百度学术
    186. 华夏,王新晴,马昭烨,王东,邵发明. 基于递归神经网络的视频多目标检测技术. 计算机应用研究. 2020(02): 615-620 . 百度学术
    187. 孙世宇,李喆,李建增,胡永江. 基于卷积神经网络的无人机图像模糊类型识别. 火力与指挥控制. 2020(02): 1-5 . 百度学术
    188. 侯威力,俞磊,沈寅,王敬汶,陈懿,顾淼,蔡培濛. 无人机在城市水务管理中的智能应用. 新型工业化. 2020(01): 122-124 . 百度学术
    189. 马骞. 基于卷积神经网络的密集场景人流估计方案. 电子设计工程. 2020(05): 189-193 . 百度学术
    190. 谭远模. 无人机航测技术在农地杂草识别中的应用. 北京测绘. 2020(04): 514-517 . 百度学术
    191. 黄宏梅,陆卫忠,杨茹,曹燕. 深度学习在花卉养护技术中的应用. 计算机系统应用. 2020(03): 261-268 . 百度学术
    192. 肖春姣,李宇,张洪群,陈俊. 深度融合网结合条件随机场的遥感图像语义分割. 遥感学报. 2020(03): 254-264 . 百度学术
    193. 张毅. 基于图像理解的典型气象灾害风险识别方法研究. 环境科学与管理. 2020(02): 186-190 . 百度学术
    194. 孟月波,纪拓,刘光辉,徐胜军,李彤月. 编码-解码多尺度卷积神经网络人群计数方法. 西安交通大学学报. 2020(05): 149-157 . 百度学术
    195. 鄢仁武,林穿,高硕勋,罗家满,李天建,夏正邦. 基于小波时频图和卷积神经网络的断路器故障诊断分析. 振动与冲击. 2020(10): 198-205 . 百度学术
    196. 钦杰,张力平,叶云飞,胡鹏,蔺宏良. 一种基于卷积神经网络的电涡流金属辨识方法. 电子测量与仪器学报. 2020(04): 172-179 . 百度学术
    197. 郑庆翔,朱敏. 基于深度卷积神经网络的高光谱图像分类算法研究. 白城师范学院学报. 2020(02): 24-29 . 百度学术
    198. 祝诗平,卓佳鑫,黄华,李光林. 基于CNN的小麦籽粒完整性图像检测系统. 农业机械学报. 2020(05): 36-42 . 百度学术
    199. 沈兆轩,袁三男. 利用卷积神经网络支持向量回归机的地区负荷聚类集成预测. 电网技术. 2020(06): 2237-2244 . 百度学术
    200. 岑海燕,朱月明,孙大伟,翟莉,万亮,麻志宏,刘子毅,何勇. 深度学习在植物表型研究中的应用现状与展望. 农业工程学报. 2020(09): 1-16 . 百度学术
    201. 王浩,杨东升,周博文,高筱婷,庞永恒. 基于并联卷积神经网络的多端直流输电线路故障诊断. 电力系统自动化. 2020(12): 84-95 . 百度学术
    202. 徐代,岳璋,杨文霞,任潇. 基于改进的三向流Faster R-CNN的篡改图像识别. 计算机应用. 2020(05): 1315-1321 . 百度学术
    203. 赵琪,孙立双,谢志伟. 基于改进MCNN的密度图在室内定位中的应用. 测绘通报. 2020(06): 12-16 . 百度学术
    204. 余东行,张保明,赵传,郭海涛,卢俊. 联合卷积神经网络与集成学习的遥感影像场景分类. 遥感学报. 2020(06): 717-727 . 百度学术
    205. 李启飞,吴芳,林义杰. 基于卷积神经网络对磁异常信号的识别研究. 海军航空工程学院学报. 2020(02): 161-166 . 百度学术
    206. 赵发宾. 基于计算机方法的混凝土识别与应用研究. 粉煤灰综合利用. 2020(03): 29-32 . 百度学术
    207. 张云,李岚. 基于级联卷积神经网络的人脸特征点识别算法实现. 兰州理工大学学报. 2020(03): 105-109 . 百度学术
    208. 张清,胡国兵,赵嫔姣. 基于AlexNet卷积神经网络的5G信号调制方式识别. 信息化研究. 2020(02): 36-43 . 百度学术
    209. 李东帅,黄靖宇. 基于深度学习的高速磁浮轨道不平顺预估. 华东交通大学学报. 2020(03): 44-51 . 百度学术
    210. 李莉,乔璐,张浩洋. 基于深度学习的肺结节自动检测算法. 计算机应用与软件. 2020(07): 95-100 . 百度学术
    211. 陈鹏,陈智利,李庞跃,牛恒,周泉. 树莓派3B+导盲系统设计与实现. 西安工业大学学报. 2020(03): 305-309 . 百度学术
    212. 徐少平,林珍玉,李崇禧,崔燕,刘蕊蕊. 浅层CNN网络构建的噪声比例估计模型. 中国图象图形学报. 2020(07): 1344-1355 . 百度学术
    213. 赵毅力,李禹成,陈皓. 云南野生鸟类图像自动识别系统. 计算机应用研究. 2020(S1): 423-425 . 百度学术
    214. 陈婷丽,王静,袁非. 基于深度学习的眼底疾病筛查诊断系统的初步研究. 国际眼科杂志. 2020(08): 1452-1455 . 百度学术
    215. 张辉,王杨,李昌,张鑫,赵传信. 基于深度神经决策森林的体域网数据融合方法. 计算机应用研究. 2020(08): 2329-2332 . 百度学术
    216. 王玉静,王诗达,康守强,王庆岩,V.I.MIKULOVICH. 基于改进深度森林的滚动轴承剩余寿命预测方法. 中国电机工程学报. 2020(15): 5032-5043 . 百度学术
    217. 甄岩,袁健全,池庆玺,郝明瑞. 深度强化学习方法在飞行器控制中的应用研究. 战术导弹技术. 2020(04): 112-118 . 百度学术
    218. 孙蕊,张旭,郭颖,于新文,陈艳,侯亚男. 基于Faster R-CNN金丝猴优化检测方法. 激光与光电子学进展. 2020(12): 259-268 . 百度学术
    219. 柳翠明,赵东旭. 利用深度学习的无人机影像快速发现推土区违法建设. 城市勘测. 2020(04): 83-86 . 百度学术
    220. 刘文彬,温柏坚,高尚,郑杰生,郑颖龙,董召杰,王尧. 基于深度学习的智能图像处理研究. 自动化与仪器仪表. 2020(08): 60-63 . 百度学术
    221. 丁琼. Matlab平台下水书文字特征提取与分类方法实现研究. 电子技术与软件工程. 2020(14): 155-157 . 百度学术
    222. 刘帅,张旭含,李笑迎,田野. 基于双分支卷积网络的高光谱与多光谱图像协同土地利用分类. 农业工程学报. 2020(14): 252-262 . 百度学术
    223. 杨刚,贺冬葛,戴丽珍. 基于CNN和粒子群优化SVM的手写数字识别研究. 华东交通大学学报. 2020(04): 41-47 . 百度学术
    224. 肖经纬,田军委,王沁,程希希,王佳. 基于改进残差网络的果实病害分类方法. 计算机工程. 2020(09): 221-225 . 百度学术
    225. 吴定安,钟建伟,秦勉,向家国,曾凡伟,陈晨,胡凯. 基于卷积神经网络的电能质量扰动识别研究. 湖北民族大学学报(自然科学版). 2020(03): 318-321+327 . 百度学术
    226. 段中兴,齐嘉麟. 基于多尺度卷积神经网络的立体匹配算法研究. 计算机测量与控制. 2020(09): 206-211 . 百度学术
    227. 付天豪,于力革. 改进卷积神经网络的动态手势识别. 计算机系统应用. 2020(09): 225-230 . 百度学术
    228. 徐少平,刘婷云,林珍玉,崔燕. 用于去除随机脉冲噪声的两阶段盲卷积降噪模型. 计算机学报. 2020(09): 1673-1690 . 百度学术
    229. 沈凯文,李浩伟,韩进,房若民. 基于卷积神经网络的病虫害可视化监测系统设计. 软件导刊. 2020(09): 122-126 . 百度学术
    230. 伍思雨,冯骥. 基于改进VGGNet卷积神经网络的鲜花识别. 重庆师范大学学报(自然科学版). 2020(04): 124-131 . 百度学术
    231. 魏巍,徐卫峰. 卷积神经网络在类风湿性关节炎X光影像自动识别的应用及效果分析. 医院管理论坛. 2020(07): 72-74 . 百度学术
    232. 孟凡奎,银温社,贺建峰. 基于深度学习的眼底图像出血点检测方法. 山东大学学报(理学版). 2020(09): 62-71 . 百度学术
    233. 杨佳,宋晓茹,高嵩,吴雪. 一种混合验证码的识别算法研究. 自动化与仪表. 2020(09): 56-59+63 . 百度学术
    234. 张琪安,张波涛,吕强,王亚东. 采用卷积神经网络的低风险可行地貌分类方法. 控制理论与应用. 2020(09): 1944-1950 . 百度学术
    235. 张燕,王铭玥,王婕,姜恺宁,张筠晗. 基于Xception-LSTM的下肢运动能力评价方法. 中国康复理论与实践. 2020(06): 643-647 . 百度学术
    236. 马震,冯青锋,谢晋. 基于孪生网络实现商品标题相似度判别的方法研究. 信息记录材料. 2020(09): 162-164 . 百度学术
    237. 王维波,徐西龙,盛立,高明. 卷积神经网络微地震事件检测. 石油地球物理勘探. 2020(05): 939-949+929 . 百度学术
    238. 土登达杰,普布旦增,仁青诺布. 基于语义分割的草场生长状态分析. 电子技术与软件工程. 2020(16): 132-135 . 百度学术
    239. 伍煜亮,黄上瑶,宋景华,刘洋宏,黄承昌. 禁入区域异常报警系统. 数字通信世界. 2020(10): 96-97 . 百度学术
    240. 柳霄羽,蔡庭钰. 基于CNN手写识别技术的智能作业批阅软件的设计与开发. 信息与电脑(理论版). 2020(18): 99-101 . 百度学术
    241. 刘晓天,孙冰,廖超,金佳莉,施招婉,范黎明,唐艺家,何继红,何卫忠,杨龙,孙倩,裴男才. 基于街景图像的城市街道绿视率计量方法比较分析. 江西农业大学学报. 2020(05): 1022-1031 . 百度学术
    242. 张军,钟定江,洛桑珠巴,王永亮,李猛. 基于高原环境的光伏电站智能机器人巡检系统. 电子技术与软件工程. 2020(18): 37-38 . 百度学术
    243. 李剑. 基于粒子群算法的卷积神经网络优化研究. 计算机与数字工程. 2020(10): 2452-2457 . 百度学术
    244. 成思齐,宋晓茹,高嵩,陈超波. 基于卷积神经网络进行发票分类. 电子设计工程. 2020(22): 170-174 . 百度学术
    245. 侯俊铭,姚恩超,朱红杰. 基于卷积神经网络的蓖麻种子损伤分类研究. 农业机械学报. 2020(S1): 440-449 . 百度学术
    246. 黄彩云,吴金红,陈勇跃,王翠波. 非均衡数据下基于卷积神经网络的专利文本自动分类研究. 文献与数据学报. 2020(03): 25-36 . 百度学术
    247. 朱新挺,陈志坤,彭冬亮. 面向一体化应用的电磁信号智能检测方法研究. 信号处理. 2020(10): 1708-1713 . 百度学术
    248. 胡开华,黄华,章义来,张玉静. 陶瓷产品三维互动装饰设计定制服务平台. 重庆大学学报. 2020(11): 121-136 . 百度学术
    249. 李天琪,谭海,戴激光,杜阳,王杨. 结合卷积神经网络和张量投票的道路提取方法. 激光与光电子学进展. 2020(20): 186-193 . 百度学术
    250. 彭超,唐向红,陆见光. 基于边缘计算的轴承故障诊断. 组合机床与自动化加工技术. 2020(12): 52-55 . 百度学术
    251. 王立刚,张志佳,李晋,范莹莹,刘立强. 基于卷积神经网络的LED灯类字体数字识别. 电子测量与仪器学报. 2020(11): 148-154 . 百度学术
    252. 王金甲,张玉珍,夏静,王凤嫔. 多层局部块坐标下降法及其驱动的分类重构网络. 自动化学报. 2020(12): 2647-2661 . 本站查看
    253. 周亦敏,李锡麟. 基于卷积神经网络的手势识别研究. 智能计算机与应用. 2020(10): 27-31 . 百度学术
    254. 马志远,余粟. 基于Faster-RCNN网络的表格检测算法研究. 智能计算机与应用. 2020(12): 24-27+31 . 百度学术
    255. 丁萌,姜欣言. 先进驾驶辅助系统中基于单目视觉的场景深度估计方法. 光学学报. 2020(17): 137-145 . 百度学术
    256. 田影,陈国栋,潘冠慈. 基于卷积神经网络的黑白人物图像多种合理着色的研究. 通化师范学院学报. 2019(02): 6-11 . 百度学术
    257. 刘彪,黄蓉蓉,林和,苏伟. 基于卷积神经网络的盲文音乐识别研究. 智能系统学报. 2019(01): 186-193 . 百度学术
    258. 马大中,胡旭光,孙秋野,郑君,王睿. 基于数据特征融合的管网信息物理异常诊断方法. 自动化学报. 2019(01): 163-173 . 本站查看
    259. 马浩鹏,朱春媚,周文辉,殷春. 基于深度学习的乳液泵缺陷检测算法. 液晶与显示. 2019(01): 81-89 . 百度学术
    260. 左国玉,马蕾,徐长福,徐家园. 基于跨连接卷积神经网络的绝缘子检测方法. 电力系统自动化. 2019(04): 101-108 . 百度学术
    261. 徐阳,张忠伟,刘明. 利用信息交互最优权重改进神经网络的方法. 吉林大学学报(信息科学版). 2019(01): 107-112 . 百度学术
    262. 宋晓茹,吴雪,高嵩,陈超波. 基于深度神经网络的手写数字识别模拟研究. 科学技术与工程. 2019(05): 193-196 . 百度学术
    263. 杨军志,葛长俊,张剑,寇翀. 基于人工智能的服务区智慧照明管理系统. 建筑电气. 2019(02): 55-59 . 百度学术
    264. 曾平平,李林升. 基于卷积神经网络的水果图像分类识别研究. 机械设计与研究. 2019(01): 23-26+34 . 百度学术
    265. 刘海玲. 基于计算机视觉算法的图像处理技术. 计算机与数字工程. 2019(03): 672-677 . 百度学术
    266. 崔方,赵庶旭. 卷积神经网络GPS坐标转换方法. 测绘通报. 2019(03): 1-5 . 百度学术
    267. 安雅莉,朱海龙,张学军. 使用迁移学习的驾驶员分神操作分类模型. 计算机产品与流通. 2019(04): 111 . 百度学术
    268. 俞颂华,王汝凉. 基于CNN与MFCC的城市场景声音识别. 广西师范学院学报(自然科学版). 2019(01): 50-56 . 百度学术
    269. 陈文兵,刘小明,王宏斌,陈允杰. G-CNN模型在浓雾天气形势识别中的应用. 计算机工程与应用. 2019(08): 124-131 . 百度学术
    270. 党应聪,陈劲杰. 基于卷积神经网络的简单几何体三维模型自动分类识别研究. 软件工程. 2019(04): 13-16 . 百度学术
    271. 赵海文,李锋,赵亚川,齐兴悦. 基于YOLO模型的机器人电梯厅门装箱状态快速识别方法. 包装工程. 2019(07): 180-185 . 百度学术
    272. 陈金富,朱乔木,石东源,李银红,ZHU Lin,段献忠,LIU Yilu. 利用时空相关性的多位置多步风速预测模型. 中国电机工程学报. 2019(07): 2093-2106 . 百度学术
    273. 陈天娇,曾娟,谢成军,王儒敬,刘万才,张洁,李瑞,陈红波,胡海瀛,董伟. 基于深度学习的病虫害智能化识别系统. 中国植保导刊. 2019(04): 26-34 . 百度学术
    274. 仲志丹,吴进峰,任金梅. 油井动液面位置智能识别算法研究. 智能计算机与应用. 2019(03): 45-48+53 . 百度学术
    275. 张艳升,李喜旺,李丹,杨华. 基于卷积神经网络的工控网络异常流量检测. 计算机应用. 2019(05): 1512-1517 . 百度学术
    276. 徐少平,刘婷云,李崇禧,唐祎玲,胡凌燕. 基于CNN噪声分离模型的噪声水平估计算法. 计算机研究与发展. 2019(05): 1060-1070 . 百度学术
    277. 王山海,刘谦,马鑫鑫. 基于图像识别的人工影响天气业务的研究. 计算机技术与发展. 2019(05): 172-177 . 百度学术
    278. 邢珍珍. 卷积神经网络在图像处理中的应用研究. 软件工程. 2019(06): 5-7 . 百度学术
    279. 徐迅,陶俊,吴瑰. 基于卷积神经网络的带遮蔽人脸识别. 江汉大学学报(自然科学版). 2019(03): 246-251 . 百度学术
    280. 万晓琪,宋辉,罗林根,李喆,盛戈皞,江秀臣. 卷积神经网络在局部放电图像模式识别中的应用. 电网技术. 2019(06): 2219-2226 . 百度学术
    281. 罗金梅,罗建,李艳梅,赵旭. 基于多特征融合CNN的人脸识别算法研究. 航空计算技术. 2019(03): 40-45 . 百度学术
    282. 王胜,吕林涛,杨宏才. 卷积神经网络在印刷品缺陷检测的应用. 包装工程. 2019(11): 203-211 . 百度学术
    283. 王红霞,周家奇,辜承昊,林泓. 用于图像分类的卷积神经网络中激活函数的设计. 浙江大学学报(工学版). 2019(07): 1363-1373 . 百度学术
    284. 江白华,张亚,曾文文. 基于改进卷积神经网络的铁轨伤损图像识别. 测控技术. 2019(06): 19-22+27 . 百度学术
    285. 吴一凡,冉晓旻. CNN神经网络在航迹预测中的应用. 电子设计工程. 2019(12): 13-20 . 百度学术
    286. 高玉潼,原玥. 基于超像素分割的实时野外场景理解. 沈阳大学学报(自然科学版). 2019(03): 210-216 . 百度学术
    287. 刘斌,陈桂芬,董聪瀚. CNN在汽车识别中的应用研究. 长春理工大学学报(自然科学版). 2019(03): 75-79 . 百度学术
    288. 王枫,陈小平. CNN深度学习的验证码识别及Android平台移植. 单片机与嵌入式系统应用. 2019(07): 20-22+73 . 百度学术
    289. 蔡楠,李萍. 基于KPCA初始化卷积神经网络的方法. 计算机技术与发展. 2019(07): 76-79 . 百度学术
    290. 蒋丰千,李旸,余大为,孙敏,张恩宝. 基于Caffe卷积神经网络的大豆病害检测系统. 浙江农业学报. 2019(07): 1177-1183 . 百度学术
    291. 刘亮. 基于改进卷积神经网络的人脸识别算法. 科技通报. 2019(07): 174-177 . 百度学术
    292. 董思雨. 自主选课匹配系统. 电子测试. 2019(14): 63-65 . 百度学术
    293. 严薇薇,旷小芳,肖云霞,郑梦雪,刘俊,杨娟. 基于深度学习技术的注意力转移模式的挖掘——以二语学习者的眼动数据为例. 电化教育研究. 2019(08): 30-36 . 百度学术
    294. 李耀高. 基于神经网络的煤HRTEM图像处理技术. 煤炭技术. 2019(08): 167-170 . 百度学术
    295. 吴沛佶,梅雪,何毅,袁申强. 基于深度网络模型的视频序列中异常行为的检测方法. 激光与光电子学进展. 2019(13): 134-140 . 百度学术
    296. 高树辉,姜晓佳. 卷积神经网络在物证检验中的应用与毛发自动识别的展望. 科学技术与工程. 2019(23): 1-9 . 百度学术
    297. 杜阔,李亚. 基于卷积神经网络的数字分类器的研究与优化. 现代电子技术. 2019(16): 98-103 . 百度学术
    298. 蒋宗礼,王逸鹤. 基于序列挖掘的兴趣点推荐算法. 北京工业大学学报. 2019(09): 853-858 . 百度学术
    299. 郭媛,曾银川,曾良才,傅连东,湛从昌. 基于神经网络的液压缸内泄漏在线测量研究. 液压与气动. 2019(09): 36-44 . 百度学术
    300. 曾琦,向德华,李宁,肖红光. 基于半监督深度生成对抗网络的图像识别方法. 测控技术. 2019(08): 37-42 . 百度学术
    301. 肖银燕,全惠敏. 基于3D CNN的鼻咽癌CT图像分割. 计算机工程与科学. 2019(08): 1444-1452 . 百度学术
    302. 司徒仕忠,邱广萍,王锦春. 基于深度相机的障碍物识别. 科技创新与应用. 2019(27): 37-40 . 百度学术
    303. 王郅佶. 基于卷积神经网络的描述符提取在SLAM中的应用. 电子制作. 2019(18): 39-41 . 百度学术
    304. 王保平. 室外监控下特定目标人员的判别. 信息通信. 2019(08): 72-73 . 百度学术
    305. 田琳静,宋文龙,卢奕竹,吕娟,李焕新,陈静. 基于深度学习的农业区土地利用无人机监测分类. 中国水利水电科学研究院学报. 2019(04): 312-320 . 百度学术
    306. 杨知,欧文浩,刘晓燕,李闯,费香泽,赵斌滨,刘龙,马潇. 基于LinkNet卷积神经网络的高分辨率遥感影像水体信息提取. 云南大学学报(自然科学版). 2019(05): 932-938 . 百度学术
    307. 谢璐阳,夏兆君,朱少华,张代庆,赵奉奎. 基于卷积神经网络的图像识别过拟合问题分析与研究. 软件工程. 2019(10): 27-29+26 . 百度学术
    308. 李策,张栋,杜少毅,朱子重,贾盛泽,曲延云. 一种迁移学习和可变形卷积深度学习的蝴蝶检测算法. 自动化学报. 2019(09): 1772-1782 . 本站查看
    309. 罗建军,刘振声,龚翔,黄绍川,欧阳业,魏征. 基于无人机图像与迁移学习的线路绝缘子状态评价方法. 电力工程技术. 2019(05): 30-36 . 百度学术
    310. 王翔,赵南京,殷高方,孟德硕,马明俊,俞志敏,石朝毅,覃志松,刘建国. 基于反向传播神经网络的激光诱导荧光光谱塑料分类识别方法研究. 光谱学与光谱分析. 2019(10): 3136-3141 . 百度学术
    311. 何金辉. 基于机器视觉与图像识别的发射机弧光捕捉定位系统在实际工作中的应用. 广播电视信息. 2019(10): 82-86 . 百度学术
    312. 王海龙,夏筱筠,孙维堂. 基于EMD与卷积神经网络的滚动轴承故障诊断. 组合机床与自动化加工技术. 2019(10): 46-48+52 . 百度学术
    313. 程时伟,周桃春,唐智川,范菁,孙凌云,朱安杰. CNN实现的运动想象脑电分类及人-机器人交互. 软件学报. 2019(10): 3005-3016 . 百度学术
    314. 华夏,王新晴,马昭烨,王东,邵发明. 复杂大交通场景弱小目标检测技术. 计算机应用研究. 2019(11): 3486-3492 . 百度学术
    315. 李林升,曾平平. 改进深度学习框架Faster-RCNN的苹果目标检测. 机械设计与研究. 2019(05): 24-27 . 百度学术
    316. 李若天航. 基于强化学习的智能浇灌系统. 现代化农业. 2019(11): 15-18 . 百度学术
    317. 王舶仲,蒋毅舟,文超,段浩然,易进,熊旋,毛文奇,袁培. 基于生成对抗网络的隔离开关分合位置判别方法研究及应用. 智慧电力. 2019(10): 77-84 . 百度学术
    318. 席阿行,赵津,周滔,胡秋霞. 卷积神经网络行为克隆方法在无人车上的研究. 现代电子技术. 2019(22): 178-182 . 百度学术
    319. 孙娇娇,龚安,史海涛. 基于卷积神经网络的低剂量CT图像肺结节检测. 计算机技术与发展. 2019(11): 173-177 . 百度学术
    320. 周可慧,廖志伟,肖异瑶,肖立军,蓝鹏昊,万新宇. 基于改进CNN的电力设备红外图像分类模型构建研究. 红外技术. 2019(11): 1033-1038 . 百度学术
    321. 胡忠康,刘英,周晓林,赵乾,沈鹭翔. 基于深度置信网络的实木板材缺陷及纹理识别研究. 计算机应用研究. 2019(12): 3889-3892 . 百度学术
    322. 徐少平,林珍玉,李崇禧,刘婷云,杨晓辉. 采用训练策略实现的快速噪声水平估计. 中国图象图形学报. 2019(11): 1882-1892 . 百度学术
    323. 娄润东,陈俊彪,侯宏花,刘艳莉,田珠,张鹏程,桂志国. 基于深度卷积神经网络的细胞分类新方法. 测试技术学报. 2019(06): 509-515 . 百度学术
    324. 包本刚. 融合多特征的目标检测与跟踪方法. 电子测量与仪器学报. 2019(09): 93-99 . 百度学术
    325. 高明慧,张尤赛,王亚军,李垣江. 应用卷积神经网络的纹理合成优化方法. 计算机工程与设计. 2019(12): 3551-3556 . 百度学术
    326. 高建瓴,王竣生,王许. 基于DenseNet的图像识别方法研究. 贵州大学学报(自然科学版). 2019(06): 58-62 . 百度学术
    327. 吴海平,黄世存. 基于深度学习的新增建设用地信息提取试验研究——全国土地利用遥感监测工程创新探索. 国土资源遥感. 2019(04): 159-166 . 百度学术
    328. 袁明新,于洪涛,江亚峰,王琪,申燚. 联合迁移学习和自适应学习率的苹果成熟度识别. 中国农机化学报. 2019(11): 131-135 . 百度学术
    329. 杨文佳,朱海龙,刘靖宇. 基于卷积神经网络的天气现象识别方法研究. 智能计算机与应用. 2019(06): 214-216 . 百度学术
    330. 谭朝文,宗容,王威廉,杨宏波. 适于卷积神经网络的心音预处理算法. 计算机仿真. 2019(12): 214-218 . 百度学术
    331. 杨丽娟,李利. 基于双线性插值的内容感知图像缩放算法仿真. 计算机仿真. 2019(12): 244-248 . 百度学术
    332. 韩宇. 基于强化学习的网络学习的搜索. 电子制作. 2019(24): 57-58+33 . 百度学术
    333. 陈妮亚,阮佳阳,黄金苗,杨伟. 结合深度学习与生物特征识别在冷链拣选中的算法研究. 智能科学与技术学报. 2019(01): 88-95 . 百度学术
    334. 王相龙,胡钊政,穆孟超,陶倩文,张帆. 基于VGG深度卷积神经网络和空间分布的道路裂纹种类识别. 交通信息与安全. 2019(06): 95-102 . 百度学术
    335. 张治国,李德平,柳宁. 电器标签分类的SVM方法研究. 机电工程技术. 2019(12): 1-4+14 . 百度学术
    336. 蔡惠慧,徐永洋,李孜轩,曹豪豪,冯雅兴,陈思琼,李永胜. 基于卷积神经网络模型划分成矿远景区——以甘肃大桥地区金多金属矿田为例. 地质通报. 2019(12): 1999-2009 . 百度学术
    337. 王奉涛,薛宇航,王洪涛,马琳杰,李宏坤,韩清凯,于晓光. GLT-CNN方法及其在航空发动机中介轴承故障诊断中的应用. 振动工程学报. 2019(06): 1077-1083 . 百度学术
    338. 周月鹏,卢喜利. 基于组合激活函数的CNN应用研究. 韶关学院学报. 2019(12): 24-30 . 百度学术
    339. 肖璞,黄海霞. 基于CNN算法的深度学习研究及应用. 现代计算机. 2019(35): 27-32 . 百度学术
    340. 李崇禧,徐少平,崔燕,刘婷云,张贵珍,林珍玉. 带参考图像通道的卷积神经网络随机脉冲噪声降噪算法. 光电子·激光. 2019(11): 1163-1171 . 百度学术
    341. 韩要昌,王洁,史通,蔡启航. 基于改进GoogLeNet的遥感图像分类方法. 弹箭与制导学报. 2019(05): 139-142+153 . 百度学术
    342. 陈梦,王晓青. 全卷积神经网络在建筑物震害遥感提取中的应用研究. 震灾防御技术. 2019(04): 810-820 . 百度学术
    343. 张航,程清,武英洁,王亚新,张承明,殷复伟. 一种基于卷积神经网络的小麦病害识别方法. 山东农业科学. 2018(03): 137-141 . 百度学术
    344. 徐露露. 基于正交试验设计下的卷积神经网络在图像识别上的研究与应用. 电脑知识与技术. 2018(05): 203-205 . 百度学术
    345. 王宏宇. 网络不良图片识别技术研究. 电脑知识与技术. 2018(12): 195-196+199 . 百度学术
    346. 张涛,张乐乐. 基于卷积神经网络的图片验证码识别. 电子测量技术. 2018(14): 83-87 . 百度学术
    347. 刘勤让,刘崇阳. 利用参数稀疏性的卷积神经网络计算优化及其FPGA加速器设计. 电子与信息学报. 2018(06): 1368-1374 . 百度学术
    348. 董叶豪,柯宗武,熊旭辉. 卷积神经网络在图像处理方面的应用. 福建电脑. 2018(05): 151-153 . 百度学术
    349. 熊平,胡彩霞,周欣星. CNN与人工特征提取快速识别斑马线的方法. 电子设计工程. 2018(03): 189-193 . 百度学术
    350. 吕晓琪,吴凉,谷宇,张文莉,李菁. 基于三维卷积神经网络的低剂量CT肺结节检测. 光学精密工程. 2018(05): 1211-1218 . 百度学术
    351. 王文秀,傅雨田,董峰,李锋. 基于深度卷积神经网络的红外船只目标检测方法. 光学学报. 2018(07): 160-166 . 百度学术
    352. 罗梓月,余小清,万旺根. 一种新的基于人脸表情识别的图像理解模型. 工业控制计算机. 2018(03): 34-36 . 百度学术
    353. 肖皓,祝永新,汪宁,田犁,汪辉. 面向卷积神经网络的FPGA硬件加速器设计. 工业控制计算机. 2018(06): 99-101 . 百度学术
    354. 汪秀军,曹大平,曹宜,舒兴,荣猛,范强. 非接触式生理参数测量设备的研究. 信息技术. 2018(08): 17-22 . 百度学术
    355. 陈伟,何家欢,裴喜平. 基于相空间重构和卷积神经网络的电能质量扰动分类. 电力系统保护与控制. 2018(14): 87-93 . 百度学术
    356. 胡悦. 基于卷积神经网络的股票市场择时模型——以上证综指为例. 金融经济. 2018(04): 71-74 . 百度学术
    357. 周安众,罗可. 一种多尺度卷积神经网络的人脸检测模型. 计算机工程与应用. 2018(14): 168-174+235 . 百度学术
    358. 施恩,李骞,顾大权,赵章明. 基于局部特征的卷积神经网络模型. 计算机工程. 2018(02): 282-286 . 百度学术
    359. 施恩,李骞,顾大权,赵章明. 基于卷积神经网络的雷达回波外推方法. 计算机应用. 2018(03): 661-665+676 . 百度学术
    360. 李万相,田莹. 基于深度学习算法的小样本人耳识别. 计算机仿真. 2018(08): 246-250+369 . 百度学术
    361. 丁承君,刘强,田军强,朱雪宏. 信息物理系统事件驱动下的农业气象监测系统. 江苏农业学报. 2018(04): 825-834 . 百度学术
    362. 张小锋,刘红铮. 基于卷积神经网络的花朵图片分类算法. 计算机与现代化. 2018(09): 52-55 . 百度学术
    363. 焦计晗,张帆,张良. 基于改进AlexNet模型的油菜种植面积遥感估测. 计算机测量与控制. 2018(02): 186-189 . 百度学术
    364. 胡杰,李少波,于丽娅,杨观赐. 基于卷积神经网络与随机森林算法的专利文本分类模型. 科学技术与工程. 2018(06): 268-272 . 百度学术
    365. 吴新杰,李红玉,梁南南. 卷积神经网络在ECT图像重建上的应用. 辽宁大学学报(自然科学版). 2018(01): 28-33 . 百度学术
    366. 李勇,林小竹,蒋梦莹. 基于跨连接LeNet-5网络的面部表情识别. 自动化学报. 2018(01): 176-182 . 本站查看
    367. 唐贤伦,杜一铭,刘雨微,李佳歆,马艺玮. 基于条件深度卷积生成对抗网络的图像识别方法. 自动化学报. 2018(05): 855-864 . 本站查看
    368. 梁蒙蒙,周涛,夏勇,张飞飞,杨健. 基于随机化融合和CNN的多模态肺部肿瘤图像识别. 南京大学学报(自然科学). 2018(04): 775-785 . 百度学术
    369. 张东俊,黎潇,吴红,王天忠. 用于作战实验运用的时空逻辑推演方法. 指挥控制与仿真. 2018(02): 99-105 . 百度学术
    370. 王超,陈庆奎. 基于CUDA的交通限速牌识别. 软件导刊. 2018(07): 44-48 . 百度学术
    371. 冉鹏,王灵,李昕,刘鹏伟. 改进Softmax分类器的深度卷积神经网络及其在人脸识别中的应用. 上海大学学报(自然科学版). 2018(03): 352-366 . 百度学术
    372. 索琰琰,吴昊,李娆,冯成,孟令凯,苑海朝. 浅谈卷积神经网络. 数码世界. 2018(05): 20-21 . 百度学术
    373. 杨红玲,宣士斌,莫愿斌. 基于卷积神经网络的手势识别. 计算机技术与发展. 2018(07): 11-14 . 百度学术
    374. 聂倩倩,秦润泽,高育新,胡欣宇. 人脸表情识别算法综述. 物联网技术. 2018(05): 55-57 . 百度学术
    375. 张路煜,廖鹏,赵俊峰,郭靓. 基于卷积神经网络的未知协议识别方法. 微电子学与计算机. 2018(07): 106-108 . 百度学术
    376. 叶远斌. 神经网络深度学习算法在地理国情监测中的应用研究. 西部资源. 2018(04): 147-149 . 百度学术
    377. 应自炉,商丽娟,徐颖,刘健. 面向图像超分辨率的紧凑型多径卷积神经网络算法研究. 信号处理. 2018(06): 668-679 . 百度学术
    378. 廖原. 基于卷积网络的车牌二值化算法. 信息与电脑(理论版). 2018(12): 67-68 . 百度学术
    379. 王心宇,马良,蔡瑞. 基于卷积神经网络的图像识别. 工程技术研究. 2018(04): 101-102 . 百度学术
    380. 刘涵,郭润元. 基于X射线图像和卷积神经网络的石油钢管焊缝缺陷检测与识别. 仪器仪表学报. 2018(04): 247-256 . 百度学术
    381. 陈波,余秋婷,陈铁明. 基于传感器人体行为识别深度学习模型的研究. 浙江工业大学学报. 2018(04): 375-381 . 百度学术
    382. 鄢小虎,李康,陈凯. 一种基于卷积神经网络的智慧路灯联动控制算法. 照明工程学报. 2018(04): 72-75 . 百度学术
    383. 李东东,王浩,杨帆,郑小霞,周文磊,邹胜华. 基于一维卷积神经网络和Soft-Max分类器的风电机组行星齿轮箱故障检测. 电机与控制应用. 2018(06): 80-87+108 . 百度学术
    384. 丁晓龙. 基于深度学习的图像风格迁移技术的前沿进展. 电子制作. 2018(18): 86-87+93 . 百度学术
    385. 李幼蛟,卓力,张菁,李嘉锋,张辉. 行人再识别技术综述. 自动化学报. 2018(09): 1554-1568 . 本站查看
    386. 万萌,冯新玲. 基于无监督特征选择和卷积神经网络的图像识别算法. 赤峰学院学报(自然科学版). 2018(10): 52-55 . 百度学术
    387. 李东东,王浩,杨帆,郑小霞,华伟,邹胜华. 基于无监督特征学习的行星齿轮箱故障特征提取和检测. 电网技术. 2018(11): 3805-3811 . 百度学术
    388. 王粲. 基于hashing的二值加速. 电子制作. 2018(20): 39-40+38 . 百度学术
    389. 卢鹏,林根巧,邹国良. 基于信息熵和深度学习的无参考图像质量评价方法研究. 计算机应用研究. 2018(11): 3508-3512 . 百度学术
    390. 赵志衡,宋欢,朱江波,卢雷,孙磊. 基于卷积神经网络的花生籽粒完整性识别算法及应用. 农业工程学报. 2018(21): 195-201 . 百度学术
    391. 梁蒙蒙,周涛,夏勇,张飞飞,杨健. 基于PSO-ConvK卷积神经网络的肺部肿瘤图像识别. 山东大学学报(工学版). 2018(05): 77-84 . 百度学术
    392. 杨亚东,王晓峰,潘静静. 改进CNN及其在船舶识别中的应用. 计算机工程与设计. 2018(10): 3228-3233 . 百度学术
    393. 蒋梦莹,林小竹,柯岩. 基于优化分类的数据增广方法. 计算机工程与设计. 2018(11): 3559-3563 . 百度学术
    394. 焦廉溪. 基于CNN和LSTM的交通流预测. 通讯世界. 2018(10): 265-266 . 百度学术
    395. 陈磊士,赵俊三,李易,朱祺夫,许可. 基于机器学习的多源遥感影像融合土地利用分类研究. 西南师范大学学报(自然科学版). 2018(10): 103-111 . 百度学术
    396. 孟祥锐,张树清,臧淑英. 基于卷积神经网络和高分辨率影像的湿地群落遥感分类——以洪河湿地为例. 地理科学. 2018(11): 1914-1923 . 百度学术
    397. 陈磊士,赵俊三,董智文,朱褀夫. 基于深度学习的滇中城市多光谱影像建设用地信息提取. 软件导刊. 2018(11): 177-180+186 . 百度学术
    398. 王开宇,生梦林,韩睿,李伯轩,刘晨阳,申人升. 卷积神经网络的FPGA实现及优化. 实验室科学. 2018(04): 79-84 . 百度学术
    399. 钱勇生,邵洁,季欣欣,李晓瑞,莫晨,程其玉. 基于改进卷积神经网络的多视角人脸表情识别. 计算机工程与应用. 2018(24): 12-19 . 百度学术
    400. 陈寿宏,柳馨雨,马峻,康怀强. 深度卷积神经网络胸片肺结节分类识别研究. 计算机工程与应用. 2018(24): 176-181 . 百度学术
    401. 王红杰,陈宇,周雨佳. 基于迁移学习的糖尿病视网膜图像分类方法. 黑龙江工程学院学报. 2018(06): 33-36+46 . 百度学术
    402. 杨敏. 基于文本识别的图书智能管理. 自动化技术与应用. 2018(12): 145-150 . 百度学术
    403. 华夏,王新晴,王东,马昭烨,邵发明. 基于改进SSD的交通大场景多目标检测. 光学学报. 2018(12): 221-231 . 百度学术
    404. 张薇,吕晓琪,吴凉,张明,李菁. 基于典型医学图像的分类技术研究进展. 激光与光电子学进展. 2018(12): 96-105 . 百度学术
    405. 王九清,邢素霞,王孝义,曹宇. 基于卷积神经网络与高光谱的鸡肉品质分类检测. 肉类研究. 2018(12): 36-41 . 百度学术
    406. 唐浩漾,孙梓巍,王婧,钱萌. 基于VGG-19混合迁移学习模型的服饰图片识别. 西安邮电大学学报. 2018(06): 87-93 . 百度学术
    407. 王锐,来文豪,李仲强. 基于卷积神经网络的铁轨伤损检测研究. 河南城建学院学报. 2018(06): 71-76 . 百度学术
    408. 李玉刚,王永滨. 基于注意力的图像视觉关系识别研究. 中国传媒大学学报(自然科学版). 2018(06): 36-39 . 百度学术
    409. 赵新秋,贺海龙,杨冬冬,段思雨. 基于改进的卷积神经网络在图片分类中的应用. 高技术通讯. 2018(Z2): 930-936 . 百度学术
    410. 吴乐明,刘浩,况奇刚,孙晓帆,张鑫生. 归类精度保持的图像测试集压缩方法. 电子测量与仪器学报. 2018(10): 154-160 . 百度学术
    411. 谭建灿,毛克彪,左志远,赵天杰,谭雪兰,李建军. 基于卷积神经网络和AMSR2微波遥感的土壤水分反演研究. 高技术通讯. 2018(05): 399-408 . 百度学术
    412. 郑祥祥,张治安. 一种光场图像空间和角度分辨率重建方法. 电脑知识与技术. 2017(12): 171-173 . 百度学术
    413. 张宏伟,张凌婕,李鹏飞. 基于深度卷积神经网络的织物花型分类. 纺织高校基础科学学报. 2017(02): 261-265+271 . 百度学术
    414. 董水龙,李海生,祝晓斌,蔡强. 利用CNN特征和BoWs的三维模型检索算法. 广西大学学报(自然科学版). 2017(05): 1787-1792 . 百度学术
    415. 郑友亮. 基于卷积神经网络的沿海水质评价技术研究. 自动化与信息工程. 2017(03): 12-16+36 . 百度学术
    416. 刘晨,曲长文,周强,李智. 一种卷积神经网络的优化方法. 舰船电子工程. 2017(05): 36-40 . 百度学术
    417. 徐有正,黄刚. 多标签图像的识别分类处理算法. 计算机时代. 2017(10): 4-7 . 百度学术
    418. 周飞燕,金林鹏,董军. 卷积神经网络研究综述. 计算机学报. 2017(06): 1229-1251 . 百度学术
    419. 韩光辉,刘峡壁,郑光远. 肺部CT图像病变区域检测方法. 自动化学报. 2017(12): 2071-2090 . 本站查看
    420. 李帷韬,曹仲达,朱程辉,陈克琼,王建平,刘雪景,郑成强. 基于深度集成学习的青梅品级智能反馈认知方法. 农业工程学报. 2017(23): 276-283 . 百度学术
    421. 李福卫,李玉惠. 基于卷积神经网络的图像清晰度识别方法. 软件. 2017(07): 6-9 . 百度学术
    422. 杨光,周鹏举,张宋彬,徐鹏. 基于卷积神经网络的变电站巡检机器人图像识别. 软件. 2017(12): 190-192 . 百度学术
    423. 张宏伟,张凌婕,李鹏飞,宋执环. 基于GoogLeNet的色织物花型分类. 纺织科技进展. 2017(07): 33-35+52 . 百度学术
    424. 李孟起,郑煜辰. 基于深度学习特征和在线感知机的物体识别系统. 数码世界. 2017(08): 200-201 . 百度学术
    425. 胡彩霞,熊平,周欣星. 基于卷积神经网络的人行道识别算法研究. 信息与电脑(理论版). 2017(21): 53-55 . 百度学术
    426. 白中浩,王鹏辉,李智强. 基于Stixel-world及特征融合的双目立体视觉行人检测. 仪器仪表学报. 2017(11): 2822-2829 . 百度学术
    427. 刘万军,梁雪剑,曲海成. 自适应增强卷积神经网络图像识别. 中国图象图形学报. 2017(12): 1723-1736 . 百度学术

    其他类型引用(1171)

  • 加载中
图(3) / 表(2)
计量
  • 文章访问数:  8953
  • HTML全文浏览量:  3489
  • PDF下载量:  7355
  • 被引次数: 1598
出版历程
  • 收稿日期:  2015-12-11
  • 录用日期:  2016-05-03
  • 刊出日期:  2016-09-01

目录

/

返回文章
返回