张慧 王坤峰 王飞跃

张慧, 王坤峰, 王飞跃. 深度学习在目标视觉检测中的应用进展与展望. 自动化学报, 2017, 43(8): 1289-1305. doi: 10.16383/j.aas.2017.c160822
ZHANG Hui, WANG Kun-Feng, WANG Fei-Yue. Advances and Perspectives on Applications of Deep Learning in Visual Object Detection. ACTA AUTOMATICA SINICA, 2017, 43(8): 1289-1305. doi: 10.16383/j.aas.2017.c160822
国家自然科学基金 61304200

国家留学基金 201504910397

国家自然科学基金 61533019


    张慧    中国科学院自动化研究所复杂系统管理与控制国家重点实验室博士研究生.主要研究方向为智能交通系统, 目标视觉检测, 深度学习.E-mail:zhanghui2015@ia.ac.cn

    王坤峰    中国科学院自动化研究所复杂系统管理与控制国家重点实验室副研究员.主要研究方向为智能交通系统, 智能视觉计算, 机器学习.E-mail:kunfeng.wang@ia.ac.cn


    王飞跃    中国科学院自动化研究所复杂系统管理与控制国家重点实验室研究员.国防科学技术大学军事计算实验与平行系统技术研究中心主任.主要研究方向为智能系统和复杂系统的建模、分析与控制.本文通信作者.E-mail:feiyue.wang@ia.ac.cn

Advances and Perspectives on Applications of Deep Learning in Visual Object Detection


National Natural Science Foundation of China 61304200

China Scholarship Council 201504910397

National Natural Science Foundation of China 61533019

       Ph. D. candidate at the State Key Laboratory of Management and Control for Complex Systems, Institute of Automation, Chinese Academy of Sciences. Her research interest covers intelligent transportation systems, object vision detection, and deep learning.E-mail:

       Associate professor at the State Key Laboratory of Management and Control for Complex Systems, Institute of Automation, Chinese Academy of Sciences. His research interest covers intelligent transportation systems, intelligent vision computing, and machine learning.E-mail:

    Corresponding author: WANG Fei-Yue    Professor at the State Key Laboratory of Management and Control for Complex Systems, Institute of Automation, Chinese Academy of Sciences. Director of the Research Center for Computational Experiments and Parallel Systems Technology, National University of Defense Technology. His research interest covers modeling, analysis, and control of intelligent systems and complex systems. Corresponding author of this paper.E-mail:feiyue.wang@ia.ac.cn
  • 摘要: 目标视觉检测是计算机视觉领域的一个重要问题,在视频监控、自主驾驶、人机交互等方面具有重要的研究意义和应用价值.近年来,深度学习在图像分类研究中取得了突破性进展,也带动着目标视觉检测取得突飞猛进的发展.本文综述了深度学习在目标视觉检测中的应用进展与展望.首先对目标视觉检测的基本流程进行总结,并介绍了目标视觉检测研究常用的公共数据集;然后重点介绍了目前发展迅猛的深度学习方法在目标视觉检测中的最新应用进展;最后讨论了深度学习方法应用于目标视觉检测时存在的困难和挑战,并对今后的发展趋势进行展望.
    1)  本文责任编委 周涛
  • 图  1  目标视觉检测的基本流程

    Fig.  1  Basic procedure for object detection

    图  2  几种公共数据集的对比图

    Fig.  2  Comparison of several common datasets

    图  3  卷积神经网络的基本结构[59]

    Fig.  3  Basic structure of convolutional neural network[59]

    图  4  ILSVRC图像分类任务历年冠军方法的Top-5错误率(下降曲线)和网络层数(上升曲线)

    Fig.  4  Top-5 error rate (descent curve) and network layers (rise curve) of the champion methods each year in image classification task of ILSVRC

    图  5  R-CNN的计算流程[44]

    Fig.  5  Calculation flow of R-CNN[44]

    图  6  Fast R-CNN的计算流程[58]

    Fig.  6  Calculation flow of Fast R-CNN[58]

    图  7  区域建议网络的基本结构[7]

    Fig.  7  Basic structure of region proposal network[7]

    图  8  HyperNet的计算流程[73]

    Fig.  8  Calculation flow of HyperNet[73]

    图  9  基于DNN回归的目标检测框架[1]

    Fig.  9  Object detection framework based on DNN regression[1]

    图  10  一些目标视觉检测方法在公共数据集上的性能比较

    Fig.  10  Performance comparison of some object visual detection methods on public datasets

    图  11  平行视觉的基本框架[85]

    Fig.  11  Basic framework of parallel vision[85]

    表  1  经典CNN模型在ILSVRC图像分类任务上的性能对比

    Table  1  Performance comparison of classical CNN model in image classification task of ILSVRC

    Inception-v4, Inception-ResNet[65]3.08
    下载: 导出CSV
