刘雅婷 王坤峰 王飞跃

谢昭, 童昊浩, 孙永宣, 吴克伟. 一种仿生物视觉感知的视频轮廓检测方法. 自动化学报, 2015, 41(10): 1814-1824. doi: 10.16383/j.aas.2015.c150018
引用本文: 刘雅婷, 王坤峰, 王飞跃. 基于踪片Tracklet关联的视觉目标跟踪:现状与展望. 自动化学报, 2017, 43(11): 1869-1885. doi: 10.16383/j.aas.2017.c170117
XIE Zhao, TONG Hao-Hao, SUN Yong-Xuan, WU Ke-Wei. Dynamic Contour Detection Inspired by Biological Visual Perception. ACTA AUTOMATICA SINICA, 2015, 41(10): 1814-1824. doi: 10.16383/j.aas.2015.c150018
Citation: LIU Ya-Ting, WANG Kun-Feng, WANG Fei-Yue. Tracklet Association-based Visual Object Tracking:The State of the Art and Beyond. ACTA AUTOMATICA SINICA, 2017, 43(11): 1869-1885. doi: 10.16383/j.aas.2017.c170117


国家自然科学基金 91520301

国家自然科学基金 61533019

国家自然科学基金 71232006


    刘雅婷 中国科学院自动化研究所复杂系统管理与控制国家重点实验室博士研究生.主要研究方向为视觉目标跟踪, 机器学习.E-mail:liuyating2015@ia.ac.cn

    王坤峰 中国科学院自动化研究所复杂系统管理与控制国家重点实验室副研究员.主要研究方向为智能交通系统, 智能视觉计算, 机器学习.E-mail:kunfeng.wang@ia.ac.cn


    王飞跃 中国科学院自动化研究所复杂系统管理与控制国家重点实验室研究员.国防科技大学军事计算实验与平行系统技术研究中心主任.主要研究方向为智能系统和复杂系统的建模、分析与控制.本文通信作者.E-mail:feiyue.wang@ia.ac.cn

Tracklet Association-based Visual Object Tracking:The State of the Art and Beyond


National Natural Science Foundation of China 91520301

National Natural Science Foundation of China 61533019

National Natural Science Foundation of China 71232006

    Author Bio:

    Ph. D. candidate at The State Key Laboratory of Management and Control for Complex Systems, Institute of Automation, Chinese Academy of Sciences. Her research interest covers visual object tracking and machine learning

    Associate professor at The State Key Laboratory of Management and Control for Complex Systems, Institute of Automation, Chinese Academy of Sciences. His research interest covers intelligent transportation systems, intelligent vision computing, and machine learning

    Corresponding author: WANG Fei-Yue Professor at The State Key Laboratory of Management and Control for Complex Systems, Institute of Automation, Chinese Academy of Sciences. Director of the Research Center for Computational Experiments and Parallel Systems Technology, National University of Defense Technology. His research interest covers modeling, analysis, and control of intelligent systems and complex systems. Corresponding author of this paper
  • 摘要: 近年来,由于计算机视觉技术的发展和计算机硬件性能的提高,基于视觉的目标跟踪方法得到了飞速的发展.其中,基于踪片(Tracklet)关联的目标跟踪方法因为具有对目标遮挡的强鲁棒性、算法运行的快速性等优点得到了广泛关注,本文对这类方法的最新研究进展进行了综述.首先,简明地介绍了视觉目标跟踪的基本知识、研究意义和研究现状.然后,通过感兴趣目标检测、跟踪特征提取、踪片生成、踪片关联与补全四个步骤,系统详尽地介绍了基于踪片关联的目标跟踪方法,分析了近年来提出的一些踪片关联方法的优缺点.最后,本文指出了该研究问题的发展方向,一方面要提出更先进的目标跟踪模型,另一方面要采用平行视觉方法进行虚实互动的模型学习与评估.

  • 图  1  基于踪片关联的视觉目标跟踪方法流程图

    Fig.  1  Flowchart of visual object tracking based on tracklet association

    图  2  位置相关性示意图

    Fig.  2  Sketch map of position relations

    图  3  踪片对运动相似性估计[58]

    Fig.  3  Estimation of motion similarity between a pair of tracklets[58]

    图  4  有遮挡的目标跟踪轨迹[62]

    Fig.  4  Tracklet association for occluded objects[62]

    图  5  特定目标度量的踪片关联框架图[63]

    Fig.  5  Framework of tracklet association through target-specific metric learning[63]

    图  6  二分图算法和GMCP算法比较[68]

    Fig.  6  The comparison of bipartite and GMCP matching[68]

    图  7  基于卷积神经网络和时空约束的踪片关联示意图[69

    Fig.  7  Illustration of tracklet association based on convolutional neural networks and spatio-temporal constraint[69]

    图  8  基本关联与社交组关联结合[71]

    Fig.  8  Illustration of the combination of tracklet association and social grouping[71]

    图  9  不同场景下的人群动力学模型[83]

    Fig.  9  The crowd dynamic models in different scenes[83]

    图  10  平行视觉的基本框架与体系结构[93]

    Fig.  10  Basic framework and architecture for parallel vision[93]

    表  1  多目标跟踪常见的公共数据集

    Table  1  Frequently used public datasets for multi-target tracking research

    MOT challenge[48]2015年不仅标记了行人, 车辆、静态的人、遮挡物体等都被标注22个视频序列, 共11 286帧图像实际数据集
    CAVIAR[49]2003年行人会面、购物, 穿越拥挤人群及在公共场所遗失行李等复杂场景28段视频实际数据集
    i-LIDS[50]2006年多摄像机配置, 可以选择多视角的数据进行实验10小时视频实际数据集
    UA-DETRAC[51]2015年多个数据采集地; 涉及汽车、公共汽车、货车等多种车辆; 包含多云、夜晚、晴天和下雨等天气条件10小时视频实际数据集
    文献[52]中的数据集2014年从拥挤繁忙的火车站采集42 million的轨迹实际数据集
    KITTI[53]2012年每幅图像多达15辆车和30个行人; 包含三维立体, 光流, 视觉光度法, 3D物体检测和3D跟踪50个视频序列实际数据集
    Virtual KITTI[46]2016年数据从不同的成像和天气条件下的五个虚拟世界生成.有准确, 完整的2D和3D多对象跟踪注释, 并有像素级别和实例级别标签, 以及深度标签50个高分辨率单目视频, 共21 260帧虚拟数据集
    SYNTHIA[54]2016年多样化的场景; 多种动态物体种类; 多季节; 不同的照明条件和天气情况; 多传感器多视角2分23秒雪景及1分48秒傍晚车载视频序列虚拟数据集
    表  2  踪片关联跟踪方法在公共数据集上的测试情况表

    Table  2  Testing results of tracklet association-based tracking methods on public datasets

    方法 数据集 MT
    文献[58] PETS09 89.9 0.0 13 0
    TUD 70.0 0.0 1 0
    文献[63] TUD 100 0.0 3 0
    文献[66] CAVIAR 84.0 4.0 6 8
    文献[68] PETS09-view1 8 90.3 % 69.02 %
    文献[69] PETS09 94.7 0.0 8 4 95.8 % 86.4 %
    MOT Challenge 11.2 44.8 943 712 29.6 % 71.8 %
    文献[71] CAVIAR 88.0 2.6 5 6
    文献[73] CAVIAR 84.3 3.6 14
    文献[75] PETS09 89.5 0.0 21 15
    CAVIAR 89.1 0.7 11 5
