谭建豪 郑英帅 王耀南 马小萍

谭建豪, 郑英帅, 王耀南, 马小萍. 基于中心点搜索的无锚框全卷积孪生跟踪器. 自动化学报, 2021, 47(4): 801−812 doi: 10.16383/j.aas.c200469
引用本文: 谭建豪, 郑英帅, 王耀南, 马小萍. 基于中心点搜索的无锚框全卷积孪生跟踪器. 自动化学报, 2021, 47(4): 801−812 doi: 10.16383/j.aas.c200469
Tan Jian-Hao, Zheng Ying-Shuai, Wang Yao-Nan, Ma Xiao-Ping. AFST: Anchor-free fully convolutional siamese tracker with searching center point. Acta Automatica Sinica, 2021, 47(4): 801−812 doi: 10.16383/j.aas.c200469
Citation: Tan Jian-Hao, Zheng Ying-Shuai, Wang Yao-Nan, Ma Xiao-Ping. AFST: Anchor-free fully convolutional siamese tracker with searching center point. Acta Automatica Sinica, 2021, 47(4): 801−812 doi: 10.16383/j.aas.c200469


doi: 10.16383/j.aas.c200469
基金项目: 国家自然科学基金(61433016)资助

    谭建豪:湖南大学电气与信息工程学院教授. 主要研究方向为智能机器人, 数据挖掘和模式识别. E-mail: tanjianhao96@sina.com

    郑英帅:湖南大学电气与信息工程学院硕士研究生. 主要研究方向为计算机视觉, 机器学习. 本文通信作者. E-mail: zheng_ys415@163.com

    王耀南:湖南大学电气与信息工程学院教授. 主要研究方向为智能控制理论, 机器人系统和计算机视觉. E-mail: yaonan@hnu.edu.cn

    马小萍:湖南大学电气与信息工程学院硕士研究生. 主要研究方向为机器视觉, 无人机控制技术. E-mail: maxiaoping@hnu.edu.cn

AFST: Anchor-free Fully Convolutional Siamese Tracker With Searching Center Point

Funds: Supported by National Natural Science Foundation of China (61433016)
    TAN Jian-Hao Professor at the School of Electrical and Information Engineering, Hunan University. His research interest covers intelligent robots, data mining, and pattern recognition

    ZHENG Ying-Shuai Master student at the School of Electrical and Information Engineering, Hunan University. His research interest covers computer vision and machine learning. Corresponding author of this paper

    WANG Yao-Nan Professor at the School of Electrical and Information Engineering, Hunan University. His research interest covers intelligent control theory, robot systems, and computer vision

    MA Xiao-Ping Master student at the School of Electrical and Information Engineering, Hunan University. Her research interest covers machine vision and UAV control technology

  • 摘要: 为解决孪生网络跟踪器鲁棒性差的问题, 重新设计了孪生网络跟踪器的分类与回归分支, 提出一种基于像素上直接预测方式的高鲁棒性跟踪算法—无锚框全卷积孪生跟踪器(Anchor-free fully convolutional siamese tracker, AFST). 目前高性能的跟踪算法, 如SiamRPN、SiamRPN++、CRPN都是基于预定义的锚框进行分类和目标框回归. 与之相反, 提出的AFST则是直接在每个像素上进行分类和预测目标框. 通过去掉锚框, 大大简化了分类任务和回归任务的复杂程度, 并消除了锚框和目标误匹配问题. 在训练中, 还进一步添加了同类不同实例的图像对, 从而引入了相似语义干扰物, 使得网络的训练更加充分. 在VOT2016、GOT-10k、OTB2015三个公开的基准数据集上的实验表明, 与现有的跟踪算法对比, AFST达到了先进的性能.
  • 图  1  AFST网络流程框架图

    Fig.  1  AFST network flow diagram

    图  2  多级融合模块

    Fig.  2  Multistage feature fusion

    图  3  回归方式

    Fig.  3  Regression approach

    图  4  两种计算CS的方式

    Fig.  4  Two ways to calculate center score

    图  5  基于中心得分的搜索过程图

    Fig.  5  A search process graph based on the center score

    图  6  采样策略对比图

    Fig.  6  Sampling strategy comparison diagram

    图  7  不同挑战下的精度−鲁棒性曲线图

    Fig.  7  Accuracy-Robustness curves for different challenges

    图  8  不同视频序列跟踪结果

    Fig.  8  Tracking results for different video sequences

    图  9  OTB2015结果对比图

    Fig.  9  Comparison chart of results on OTB2015

    图  10  GOT-10k成功率对比图

    Fig.  10  Success rate comparison graph on GOT-10k

    图  11  锚框与目标框误匹配

    Fig.  11  The anchor box is mismatched with the target box

    图  12  锚框分布图

    Fig.  12  Anchor box distribution map

    表  1  消融实验

    Table  1  Ablation experiments

    3ResNet50cls + regnone0.5920.3330.345nonenone
    4ResNet50cls + regnone0.6020.3020.355sumnone
    5ResNet50cls + regnone0.6070.2420.382sumyes
    6ResNet50cls + regCS0.6100.2240.415concatyes
    7ResNet50cls + regCS0.6140.2380.397sumyes
    8ResNet50cls + regCS0.6240.2050.412msfyes
    表  2  VOT2016上与多个跟踪器对比

    Table  2  Compare with multiple trackers on VOT2016

    表  3  不同挑战因素下的失败率

    Table  3  Failure rates under different challenge factors

    表  4  GOT-10k上与多个跟踪器对比

    Table  4  Compare with multiple trackers on GOT-10k

