2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种用于目标跟踪边界框回归的光滑IoU损失

李功 赵巍 刘鹏 唐降龙

李功, 赵巍, 刘鹏, 唐降龙. 一种用于目标跟踪边界框回归的光滑IoU损失. 自动化学报, 2023, 49(2): 288−306 doi: 10.16383/j.aas.c210525
引用本文: 李功, 赵巍, 刘鹏, 唐降龙. 一种用于目标跟踪边界框回归的光滑IoU损失. 自动化学报, 2023, 49(2): 288−306 doi: 10.16383/j.aas.c210525
Li Gong, Zhao Wei, Liu Peng, Tang Xiang-Long. Smooth-IoU loss for bounding box regression in visual tracking. Acta Automatica Sinica, 2023, 49(2): 288−306 doi: 10.16383/j.aas.c210525
Citation: Li Gong, Zhao Wei, Liu Peng, Tang Xiang-Long. Smooth-IoU loss for bounding box regression in visual tracking. Acta Automatica Sinica, 2023, 49(2): 288−306 doi: 10.16383/j.aas.c210525

一种用于目标跟踪边界框回归的光滑IoU损失

doi: 10.16383/j.aas.c210525
基金项目: 国家自然科学基金(51935005), 基础科研项目(JCKY20200603C010), 空间智能控制技术重点实验室基金(ZDSYS-2018-02)资助
详细信息
    作者简介:

    李功:哈尔滨工业大学模式识别与智能系统研究中心博士研究生. 分别于2015年和2018年获得哈尔滨工业大学学士和硕士学位. 主要研究方向为计算机视觉中的目标跟踪, 模式识别. E-mail: ligong101@126.com

    赵巍:哈尔滨工业大学副教授. 主要研究方向为模式识别, 机器学习和计算机视觉. 本文通信作者.E-mail: zhaowei@hit.edu.cn

    刘鹏:哈尔滨工业大学教授. 2007 年获得哈尔滨工业大学博士学位. 主要研究方向为图像处理, 视频分析, 模式识别和大规模集成电路设计. E-mail: pengliu@hit.edu.cn

    唐降龙:哈尔滨工业大学教授. 1995年获得哈尔滨工业大学博士学位. 主要研究方向为模式识别, 图像处理和机器学习. E-mail: tangxl@hit.edu.cn

Smooth-IoU Loss for Bounding Box Regression in Visual Tracking

Funds: Supported by National Natural Science Foundation of China (51935005), Basic Scientific Research Projects (JCKY20200603C010), and Mutual Fund of Space Intelligent Control Technology Key Laboratory (ZDSYS-2018-02)
More Information
    Author Bio:

    LI Gong Ph.D. candidate at the Pattern Recognition and Intelligent System Research Center, Harbin Institute of Technology. He received his bachelor and master degrees from Harbin Institute of Technology in 2015 and 2018, respectively. His research interest covers target tracking in computer vision and pattern recognition

    ZHAO Wei Associate professor at Harbin Institute of Technology. Her research interest covers pattern recognition, machine learning, and computer vision. Corresponding author of this paper

    LIU Peng Professor at Harbin Institute of Technology. He received his Ph.D. degree from Harbin Institute of Technology in 2007. His research interest covers image processing, video analysis, pattern recognition, and design of large scale integrated circuits

    TANG Xiang-Long Professor at Harbin Institute of Technology. He received his Ph.D. degree from Harbin Institute of Technology in 1995. His research interest covers pattern recognition, image processing, and machine learning

  • 摘要: 边界框回归分支是深度目标跟踪器的关键模块, 其性能直接影响跟踪器的精度. 评价精度的指标之一是交并比(Intersection over union, IoU). 基于IoU的损失函数取代了$ \ell_n $-norm损失成为目前主流的边界框回归损失函数, 然而IoU损失函数存在2个固有缺陷: 1)当预测框与真值框不相交时IoU为常量 0, 无法梯度下降更新边界框的参数; 2)在IoU取得最优值时其梯度不存在, 边界框很难收敛到 IoU 最优处. 揭示了在回归过程中IoU最优的边界框各参数之间蕴含的定量关系, 指出在边界框中心处于特定位置时存在多种尺寸不同的边界框使IoU损失最优的情况, 这增加了边界框尺寸回归的不确定性. 从优化两个统计分布之间散度的视角看待边界框回归问题, 提出了光滑IoU (Smooth-IoU, SIoU)损失, 即构造了在全局上光滑(即连续可微)且极值唯一的损失函数, 该损失函数自然蕴含边界框各参数之间特定的最优关系, 其唯一取极值的边界框可使IoU达到最优. 光滑性确保了在全局上梯度存在使得边界框更容易回归到极值处, 而极值唯一确保了在全局上可梯度下降更新参数, 从而避开了IoU损失的固有缺陷. 提出的光滑损失可以很容易取代IoU损失集成到现有的深度目标跟踪器上训练边界框回归, 在 LaSOT、GOT-10k、TrackingNet、OTB2015和VOT2018测试基准上所取得的结果, 验证了光滑IoU损失的易用性和有效性.
  • 近年来, 随着互联网、云计算等信息科技的蓬勃发展, 2006年美国国家科学基金会提出了信息技术的发展方向 — 信息物理系统(Cyber-physical system, CPS)[1], CPS是计算资源和物理资源的紧密耦合与协同, 使得系统的适应性、自治力、可靠性、安全性和可用性远超当前的系统[2]. 能源是人类赖以生存和发展的基础, 能源的可持续和清洁化始终是人类孜孜以求的目标[3]. 近年来, 随着风、光等新能源利用技术的高速发展, 以风、光等永续清洁能源为主要供能形式, 建设清洁低碳安全高效的信息能源系统, 实现绿色可再生能源高效利用, 破解当前化石能源困局成为业界重要共识[4]. 尽管信息物理系统的稳定性已经得到了广泛的研究, 但大部分的学者皆关注于通信网络延时或攻击下的信息物理系统的稳定性问题[5-6], 无网络通信的信息物理系统的信−物融合稳定性分析策略亟待提出. 其中, 内嵌数字控制系统的并网逆变器系统可以被认为是最简单和最典型的信息能源系统之一. 基于此, 本文聚焦于无通信网络的内嵌数字控制的并网逆变器系统, 提出信息能源系统的信−物融合稳定性分析技术.

    信息能源/信息电力系统稳定性已经被广泛研究, 其可以被区分为网络攻击下的系统稳定性问题和无网络攻击下的系统稳定性问题[7-11]. 从攻击角度出发, 当前研究已经从网络攻击[7]、攻击级联反应[8]、主动预防[9]等多角度构建了相对完整的研究体系. 从无攻击角度出发, 当前研究多集中于分布式/集中式通信网络的延时. Xu等[10]和张一媚等[11]分别对信息电力系统和信息能源系统信−物融合导致的通信延时设计了延时阈值条件. 两者都是针对二级控制中存在的通信延时展开研究, 给出了二级控制中致使控制器失效的极限延时时间. 无通信网络的底层信息能源网络稳定性评估尚属空白, 而隶属于无通信网络的底层信息能源网络的内嵌数字控制系统的并网逆变器系统可以被认为最简单而典型的信息物理系统之一, 其包含数字控制系统和电力变换器件而无通信网络. 从效率的角度出发, 逆变器的开关/采样频率总是选择尽可能低的频率, 其势必产生系统固有延迟时间[12], 此固有延时时间由信息/物理层的采样延迟时间、信息层的计算延迟时间和物理层的脉宽调制(Pulse-width modulation, PWM)延迟时间三部分组成, 其有效反映了信息−物理相互融合作用的影响. 因此, 确保系统稳定情况下的信息−物理相互融合而导致的等效延时的阈值亟待提出, 该阈值可以进一步指导实际微电网开关/采样频率的选取, 避免系统出现信息−物理融合影响而导致的失稳现象. 同时, 在2020年, 功率−信号混合传递策略在Nature Communications上被提出, 本文方法不需要传统的通信网络, 而是通过物理层的脉宽调制的开关频率和相位偏差两个自由度传递信息, 该方法将信息−物理耦合成了一个整体[13]. 然而该方法需要一系列正交的开关频率传递信息, 随着开关频率的降低也会导致信息−物理融合的低频/次同步振荡问题.

    由采样−计算−脉宽调制造成的固有延时隶属于纳秒级延时, 同时隶属于系统最底层且基础的电磁时间尺度的稳定性问题和电力系统中的静态小扰动稳定性问题[14]. 目前, 电磁时间尺度稳定性分析技术已经取得了诸多研究成果[15-23]. 相关成果可以被分为基于状态方程的稳定性分析技术[14-17]、基于闭环传递函数的稳定性分析技术[18-19]和基于阻抗方法的稳定性分析技术[20-26] 3个大类. 其中基于状态方程的稳定性分析技术首先从电能变换器件及其连接线路的角度出发构建整个系统的状态方程, 其主要热点及难点问题在于构建整个状态方程时考虑延时、锁相环耦合等问题. 文献[14]提出通过柏德近似等方法对上述问题进行化简. 此外, 当电力变换器的数量增多时, 整体的状态方程将变得十分复杂, 目前有效的解决方法是对整体的状态方程进行降阶, 如奇异值摄动法[15]、Schur变换法[16]和Kron降阶法[17]等. 基于闭环传递函数的稳定性分析方法是建立整个系统模型并利用波特图和根轨迹等方法判别系统的稳定性[18]. 然而基于闭环传递函数的波特图和根轨迹法也存在复杂的计算量, 因此, 该稳定性分析方法也需要降阶处理, 其常见的降阶方法有奇异值摄动法等[19]. 然而, 状态方程法和闭环传递函数法随着变换器数量增加而导致模型维数灾问题, 并且随着可再生能源的渗透率不断地提高, 整个网络的状态方程或传递函数难以构建[20].

    因此, 基于阻抗方法的电磁时间尺度稳定性分析技术越来越得到学者的关注. 阻抗方法通过构建整个系统的阻抗模型并利用广义奈奎斯特曲线[21]以判别系统稳定性. 鉴于双向能流的交/直流混合微电网的急速发展, 文献[21]首先提出了Z$+ $Z型阻抗评估判据. 鉴于现存广义奈奎斯特判据高复杂性, 相关学者提出了简化稳定判据, 如范数阻抗判据和禁止区域阻抗判据[22-24]. 其中, 根据不同范数类别和判据区间范围, 将基于范数的阻抗判据分为G范数判据、Infinity范数判据和Infinity-one范数判据[22] 3类. 另外一系列的稳定判据则基于禁止区域, 如Middlebrook判据、增益和相位裕度判据、对立的观点判据等[23-24]. 然而上述阻抗稳定性分析方法多关注于稳定运行点的辨识和所构建的回比矩阵的稳定裕度, 而无法提供确保系统稳定运行时, 等效延时的变化区域或系统采样/开关频率阈值. 为了提供在信息−物理融合影响的情况下确保系统稳定的采样/开关频率阈值, 本文提出了一种基于自适应步长搜索算法的采样/开关频率阈值辨识技术. 本文的主要特点和优点如下:

    1)本文构建了内嵌等效时延的广义阻抗回比矩阵, 该等效延迟时间由信息/物理层的采样延迟时间、信息层的计算延迟时间和物理层的脉宽调制延迟时间3部分组成. 其有效反映了信息−物理相互融合作用的影响和为后续系统采样/开关频率阈值辨识提供模型基础.

    2)本文利用柏德逼近技术将延时的指数型函数转化为频率分数函数, 进而将系统采样/开关频率阈值的求解问题转化为等效回比矩阵为Hurwitz的辨识问题. 其消除了传统阻抗技术中所涉及的广义奈奎斯特判据复杂度高的问题, 进而可以获得工程可用的稳定性判据.

    3)本文提出了基于自适应步长搜索算法的采样/开关频率阈值辨识技术, 其能够获得信息能源系统采样/开关频率阈值, 有效指导微电网开关/采样频率的选取, 避免系统出现信息−物理融合影响而导致失稳现象.

    常见的内嵌数字控制系统的并网逆变器系统如图1所示[23-27], 图1中, DG代表分布式电源. 在弱电网当中, 相较于传统的P&Q控制型并网逆变器, 下垂控制型并网逆变器具备更好的系统稳定性. 基于此, 下垂控制型并网逆变器已经被广泛应用于当前的交流微电网当中[22], 具体控制策略见文献[23]. 在此类分散式控制系统当中, 信息物理网络间存在固有延时时间, 包括信息/物理层的采样延迟时间、信息层的计算延迟时间和物理层的脉宽调制延迟时间三部分组成, 其有效反映了信息−物理相互融合作用的影响[24]. 在本文中, 由于此信息−物理相互融合作用而产生的等效延时定义为$ G\left( \tau \right) $. 从稳定性分析判据出发, 本文所研究的微电网系统可以等效为如图2所示的同步旋转坐标系下(dq轴)的戴维南等效电路[2]. 值得注意的是, 本文将多个分布式电源和逆变器系统等效为图2的单电源系统, 该等效是阻抗辨识技术相较于其他方法的最大优势, 通过网络拓扑等效可以降低计算负担, 本方法保留了精细划分不同电源/逆变器分别对系统稳定性的影响/贡献量, 可以利用参与因子法对某个或某几个电源/逆变器的影响进行精细化区分.

    图 1  内嵌数字控制系统的并网逆变器
    Fig. 1  Grid connected inverter with digital control system
    图 2  互联系统戴维南等效电路
    Fig. 2  Thevenin equivalent circuit of interconnected system

    相关电源/负载阻抗可以通过如下过程获得: 在dq轴下, 下垂控制器的电压/电流动态特性如下所示[27]:

    $$ {V_{invd}} = {I_{invd}}({R_{inv}} + s{L_{inv}}) - \omega {L_{inv}}{I_{invq}} + {V_{cd}} $$ (1)
    $$ {V_{invq}} = {I_{invq}}({R_{inv}} + s{L_{inv}}) + \omega {L_{inv}}{I_{invd}} + {V_{cq}} $$ (2)
    $$ {I_{invd}} = {C_{inv}}{V_{cd}}s - \omega {C_{inv}}{V_{cq}} + {I_{cd}} $$ (3)
    $$ {I_{invq}} = {C_{inv}}{V_{cq}}s + \omega {C_{inv}}{V_{cd}} + {I_{cq}} $$ (4)

    式中, $ {V_{invd}} $$ {V_{invq}} $$ {I_{invd}} $$ {I_{invq}} $分别表示在dq轴下并网逆变器的输出电压和电流; $ {V_{cd}} $$ {V_{cq}} $$ {I_{cd}} $$ {I_{cq}} $分别表示在dq轴下并网逆变器的电压和电流; $ {R_{inv}} $$ {L_{inv}} $$ {C_{inv}} $分别表示电阻−电感−电容(Resistance-inductance-capacitance, RLC)电路中的电阻、电感和电容. 进一步, 电压−电流双闭环控制器如下所示[27]:

    $$ I_{invd}^\# = G_v^{inv}(V_{cd}^\# - {V_{cd}}) - \omega {C_{inv}}{V_{cq}} + K{I_{cd}} $$ (5)
    $$ I_{invq}^\# = G_v^{inv}(V_{cq}^\# - {V_{cq}}) + \omega {C_{inv}}{V_{cd}} + K{I_{cq}} $$ (6)
    $$ V_{invd}^\# = G_i^{inv}(I_{cd}^\# - {I_{cd}}) - \omega {L_{inv}}{I_{cq}} + {V_{cd}} $$ (7)
    $$ V_{invq}^\# = G_i^{inv}(I_{cq}^\# - {I_{cq}}) + \omega {L_{inv}}{I_{cd}} + {V_{cq}} $$ (8)

    式中, $ I_{cd}^\# $$ I_{cq}^\# $$ V_{cd}^\# $$ V_{cq}^\# $分别表示在dq轴下并网逆变器电流和电压信号, $ G_v^{inv} $$ G_i^{inv} $表示电压/电流双闭环比例积分(Proportional integral, PI)控制器$(G_v^{inv} = k_{vp}^{inv} + k_{vi}^{inv}/s$$G_i^{inv} = k_{ip}^{inv} + k_{ii}^{inv}/s),$$ K $表示反馈系数. 此外, 瞬时有功功率$ {p_{inv}} $和无功功率$ {q_{inv}} $通过式(9) 、式 (10)提供, 低通滤波器被应用至逆变器当中以获取平抑波动的有功功率$ {P_{inv}} $和无功功率$ {Q_{inv}} $, 基于此, 逆变器的输出有功功率和无功功率如下所示:

    $$ {p_{{{inv}}}} = {\text{1}}{\text{.5}}\left( {{V_{cd}}{I_{cd}} + {V_{cq}}{I_{cq}}} \right) $$ (9)
    $$ {q_{{{inv}}}} = {\text{1}}{\text{.5}}\left( {{V_{cd}}{I_{cq}} - {V_{cq}}{I_{cd}}} \right) $$ (10)
    $$ {P_{inv}} = \frac{{{\omega _f}}}{{s + {\omega _f}}}{p_{inv}} $$ (11)
    $$ {Q_{inv}} = \frac{{{\omega _f}}}{{s + {\omega _f}}}{q_{inv}} $$ (12)

    式中, $ {\omega _f} $表示低通滤波器的截止频率. 如图3所示, 在内嵌数字控制系统的并网逆变器系统, 系统等效延时由3部分组成, 即, 信息/物理层的采样延迟时间和信息层的计算延迟时间可以表征为$ G\left( {{\tau _1}} \right) $, 其中$ {\tau _1} = {T_s} $, $ {T_s} $表示采样周期, 即采样频率的倒数, $ {T_s} = 1/{f_s} $, 物理层的脉宽调制延迟时间可以表征为$ G\left( {{\tau _2}} \right) $, 其中$ {\tau _2} = 0.5{T_w} $, $ {T_w} $表示脉宽调制周期, 即开关频率的倒数, $ {T_w} = 1/{f_w} $. 传统上, 采样周期和脉宽调制周期往往取值相同[24]. 基于此, 系统等效延时可以表示为$G\left( \tau \right) = {{\rm{e}}^{ - \tau s}} = {{\rm{e}}^{ - 1.5{T_s}s}} = {{\rm{e}}^{ - 1.5{T_w}s}} = {{\rm{e}}^{ - 1.5Ts}}$, 其中, $ T $表示系统采样或开关周期. 因此, 式(11) 、式 (12)可以表示为:

    图 3  时间延时构成
    Fig. 3  Time-delay components
    $$ {P_{inv}} = \frac{{{\omega _f}}}{{s + {\omega _f}}}{{\rm{e}}^{ - 1.5Ts}}{p_{inv}} $$ (13)
    $$ {Q_{inv}} = \frac{{{\omega _f}}}{{s + {\omega _f}}}{{\rm{e}}^{ - 1.5Ts}}{q_{inv}} $$ (14)

    式中, $ s $表示拉普拉斯因子, 根据文献[13]可知, ${{\rm{e}}^{ - 1.5Ts}} = 4f - 3s/4f + 3s$, 其中$ f $表示系统采样或开关频率. 下垂控制器可以表示为

    $$ \omega = {\omega ^\# } - m{P_{inv}} $$ (15)
    $$ V_{cd}^\# = {V^\# } - n{Q_{inv}} $$ (16)

    式中, $ {\omega ^\# } $$ {V^\# } $分别表示额定角频率和电压, 依据动态矢量技术[27], 式(1) 、 式(2)和式(7) 、式 (8)进行偏差分析, 其中主要利用的原理: $x = y = {x^\# } + \Delta x = {y^\# } + \Delta y \to \Delta x = \Delta y$, 因此, $ \Delta I_{inv}^\# $的小信号模型为:

    $$ \left[ {\begin{array}{*{20}{l}} {\Delta I_{invd}^\# } \\ {\Delta I_{invq}^\# } \end{array}} \right] = {\left[ {B1} \right]_{2 \times 2}}\left[ {\begin{array}{*{20}{l}} {\Delta I_{invd}^{}} \\ {\Delta I_{invq}^{}} \end{array}} \right] + {\left[ {B2} \right]_{2 \times 2}}\left[ {\begin{array}{*{20}{c}} {\Delta \omega } \\ {\Delta V_{cd}^\# } \end{array}} \right] $$ (17)

    其中

    $$\begin{split} &{\left[ {B1} \right]_{2 \times 2}} = {\rm{diag}}\left\{ \frac{{{R_{inv}} + s{L_{inv}} + G_i^{inv}\left( s \right)}}{{G_i^{inv}\left( s \right)}},\right. \\ & \qquad\qquad\quad\left.\frac{{{R_{inv}} + s{L_{inv}} + G_i^{inv}\left( s \right)}}{{G_i^{inv}\left( s \right)}} \right\} \\ &{\left[ {B2} \right]_{2 \times 2}} = \left[ {\begin{aligned} &{ - \frac{{I_{invq}^\# {L_{inv}}}}{{G_i^{inv}\left( s \right)}}}&0 \\ & {\frac{{I_{invd}^\# {L_{inv}}}}{{G_i^{inv}\left( s \right)}}}&0 \end{aligned}} \right]\end{split} $$

    建立式(3) ~ 式(6)的小信号模型:

    $$ \begin{split} \left[ {\begin{array}{*{20}{l}} {\Delta I_{invd}^{}} \\ {\Delta I_{invq}^{}} \end{array}} \right] =\;& \left[ {\begin{array}{*{20}{l}} {\Delta I_{cd}^{}} \\ {\Delta I_{cq}^{}} \end{array}} \right] + {\left[ {B3} \right]_{2 \times 2}}\left[ {\begin{array}{*{20}{l}} {\Delta V_{cd}^{}} \\ {\Delta V_{cq}^{}} \end{array}} \right] + \\ & {\left[ {B4} \right]_{2\times 2}}\left[ {\begin{array}{*{20}{c}} {\Delta \omega } \\ {\Delta V_{cd}^\# } \end{array}} \right] \\[-20pt] \end{split} $$ (18)
    $$ \begin{split} \left[ {\begin{array}{*{20}{l}} {\Delta I_{invd}^\# } \\ {\Delta I_{invq}^\# } \end{array}} \right] = \;&{\left[ {B5} \right]_{2 \times 2}}\left[ {\begin{array}{*{20}{l}} {\Delta V_{cd}^{}} \\ {\Delta V_{cq}^{}} \end{array}} \right] + \\ & {\left[ {B6} \right]_{2 \times 2}}\left[ {\begin{array}{*{20}{l}} {\Delta I_{cd}^{}} \\ {\Delta I_{cq}^{}} \end{array}} \right] + {\left[ {B7} \right]_{2 \times 2}}\left[ {\begin{array}{*{20}{c}} {\Delta \omega } \\ {\Delta V_{cd}^\# } \end{array}} \right] \end{split} $$ (19)

    其中

    $$ \begin{split} &{\left[ {B3} \right]_{2 \times 2}}=\left[ {\begin{array}{*{20}{c}} {s{C_{inv}}}&{ - {\omega ^\# }{C_{inv}}} \\ {{\omega ^\# }{C_{inv}}}&{s{C_{inv}}} \end{array}} \right] \\ &{\left[ {B4} \right]_{2 \times 2}} = \left[ {\begin{array}{*{20}{c}} 0&0 \\ {V_{cd}^\# {C_{inv}}}&0 \end{array}} \right] \\ &{\left[ {B5} \right]_{2\times 2}} = \left[ {\begin{array}{*{20}{c}} { - G_v^{inv}\left( s \right)}&{ - {\omega ^\# }{C_{inv}}} \\ {{\omega ^\# }{C_{inv}}}&{ - G_v^{inv}\left( s \right)} \end{array}} \right] \\ &{\left[ {B6} \right]_{2 \times 2}} = \left[ {\begin{array}{*{20}{c}} K&0 \\ 0&K \end{array}} \right]\\ &{\left[ {B7} \right]_{2 \times 2}} = \left[ {\begin{array}{*{20}{c}} 0&{G_v^{inv}\left( s \right)} \\ 0&0 \end{array}} \right]\end{split}$$

    式(11) ~ 式 (16)的小信号模型为:

    $$\begin{split} \Delta {p_{inv}} = \;&1.5( {V_{cd}}\Delta {I_{cd}} + \Delta {V_{cd}}{I_{cd}} +\\ &{V_{cq}}\Delta {I_{cq}} + \Delta {V_{cq}}{I_{cq}}) \end{split}$$ (20)
    $$ \begin{split} \Delta {q_{inv}} =\;& 1.5( {V_{cd}}\Delta {I_{cq}} + \Delta {V_{cd}}{I_{cq}}-\\ & {V_{cq}}\Delta {I_{cd}} - \Delta {V_{cq}}{I_{cd}})\end{split} $$ (21)
    $$ \Delta \omega = - \frac{{m{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}\Delta {p_{inv}} $$ (22)
    $$ \Delta V_{cd}^\# = - \frac{{n{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}\Delta {q_{inv}} $$ (23)

    相似地, 以矩阵形式表征式(20) ~ 式(23):

    $$ \left[ {\begin{array}{*{20}{c}} {\Delta \omega } \\ {\Delta V_{cd}^\# } \end{array}} \right] = {[B8]_{2\times2}}\left[ {\begin{array}{*{20}{c}} {\Delta {V_{cd}}} \\ {\Delta {V_{cq}}} \end{array}} \right] + {[B9]_{2\times2}}\left[ {\begin{array}{*{20}{c}} {\Delta {I_{cd}}} \\ {\Delta {I_{cq}}} \end{array}} \right] $$ (24)

    其中

    $$ {[B8]_{2\times2}} = \left[ {\begin{array}{*{20}{c}} {B811}&{B812} \\ {B821}&{B822} \end{array}} \right] $$
    $$ \begin{split} &B811 = \frac{{1.5m{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}I_{cd}^\# \\ & B812 = - \frac{{1.5m{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}I_{cq}^\# \\ &B821 = - \frac{{1.5n{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}I_{cq}^\# \\ & B822 = - \frac{{1.5n{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}I_{cd}^\# \\ &{[B9]_{2\times2}} = {\rm{diag}}\left\{ - \frac{{1.5m{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}V_{cd}^\# ,\right. \\ &\qquad\qquad\quad\left. - \frac{{1.5n{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}V_{cd}^\# \right\} \end{split} $$

    由于下垂逆变器的输出阻抗矩阵 ${{\boldsymbol{Z}}_{{{inv}}}} = \left[ {\begin{aligned} {{Z_{dd}}}\;\;{{Z_{dq}}} \\ {{Z_{qd}}}\;\;{{Z_{qq}}} \end{aligned}} \right]$, 满足如下的等式关系$\left[ {\begin{aligned} {\Delta {V_{cd}}} \\ {\Delta {V_{cq}}} \end{aligned}} \right] = \left[ {\begin{aligned} {{Z_{dd}}}\;{{Z_{dq}}} \\ {{Z_{qd}}}\;{{Z_{qq}}} \end{aligned}} \right]\times \left[ {\begin{aligned} {\Delta {I_{cd}}} \\ {\Delta {I_{cq}}} \end{aligned}} \right]$. 因此, 将式(18)、式(19)和式(24)代入式(17),可以得到逆变器的输出阻抗矩阵:

    $$ \begin{split} {{\boldsymbol{Z}}_{{{inv}}}} =\;& \left[ {\begin{array}{*{20}{c}} {{Z_{dd}}}&{{Z_{dq}}} \\ {{Z_{qd}}}&{{Z_{qq}}} \end{array}} \right] =\\ & \{ {\left[ {B5} \right] + \left[ {B7} \right]\left[ {B8} \right] - \left[ {B1} \right]\left[ {B3} \right]}- \\ & { \left[ {B1} \right]\left[ {B4} \right]\left[ {B8} \right] - \left[ {B2} \right]\left[ {B8} \right]} \}^{ - 1} \cdot \\ &\{ {\left[ {B1} \right]\left[ {B4} \right]\left[ {B9} \right] + \left[ {B1} \right] + } \\ &{\left[ {B2} \right]\left[ {B9} \right] - \left[ {B6} \right] - \left[ {B7} \right]\left[ {B9} \right]} \} \end{split} $$ (25)

    最后, 弱电网的输入导纳矩阵如下[26]:

    $$ {{\boldsymbol{Y}}_{{g}}} = {{\boldsymbol{Z}}_{{g}}^{ - 1}} = {\left[ {\begin{array}{*{20}{c}} {{Z_{dd}}}&{{Z_{dq}}} \\ {{Z_{qd}}}&{{Z_{qq}}} \end{array}} \right]^{ - 1}} $$ (26)
    $$ \begin{split} &{Z_{dd}} = {Z_{qq}} = \frac{{\left[ {C1} \right]{s^2} + \left[ {C2} \right]s + \left[ {C3} \right]}}{{\left[ {C4} \right]{s^2} + \left[ {C5} \right]s + \left[ {C6} \right]}}\\ &{Z_{dq}} = - {Z_{qd}} = \frac{{\left[ {C7} \right]}}{{\left[ {C4} \right]{s^2} + \left[ {C5} \right]s + \left[ {C6} \right]}}\\ &{\left[ {C1} \right]} = \left( {{L_g}{C_g} + {R_g}{C_g}} \right){L_g} \\ & {\left[ {C2} \right]} = {L_g}{R_g}{C_g} + R_s^2{C_g} + {L_g} \\ & {\left[ {C3} \right]} = \left( {{L_g}{C_g} + {R_g}{C_g}} \right){L_g}\omega _{}^{\# 2} + {R_g} \\ &{\left[ {C4} \right]} = {\left( {{L_g}{C_g} + {R_g}{C_g}} \right)^2} \\ & {\left[ {C5} \right]} = 2\left( {{L_g}{C_g} + {R_g}{C_g}} \right) \\ & {\left[ {C6} \right]} = {\left( {{L_g}{C_g} + {R_g}{C_g}} \right)^2}\omega _{}^{\# 2} + 1\\ & {\left[ {C7} \right]} = \left( {{L_g}{C_g} + {R_g}{C_g}} \right){R_g}{\omega ^\# } - {L_g}{\omega ^\# }\end{split} $$

    式中, $ {R_g} $$ {L_g} $$ {C_g} $分别表示等效交流母线的电阻、电感和电容; $ {\omega ^\# } $表示系统额定频率. 因此, 内嵌等效延时的微电网系统的等效回比矩阵如下:

    $$ {{\boldsymbol{R}}_{{0}}} = {{\boldsymbol{Z}}_{{{inv}}}}{{\boldsymbol{Y}}_{{g}}} $$ (27)

    同时, 微电网系统的等效回比矩阵是等效延时时间的函数, 即, ${{\boldsymbol{R}}_{{0}}} = h(T)$. 根据阻抗稳定判据[23], 当等效回比矩阵的广义奈奎斯特曲线不包含(−1, 0)点时, 系统稳定性可以得到保证.

    由于复杂的奈奎斯特曲线簇绘制过程不利于参数的设计, 相关学者相继提出了如图4所示的稳定禁止区域判据, Middlebrook判据、对立的观点判据、GMPM判据和NSFR判据[28], 其中${\rm{Re}}(\cdot)$代表实部, ${\rm{Im}}(\cdot)$代表虚部. 相较于前三种禁止区域判据, NSFR判据具备更低的保守性. 当$ {\varepsilon _{GM}} $趋向于1且$ {\theta _{PM}} $趋向于0时, NSFR判据可以转化为近似充要条件. 因此本文选用NSFR判据以分析延时依赖的等效回比矩阵的稳定性.

    图 4  稳定禁止判据
    Fig. 4  Stability forbidden criterion

    引理1[23]. 如果微电网系统等效回比矩阵的相反数$(- {{\boldsymbol{R}}_{{0}}})$不包围(1, 0)点, 则微电网系统的电磁时间尺度稳定性可以得到保证.

    因此, 互联系统电磁时间尺度稳定运行区域可以通过$- {{\boldsymbol{R}}_{{0}}}$得到(如图5中深色区域所示). 进而, 稳定运行区域可以由三个子区域的并集得到(如图6中深色区域所示), 即$ A = {A_1} \cup {A_2} \cup {A_3} $. 其中$ {A_1} $可以通过平移映射将原矩阵转化为Hurwitz矩阵${{\boldsymbol{R}}_{{1}}}$所构成的空间平面, $ {A_2} $$ {A_3} $可以分别通过转映射将原矩阵转化为Hurwitz矩阵${{\boldsymbol{R}}_{{2}}}$${{\boldsymbol{R}}_{{3}}}$, 进而可以将${{\boldsymbol{R}}_{{1}}}$${{\boldsymbol{R}}_{{2}}}$${{\boldsymbol{R}}_{{3}}}$定义为等效回比矩阵:

    图 5  稳定运行区域
    Fig. 5  Stability operation region
    图 6  稳定运行区域集合
    Fig. 6  Set of stability operation regions
    $$ {A}_{1}: {\boldsymbol{R}}_{{1}}=-{\boldsymbol{R}}_{{0}}-{\varepsilon }_{GM}{\boldsymbol{E}} $$ (28)
    $$ {A}_{2}: {\boldsymbol{R}}_{{2}}=-{\boldsymbol{R}}_{{0}}\times {{\rm{e}}}^{{\rm{j}}{\theta }_{PM}} $$ (29)
    $$ {A_3}: {{\boldsymbol{R}}_{{3}}} = - {{\boldsymbol{R}}_{{0}}} \times {{\rm{e}}^{ - {\rm{j}}{\theta _{PM}}}} $$ (30)

    式中, ${{\boldsymbol{R}}_{{1}}}$${{\boldsymbol{R}}_{{2}}}$${{\boldsymbol{R}}_{{3}}}$是Hurwitz矩阵. E表示单位矩阵.

    注1. 文献[25]所采用的方法是奈奎斯特稳定判据, 该方法更适用于已知系统的稳定性判别, 而难以给出稳定运行区间的范围. 奈奎斯特法求取稳定区间的极限需要成千上万次绘制奈奎斯特曲线或波特图, 随着可再生能源数量的递增, 该方法将极大地耗费人力资源, 因此, 文献[29]明确指出“奈奎斯特判据复杂, 难以适用于交流网络的系统设计”. 基于此, 本文将采样/开关频率阈值辨识问题转化为矩阵Hurwitz辨识问题, 从而消除了奈奎斯特曲线或波特图, 降低了计算负担. 同时相较于文献[29]提出的范数判据方法, 本文方法的保守性更低.

    接着, 将提供逆变器的极限开关/采样频率阈值. 通过上述分析可知, 当${{\boldsymbol{R}}_{{1}}}$${{\boldsymbol{R}}_{{2}}}$${{\boldsymbol{R}}_{{3}}}$是Hurwitz矩阵时, 系统的稳定性可以得到保证, 基于此, 等效回比矩阵是采样/开关频率依赖的非线性时不变矩阵. 因此, 本文提出基于等效回比矩阵的自适应步长搜索算法以获取微电网稳定下的采样/开关频率极限阈值. 为了增强算法的适应性, 本文采用最小均方(Least mean square, LMS)作为生长因子:

    $$ r\left(m+1\right)=r\left(m\right)+{\rm{sign}}({L}_{\mathrm{min}})\times \Delta r\left(0\right)\times {\left|{L}_{\mathrm{min}}\right|}^{\lambda \left(m\right)}\text{ } $$ (31)
    $$ \lambda \left(m\right)=\alpha \times \left(1+{{\rm{e}}}^{-\beta {\left|s\left(m\right)\right|}^{2}}\right)\text{ } $$ (32)
    $$ s\left(m\right)=\gamma s\left(m-1\right)+\left(1-\gamma \right){L}_{\mathrm{min}}\text{ } $$ (33)

    式中, ${\rm{sign}}(\cdot)$表示符号函数, $ {L_{\min }} $表示等效回比矩阵的最小特征根的实部, $ {\left| {{L_{\min }}} \right|^{\lambda \left( m \right)}} $$ \lambda \left( m \right) $表示可变步长因子和步长增长因子, $ \alpha $$ \beta $表示调整因子, $ \gamma $表示遗忘因子, 详细的计算步骤如下所示:

    算法1. 自适应步长搜索算法

    初始化. 全局变量$ r(0) = 0 $, $ m = 0 $$ \Delta r(0) = 0 $.

    迭代.

    1)初始化局部变量, 如${L_{{\rm{max}}1}} = \emptyset$, ${L_{{\rm{max}}2}} = \emptyset$, ${L_{{\rm{max}}3}} = \emptyset$$ i = 1 $;

    2)计算微电网的等效回比矩阵${\boldsymbol{R}} (s)$, 其中$s = - {\rm{j}}2\cdot \pi {f_i}$. 在此频率下, 分别计算等效回比矩阵${{\boldsymbol{R}}_{{1}}}$${{\boldsymbol{R}}_{{2}}}$${{\boldsymbol{R}}_{{3}}}$;

    3)计算三个等效回比矩阵的最大实部, 即${L_1} = {\rm{max}}({\rm{real}}({\rm{eig}}({{\boldsymbol{R}}_{{1}}})))$${L_2} = {\rm{max}}({\rm{real}}({\rm{eig}}({{\boldsymbol{R}}_{{2}}})))$${L_3} = {\rm{max}}({\rm{real}}({\rm{eig}}({{\boldsymbol{R}}_{{3}}})))$;

    4)扩展矩阵, ${L_{{\rm{max}}1}} = [{L_{{\rm{max}}1}},{L_1}]$${L_{{\rm{max}}2}} = [{L_{{\rm{max}}2}}, {L_2}]$${L_{{\rm{max}}3}} = [{L_{{\rm{max}}3}},{L_3}]$. 如果$i < 20\,000$, $ i = i + 1 $, 然后返回第2)步, 否则进行第5)步;

    5)选取${L_{{\rm{max}}1}}$${L_{{\rm{max}}2}}$${L_{{\rm{max}}3}}$中的最大值, 即${L_{{\rm{max}} - 1}} = {\rm{max}}({L_{{\rm{max}}1}})$${L_{{\rm{max}} - 2}} = {\rm{max}}({L_{{\rm{max}}2}})$${L_{{\rm{max}} - 3}} = {\rm{max}}({L_{{\rm{max}}3}})$. 定义${L_{{\rm{min}}}}$${L_{{\rm{max}} - 1}}$${L_{{\rm{max}} - 2}}$${L_{{\rm{max}} - 3}}$中的最小值, 即${L_{{\rm{min}}}} = {\rm{min}} ({L_{{\rm{max}} - 1}},{L_{{\rm{max}} - 2}},{L_{{\rm{max}} - 3}})$;

    6)判断$ r(m) $${L_{{\rm{min}}}}$是否等于0. 若判别结果为是, 则存储开区间$ (0,r(m)) $的记录, 然后进入第7)步. 反之$r(m + 1)=r\left(m\right)+{\rm{sign}}({L}_{\mathrm{min}})\times \Delta r\left(0\right)\times {\left|{L}_{\mathrm{min}}\right|}^{\lambda \left(m\right)},$然后返回第1)步;

    7)计算第6)步中的所有开集合的集合, 记录的结果为等效延时的最大值$ {T_{\max }} $.

    注2. 算法中i的上限取值为20000, 即验证频率从[0, 20000] Hz情况下系统的极限开关频率. 选取20000的原因在于, 本文研究的动机是探究随着开关频率降低所导致的低频和次/超同步振荡等宽频振荡现象的诱发条件. 而宽频振荡的范围是[0, 3000] Hz左右, 为保证极端条件下 本文方法的有效性而提高了频率的验证范围. 如果工程师希望快速计算结果, 可以将其上限降低至3000. 上述自适应步长搜索算法可以获得在等效回比矩阵Hurwitz情况下的最大等效延时时间. 因此, 采样/开关频率阈值为$ {f_{\min }} = 1/{T_{\max }} $. 同时上述所提出的自适应步长搜索算法属于二分法的一类变型, 同时$ {L_{\min }} $$ r\left( m \right) $的关系如图7所示, 其存在单调递增特性[14]. 因此, 系统的收敛性可以得到很好保证, 并且不受初始值选取的影响.

    图 7  $ {L_{\min }} $$ {T_{\max }} $的关系曲线
    Fig. 7  Relationship curve between $ {L_{\min }} $ and $ {T_{\max }} $

    注3. 本文所指的适应性主要针对算法的收敛速度, 确保本方法适用于对计算时间要求较高的系统. 由于传统的固定步长的搜索方法的收敛较慢, 因此, 本文利用指数函数的特性, 在收敛点处(0值处)变化率低和远离收敛点处变化率高的特点. 换而言之, 确保在收敛点附近, 按照小步长搜索, 在远离收敛点处, 按照大步长搜索. 其中通过设定最小均方作为指数项, 利用指数函数的性质可以提高本算法的收敛速度, 从而提高本算法的适用性, 应对高计算速度要求的系统.

    为了验证本文所提出的信息能源系统信−物融合的稳定性分析方法的有效性, 本文选取文献[30]所表征的系统和控制器参数. 相关的控制参数如表1所示, 并网逆变器数量选取为3个, 弱电网的电路阻抗为${R_g} = 0.25\;\Omega ,{L_g} = 10\;{\rm{mH}},\;{C_g} = 100$ μF. 本文基于等效回比矩阵的自适应步长搜索算法而获取微电网稳定下的采样/开关频率极限阈值为3.662 kHz. 本文将分别验证系统不同开关/采样频率下系统的稳定性, 基于实际的Matlab/Simulink仿真软件所搭建仿真测试平台, 利用弱电网和并网逆变器之间的交流母线电压的波形情况, 来验证本文基于等效回比矩阵的自适应步长搜索算法的有效性. 具体的4组仿真验证案例如下所示:

    表 1  仿真系统参数表
    Table 1  Simulation system parameters
    参数数值
    电压控制器$G_v^{inv} = 1 + 8/{ {s} }$
    电流控制器$G_c^{inv} = 4 + 150/{ {s} }$
    母线电压700 V
    额定电压220 V
    额定频率50 Hz
    截止频率5 Hz
    滤波器电容600 μF
    滤波器电感6 mH
    下载: 导出CSV 
    | 显示表格

    1)首先, 微电网系统的开关/采样频率选取为4 kHz, 很明显, 此开关/采样频率大于提出的自适应步长搜索算法所求解得到的阈值频率, 因此, 系统可以保持稳定. 但基于文献[29], 如图8所示, 系统的回比矩阵的无穷范数在[126 Hz, 212 Hz]的范围内大于1, 因此系统可能发生失稳现象. 系统实际的电压波形图如图9所示, 通过观察图9所示的波形图可知, 弱电网和并网逆变器之间的交流母线电压恒定保持在220 V/50 Hz, 由此可见系统保持了良好的稳定性. 相较于现存范数方法, 本文所提方法的保守性较低.

    图 8  无穷范数判据
    Fig. 8  Infinite norm criterion
    图 9  绝缘栅双极型晶体管开关频率4 kHz下电压波形
    Fig. 9  Voltage waveform under 4 kHz of insulated gate bipolar transistor

    2)微电网系统的开关/采样频率选取3.5 kHz, 很明显, 此开关/采样频率略小于提出的辨识策略求解得到的阈值频率, 因此, 系统难以保持系统的绝对稳定. 系统实际的电压波形图如图10所示, 系统发生轻度的低频振荡.

    图 10  绝缘栅双极型晶体管开关频率3.5 kHz下电压波形
    Fig. 10  Voltage waveform under 3.5 kHz of insulated gate bipolar transistor

    3)微电网系统的开关/采样频率选取3 kHz, 很明显, 此开关/采样频率明显小于提出的辨识策略求解得到的阈值频率, 因此, 系统极易发生失稳现象. 系统实际的电压波形图如图11所示, 系统发生大幅的低频振荡.

    图 11  绝缘栅双极型晶体管开关频率3 kHz下电压波形
    Fig. 11  Voltage waveform under 3 kHz of insulated gate bipolar transistor

    4)微电网系统的开关/采样频率选取2 kHz, 很明显, 此开关/采样频率远远小于提出的辨识策略求解得到的阈值频率, 因此, 系统必然发生失稳现象. 系统实际的电压波形图如图12所示, 系统大幅度的发散振荡, 如果不采用有效抑制措施, 系统将会诱发过流/过压保护而发生解列等极端现象.

    图 12  绝缘栅双极型晶体管开关频率2 kHz下电压波形
    Fig. 12  Voltage waveform under 2 kHz of insulated gate bipolar transistor

    综上所述, 本文提出的基于等效回比矩阵的自适应步长搜索算法的有效性得到了很好验证, 其可以有效指导实际微电网开关/采样频率的选取, 避免系统出现信息−物理融合影响而导致的失稳现象.

    为更好地验证本文提出的基于等效回比矩阵的自适应步长搜索算法的有效性, 本文在如图13所示的微电网系统的实验平台进行验证, 相关控制和物理拓扑参数与仿真验证平台相同, 同时3台逆变器由TMS320F28335DSP控制, 硬件拓扑内嵌于OPAL-RT OP5600.

    图 13  半实物测试系统图
    Fig. 13  Hardware in the loop test system diagram

    在此情境下, 基于所提出的基于等效回比矩阵的自适应步长搜索算法而获取微电网稳定下的采样/开关频率极限阈值依旧是3.662 kHz. 相似于第3部分的仿真验证模块, 分别选取微电网系统的开关/采样频率为4 kHz、3.5 kHz和3 kHz. 当微电网的开关/采样频率为4 kHz时, 此场景中系统的开关/采样频率大于提出的辨识策略求解得到的阈值频率, 因此, 系统可以保持稳定. 系统实际的电压波形如图14所示, 系统保持了良好的稳定性.

    图 14  绝缘栅双极型晶体管开关频率4 kHz下实验电压波形
    Fig. 14  Experimental voltage waveform under4 kHz of insulated gate bipolar transistor

    当微电网的开关/采样频率为3.5 kHz 时, 此场景中系统的开关/采样频率小于提出的辨识策略求解得到的阈值频率, 因此, 系统难以保持绝对稳定. 系统实际的电压波形图如图15所示, 系统发生轻微低频振荡.

    图 15  绝缘栅双极型晶体管开关频率3.5 kHz下实验电压波形
    Fig. 15  Experimental voltage waveform under3.5 kHz of insulated gate bipolar transistor

    当微电网的开关/采样频率为3 kHz 时, 此场景中系统的开关/采样频率小于提出的辨识策略求解得到的阈值频率, 因此, 系统的稳定性将得不到保证. 系统实际的电压波形图如图16所示, 系统发生失稳现象. 综上所述, 本文提出的基于等效回比矩阵的自适应步长搜索算法的有效性得到验证.

    图 16  绝缘栅双极型晶体管开关频率3 kHz下实验电压波形
    Fig. 16  Experimental voltage waveform under3 kHz of insulated gate bipolar transistor

    内嵌数字控制系统的并网逆变器系统是一种最简单和典型的信息能源系统, 同时从效率的角度出发, 逆变器的开关/采样频率总是选择尽可能低的频率, 势必产生系统固有延迟时间. 基于此, 本文提出了一种基于稳定性的开关/采样频率阈值辨识方法. 本文具有3个主要的创新点/贡献点: 1)构建了内嵌等效时延的广义阻抗回比矩阵, 该等效延迟时间由信息/物理层的采样延迟时间、信息层的计算延迟时间和物理层的脉宽调制延迟时间3部分组成. 其有效反映了信息−物理相互融合作用的影响和为后续系统采样/开关频率阈值辨识提供模型基础. 2)利用柏德逼近技术将延时转化为频率分数函数, 进而将系统采样/开关频率阈值的求解问题转化为等效回比矩阵为Hurwitz的辨识问题. 其消除了传统阻抗技术中所涉及的广义奈奎斯特判据复杂度高的问题, 进而可以获得工程可用的稳定性判据. 3)提出了基于自适应步长搜索算法的采样/开关频率阈值辨识技术, 其能够获得信息能源系统采样/开关频率阈值, 指导实际微电网开关/采样频率的选取, 避免系统出现信息−物理融合影响而导致的失稳现象, 最后, 仿真和实验结果验证了该方法的有效性. 未来并网逆变器类系统三级控制体系的整体信息−物理稳定性分析技术势必成为研究的重点领域. 同时, 随着高比例的可再生能源和高占比的电力变化设备接入能源系统, 稳定机理分析及其抑制技术也将成为待研究的重点内容.

  • 图  1  深度目标跟踪模型的边界框回归示意图

    Fig.  1  The schematic of bounding box regression in deep tracking model

    图  2  边界框类比为正态分布的示意图

    Fig.  2  The schematic of bounding box analogized as Gaussian distribution

    图  3  ${\cal{L}}_{{\rm{IoU}}}$${\cal{L}}_{{\rm{SIoU}}}$在对数坐标下的可视化图像示例

    Fig.  3  A visualized example of ${\cal{L}}_{{\rm{SIoU}}}$and${\cal{L}}_{{\rm{IoU}}}$viewed in the logarithmic scale of horizontal axis

    图  4  $ d_{\cal{H}}>2 $时最优化${\cal{L}}_{{\rm{SIoU}}}$${\cal{L}}_{{\rm{IoU}}}$的边界框示例

    Fig.  4  Illustration of predicted box that minimizes${\cal{L}}_{{\rm{SIoU}}}$ and ${\cal{L}}_{{\rm{IoU}}}$ if $ d_{\cal{H}}>2 $

    图  5  正则项 ${\cal{R}}_{{S}}$ 的图像示例

    Fig.  5  Illustration of regularization ${\cal{R}}_{{S}}$

    图  6  不同参数 $ \lambda $$ |x| $ 的光滑代理函数${\cal A}_\lambda(x)$

    Fig.  6  Plot of smooth surrogate function${\cal A}_\lambda(x)$ for $ |x| $with different$ \lambda $controlling its shape

    图  7  梯度截断后的${\cal{L}}_{{\rm{SIoU}}}$可视化示例

    Fig.  7  A visualized example of ${\cal{L}}_{{\rm{SIoU}}}$ with truncated gradient

    图  8  从两种分布中采样近距离和远距离的初始预测框位置

    Fig.  8  Sample the initial predicted boxes subject to normal distribution with short and longmean-variance

    图  9  各种边界框回归损失比较

    Fig.  9  Comparison among the convergence performance of different bounding box regression losses

    图  10  不同迭代次数的$ {\cal{L}}_{{\rm{GIoU}}} $$ {\cal{L}}_{{\rm{CIoU}}} $$ {\cal{L}}_{{\rm{SIoU}}} $的回归示例

    Fig.  10  Illustration of predicted boxes via $ {\cal{L}}_{{\rm{GIoU}}} $, $ {\cal{L}}_{{\rm{CIoU}}} $ and $ {\cal{L}}_{{\rm{SIoU}}} $ regressing in different iterations

    图  11  在LaSOT测试集上, 分别以 $ {\cal{L}}_{{\rm{IoU}}} $(点线框标出)和$ {\cal{L}}_{{\rm{SIoU}}} $(虚线框标出)训练的模型 SiamFC++ 的可视化结果示例 (实线框为真值标签)

    Fig.  11  Visualized tracking results of SiamFC++trained using $ {\cal{L}}_{{\rm{IoU}}} $ (marked in dotted box) and$ {\cal{L}}_{{\rm{SIoU}}} $ (marked in dashed box) on LaSOT(solid box denotes groundtruth)

    图  12  在LaSOT上评估成功率、精确率和标准化精确率结果

    Fig.  12  Success plot with area under the curve, precision plot and normalized precision plot on LaSOT

    图  13  在GOT-10k 上的成功率图

    Fig.  13  Success plot on GOT-10k

    表  1  在基准 LaSOT 上, 分别以 $ {\cal{L}}_{{\rm{IoU}}} $(原本的)和 $ {\cal{L}}_{{\rm{SIoU}}} $训练的模型 SiamFC++的测试结果(%)

    Table  1  Comparison between the performance of SiamFC++ trained using $ {\cal{L}}_{{\rm{IoU}}} $ (original), $ {\cal{L}}_{{\rm{SIoU}}} $on the test set of LaSOT (%)

    评价指标 成功率 精确度 标准化精确度
    ${\cal{L} }_{{\rm{IoU}}}$ 55.6 55.5 64.8
    ${\cal{L} }_{{\rm{SIoU}}}$ 57.6 58.3 66.9
    相对增益 3.60 5.05 3.24
    下载: 导出CSV

    表  2  在基准LaSOT上, 分别以$ {\cal{L}}_{{\rm{IoU}}} $(原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $训练的模型SiamBAN的测试对比(%)

    Table  2  Comparison between the performance of SiamBAN trained using $ {\cal{L}}_{{\rm{IoU}}} $ (original), $ {\cal{L}}_{{\rm{SIoU}}} $on the test set of LaSOT (%)

    评价指标 成功率 精确度 标准化精确度
    ${\cal{L} }_{{\rm{IoU}}}$ 51.4 52.1 59.8
    ${\cal{L} }_{{\rm{SIoU}}}$ 54.3 53.9 63.3
    相对增益 5.64 3.45 4.85
    下载: 导出CSV

    表  3  在基准LaSOT上, 分别以$ {\cal{L}}_{{\rm{IoU}}} $(原本的)和 $ {\cal{L}}_{{\rm{SIoU}}} $训练模型SiamCAR的测试对比(%)

    Table  3  Comparison between the performance of SiamCAR trained using $ {\cal{L}}_{{\rm{IoU}}} $ (original), $ {\cal{L}}_{{\rm{SIoU}}} $ on the test set of LaSOT (%)

    评价指标 成功率 精确率 标准化精确率
    ${\cal{L} }_{{\rm{IoU}}}$ 51.6 52.4 61.0
    ${\cal{L} }_{{\rm{SIoU}}}$ 54.9 54.8 63.1
    相对增益 6.39 4.58 3.44
    下载: 导出CSV

    表  4  在基准LaSOT上, 与先进方法的性能评估对比

    Table  4  Performance evaluation for state-of-the-artalgorithms on LaSOT

    方法 成功率 精确率 标准化精确率
    SiamBAN 51.4 52.1 59.8
    ATOM 51.5 50.5 57.6
    SiamCAR 51.6 52.4 61.0
    SiamRPN++ 49.6 49.1 56.9
    Ocean-online 56.0 56.6 65.1
    SiamFC++ 55.6 55.5 64.8
    DiMP 56.8 56.4 64.3
    SiamBAN (SIoU) 54.3 53.9 63.3
    SiamCAR (SIoU) 54.2 53.7 63.1
    SiamFC++ (SIoU) 57.6 58.3 66.9
    下载: 导出CSV

    表  5  在GOT-10k上, 分别以$ {\cal{L}}_{{\rm{IoU}}} $(原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $训练的模型SiamFC++ 测试对比(%)

    Table  5  Comparison between the performance of SiamFC++ trained using $ {\cal{L}}_{{\rm{IoU}}} $ (original), $ {\cal{L}}_{{\rm{SIoU}}} $on the test set of GOT-10k (%)

    评价指标 $ {\rm{AO}} $ ${\rm{SR} }_{0.50}$ ${\rm{SR} }_{0.75}$
    ${\cal{L} }_{{\rm{IoU}}}$ 59.5 69.5 47.9
    ${\cal{L} }_{{\rm{SIoU}}}$ 61.7 74.7 46.8
    相对增益 3.69 7.48 −2.29
    下载: 导出CSV

    表  6  在GOT-10k上, 分别以$ {\cal{L}}_{{\rm{IoU}}} $(原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $训练的模型SiamCAR测试结果(%)

    Table  6  Comparison between the performance of SiamCAR trained using $ {\cal{L}}_{{\rm{IoU}}} $ (original), $ {\cal{L}}_{{\rm{SIoU}}} $on the test set of GOT-10k (%)

    评价指标 $ {\rm{AO}} $ ${\rm{SR} }_{0.50}$ ${\rm{SR} }_{0.75}$
    ${\cal{L} }_{{\rm{IoU}}}$ 58.1 68.3 44.1
    ${\cal{L} }_{{\rm{SIoU}}}$ 60.2 72.6 46.4
    相对增益 3.61 6.29 5.22
    下载: 导出CSV

    表  7  在基准GOT-10k上, 与先进方法的性能评估对比 (%)

    Table  7  Performance evaluation for state-of-the-artalgorithms on GOT-10k (%)

    方法 $ {\rm{AO}} $ ${\rm{SR} }_{0.50}$
    MDNet 29.9 30.3
    SPM 51.3 59.3
    ATOM 55.6 63.4
    SiamCAR 56.9 67.0
    SiamRPN++ 51.7 61.8
    Ocean-online 61.1 72.1
    D3S 59.7 67.6
    SiamFC++ 59.5 69.5
    DiMP-50 61.1 71.2
    SiamCAR (SIoU) 60.2 72.6
    SiamFC++ (SIoU) 61.7 74.7
    下载: 导出CSV

    表  8  在TrackingNet上, 分别以$ {\cal{L}}_{{\rm{IoU}}} $(原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $训练的模型SiamFC++的测试结果(%)

    Table  8  Comparison between the performance of SiamFC++ trained using $ {\cal{L}}_{{\rm{IoU}}} $ (original), $ {\cal{L}}_{{\rm{SIoU}}} $on the test of TrackingNet (%)

    评价指标 精确率 标准化精确率 成功率
    ${\cal{L} }_{\rm{{IoU}}}$ 70.5 80.0 75.4
    ${\cal{L} }_{{\rm{SIoU}}}$ 72.1 81.9 76.2
    相对增益 2.27 2.37 1.06
    下载: 导出CSV

    表  9  在基准TrackingNet上, 与先进方法的性能评估对比 (%)

    Table  9  Performance evaluation for state-of-the-artalgorithms on TrackingNet (%)

    方法 成功率 标准化精确率
    MDNet 60.6 70.5
    ATOM 70.3 77.1
    DaSiamRPN 63.8 73.3
    SiamRPN++ 73.3 80.0
    UpdateNet 67.7 75.2
    SPM 71.2 77.8
    SiamFC++ 75.4 80.0
    DiMP 74.0 80.1
    SiamFC++ (SIoU) 76.2 81.9
    下载: 导出CSV

    表  10  在OTB2015上, 分别以$ {\cal{L}}_{{\rm{IoU}}} $(原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $训练的模型SiamFC++ 的测试结果 (%)

    Table  10  Comparison between the performance of SiamFC++ trained using $ {\cal{L}}_{{\rm{IoU}}} $(original),$ {\cal{L}}_{{\rm{SIoU}}} $on the test of OTB2015 (%)

    评价指标 成功率 标准化精确率
    ${\cal{L} }_{ {\rm{IoU} } }$ 68.2 89.5
    ${\cal{L} }_{{\rm{SIoU}}}$ 68.7 89.8
    相对增益 0.74 0.34
    下载: 导出CSV

    表  11  在OTB2015上, 分别以$ {\cal{L}}_{{\rm{IoU}}} $(原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $训练的模型SiamBAN测试结果 (%)

    Table  11  Comparison between the performance of SiamBAN trained using $ {\cal{L}}_{{\rm{IoU}}} $ (original), $ {\cal{L}}_{{\rm{SIoU}}} $on on the test of OTB2015 (%)

    评价指标 成功率 标准化精确率
    ${\cal{L} }_{ {\rm{IoU} } }$ 69.6 91.0
    ${\cal{L} }_{{\rm{SIoU}}}$ 69.9 91.5
    相对增益 0.43 0.55
    下载: 导出CSV

    表  12  在VOT2018上, 分别以$ {\cal{L}}_{{\rm{IoU}}} $(原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $训练的模型SiamFC++ 测试结果(%)

    Table  12  Comparison between the performance of SiamFC++ trained using $ {\cal{L}}_{{\rm{IoU}}} $ (original),$ {\cal{L}}_{{\rm{SIoU}}} $on on the test of VOT2018 (%)

    评价指标 ${\rm{准确率} }$ ${\rm{鲁棒性} }$ ${ {\rm{EAO} } }$
    ${\cal{L} }_{{\rm{IoU}}}$ 0.586 0.201 0.427
    ${\cal{L} }_{{\rm{SIoU}}}$ 0.582 0.196 0.400
    下载: 导出CSV

    表  13  在基准LaSOT 上, 与其他基于IoU损失训练得到的满足不同IoU阈值的测试集图像帧数占比的对比结果 (%)

    Table  13  Comparison results with other IoU-based loss for the ratio of frames exceeding different IoU thresholdson the test set of LaSOT (%)

    IoU阈值 ≥ 0.95 ≥ 0.90 ≥ 0.85 ≥ 0.80 ≥ 0.75 ≥ 0.70 ≥ 0.65 ≥ 0.60 ≥ 0.55 ≥ 0.50
    SiamFC++ (SIoU) 2.75 15.93 31.83 44.05 52.33 57.71 61.71 64.41 66.52 68.14
    SiamFC++ (DIoU) 1.60 13.19 29.72 42.84 51.48 57.09 61.28 64.17 66.31 67.95
    SiamFC++ (GIoU) 2.45 16.18 31.10 42.26 50.39 55.81 59.56 62.37 64.58 66.34
    SiamFC++ 1.52 12.73 29.10 41.90 50.20 55.63 59.72 62.51 64.68 66.31
    SiamBAN (SIoU) 1.18 10.79 24.86 36.64 45.50 51.87 56.45 60.03 62.77 64.84
    SiamBAN (GIoU) 1.49 11.77 24.71 35.15 44.77 50.79 54.93 57.76 60.70 63.98
    SiamBAN 1.98 12.89 25.40 35.57 43.46 49.29 53.38 56.53 58.92 60.78
    SiamCAR (SIoU) 1.20 10.80 24.81 36.74 45.75 52.29 56.97 60.71 63.53 65.66
    SiamCAR (DIoU) 1.20 10.91 25.10 36.62 45.04 51.47 56.18 59.89 62.70 64.83
    SiamCAR 1.27 10.62 23.90 35.98 44.93 50.87 55.08 57.86 59.94 61.61
    下载: 导出CSV

    表  14  在基准GOT-10k上, 与其他基于IoU损失训练得到的满足不同IoU阈值的测试集图像帧数占比的对比结果 (%)

    Table  14  Comparison results with other IoU-based loss for the ratio of frames exceeding different IoU thresholdson the test set of GOT-10k (%)

    IoU阈值 ≥ 0.95 ≥ 0.90 ≥ 0.85 ≥ 0.80 ≥ 0.75 ≥ 0.70 ≥ 0.65 ≥ 0.60 ≥ 0.55 ≥ 0.50
    SiamFC++ (SIoU) 0.94 8.18 22.01 35.76 46.83 55.71 62.16 67.40 71.39 74.68
    SiamFC++ (DIoU) 0.72 7.56 21.10 35.11 46.86 55.45 61.68 66.82 70.74 73.86
    SiamFC++ (GIoU) 0.97 7.20 21.80 34.19 45.85 54.50 59.24 63.48 66.02 69.49
    SiamCAR (SIoU) 0.94 8.58 22.20 35.83 46.46 54.74 60.66 65.49 69.30 72.62
    SiamCAR (GIoU) 1.13 6.72 19.23 34.78 45.37 53.73 59.98 64.96 68.95 71.96
    SiamCAR (DIoU) 0.92 6.19 18.85 32.54 43.73 52.51 58.86 64.04 68.09 71.33
    SiamCAR 0.81 8.02 20.76 33.88 44.07 51.87 57.21 61.35 64.99 68.31
    下载: 导出CSV

    表  15  在GOT-10k上, 对${\cal{L}}_{{\rm{SIoU}}}$的正则项和代理函数的消融实验(%)

    Table  15  Ablation studies about the regulariztion and surrogate function on GOT-10k (%)

    评价指标 $ {\rm{AO}} $ ${\rm{SR} }_{0.50}$ ${\rm{SR} }_{0.75}$
    ${\cal{L} }_{ {\rm{SIoU} } }\;({\rm{w/o} } \, {\cal {AR} })$ 59.9 72.1 46.3
    ${\cal{L} }_{ {\rm{SIoU} } }\; ({\rm{w/} } \;{ \cal{AR} })$ 61.7 74.7 46.8
    相对增益 3.01 3.61 1.08
    ${\cal{L} }_{ {\rm{SIoU} } }\;({\rm{w/} } \;{\cal {R} })$ 61.4 74.5 46.7
    相对增益 2.51 3.33 0.86
    ${\cal{L} }_{ {\rm{SIoU} } } \;({\rm{w/} } \;{ {\cal A} }_2)$ 60.3 72.6 46.5
    相对增益 0.67 0.69 0.43
    ${\cal{L} }_{ {\rm{SIoU} } }\; ({\rm{w/} } \;{ {\cal A} }_4)$ 60.6 73.4 46.3
    相对增益 1.17 1.80 0
    ${\cal{L} }_{ {\rm{SIoU} } }\; ({\rm{w/} } \;{ {\cal A} }_8)$ 60.4 73.4 46.0
    相对增益 0.83 1.80 −0.65
    ${\cal{L} }_{ {\rm{SIoU} } }\; ({\rm{w/} } \;{ {\cal A} }_1)$ 58.9 71.3 43.7
    相对增益 −1.17 −1.11 −5.62
    下载: 导出CSV
  • [1] 孟琭, 杨旭. 目标跟踪算法综述. 自动化学报, 2019, 45(7):1244-1260

    Meng Lu, Yang Xu. A survey of object tracking algorithms. Acta Automatica Sinica, 2019, 45(7):1244-1260
    [2] 蒋弘毅, 王永娟, 康锦煜. 目标检测模型及其优化方法综述. 自动化学报, 2021, 47(6): 1232-1255

    Jiang Hong-Yi, Wang Yong-Juan, Kang Jin-Yu. A survey of object detection models and its optimization methods. Acta Automatica Sinica, 2021, 47(6):1232-1255
    [3] Girshick R B. Fast R-CNN. In: Proceedings of the IEEE International Conference on Computer Vision. Santiago, Chile: IEEE, 2015. 1440−1448
    [4] Yu J, Jiang Y, Wang Z, Cao Z, Huang T S. Unitbox: An advanced object detection network. In: Proceedings of the ACM Conference on Multimedia Conference. Amsterdam, Netherland: 2016. 516−520
    [5] Rezatofighi H, Tsoi N, Gwak J, Sadeghian A, Reid I D, Savarese S. Generalized intersection over union: A metric and a loss for bounding box regression. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Bea-ch, USA: 2019. 658−666
    [6] Zheng Z, Wang P, Li J, Ye R, Ren D. Distance-IOU loss: Faster and better learning for bounding box regression. In: Proceedings of the 34th AAAI Conference on Artificial Intelligence. New York, USA: AAAI Press, 2020. 12993−13000
    [7] Zhang Y, Ren W, Zhang Z, Jia Z, Wang L, Tan T. Focal and efficient IOU loss for accurate bounding box regression [Online], available: https://arxiv.org/abs/2101.08158, August 11, 2021
    [8] Li B, Yan J, Wu W, Zhu Z, Hu X. High performance visual tracking with siamese region proposal network. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Salt Lake City, USA: 2018. 8971−8980
    [9] Li B, Wu W, Wang Q, Wu W, Yan J, Hu W. SiamRPN++: Evolution of siamese visual tracking with very deep networks. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 4282−4291
    [10] Zhu Z, Wang Q, Li B, Wu W, Yan J, Hu W. Distractor-aware siamese networks for visual object tracking. In: Proceedings of the 15th European Conference on Computer Vision. Munich, Germany: 2018. 103−119
    [11] He Y, Zhu C, Wang J, Savvides M, Zhang X. Bounding box regression with uncertainty for accurate object detection. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 2888−2897
    [12] Law H, Deng J. Cornernet: Detecting objects as paired keypoints. In: Proceedings of the 15th European Conference on Computer Vision. Munich, Germany: 2018. 765−781
    [13] Gidaris S, Komodakis N. Locnet: Improving localization accuracy for object detection. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA: 2016. 789−798
    [14] Zhou X, Koltun V, Krähenbühl P. Tracking objects as points. In: Proceedings of the 16th European Conference on Computer Vision. Glasgow, UK: 2020. 474−490
    [15] Lin T.-Y, Goyal P, Girshick R, et al. Focal loss for dense object detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, 42(2):318-327 doi: 10.1109/TPAMI.2018.2858826
    [16] Held D, Thrun S, Savarese S. Learning to track at 100 FPS with deep regression networks. In: Proceedings of the 14th European Conference on Computer Vision. Amsterdam, Netherlands: 2016. 749−765
    [17] Bertinetto L, Valmadre J, Henriques J F, Vedaldi A, Torr H S P. Fully-convolutional siamese networks for object tracking. In: Proceedings of the European Conference on Computer Vision Workshops. Amsterdam, Netherlands: 2016. 850−865
    [18] Jiang B, Luo R, Mao J, Xiao T, Jiang Y. Acquisition of localization confidence for accurate object detection. In: Proceedings of the 15th European Conference on Computer Vision. Munich, Germany: 2018. 816−832
    [19] Wang G, Luo C, Xiong Z, Zeng W. SPM-tracker: Series-parallel matching for real-time visual object tracking. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 3643−3652
    [20] Xu Y, Wang Z, Li Z, Ye Y, Yu G. SiamFC++: Towards robust and accurate visual tracking with target estimation guidelines. In: Proceedings of the 34th AAAI Conference on Artificial Intelligence. New York, USA: AAAI Press, 2020. 12549−12556
    [21] Chen Z, Zhong B, Li G, Zhang S, Ji R. Siamese box adaptive network for visual tracking. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Sea-ttle, USA: IEEE, 2020. 6667−6676
    [22] Guo D, Wang J, Cui Y, Wang Z, Chen S. SiamCAR: Siamese fully convolutional classification and regression for visual tracking. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle, USA: IEEE, 2020. 6268−6276
    [23] Zhang Z, Peng H, Fu J, Li B, Hu W. Ocean: Object-aware anchor-free tracking. In: Proceedings of the 16th European Conference on Computer Vision. Glasgow, UK: 2020. 771−787
    [24] 谭建豪, 郑英帅, 王耀南, 马小萍. 基于中心点搜索的无锚框全卷积孪生跟踪器. 自动化学报, 2021, 47(4): 801-812

    Tan Jian-Hao, Zheng Ying-Shuai, Wang Yao-Nan, et al. AFST: Anchor-free fully convolutional siamese tracker with searching center point. Acta Automatica Sinica, 2021, 47(4):801-812
    [25] Szegedy C, Liu W, Jia Y Q, Sermanet P, Reed S, Anguelov D, et al. Going deeper with convolutions. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Boston, USA: 2015. 1−9
    [26] He K, Zhang X, Ren S, Sun J. Deep residual learning for image recognition. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA: 2016. 770−778
    [27] Russakovsky O, Deng J, Su H, et al. Imagenet large scale visual recognition challenge. International Journal of Computer Vision, 2015, 115(3):211-252 doi: 10.1007/s11263-015-0816-y
    [28] Lin T Y, Maire M, Belongie S, Hays J, Perona P, Ramanan D, et al. Microsoft COCO: Common objects in context. In: Proceedings of the 13th European Conference on Computer Vision. Zurich, Switzerland: 2014. 740−755
    [29] Real E, Shlens J, Mazzocchi S, Pan X, Vanhoucke V. Youtube-boundingboxes: A large high-precision human-annotated data set for object detection in video. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, USA: 2017. 7464−7473
    [30] Fan H, Lin L, Yang F, Chu P, Deng G, Yu S, et al. Lasot: A high-quality benchmark for large-scale single object tracking. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 5374−5383
    [31] Müller M, Bibi A, Giancola S, Al-Subaihi S, Ghanem B. Trackingnet: A large-scale dataset and benchmark for object tracking in the wild. In: Proceedings of the 15th European Conference on Computer Vision. Munich, Germany: 2018. 310−327
    [32] Huang L, Zhao X, Huang K. Got-10k: A large high-diversity benchmark for generic object tracking in the wild. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2021, 43(5):1562-1577 doi: 10.1109/TPAMI.2019.2957464
    [33] Wu Y, Lim J, Yang M. Object tracking benchmark. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(9):1834-1848 doi: 10.1109/TPAMI.2014.2388226
    [34] Kristan M, He Z. The sixth visual object tracking VOT2018 challenge results. In: Proceedings of the European Conference on Computer Vision Workshops. Munich, Germany: 2018. 3−53
    [35] Wang Q, Zhang L, Bertinetto L, Hu W, Torr P H S. Fast online object tracking and segmentation: A unifying approach. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 1328−1338
    [36] Huang L, Zhao X, Huang K. Globaltrack: A simple and strong baseline for long-term tracking. In: Proceedings of the 34th AAAI Conference on Artificial Intelligence. New York, USA: AAAI Press, 2020. 11037−11044
    [37] Fan H, Ling H. Siamese cascaded region proposal networks for real-time visual tracking. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 7952−7961
    [38] Danelljan M, Bhat G, Khan F S, Felsberg M. ATOM: Accurate tracking by overlap maximization. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 4660−4669
    [39] Bhat G, Danelljan M, Gool L V, Timofte R. Learning discriminative model prediction for tracking. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. Seo-ul, South Korea: IEEE, 2019. 6181−6190
    [40] Nam H, Han B. Learning multi-domain convolutional neural networks for visual tracking. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA: IEEE, 2016. 4293−4302
    [41] Lukezic A, Matas J, Kristan M. D3S: A discriminative single shot segmentation tracker. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Sea-ttle, USA: IEEE, 2020. 7131−7140
    [42] Zhang L, Gonzalez-Garcia A, Weijervan De J, Danelljan M, Khan F S. Learning the model update for siamese trackers. In: Proceedings of the IEEE/CVF International Conference on Com-puter Vision. Seoul, South Korea: IEEE, 2019. 4009−4018
  • 期刊类型引用(14)

    1. 刘祥,李辉,程远志,孔祥振,陈双敏. 图像与点云多重信息感知关联的三维多目标跟踪. 中国图象图形学报. 2024(01): 163-178 . 百度学术
    2. 刘龙哲,刘刚,徐红鹏,权冰洁,田慧. 面向单阶段目标检测的损失函数优化设计. 电光与控制. 2024(03): 86-93 . 百度学术
    3. 乔珠峰,赵秋菊,郭建鑫,陈会娜,平阳,赵继春. 基于改进YOLOv5的草莓病害智能识别终端设计. 中国农机化学报. 2024(03): 205-211 . 百度学术
    4. 张佳钰,蔡泽烽,冯杰. 基于改进的CenterNet变电站设备红外温度检测方法. 计算机测量与控制. 2024(07): 50-56 . 百度学术
    5. 刘晶,祁文哲,吕德芳,李杉杉. 改进YOLOv5的轨面伤损检测方法. 智能计算机与应用. 2024(06): 71-78 . 百度学术
    6. 李银银,刘磊,孙大杰,赵静. 基于改进的卷积神经网络水果分类算法设计. 哈尔滨商业大学学报(自然科学版). 2024(04): 413-422 . 百度学术
    7. 路晓亚,李海芳. 低可见度环境下基于改进YOLOv3的井下人员定位方法. 工矿自动化. 2024(09): 130-137 . 百度学术
    8. 纪桐,王子涵. 基于YOLOv7的石墨化配电室员工违规行为检测. 智能计算机与应用. 2024(12): 118-123 . 百度学术
    9. 张银胜,杨宇龙,吉茹,蓝天鹤,单慧琳. 改进YOLOv5s的风力涡轮机表面缺陷检测. 电子测量与仪器学报. 2023(01): 40-49 . 百度学术
    10. 王彦生,曹雪虹,焦良葆,孙宏伟,高阳. 基于改进YOLOv5的电厂人员吸烟检测. 计算机测量与控制. 2023(05): 48-55 . 百度学术
    11. 钟源建,刘添荣,李卓亮. 基于改进AI-YOLO v4算法的施工现场安全预警技术研究. 粘接. 2023(10): 185-188 . 百度学术
    12. 李甜,林贵敏,施文灶,庄镇榕,杨玮琪,孙雯婷,温鹏宇,王磊. 改进YOLOv5s无人机航拍图像目标检测. 闽江学院学报. 2023(05): 51-62 . 百度学术
    13. 孙梦宇,王鹏,徐均琪,李晓艳,郜辉,邸若海. 自适应信息选择的变尺度相关滤波红外目标跟踪算法. 光子学报. 2023(12): 226-238 . 百度学术
    14. 范海红. 基于RepGT损失的改进Faster R-CNN的包裹检测算法. 物流技术. 2022(05): 78-81 . 百度学术

    其他类型引用(15)

  • AAS-CN-2021-0525数据.zip
  • 加载中
图(13) / 表(15)
计量
  • 文章访问数:  1295
  • HTML全文浏览量:  635
  • PDF下载量:  246
  • 被引次数: 29
出版历程
  • 收稿日期:  2021-06-11
  • 录用日期:  2021-09-17
  • 网络出版日期:  2021-11-15
  • 刊出日期:  2023-02-20

目录

/

返回文章
返回