-
摘要: 边界框回归分支是深度目标跟踪器的关键模块, 其性能直接影响跟踪器的精度. 评价精度的指标之一是交并比(Intersection over union, IoU). 基于IoU的损失函数取代了
$ \ell_n $ -norm损失成为目前主流的边界框回归损失函数, 然而IoU损失函数存在2个固有缺陷: 1)当预测框与真值框不相交时IoU为常量 0, 无法梯度下降更新边界框的参数; 2)在IoU取得最优值时其梯度不存在, 边界框很难收敛到 IoU 最优处. 揭示了在回归过程中IoU最优的边界框各参数之间蕴含的定量关系, 指出在边界框中心处于特定位置时存在多种尺寸不同的边界框使IoU损失最优的情况, 这增加了边界框尺寸回归的不确定性. 从优化两个统计分布之间散度的视角看待边界框回归问题, 提出了光滑IoU (Smooth-IoU, SIoU)损失, 即构造了在全局上光滑(即连续可微)且极值唯一的损失函数, 该损失函数自然蕴含边界框各参数之间特定的最优关系, 其唯一取极值的边界框可使IoU达到最优. 光滑性确保了在全局上梯度存在使得边界框更容易回归到极值处, 而极值唯一确保了在全局上可梯度下降更新参数, 从而避开了IoU损失的固有缺陷. 提出的光滑损失可以很容易取代IoU损失集成到现有的深度目标跟踪器上训练边界框回归, 在 LaSOT、GOT-10k、TrackingNet、OTB2015和VOT2018测试基准上所取得的结果, 验证了光滑IoU损失的易用性和有效性.-
关键词:
- 光滑IoU损失 /
- $ \ell_n $ -norm损失 /
- 边界框回归 /
- 目标跟踪
Abstract: The branch of bounding box regression is a critical module in visual object trackers, and its performance directly affects accuracy of a tracker. One of evaluation metrics used to measure accuracy is intersection over union (IoU). The IoU loss which was proposed to replace$ \ell_n $ -norm loss for bounding box regression is increasingly popular. However, there are two inherent issues in IoU loss: One is that the parameters of bounding box can not be updated via gradient descent if the predicted box does not intersect with ground-truth box; the other is the gradient of the optimal IoU does not exist, so it is difficult to make the predicted box regressed to the IoU optimum. We reveal the explicit relationship among the parameters of IoU optimal bounding box in regression process, and point out that the size of a predicted box which makes IoU loss optimal is not unique when its center is in specific areas, increasing the uncertainty of bounding box regression. From the perspective of optimizing divergence between two distributions, we propose a smooth-IoU (SIoU) loss, which is a globally smooth (continuously differentiable) loss function with unique extremum. The smooth-IoU loss naturally implicates a specific optimal relationship among the parameters of bounding box, and its gradient over the global domain exists, making it easier to regress the predicted box to the extremal bounding box, and the unique extremum ensures that the parameters can be updated via gradient descent. In addition, the proposed smooth-IoU loss can be easily incorporated into existing trackers by replacing the IoU-based loss to train bounding box regression. Extensive experiments on visual tracking benchmarks including LaSOT, GOT-10k, TrackingNet, OTB2015, and VOT2018 demonstrate that smooth-IoU loss achieves state-of-the-art performance, confirming its effectiveness and efficiency.-
Key words:
- Smooth-IoU loss /
- $ \ell_n $-norm loss /
- bounding box regression /
- visual tracking
-
近年来, 随着互联网、云计算等信息科技的蓬勃发展, 2006年美国国家科学基金会提出了信息技术的发展方向 — 信息物理系统(Cyber-physical system, CPS)[1], CPS是计算资源和物理资源的紧密耦合与协同, 使得系统的适应性、自治力、可靠性、安全性和可用性远超当前的系统[2]. 能源是人类赖以生存和发展的基础, 能源的可持续和清洁化始终是人类孜孜以求的目标[3]. 近年来, 随着风、光等新能源利用技术的高速发展, 以风、光等永续清洁能源为主要供能形式, 建设清洁低碳安全高效的信息能源系统, 实现绿色可再生能源高效利用, 破解当前化石能源困局成为业界重要共识[4]. 尽管信息物理系统的稳定性已经得到了广泛的研究, 但大部分的学者皆关注于通信网络延时或攻击下的信息物理系统的稳定性问题[5-6], 无网络通信的信息物理系统的信−物融合稳定性分析策略亟待提出. 其中, 内嵌数字控制系统的并网逆变器系统可以被认为是最简单和最典型的信息能源系统之一. 基于此, 本文聚焦于无通信网络的内嵌数字控制的并网逆变器系统, 提出信息能源系统的信−物融合稳定性分析技术.
信息能源/信息电力系统稳定性已经被广泛研究, 其可以被区分为网络攻击下的系统稳定性问题和无网络攻击下的系统稳定性问题[7-11]. 从攻击角度出发, 当前研究已经从网络攻击[7]、攻击级联反应[8]、主动预防[9]等多角度构建了相对完整的研究体系. 从无攻击角度出发, 当前研究多集中于分布式/集中式通信网络的延时. Xu等[10]和张一媚等[11]分别对信息电力系统和信息能源系统信−物融合导致的通信延时设计了延时阈值条件. 两者都是针对二级控制中存在的通信延时展开研究, 给出了二级控制中致使控制器失效的极限延时时间. 无通信网络的底层信息能源网络稳定性评估尚属空白, 而隶属于无通信网络的底层信息能源网络的内嵌数字控制系统的并网逆变器系统可以被认为最简单而典型的信息物理系统之一, 其包含数字控制系统和电力变换器件而无通信网络. 从效率的角度出发, 逆变器的开关/采样频率总是选择尽可能低的频率, 其势必产生系统固有延迟时间[12], 此固有延时时间由信息/物理层的采样延迟时间、信息层的计算延迟时间和物理层的脉宽调制(Pulse-width modulation, PWM)延迟时间三部分组成, 其有效反映了信息−物理相互融合作用的影响. 因此, 确保系统稳定情况下的信息−物理相互融合而导致的等效延时的阈值亟待提出, 该阈值可以进一步指导实际微电网开关/采样频率的选取, 避免系统出现信息−物理融合影响而导致的失稳现象. 同时, 在2020年, 功率−信号混合传递策略在Nature Communications上被提出, 本文方法不需要传统的通信网络, 而是通过物理层的脉宽调制的开关频率和相位偏差两个自由度传递信息, 该方法将信息−物理耦合成了一个整体[13]. 然而该方法需要一系列正交的开关频率传递信息, 随着开关频率的降低也会导致信息−物理融合的低频/次同步振荡问题.
由采样−计算−脉宽调制造成的固有延时隶属于纳秒级延时, 同时隶属于系统最底层且基础的电磁时间尺度的稳定性问题和电力系统中的静态小扰动稳定性问题[14]. 目前, 电磁时间尺度稳定性分析技术已经取得了诸多研究成果[15-23]. 相关成果可以被分为基于状态方程的稳定性分析技术[14-17]、基于闭环传递函数的稳定性分析技术[18-19]和基于阻抗方法的稳定性分析技术[20-26] 3个大类. 其中基于状态方程的稳定性分析技术首先从电能变换器件及其连接线路的角度出发构建整个系统的状态方程, 其主要热点及难点问题在于构建整个状态方程时考虑延时、锁相环耦合等问题. 文献[14]提出通过柏德近似等方法对上述问题进行化简. 此外, 当电力变换器的数量增多时, 整体的状态方程将变得十分复杂, 目前有效的解决方法是对整体的状态方程进行降阶, 如奇异值摄动法[15]、Schur变换法[16]和Kron降阶法[17]等. 基于闭环传递函数的稳定性分析方法是建立整个系统模型并利用波特图和根轨迹等方法判别系统的稳定性[18]. 然而基于闭环传递函数的波特图和根轨迹法也存在复杂的计算量, 因此, 该稳定性分析方法也需要降阶处理, 其常见的降阶方法有奇异值摄动法等[19]. 然而, 状态方程法和闭环传递函数法随着变换器数量增加而导致模型维数灾问题, 并且随着可再生能源的渗透率不断地提高, 整个网络的状态方程或传递函数难以构建[20].
因此, 基于阻抗方法的电磁时间尺度稳定性分析技术越来越得到学者的关注. 阻抗方法通过构建整个系统的阻抗模型并利用广义奈奎斯特曲线[21]以判别系统稳定性. 鉴于双向能流的交/直流混合微电网的急速发展, 文献[21]首先提出了Z
$+ $ Z型阻抗评估判据. 鉴于现存广义奈奎斯特判据高复杂性, 相关学者提出了简化稳定判据, 如范数阻抗判据和禁止区域阻抗判据[22-24]. 其中, 根据不同范数类别和判据区间范围, 将基于范数的阻抗判据分为G范数判据、Infinity范数判据和Infinity-one范数判据[22] 3类. 另外一系列的稳定判据则基于禁止区域, 如Middlebrook判据、增益和相位裕度判据、对立的观点判据等[23-24]. 然而上述阻抗稳定性分析方法多关注于稳定运行点的辨识和所构建的回比矩阵的稳定裕度, 而无法提供确保系统稳定运行时, 等效延时的变化区域或系统采样/开关频率阈值. 为了提供在信息−物理融合影响的情况下确保系统稳定的采样/开关频率阈值, 本文提出了一种基于自适应步长搜索算法的采样/开关频率阈值辨识技术. 本文的主要特点和优点如下:1)本文构建了内嵌等效时延的广义阻抗回比矩阵, 该等效延迟时间由信息/物理层的采样延迟时间、信息层的计算延迟时间和物理层的脉宽调制延迟时间3部分组成. 其有效反映了信息−物理相互融合作用的影响和为后续系统采样/开关频率阈值辨识提供模型基础.
2)本文利用柏德逼近技术将延时的指数型函数转化为频率分数函数, 进而将系统采样/开关频率阈值的求解问题转化为等效回比矩阵为Hurwitz的辨识问题. 其消除了传统阻抗技术中所涉及的广义奈奎斯特判据复杂度高的问题, 进而可以获得工程可用的稳定性判据.
3)本文提出了基于自适应步长搜索算法的采样/开关频率阈值辨识技术, 其能够获得信息能源系统采样/开关频率阈值, 有效指导微电网开关/采样频率的选取, 避免系统出现信息−物理融合影响而导致失稳现象.
1. 广义阻抗回比矩阵
常见的内嵌数字控制系统的并网逆变器系统如图1所示[23-27], 图1中, DG代表分布式电源. 在弱电网当中, 相较于传统的P&Q控制型并网逆变器, 下垂控制型并网逆变器具备更好的系统稳定性. 基于此, 下垂控制型并网逆变器已经被广泛应用于当前的交流微电网当中[22], 具体控制策略见文献[23]. 在此类分散式控制系统当中, 信息物理网络间存在固有延时时间, 包括信息/物理层的采样延迟时间、信息层的计算延迟时间和物理层的脉宽调制延迟时间三部分组成, 其有效反映了信息−物理相互融合作用的影响[24]. 在本文中, 由于此信息−物理相互融合作用而产生的等效延时定义为
$ G\left( \tau \right) $ . 从稳定性分析判据出发, 本文所研究的微电网系统可以等效为如图2所示的同步旋转坐标系下(dq轴)的戴维南等效电路[2]. 值得注意的是, 本文将多个分布式电源和逆变器系统等效为图2的单电源系统, 该等效是阻抗辨识技术相较于其他方法的最大优势, 通过网络拓扑等效可以降低计算负担, 本方法保留了精细划分不同电源/逆变器分别对系统稳定性的影响/贡献量, 可以利用参与因子法对某个或某几个电源/逆变器的影响进行精细化区分.相关电源/负载阻抗可以通过如下过程获得: 在dq轴下, 下垂控制器的电压/电流动态特性如下所示[27]:
$$ {V_{invd}} = {I_{invd}}({R_{inv}} + s{L_{inv}}) - \omega {L_{inv}}{I_{invq}} + {V_{cd}} $$ (1) $$ {V_{invq}} = {I_{invq}}({R_{inv}} + s{L_{inv}}) + \omega {L_{inv}}{I_{invd}} + {V_{cq}} $$ (2) $$ {I_{invd}} = {C_{inv}}{V_{cd}}s - \omega {C_{inv}}{V_{cq}} + {I_{cd}} $$ (3) $$ {I_{invq}} = {C_{inv}}{V_{cq}}s + \omega {C_{inv}}{V_{cd}} + {I_{cq}} $$ (4) 式中,
$ {V_{invd}} $ 、$ {V_{invq}} $ 、$ {I_{invd}} $ 和$ {I_{invq}} $ 分别表示在dq轴下并网逆变器的输出电压和电流;$ {V_{cd}} $ 、$ {V_{cq}} $ 、$ {I_{cd}} $ 和$ {I_{cq}} $ 分别表示在dq轴下并网逆变器的电压和电流;$ {R_{inv}} $ 、$ {L_{inv}} $ 和$ {C_{inv}} $ 分别表示电阻−电感−电容(Resistance-inductance-capacitance, RLC)电路中的电阻、电感和电容. 进一步, 电压−电流双闭环控制器如下所示[27]:$$ I_{invd}^\# = G_v^{inv}(V_{cd}^\# - {V_{cd}}) - \omega {C_{inv}}{V_{cq}} + K{I_{cd}} $$ (5) $$ I_{invq}^\# = G_v^{inv}(V_{cq}^\# - {V_{cq}}) + \omega {C_{inv}}{V_{cd}} + K{I_{cq}} $$ (6) $$ V_{invd}^\# = G_i^{inv}(I_{cd}^\# - {I_{cd}}) - \omega {L_{inv}}{I_{cq}} + {V_{cd}} $$ (7) $$ V_{invq}^\# = G_i^{inv}(I_{cq}^\# - {I_{cq}}) + \omega {L_{inv}}{I_{cd}} + {V_{cq}} $$ (8) 式中,
$ I_{cd}^\# $ 、$ I_{cq}^\# $ 、$ V_{cd}^\# $ 和$ V_{cq}^\# $ 分别表示在dq轴下并网逆变器电流和电压信号,$ G_v^{inv} $ 和$ G_i^{inv} $ 表示电压/电流双闭环比例积分(Proportional integral, PI)控制器$(G_v^{inv} = k_{vp}^{inv} + k_{vi}^{inv}/s$ 和$G_i^{inv} = k_{ip}^{inv} + k_{ii}^{inv}/s),$ $ K $ 表示反馈系数. 此外, 瞬时有功功率$ {p_{inv}} $ 和无功功率$ {q_{inv}} $ 通过式(9) 、式 (10)提供, 低通滤波器被应用至逆变器当中以获取平抑波动的有功功率$ {P_{inv}} $ 和无功功率$ {Q_{inv}} $ , 基于此, 逆变器的输出有功功率和无功功率如下所示:$$ {p_{{{inv}}}} = {\text{1}}{\text{.5}}\left( {{V_{cd}}{I_{cd}} + {V_{cq}}{I_{cq}}} \right) $$ (9) $$ {q_{{{inv}}}} = {\text{1}}{\text{.5}}\left( {{V_{cd}}{I_{cq}} - {V_{cq}}{I_{cd}}} \right) $$ (10) $$ {P_{inv}} = \frac{{{\omega _f}}}{{s + {\omega _f}}}{p_{inv}} $$ (11) $$ {Q_{inv}} = \frac{{{\omega _f}}}{{s + {\omega _f}}}{q_{inv}} $$ (12) 式中,
$ {\omega _f} $ 表示低通滤波器的截止频率. 如图3所示, 在内嵌数字控制系统的并网逆变器系统, 系统等效延时由3部分组成, 即, 信息/物理层的采样延迟时间和信息层的计算延迟时间可以表征为$ G\left( {{\tau _1}} \right) $ , 其中$ {\tau _1} = {T_s} $ ,$ {T_s} $ 表示采样周期, 即采样频率的倒数,$ {T_s} = 1/{f_s} $ , 物理层的脉宽调制延迟时间可以表征为$ G\left( {{\tau _2}} \right) $ , 其中$ {\tau _2} = 0.5{T_w} $ ,$ {T_w} $ 表示脉宽调制周期, 即开关频率的倒数,$ {T_w} = 1/{f_w} $ . 传统上, 采样周期和脉宽调制周期往往取值相同[24]. 基于此, 系统等效延时可以表示为$G\left( \tau \right) = {{\rm{e}}^{ - \tau s}} = {{\rm{e}}^{ - 1.5{T_s}s}} = {{\rm{e}}^{ - 1.5{T_w}s}} = {{\rm{e}}^{ - 1.5Ts}}$ , 其中,$ T $ 表示系统采样或开关周期. 因此, 式(11) 、式 (12)可以表示为:$$ {P_{inv}} = \frac{{{\omega _f}}}{{s + {\omega _f}}}{{\rm{e}}^{ - 1.5Ts}}{p_{inv}} $$ (13) $$ {Q_{inv}} = \frac{{{\omega _f}}}{{s + {\omega _f}}}{{\rm{e}}^{ - 1.5Ts}}{q_{inv}} $$ (14) 式中,
$ s $ 表示拉普拉斯因子, 根据文献[13]可知,${{\rm{e}}^{ - 1.5Ts}} = 4f - 3s/4f + 3s$ , 其中$ f $ 表示系统采样或开关频率. 下垂控制器可以表示为$$ \omega = {\omega ^\# } - m{P_{inv}} $$ (15) $$ V_{cd}^\# = {V^\# } - n{Q_{inv}} $$ (16) 式中,
$ {\omega ^\# } $ 和$ {V^\# } $ 分别表示额定角频率和电压, 依据动态矢量技术[27], 式(1) 、 式(2)和式(7) 、式 (8)进行偏差分析, 其中主要利用的原理:$x = y = {x^\# } + \Delta x = {y^\# } + \Delta y \to \Delta x = \Delta y$ , 因此,$ \Delta I_{inv}^\# $ 的小信号模型为:$$ \left[ {\begin{array}{*{20}{l}} {\Delta I_{invd}^\# } \\ {\Delta I_{invq}^\# } \end{array}} \right] = {\left[ {B1} \right]_{2 \times 2}}\left[ {\begin{array}{*{20}{l}} {\Delta I_{invd}^{}} \\ {\Delta I_{invq}^{}} \end{array}} \right] + {\left[ {B2} \right]_{2 \times 2}}\left[ {\begin{array}{*{20}{c}} {\Delta \omega } \\ {\Delta V_{cd}^\# } \end{array}} \right] $$ (17) 其中
$$\begin{split} &{\left[ {B1} \right]_{2 \times 2}} = {\rm{diag}}\left\{ \frac{{{R_{inv}} + s{L_{inv}} + G_i^{inv}\left( s \right)}}{{G_i^{inv}\left( s \right)}},\right. \\ & \qquad\qquad\quad\left.\frac{{{R_{inv}} + s{L_{inv}} + G_i^{inv}\left( s \right)}}{{G_i^{inv}\left( s \right)}} \right\} \\ &{\left[ {B2} \right]_{2 \times 2}} = \left[ {\begin{aligned} &{ - \frac{{I_{invq}^\# {L_{inv}}}}{{G_i^{inv}\left( s \right)}}}&0 \\ & {\frac{{I_{invd}^\# {L_{inv}}}}{{G_i^{inv}\left( s \right)}}}&0 \end{aligned}} \right]\end{split} $$ 建立式(3) ~ 式(6)的小信号模型:
$$ \begin{split} \left[ {\begin{array}{*{20}{l}} {\Delta I_{invd}^{}} \\ {\Delta I_{invq}^{}} \end{array}} \right] =\;& \left[ {\begin{array}{*{20}{l}} {\Delta I_{cd}^{}} \\ {\Delta I_{cq}^{}} \end{array}} \right] + {\left[ {B3} \right]_{2 \times 2}}\left[ {\begin{array}{*{20}{l}} {\Delta V_{cd}^{}} \\ {\Delta V_{cq}^{}} \end{array}} \right] + \\ & {\left[ {B4} \right]_{2\times 2}}\left[ {\begin{array}{*{20}{c}} {\Delta \omega } \\ {\Delta V_{cd}^\# } \end{array}} \right] \\[-20pt] \end{split} $$ (18) $$ \begin{split} \left[ {\begin{array}{*{20}{l}} {\Delta I_{invd}^\# } \\ {\Delta I_{invq}^\# } \end{array}} \right] = \;&{\left[ {B5} \right]_{2 \times 2}}\left[ {\begin{array}{*{20}{l}} {\Delta V_{cd}^{}} \\ {\Delta V_{cq}^{}} \end{array}} \right] + \\ & {\left[ {B6} \right]_{2 \times 2}}\left[ {\begin{array}{*{20}{l}} {\Delta I_{cd}^{}} \\ {\Delta I_{cq}^{}} \end{array}} \right] + {\left[ {B7} \right]_{2 \times 2}}\left[ {\begin{array}{*{20}{c}} {\Delta \omega } \\ {\Delta V_{cd}^\# } \end{array}} \right] \end{split} $$ (19) 其中
$$ \begin{split} &{\left[ {B3} \right]_{2 \times 2}}=\left[ {\begin{array}{*{20}{c}} {s{C_{inv}}}&{ - {\omega ^\# }{C_{inv}}} \\ {{\omega ^\# }{C_{inv}}}&{s{C_{inv}}} \end{array}} \right] \\ &{\left[ {B4} \right]_{2 \times 2}} = \left[ {\begin{array}{*{20}{c}} 0&0 \\ {V_{cd}^\# {C_{inv}}}&0 \end{array}} \right] \\ &{\left[ {B5} \right]_{2\times 2}} = \left[ {\begin{array}{*{20}{c}} { - G_v^{inv}\left( s \right)}&{ - {\omega ^\# }{C_{inv}}} \\ {{\omega ^\# }{C_{inv}}}&{ - G_v^{inv}\left( s \right)} \end{array}} \right] \\ &{\left[ {B6} \right]_{2 \times 2}} = \left[ {\begin{array}{*{20}{c}} K&0 \\ 0&K \end{array}} \right]\\ &{\left[ {B7} \right]_{2 \times 2}} = \left[ {\begin{array}{*{20}{c}} 0&{G_v^{inv}\left( s \right)} \\ 0&0 \end{array}} \right]\end{split}$$ 式(11) ~ 式 (16)的小信号模型为:
$$\begin{split} \Delta {p_{inv}} = \;&1.5( {V_{cd}}\Delta {I_{cd}} + \Delta {V_{cd}}{I_{cd}} +\\ &{V_{cq}}\Delta {I_{cq}} + \Delta {V_{cq}}{I_{cq}}) \end{split}$$ (20) $$ \begin{split} \Delta {q_{inv}} =\;& 1.5( {V_{cd}}\Delta {I_{cq}} + \Delta {V_{cd}}{I_{cq}}-\\ & {V_{cq}}\Delta {I_{cd}} - \Delta {V_{cq}}{I_{cd}})\end{split} $$ (21) $$ \Delta \omega = - \frac{{m{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}\Delta {p_{inv}} $$ (22) $$ \Delta V_{cd}^\# = - \frac{{n{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}\Delta {q_{inv}} $$ (23) 相似地, 以矩阵形式表征式(20) ~ 式(23):
$$ \left[ {\begin{array}{*{20}{c}} {\Delta \omega } \\ {\Delta V_{cd}^\# } \end{array}} \right] = {[B8]_{2\times2}}\left[ {\begin{array}{*{20}{c}} {\Delta {V_{cd}}} \\ {\Delta {V_{cq}}} \end{array}} \right] + {[B9]_{2\times2}}\left[ {\begin{array}{*{20}{c}} {\Delta {I_{cd}}} \\ {\Delta {I_{cq}}} \end{array}} \right] $$ (24) 其中
$$ {[B8]_{2\times2}} = \left[ {\begin{array}{*{20}{c}} {B811}&{B812} \\ {B821}&{B822} \end{array}} \right] $$ $$ \begin{split} &B811 = \frac{{1.5m{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}I_{cd}^\# \\ & B812 = - \frac{{1.5m{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}I_{cq}^\# \\ &B821 = - \frac{{1.5n{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}I_{cq}^\# \\ & B822 = - \frac{{1.5n{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}I_{cd}^\# \\ &{[B9]_{2\times2}} = {\rm{diag}}\left\{ - \frac{{1.5m{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}V_{cd}^\# ,\right. \\ &\qquad\qquad\quad\left. - \frac{{1.5n{\omega _f}}}{{s + {\omega _f}}}\frac{{4f - 3s}}{{4f + 3s}}V_{cd}^\# \right\} \end{split} $$ 由于下垂逆变器的输出阻抗矩阵
${{\boldsymbol{Z}}_{{{inv}}}} = \left[ {\begin{aligned} {{Z_{dd}}}\;\;{{Z_{dq}}} \\ {{Z_{qd}}}\;\;{{Z_{qq}}} \end{aligned}} \right]$ , 满足如下的等式关系$\left[ {\begin{aligned} {\Delta {V_{cd}}} \\ {\Delta {V_{cq}}} \end{aligned}} \right] = \left[ {\begin{aligned} {{Z_{dd}}}\;{{Z_{dq}}} \\ {{Z_{qd}}}\;{{Z_{qq}}} \end{aligned}} \right]\times \left[ {\begin{aligned} {\Delta {I_{cd}}} \\ {\Delta {I_{cq}}} \end{aligned}} \right]$ . 因此, 将式(18)、式(19)和式(24)代入式(17),可以得到逆变器的输出阻抗矩阵:$$ \begin{split} {{\boldsymbol{Z}}_{{{inv}}}} =\;& \left[ {\begin{array}{*{20}{c}} {{Z_{dd}}}&{{Z_{dq}}} \\ {{Z_{qd}}}&{{Z_{qq}}} \end{array}} \right] =\\ & \{ {\left[ {B5} \right] + \left[ {B7} \right]\left[ {B8} \right] - \left[ {B1} \right]\left[ {B3} \right]}- \\ & { \left[ {B1} \right]\left[ {B4} \right]\left[ {B8} \right] - \left[ {B2} \right]\left[ {B8} \right]} \}^{ - 1} \cdot \\ &\{ {\left[ {B1} \right]\left[ {B4} \right]\left[ {B9} \right] + \left[ {B1} \right] + } \\ &{\left[ {B2} \right]\left[ {B9} \right] - \left[ {B6} \right] - \left[ {B7} \right]\left[ {B9} \right]} \} \end{split} $$ (25) 最后, 弱电网的输入导纳矩阵如下[26]:
$$ {{\boldsymbol{Y}}_{{g}}} = {{\boldsymbol{Z}}_{{g}}^{ - 1}} = {\left[ {\begin{array}{*{20}{c}} {{Z_{dd}}}&{{Z_{dq}}} \\ {{Z_{qd}}}&{{Z_{qq}}} \end{array}} \right]^{ - 1}} $$ (26) $$ \begin{split} &{Z_{dd}} = {Z_{qq}} = \frac{{\left[ {C1} \right]{s^2} + \left[ {C2} \right]s + \left[ {C3} \right]}}{{\left[ {C4} \right]{s^2} + \left[ {C5} \right]s + \left[ {C6} \right]}}\\ &{Z_{dq}} = - {Z_{qd}} = \frac{{\left[ {C7} \right]}}{{\left[ {C4} \right]{s^2} + \left[ {C5} \right]s + \left[ {C6} \right]}}\\ &{\left[ {C1} \right]} = \left( {{L_g}{C_g} + {R_g}{C_g}} \right){L_g} \\ & {\left[ {C2} \right]} = {L_g}{R_g}{C_g} + R_s^2{C_g} + {L_g} \\ & {\left[ {C3} \right]} = \left( {{L_g}{C_g} + {R_g}{C_g}} \right){L_g}\omega _{}^{\# 2} + {R_g} \\ &{\left[ {C4} \right]} = {\left( {{L_g}{C_g} + {R_g}{C_g}} \right)^2} \\ & {\left[ {C5} \right]} = 2\left( {{L_g}{C_g} + {R_g}{C_g}} \right) \\ & {\left[ {C6} \right]} = {\left( {{L_g}{C_g} + {R_g}{C_g}} \right)^2}\omega _{}^{\# 2} + 1\\ & {\left[ {C7} \right]} = \left( {{L_g}{C_g} + {R_g}{C_g}} \right){R_g}{\omega ^\# } - {L_g}{\omega ^\# }\end{split} $$ 式中,
$ {R_g} $ 、$ {L_g} $ 和$ {C_g} $ 分别表示等效交流母线的电阻、电感和电容;$ {\omega ^\# } $ 表示系统额定频率. 因此, 内嵌等效延时的微电网系统的等效回比矩阵如下:$$ {{\boldsymbol{R}}_{{0}}} = {{\boldsymbol{Z}}_{{{inv}}}}{{\boldsymbol{Y}}_{{g}}} $$ (27) 同时, 微电网系统的等效回比矩阵是等效延时时间的函数, 即,
${{\boldsymbol{R}}_{{0}}} = h(T)$ . 根据阻抗稳定判据[23], 当等效回比矩阵的广义奈奎斯特曲线不包含(−1, 0)点时, 系统稳定性可以得到保证.2. 自适应步长搜索算法
由于复杂的奈奎斯特曲线簇绘制过程不利于参数的设计, 相关学者相继提出了如图4所示的稳定禁止区域判据, Middlebrook判据、对立的观点判据、GMPM判据和NSFR判据[28], 其中
${\rm{Re}}(\cdot)$ 代表实部,${\rm{Im}}(\cdot)$ 代表虚部. 相较于前三种禁止区域判据, NSFR判据具备更低的保守性. 当$ {\varepsilon _{GM}} $ 趋向于1且$ {\theta _{PM}} $ 趋向于0时, NSFR判据可以转化为近似充要条件. 因此本文选用NSFR判据以分析延时依赖的等效回比矩阵的稳定性.引理1[23]. 如果微电网系统等效回比矩阵的相反数
$(- {{\boldsymbol{R}}_{{0}}})$ 不包围(1, 0)点, 则微电网系统的电磁时间尺度稳定性可以得到保证.因此, 互联系统电磁时间尺度稳定运行区域可以通过
$- {{\boldsymbol{R}}_{{0}}}$ 得到(如图5中深色区域所示). 进而, 稳定运行区域可以由三个子区域的并集得到(如图6中深色区域所示), 即$ A = {A_1} \cup {A_2} \cup {A_3} $ . 其中$ {A_1} $ 可以通过平移映射将原矩阵转化为Hurwitz矩阵${{\boldsymbol{R}}_{{1}}}$ 所构成的空间平面,$ {A_2} $ 和$ {A_3} $ 可以分别通过转映射将原矩阵转化为Hurwitz矩阵${{\boldsymbol{R}}_{{2}}}$ 和${{\boldsymbol{R}}_{{3}}}$ , 进而可以将${{\boldsymbol{R}}_{{1}}}$ 、${{\boldsymbol{R}}_{{2}}}$ 和${{\boldsymbol{R}}_{{3}}}$ 定义为等效回比矩阵:$$ {A}_{1}: {\boldsymbol{R}}_{{1}}=-{\boldsymbol{R}}_{{0}}-{\varepsilon }_{GM}{\boldsymbol{E}} $$ (28) $$ {A}_{2}: {\boldsymbol{R}}_{{2}}=-{\boldsymbol{R}}_{{0}}\times {{\rm{e}}}^{{\rm{j}}{\theta }_{PM}} $$ (29) $$ {A_3}: {{\boldsymbol{R}}_{{3}}} = - {{\boldsymbol{R}}_{{0}}} \times {{\rm{e}}^{ - {\rm{j}}{\theta _{PM}}}} $$ (30) 式中,
${{\boldsymbol{R}}_{{1}}}$ 、${{\boldsymbol{R}}_{{2}}}$ 和${{\boldsymbol{R}}_{{3}}}$ 是Hurwitz矩阵. E表示单位矩阵.注1. 文献[25]所采用的方法是奈奎斯特稳定判据, 该方法更适用于已知系统的稳定性判别, 而难以给出稳定运行区间的范围. 奈奎斯特法求取稳定区间的极限需要成千上万次绘制奈奎斯特曲线或波特图, 随着可再生能源数量的递增, 该方法将极大地耗费人力资源, 因此, 文献[29]明确指出“奈奎斯特判据复杂, 难以适用于交流网络的系统设计”. 基于此, 本文将采样/开关频率阈值辨识问题转化为矩阵Hurwitz辨识问题, 从而消除了奈奎斯特曲线或波特图, 降低了计算负担. 同时相较于文献[29]提出的范数判据方法, 本文方法的保守性更低.
接着, 将提供逆变器的极限开关/采样频率阈值. 通过上述分析可知, 当
${{\boldsymbol{R}}_{{1}}}$ 、${{\boldsymbol{R}}_{{2}}}$ 和${{\boldsymbol{R}}_{{3}}}$ 是Hurwitz矩阵时, 系统的稳定性可以得到保证, 基于此, 等效回比矩阵是采样/开关频率依赖的非线性时不变矩阵. 因此, 本文提出基于等效回比矩阵的自适应步长搜索算法以获取微电网稳定下的采样/开关频率极限阈值. 为了增强算法的适应性, 本文采用最小均方(Least mean square, LMS)作为生长因子:$$ r\left(m+1\right)=r\left(m\right)+{\rm{sign}}({L}_{\mathrm{min}})\times \Delta r\left(0\right)\times {\left|{L}_{\mathrm{min}}\right|}^{\lambda \left(m\right)}\text{ } $$ (31) $$ \lambda \left(m\right)=\alpha \times \left(1+{{\rm{e}}}^{-\beta {\left|s\left(m\right)\right|}^{2}}\right)\text{ } $$ (32) $$ s\left(m\right)=\gamma s\left(m-1\right)+\left(1-\gamma \right){L}_{\mathrm{min}}\text{ } $$ (33) 式中,
${\rm{sign}}(\cdot)$ 表示符号函数,$ {L_{\min }} $ 表示等效回比矩阵的最小特征根的实部,$ {\left| {{L_{\min }}} \right|^{\lambda \left( m \right)}} $ 和$ \lambda \left( m \right) $ 表示可变步长因子和步长增长因子,$ \alpha $ 和$ \beta $ 表示调整因子,$ \gamma $ 表示遗忘因子, 详细的计算步骤如下所示:算法1. 自适应步长搜索算法
初始化. 全局变量
$ r(0) = 0 $ ,$ m = 0 $ 和$ \Delta r(0) = 0 $ .迭代.
1)初始化局部变量, 如
${L_{{\rm{max}}1}} = \emptyset$ ,${L_{{\rm{max}}2}} = \emptyset$ ,${L_{{\rm{max}}3}} = \emptyset$ 和$ i = 1 $ ;2)计算微电网的等效回比矩阵
${\boldsymbol{R}} (s)$ , 其中$s = - {\rm{j}}2\cdot \pi {f_i}$ . 在此频率下, 分别计算等效回比矩阵${{\boldsymbol{R}}_{{1}}}$ 、${{\boldsymbol{R}}_{{2}}}$ 和${{\boldsymbol{R}}_{{3}}}$ ;3)计算三个等效回比矩阵的最大实部, 即
${L_1} = {\rm{max}}({\rm{real}}({\rm{eig}}({{\boldsymbol{R}}_{{1}}})))$ 、${L_2} = {\rm{max}}({\rm{real}}({\rm{eig}}({{\boldsymbol{R}}_{{2}}})))$ 和${L_3} = {\rm{max}}({\rm{real}}({\rm{eig}}({{\boldsymbol{R}}_{{3}}})))$ ;4)扩展矩阵,
${L_{{\rm{max}}1}} = [{L_{{\rm{max}}1}},{L_1}]$ 、${L_{{\rm{max}}2}} = [{L_{{\rm{max}}2}}, {L_2}]$ 和${L_{{\rm{max}}3}} = [{L_{{\rm{max}}3}},{L_3}]$ . 如果$i < 20\,000$ ,$ i = i + 1 $ , 然后返回第2)步, 否则进行第5)步;5)选取
${L_{{\rm{max}}1}}$ 、${L_{{\rm{max}}2}}$ 和${L_{{\rm{max}}3}}$ 中的最大值, 即${L_{{\rm{max}} - 1}} = {\rm{max}}({L_{{\rm{max}}1}})$ 、${L_{{\rm{max}} - 2}} = {\rm{max}}({L_{{\rm{max}}2}})$ 和${L_{{\rm{max}} - 3}} = {\rm{max}}({L_{{\rm{max}}3}})$ . 定义${L_{{\rm{min}}}}$ 是${L_{{\rm{max}} - 1}}$ 、${L_{{\rm{max}} - 2}}$ 和${L_{{\rm{max}} - 3}}$ 中的最小值, 即${L_{{\rm{min}}}} = {\rm{min}} ({L_{{\rm{max}} - 1}},{L_{{\rm{max}} - 2}},{L_{{\rm{max}} - 3}})$ ;6)判断
$ r(m) $ 下${L_{{\rm{min}}}}$ 是否等于0. 若判别结果为是, 则存储开区间$ (0,r(m)) $ 的记录, 然后进入第7)步. 反之$r(m + 1)=r\left(m\right)+{\rm{sign}}({L}_{\mathrm{min}})\times \Delta r\left(0\right)\times {\left|{L}_{\mathrm{min}}\right|}^{\lambda \left(m\right)},$ 然后返回第1)步;7)计算第6)步中的所有开集合的集合, 记录的结果为等效延时的最大值
$ {T_{\max }} $ .注2. 算法中i的上限取值为20000, 即验证频率从[0, 20000] Hz情况下系统的极限开关频率. 选取20000的原因在于, 本文研究的动机是探究随着开关频率降低所导致的低频和次/超同步振荡等宽频振荡现象的诱发条件. 而宽频振荡的范围是[0, 3000] Hz左右, 为保证极端条件下 本文方法的有效性而提高了频率的验证范围. 如果工程师希望快速计算结果, 可以将其上限降低至3000. 上述自适应步长搜索算法可以获得在等效回比矩阵Hurwitz情况下的最大等效延时时间. 因此, 采样/开关频率阈值为
$ {f_{\min }} = 1/{T_{\max }} $ . 同时上述所提出的自适应步长搜索算法属于二分法的一类变型, 同时$ {L_{\min }} $ 和$ r\left( m \right) $ 的关系如图7所示, 其存在单调递增特性[14]. 因此, 系统的收敛性可以得到很好保证, 并且不受初始值选取的影响.注3. 本文所指的适应性主要针对算法的收敛速度, 确保本方法适用于对计算时间要求较高的系统. 由于传统的固定步长的搜索方法的收敛较慢, 因此, 本文利用指数函数的特性, 在收敛点处(0值处)变化率低和远离收敛点处变化率高的特点. 换而言之, 确保在收敛点附近, 按照小步长搜索, 在远离收敛点处, 按照大步长搜索. 其中通过设定最小均方作为指数项, 利用指数函数的性质可以提高本算法的收敛速度, 从而提高本算法的适用性, 应对高计算速度要求的系统.
3. 仿真验证
为了验证本文所提出的信息能源系统信−物融合的稳定性分析方法的有效性, 本文选取文献[30]所表征的系统和控制器参数. 相关的控制参数如表1所示, 并网逆变器数量选取为3个, 弱电网的电路阻抗为
${R_g} = 0.25\;\Omega ,{L_g} = 10\;{\rm{mH}},\;{C_g} = 100$ μF. 本文基于等效回比矩阵的自适应步长搜索算法而获取微电网稳定下的采样/开关频率极限阈值为3.662 kHz. 本文将分别验证系统不同开关/采样频率下系统的稳定性, 基于实际的Matlab/Simulink仿真软件所搭建仿真测试平台, 利用弱电网和并网逆变器之间的交流母线电压的波形情况, 来验证本文基于等效回比矩阵的自适应步长搜索算法的有效性. 具体的4组仿真验证案例如下所示:表 1 仿真系统参数表Table 1 Simulation system parameters参数 数值 电压控制器 $G_v^{inv} = 1 + 8/{ {s} }$ 电流控制器 $G_c^{inv} = 4 + 150/{ {s} }$ 母线电压 700 V 额定电压 220 V 额定频率 50 Hz 截止频率 5 Hz 滤波器电容 600 μF 滤波器电感 6 mH 1)首先, 微电网系统的开关/采样频率选取为4 kHz, 很明显, 此开关/采样频率大于提出的自适应步长搜索算法所求解得到的阈值频率, 因此, 系统可以保持稳定. 但基于文献[29], 如图8所示, 系统的回比矩阵的无穷范数在[126 Hz, 212 Hz]的范围内大于1, 因此系统可能发生失稳现象. 系统实际的电压波形图如图9所示, 通过观察图9所示的波形图可知, 弱电网和并网逆变器之间的交流母线电压恒定保持在220 V/50 Hz, 由此可见系统保持了良好的稳定性. 相较于现存范数方法, 本文所提方法的保守性较低.
2)微电网系统的开关/采样频率选取3.5 kHz, 很明显, 此开关/采样频率略小于提出的辨识策略求解得到的阈值频率, 因此, 系统难以保持系统的绝对稳定. 系统实际的电压波形图如图10所示, 系统发生轻度的低频振荡.
3)微电网系统的开关/采样频率选取3 kHz, 很明显, 此开关/采样频率明显小于提出的辨识策略求解得到的阈值频率, 因此, 系统极易发生失稳现象. 系统实际的电压波形图如图11所示, 系统发生大幅的低频振荡.
4)微电网系统的开关/采样频率选取2 kHz, 很明显, 此开关/采样频率远远小于提出的辨识策略求解得到的阈值频率, 因此, 系统必然发生失稳现象. 系统实际的电压波形图如图12所示, 系统大幅度的发散振荡, 如果不采用有效抑制措施, 系统将会诱发过流/过压保护而发生解列等极端现象.
综上所述, 本文提出的基于等效回比矩阵的自适应步长搜索算法的有效性得到了很好验证, 其可以有效指导实际微电网开关/采样频率的选取, 避免系统出现信息−物理融合影响而导致的失稳现象.
4. 硬件在环实验验证
为更好地验证本文提出的基于等效回比矩阵的自适应步长搜索算法的有效性, 本文在如图13所示的微电网系统的实验平台进行验证, 相关控制和物理拓扑参数与仿真验证平台相同, 同时3台逆变器由TMS320F28335DSP控制, 硬件拓扑内嵌于OPAL-RT OP5600.
在此情境下, 基于所提出的基于等效回比矩阵的自适应步长搜索算法而获取微电网稳定下的采样/开关频率极限阈值依旧是3.662 kHz. 相似于第3部分的仿真验证模块, 分别选取微电网系统的开关/采样频率为4 kHz、3.5 kHz和3 kHz. 当微电网的开关/采样频率为4 kHz时, 此场景中系统的开关/采样频率大于提出的辨识策略求解得到的阈值频率, 因此, 系统可以保持稳定. 系统实际的电压波形如图14所示, 系统保持了良好的稳定性.
当微电网的开关/采样频率为3.5 kHz 时, 此场景中系统的开关/采样频率小于提出的辨识策略求解得到的阈值频率, 因此, 系统难以保持绝对稳定. 系统实际的电压波形图如图15所示, 系统发生轻微低频振荡.
当微电网的开关/采样频率为3 kHz 时, 此场景中系统的开关/采样频率小于提出的辨识策略求解得到的阈值频率, 因此, 系统的稳定性将得不到保证. 系统实际的电压波形图如图16所示, 系统发生失稳现象. 综上所述, 本文提出的基于等效回比矩阵的自适应步长搜索算法的有效性得到验证.
5. 结束语
内嵌数字控制系统的并网逆变器系统是一种最简单和典型的信息能源系统, 同时从效率的角度出发, 逆变器的开关/采样频率总是选择尽可能低的频率, 势必产生系统固有延迟时间. 基于此, 本文提出了一种基于稳定性的开关/采样频率阈值辨识方法. 本文具有3个主要的创新点/贡献点: 1)构建了内嵌等效时延的广义阻抗回比矩阵, 该等效延迟时间由信息/物理层的采样延迟时间、信息层的计算延迟时间和物理层的脉宽调制延迟时间3部分组成. 其有效反映了信息−物理相互融合作用的影响和为后续系统采样/开关频率阈值辨识提供模型基础. 2)利用柏德逼近技术将延时转化为频率分数函数, 进而将系统采样/开关频率阈值的求解问题转化为等效回比矩阵为Hurwitz的辨识问题. 其消除了传统阻抗技术中所涉及的广义奈奎斯特判据复杂度高的问题, 进而可以获得工程可用的稳定性判据. 3)提出了基于自适应步长搜索算法的采样/开关频率阈值辨识技术, 其能够获得信息能源系统采样/开关频率阈值, 指导实际微电网开关/采样频率的选取, 避免系统出现信息−物理融合影响而导致的失稳现象, 最后, 仿真和实验结果验证了该方法的有效性. 未来并网逆变器类系统三级控制体系的整体信息−物理稳定性分析技术势必成为研究的重点领域. 同时, 随着高比例的可再生能源和高占比的电力变化设备接入能源系统, 稳定机理分析及其抑制技术也将成为待研究的重点内容.
-
图 11 在LaSOT测试集上, 分别以
$ {\cal{L}}_{{\rm{IoU}}} $ (点线框标出)和$ {\cal{L}}_{{\rm{SIoU}}} $ (虚线框标出)训练的模型 SiamFC++ 的可视化结果示例 (实线框为真值标签)Fig. 11 Visualized tracking results of SiamFC++trained using
$ {\cal{L}}_{{\rm{IoU}}} $ (marked in dotted box) and$ {\cal{L}}_{{\rm{SIoU}}} $ (marked in dashed box) on LaSOT(solid box denotes groundtruth)表 1 在基准 LaSOT 上, 分别以
$ {\cal{L}}_{{\rm{IoU}}} $ (原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $ 训练的模型 SiamFC++的测试结果(%)Table 1 Comparison between the performance of SiamFC++ trained using
$ {\cal{L}}_{{\rm{IoU}}} $ (original),$ {\cal{L}}_{{\rm{SIoU}}} $ on the test set of LaSOT (%)评价指标 成功率 精确度 标准化精确度 ${\cal{L} }_{{\rm{IoU}}}$ 55.6 55.5 64.8 ${\cal{L} }_{{\rm{SIoU}}}$ 57.6 58.3 66.9 相对增益 3.60 5.05 3.24 表 2 在基准LaSOT上, 分别以
$ {\cal{L}}_{{\rm{IoU}}} $ (原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $ 训练的模型SiamBAN的测试对比(%)Table 2 Comparison between the performance of SiamBAN trained using
$ {\cal{L}}_{{\rm{IoU}}} $ (original),$ {\cal{L}}_{{\rm{SIoU}}} $ on the test set of LaSOT (%)评价指标 成功率 精确度 标准化精确度 ${\cal{L} }_{{\rm{IoU}}}$ 51.4 52.1 59.8 ${\cal{L} }_{{\rm{SIoU}}}$ 54.3 53.9 63.3 相对增益 5.64 3.45 4.85 表 3 在基准LaSOT上, 分别以
$ {\cal{L}}_{{\rm{IoU}}} $ (原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $ 训练模型SiamCAR的测试对比(%)Table 3 Comparison between the performance of SiamCAR trained using
$ {\cal{L}}_{{\rm{IoU}}} $ (original),$ {\cal{L}}_{{\rm{SIoU}}} $ on the test set of LaSOT (%)评价指标 成功率 精确率 标准化精确率 ${\cal{L} }_{{\rm{IoU}}}$ 51.6 52.4 61.0 ${\cal{L} }_{{\rm{SIoU}}}$ 54.9 54.8 63.1 相对增益 6.39 4.58 3.44 表 4 在基准LaSOT上, 与先进方法的性能评估对比
Table 4 Performance evaluation for state-of-the-artalgorithms on LaSOT
方法 成功率 精确率 标准化精确率 SiamBAN 51.4 52.1 59.8 ATOM 51.5 50.5 57.6 SiamCAR 51.6 52.4 61.0 SiamRPN++ 49.6 49.1 56.9 Ocean-online 56.0 56.6 65.1 SiamFC++ 55.6 55.5 64.8 DiMP 56.8 56.4 64.3 SiamBAN (SIoU) 54.3 53.9 63.3 SiamCAR (SIoU) 54.2 53.7 63.1 SiamFC++ (SIoU) 57.6 58.3 66.9 表 5 在GOT-10k上, 分别以
$ {\cal{L}}_{{\rm{IoU}}} $ (原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $ 训练的模型SiamFC++ 测试对比(%)Table 5 Comparison between the performance of SiamFC++ trained using
$ {\cal{L}}_{{\rm{IoU}}} $ (original),$ {\cal{L}}_{{\rm{SIoU}}} $ on the test set of GOT-10k (%)评价指标 $ {\rm{AO}} $ ${\rm{SR} }_{0.50}$ ${\rm{SR} }_{0.75}$ ${\cal{L} }_{{\rm{IoU}}}$ 59.5 69.5 47.9 ${\cal{L} }_{{\rm{SIoU}}}$ 61.7 74.7 46.8 相对增益 3.69 7.48 −2.29 表 6 在GOT-10k上, 分别以
$ {\cal{L}}_{{\rm{IoU}}} $ (原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $ 训练的模型SiamCAR测试结果(%)Table 6 Comparison between the performance of SiamCAR trained using
$ {\cal{L}}_{{\rm{IoU}}} $ (original),$ {\cal{L}}_{{\rm{SIoU}}} $ on the test set of GOT-10k (%)评价指标 $ {\rm{AO}} $ ${\rm{SR} }_{0.50}$ ${\rm{SR} }_{0.75}$ ${\cal{L} }_{{\rm{IoU}}}$ 58.1 68.3 44.1 ${\cal{L} }_{{\rm{SIoU}}}$ 60.2 72.6 46.4 相对增益 3.61 6.29 5.22 表 7 在基准GOT-10k上, 与先进方法的性能评估对比 (%)
Table 7 Performance evaluation for state-of-the-artalgorithms on GOT-10k (%)
方法 $ {\rm{AO}} $ ${\rm{SR} }_{0.50}$ MDNet 29.9 30.3 SPM 51.3 59.3 ATOM 55.6 63.4 SiamCAR 56.9 67.0 SiamRPN++ 51.7 61.8 Ocean-online 61.1 72.1 D3S 59.7 67.6 SiamFC++ 59.5 69.5 DiMP-50 61.1 71.2 SiamCAR (SIoU) 60.2 72.6 SiamFC++ (SIoU) 61.7 74.7 表 8 在TrackingNet上, 分别以
$ {\cal{L}}_{{\rm{IoU}}} $ (原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $ 训练的模型SiamFC++的测试结果(%)Table 8 Comparison between the performance of SiamFC++ trained using
$ {\cal{L}}_{{\rm{IoU}}} $ (original),$ {\cal{L}}_{{\rm{SIoU}}} $ on the test of TrackingNet (%)评价指标 精确率 标准化精确率 成功率 ${\cal{L} }_{\rm{{IoU}}}$ 70.5 80.0 75.4 ${\cal{L} }_{{\rm{SIoU}}}$ 72.1 81.9 76.2 相对增益 2.27 2.37 1.06 表 9 在基准TrackingNet上, 与先进方法的性能评估对比 (%)
Table 9 Performance evaluation for state-of-the-artalgorithms on TrackingNet (%)
方法 成功率 标准化精确率 MDNet 60.6 70.5 ATOM 70.3 77.1 DaSiamRPN 63.8 73.3 SiamRPN++ 73.3 80.0 UpdateNet 67.7 75.2 SPM 71.2 77.8 SiamFC++ 75.4 80.0 DiMP 74.0 80.1 SiamFC++ (SIoU) 76.2 81.9 表 10 在OTB2015上, 分别以
$ {\cal{L}}_{{\rm{IoU}}} $ (原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $ 训练的模型SiamFC++ 的测试结果 (%)Table 10 Comparison between the performance of SiamFC++ trained using
$ {\cal{L}}_{{\rm{IoU}}} $ (original),$ {\cal{L}}_{{\rm{SIoU}}} $ on the test of OTB2015 (%)评价指标 成功率 标准化精确率 ${\cal{L} }_{ {\rm{IoU} } }$ 68.2 89.5 ${\cal{L} }_{{\rm{SIoU}}}$ 68.7 89.8 相对增益 0.74 0.34 表 11 在OTB2015上, 分别以
$ {\cal{L}}_{{\rm{IoU}}} $ (原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $ 训练的模型SiamBAN测试结果 (%)Table 11 Comparison between the performance of SiamBAN trained using
$ {\cal{L}}_{{\rm{IoU}}} $ (original),$ {\cal{L}}_{{\rm{SIoU}}} $ on on the test of OTB2015 (%)评价指标 成功率 标准化精确率 ${\cal{L} }_{ {\rm{IoU} } }$ 69.6 91.0 ${\cal{L} }_{{\rm{SIoU}}}$ 69.9 91.5 相对增益 0.43 0.55 表 12 在VOT2018上, 分别以
$ {\cal{L}}_{{\rm{IoU}}} $ (原本的)和$ {\cal{L}}_{{\rm{SIoU}}} $ 训练的模型SiamFC++ 测试结果(%)Table 12 Comparison between the performance of SiamFC++ trained using
$ {\cal{L}}_{{\rm{IoU}}} $ (original),$ {\cal{L}}_{{\rm{SIoU}}} $ on on the test of VOT2018 (%)评价指标 ${\rm{准确率} }$ ${\rm{鲁棒性} }$ ${ {\rm{EAO} } }$ ${\cal{L} }_{{\rm{IoU}}}$ 0.586 0.201 0.427 ${\cal{L} }_{{\rm{SIoU}}}$ 0.582 0.196 0.400 表 13 在基准LaSOT 上, 与其他基于IoU损失训练得到的满足不同IoU阈值的测试集图像帧数占比的对比结果 (%)
Table 13 Comparison results with other IoU-based loss for the ratio of frames exceeding different IoU thresholdson the test set of LaSOT (%)
IoU阈值 ≥ 0.95 ≥ 0.90 ≥ 0.85 ≥ 0.80 ≥ 0.75 ≥ 0.70 ≥ 0.65 ≥ 0.60 ≥ 0.55 ≥ 0.50 SiamFC++ (SIoU) 2.75 15.93 31.83 44.05 52.33 57.71 61.71 64.41 66.52 68.14 SiamFC++ (DIoU) 1.60 13.19 29.72 42.84 51.48 57.09 61.28 64.17 66.31 67.95 SiamFC++ (GIoU) 2.45 16.18 31.10 42.26 50.39 55.81 59.56 62.37 64.58 66.34 SiamFC++ 1.52 12.73 29.10 41.90 50.20 55.63 59.72 62.51 64.68 66.31 SiamBAN (SIoU) 1.18 10.79 24.86 36.64 45.50 51.87 56.45 60.03 62.77 64.84 SiamBAN (GIoU) 1.49 11.77 24.71 35.15 44.77 50.79 54.93 57.76 60.70 63.98 SiamBAN 1.98 12.89 25.40 35.57 43.46 49.29 53.38 56.53 58.92 60.78 SiamCAR (SIoU) 1.20 10.80 24.81 36.74 45.75 52.29 56.97 60.71 63.53 65.66 SiamCAR (DIoU) 1.20 10.91 25.10 36.62 45.04 51.47 56.18 59.89 62.70 64.83 SiamCAR 1.27 10.62 23.90 35.98 44.93 50.87 55.08 57.86 59.94 61.61 表 14 在基准GOT-10k上, 与其他基于IoU损失训练得到的满足不同IoU阈值的测试集图像帧数占比的对比结果 (%)
Table 14 Comparison results with other IoU-based loss for the ratio of frames exceeding different IoU thresholdson the test set of GOT-10k (%)
IoU阈值 ≥ 0.95 ≥ 0.90 ≥ 0.85 ≥ 0.80 ≥ 0.75 ≥ 0.70 ≥ 0.65 ≥ 0.60 ≥ 0.55 ≥ 0.50 SiamFC++ (SIoU) 0.94 8.18 22.01 35.76 46.83 55.71 62.16 67.40 71.39 74.68 SiamFC++ (DIoU) 0.72 7.56 21.10 35.11 46.86 55.45 61.68 66.82 70.74 73.86 SiamFC++ (GIoU) 0.97 7.20 21.80 34.19 45.85 54.50 59.24 63.48 66.02 69.49 SiamCAR (SIoU) 0.94 8.58 22.20 35.83 46.46 54.74 60.66 65.49 69.30 72.62 SiamCAR (GIoU) 1.13 6.72 19.23 34.78 45.37 53.73 59.98 64.96 68.95 71.96 SiamCAR (DIoU) 0.92 6.19 18.85 32.54 43.73 52.51 58.86 64.04 68.09 71.33 SiamCAR 0.81 8.02 20.76 33.88 44.07 51.87 57.21 61.35 64.99 68.31 表 15 在GOT-10k上, 对
${\cal{L}}_{{\rm{SIoU}}}$ 的正则项和代理函数的消融实验(%)Table 15 Ablation studies about the regulariztion and surrogate function on GOT-10k (%)
评价指标 $ {\rm{AO}} $ ${\rm{SR} }_{0.50}$ ${\rm{SR} }_{0.75}$ ${\cal{L} }_{ {\rm{SIoU} } }\;({\rm{w/o} } \, {\cal {AR} })$ 59.9 72.1 46.3 ${\cal{L} }_{ {\rm{SIoU} } }\; ({\rm{w/} } \;{ \cal{AR} })$ 61.7 74.7 46.8 相对增益 3.01 3.61 1.08 ${\cal{L} }_{ {\rm{SIoU} } }\;({\rm{w/} } \;{\cal {R} })$ 61.4 74.5 46.7 相对增益 2.51 3.33 0.86 ${\cal{L} }_{ {\rm{SIoU} } } \;({\rm{w/} } \;{ {\cal A} }_2)$ 60.3 72.6 46.5 相对增益 0.67 0.69 0.43 ${\cal{L} }_{ {\rm{SIoU} } }\; ({\rm{w/} } \;{ {\cal A} }_4)$ 60.6 73.4 46.3 相对增益 1.17 1.80 0 ${\cal{L} }_{ {\rm{SIoU} } }\; ({\rm{w/} } \;{ {\cal A} }_8)$ 60.4 73.4 46.0 相对增益 0.83 1.80 −0.65 ${\cal{L} }_{ {\rm{SIoU} } }\; ({\rm{w/} } \;{ {\cal A} }_1)$ 58.9 71.3 43.7 相对增益 −1.17 −1.11 −5.62 -
[1] 孟琭, 杨旭. 目标跟踪算法综述. 自动化学报, 2019, 45(7):1244-1260Meng Lu, Yang Xu. A survey of object tracking algorithms. Acta Automatica Sinica, 2019, 45(7):1244-1260 [2] 蒋弘毅, 王永娟, 康锦煜. 目标检测模型及其优化方法综述. 自动化学报, 2021, 47(6): 1232-1255Jiang Hong-Yi, Wang Yong-Juan, Kang Jin-Yu. A survey of object detection models and its optimization methods. Acta Automatica Sinica, 2021, 47(6):1232-1255 [3] Girshick R B. Fast R-CNN. In: Proceedings of the IEEE International Conference on Computer Vision. Santiago, Chile: IEEE, 2015. 1440−1448 [4] Yu J, Jiang Y, Wang Z, Cao Z, Huang T S. Unitbox: An advanced object detection network. In: Proceedings of the ACM Conference on Multimedia Conference. Amsterdam, Netherland: 2016. 516−520 [5] Rezatofighi H, Tsoi N, Gwak J, Sadeghian A, Reid I D, Savarese S. Generalized intersection over union: A metric and a loss for bounding box regression. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Bea-ch, USA: 2019. 658−666 [6] Zheng Z, Wang P, Li J, Ye R, Ren D. Distance-IOU loss: Faster and better learning for bounding box regression. In: Proceedings of the 34th AAAI Conference on Artificial Intelligence. New York, USA: AAAI Press, 2020. 12993−13000 [7] Zhang Y, Ren W, Zhang Z, Jia Z, Wang L, Tan T. Focal and efficient IOU loss for accurate bounding box regression [Online], available: https://arxiv.org/abs/2101.08158, August 11, 2021 [8] Li B, Yan J, Wu W, Zhu Z, Hu X. High performance visual tracking with siamese region proposal network. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Salt Lake City, USA: 2018. 8971−8980 [9] Li B, Wu W, Wang Q, Wu W, Yan J, Hu W. SiamRPN++: Evolution of siamese visual tracking with very deep networks. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 4282−4291 [10] Zhu Z, Wang Q, Li B, Wu W, Yan J, Hu W. Distractor-aware siamese networks for visual object tracking. In: Proceedings of the 15th European Conference on Computer Vision. Munich, Germany: 2018. 103−119 [11] He Y, Zhu C, Wang J, Savvides M, Zhang X. Bounding box regression with uncertainty for accurate object detection. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 2888−2897 [12] Law H, Deng J. Cornernet: Detecting objects as paired keypoints. In: Proceedings of the 15th European Conference on Computer Vision. Munich, Germany: 2018. 765−781 [13] Gidaris S, Komodakis N. Locnet: Improving localization accuracy for object detection. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA: 2016. 789−798 [14] Zhou X, Koltun V, Krähenbühl P. Tracking objects as points. In: Proceedings of the 16th European Conference on Computer Vision. Glasgow, UK: 2020. 474−490 [15] Lin T.-Y, Goyal P, Girshick R, et al. Focal loss for dense object detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, 42(2):318-327 doi: 10.1109/TPAMI.2018.2858826 [16] Held D, Thrun S, Savarese S. Learning to track at 100 FPS with deep regression networks. In: Proceedings of the 14th European Conference on Computer Vision. Amsterdam, Netherlands: 2016. 749−765 [17] Bertinetto L, Valmadre J, Henriques J F, Vedaldi A, Torr H S P. Fully-convolutional siamese networks for object tracking. In: Proceedings of the European Conference on Computer Vision Workshops. Amsterdam, Netherlands: 2016. 850−865 [18] Jiang B, Luo R, Mao J, Xiao T, Jiang Y. Acquisition of localization confidence for accurate object detection. In: Proceedings of the 15th European Conference on Computer Vision. Munich, Germany: 2018. 816−832 [19] Wang G, Luo C, Xiong Z, Zeng W. SPM-tracker: Series-parallel matching for real-time visual object tracking. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 3643−3652 [20] Xu Y, Wang Z, Li Z, Ye Y, Yu G. SiamFC++: Towards robust and accurate visual tracking with target estimation guidelines. In: Proceedings of the 34th AAAI Conference on Artificial Intelligence. New York, USA: AAAI Press, 2020. 12549−12556 [21] Chen Z, Zhong B, Li G, Zhang S, Ji R. Siamese box adaptive network for visual tracking. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Sea-ttle, USA: IEEE, 2020. 6667−6676 [22] Guo D, Wang J, Cui Y, Wang Z, Chen S. SiamCAR: Siamese fully convolutional classification and regression for visual tracking. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle, USA: IEEE, 2020. 6268−6276 [23] Zhang Z, Peng H, Fu J, Li B, Hu W. Ocean: Object-aware anchor-free tracking. In: Proceedings of the 16th European Conference on Computer Vision. Glasgow, UK: 2020. 771−787 [24] 谭建豪, 郑英帅, 王耀南, 马小萍. 基于中心点搜索的无锚框全卷积孪生跟踪器. 自动化学报, 2021, 47(4): 801-812Tan Jian-Hao, Zheng Ying-Shuai, Wang Yao-Nan, et al. AFST: Anchor-free fully convolutional siamese tracker with searching center point. Acta Automatica Sinica, 2021, 47(4):801-812 [25] Szegedy C, Liu W, Jia Y Q, Sermanet P, Reed S, Anguelov D, et al. Going deeper with convolutions. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Boston, USA: 2015. 1−9 [26] He K, Zhang X, Ren S, Sun J. Deep residual learning for image recognition. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA: 2016. 770−778 [27] Russakovsky O, Deng J, Su H, et al. Imagenet large scale visual recognition challenge. International Journal of Computer Vision, 2015, 115(3):211-252 doi: 10.1007/s11263-015-0816-y [28] Lin T Y, Maire M, Belongie S, Hays J, Perona P, Ramanan D, et al. Microsoft COCO: Common objects in context. In: Proceedings of the 13th European Conference on Computer Vision. Zurich, Switzerland: 2014. 740−755 [29] Real E, Shlens J, Mazzocchi S, Pan X, Vanhoucke V. Youtube-boundingboxes: A large high-precision human-annotated data set for object detection in video. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, USA: 2017. 7464−7473 [30] Fan H, Lin L, Yang F, Chu P, Deng G, Yu S, et al. Lasot: A high-quality benchmark for large-scale single object tracking. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 5374−5383 [31] Müller M, Bibi A, Giancola S, Al-Subaihi S, Ghanem B. Trackingnet: A large-scale dataset and benchmark for object tracking in the wild. In: Proceedings of the 15th European Conference on Computer Vision. Munich, Germany: 2018. 310−327 [32] Huang L, Zhao X, Huang K. Got-10k: A large high-diversity benchmark for generic object tracking in the wild. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2021, 43(5):1562-1577 doi: 10.1109/TPAMI.2019.2957464 [33] Wu Y, Lim J, Yang M. Object tracking benchmark. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(9):1834-1848 doi: 10.1109/TPAMI.2014.2388226 [34] Kristan M, He Z. The sixth visual object tracking VOT2018 challenge results. In: Proceedings of the European Conference on Computer Vision Workshops. Munich, Germany: 2018. 3−53 [35] Wang Q, Zhang L, Bertinetto L, Hu W, Torr P H S. Fast online object tracking and segmentation: A unifying approach. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 1328−1338 [36] Huang L, Zhao X, Huang K. Globaltrack: A simple and strong baseline for long-term tracking. In: Proceedings of the 34th AAAI Conference on Artificial Intelligence. New York, USA: AAAI Press, 2020. 11037−11044 [37] Fan H, Ling H. Siamese cascaded region proposal networks for real-time visual tracking. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 7952−7961 [38] Danelljan M, Bhat G, Khan F S, Felsberg M. ATOM: Accurate tracking by overlap maximization. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: 2019. 4660−4669 [39] Bhat G, Danelljan M, Gool L V, Timofte R. Learning discriminative model prediction for tracking. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. Seo-ul, South Korea: IEEE, 2019. 6181−6190 [40] Nam H, Han B. Learning multi-domain convolutional neural networks for visual tracking. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA: IEEE, 2016. 4293−4302 [41] Lukezic A, Matas J, Kristan M. D3S: A discriminative single shot segmentation tracker. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Sea-ttle, USA: IEEE, 2020. 7131−7140 [42] Zhang L, Gonzalez-Garcia A, Weijervan De J, Danelljan M, Khan F S. Learning the model update for siamese trackers. In: Proceedings of the IEEE/CVF International Conference on Com-puter Vision. Seoul, South Korea: IEEE, 2019. 4009−4018 期刊类型引用(14)
1. 刘祥,李辉,程远志,孔祥振,陈双敏. 图像与点云多重信息感知关联的三维多目标跟踪. 中国图象图形学报. 2024(01): 163-178 . 百度学术
2. 刘龙哲,刘刚,徐红鹏,权冰洁,田慧. 面向单阶段目标检测的损失函数优化设计. 电光与控制. 2024(03): 86-93 . 百度学术
3. 乔珠峰,赵秋菊,郭建鑫,陈会娜,平阳,赵继春. 基于改进YOLOv5的草莓病害智能识别终端设计. 中国农机化学报. 2024(03): 205-211 . 百度学术
4. 张佳钰,蔡泽烽,冯杰. 基于改进的CenterNet变电站设备红外温度检测方法. 计算机测量与控制. 2024(07): 50-56 . 百度学术
5. 刘晶,祁文哲,吕德芳,李杉杉. 改进YOLOv5的轨面伤损检测方法. 智能计算机与应用. 2024(06): 71-78 . 百度学术
6. 李银银,刘磊,孙大杰,赵静. 基于改进的卷积神经网络水果分类算法设计. 哈尔滨商业大学学报(自然科学版). 2024(04): 413-422 . 百度学术
7. 路晓亚,李海芳. 低可见度环境下基于改进YOLOv3的井下人员定位方法. 工矿自动化. 2024(09): 130-137 . 百度学术
8. 纪桐,王子涵. 基于YOLOv7的石墨化配电室员工违规行为检测. 智能计算机与应用. 2024(12): 118-123 . 百度学术
9. 张银胜,杨宇龙,吉茹,蓝天鹤,单慧琳. 改进YOLOv5s的风力涡轮机表面缺陷检测. 电子测量与仪器学报. 2023(01): 40-49 . 百度学术
10. 王彦生,曹雪虹,焦良葆,孙宏伟,高阳. 基于改进YOLOv5的电厂人员吸烟检测. 计算机测量与控制. 2023(05): 48-55 . 百度学术
11. 钟源建,刘添荣,李卓亮. 基于改进AI-YOLO v4算法的施工现场安全预警技术研究. 粘接. 2023(10): 185-188 . 百度学术
12. 李甜,林贵敏,施文灶,庄镇榕,杨玮琪,孙雯婷,温鹏宇,王磊. 改进YOLOv5s无人机航拍图像目标检测. 闽江学院学报. 2023(05): 51-62 . 百度学术
13. 孙梦宇,王鹏,徐均琪,李晓艳,郜辉,邸若海. 自适应信息选择的变尺度相关滤波红外目标跟踪算法. 光子学报. 2023(12): 226-238 . 百度学术
14. 范海红. 基于RepGT损失的改进Faster R-CNN的包裹检测算法. 物流技术. 2022(05): 78-81 . 百度学术
其他类型引用(15)
-
AAS-CN-2021-0525数据.zip
-