2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

多率量测下随机跳变系统迁移交互多模型估计

高爽 栾小丽 赵顺毅 刘飞

高爽, 栾小丽, 赵顺毅, 刘飞. 多率量测下随机跳变系统迁移交互多模型估计. 自动化学报, 2023, 49(1): 210−218 doi: 10.16383/j.aas.c220011
引用本文: 高爽, 栾小丽, 赵顺毅, 刘飞. 多率量测下随机跳变系统迁移交互多模型估计. 自动化学报, 2023, 49(1): 210−218 doi: 10.16383/j.aas.c220011
Gao Shuang, Luan Xiao-Li, Zhao Shun-Yi, Liu Fei. Transfer interacting multiple model state estimator for Markovian jump linear systems with multi-rate measurements. Acta Automatica Sinica, 2023, 49(1): 210−218 doi: 10.16383/j.aas.c220011
Citation: Gao Shuang, Luan Xiao-Li, Zhao Shun-Yi, Liu Fei. Transfer interacting multiple model state estimator for Markovian jump linear systems with multi-rate measurements. Acta Automatica Sinica, 2023, 49(1): 210−218 doi: 10.16383/j.aas.c220011

多率量测下随机跳变系统迁移交互多模型估计

doi: 10.16383/j.aas.c220011
基金项目: 国家自然科学基金(61991402, 61833007, 61991400), 江苏省研究生科研与实践创新计划(KYCX21-2007) 资助
详细信息
    作者简介:

    高爽:江南大学博士研究生. 2018年获得江南大学学士学位. 主要研究方向为状态估计, 贝叶斯估计理论. E-mail: gaoshuang@stu.jiangnan.edu.cn

    栾小丽:江南大学教授. 2010年获得江南大学博士学位. 主要研究方向为复杂工业过程建模、控制与优化. 本文通信作者. E-mail: xlluan@jiangnan.edu.cn

    赵顺毅:江南大学研究员. 2015年获得江南大学博士学位. 主要研究方向为随机信号处理, 贝叶斯估计理论和故障检测与诊断. E-mail: shunyi.s.y@gmail.com

    刘飞:江南大学教授. 2002年获得浙江大学博士学位. 主要研究方向为过程控制, 过程系统工程. E-mail: fliu@jiangnan.edu.cn

Transfer Interacting Multiple Model State Estimator for Markovian Jump Linear Systems With Multi-rate Measurements

Funds: Supported by National Natural Science Foundation of China (61991402, 61833007, 61991400) and the Postgraduate Research Practice Innovation Program of Jiangsu Province (KYCX21-2007)
More Information
    Author Bio:

    GAO Shuang Ph.D. candidate at Jiangnan University. She received her bachelor degree from Jiangnan University in 2018. Her research interest covers state estimation and Bayesian estimation theory

    LUAN Xiao-Li Professor at Jiangnan University. She received her Ph.D. degree from Jiangnan University in 2010. Her main research interest is modeling, control and optimization of complex industrial process. Corresponding author of this paper

    ZHAO Shun-Yi Researcher at Jiangnan University. He received his Ph.D. degree from Jiangnan University in 2015. His research interest covers statistical signal processing, Bayesian estimation theory, and fault detection and diagnosis

    LIU Fei Professor at Jiangnan University. He received his Ph.D. degree from Zhejiang University in 2002. His research interest covers process control and process system engineering

  • 摘要: 实际工业过程中, 量测数据除了在线仪表采集的快速率数据, 还有离线化验等慢速率辅助量测数据. 为了更好地利用离线化验数据, 增加在线估计的精度, 针对随机跳变系统, 引入迁移学习思想, 提出迁移交互多模型估计 (Transfer interacting multiple model state estimator, IMM-TF) 新策略. 首先, 将离线化验数据的边缘分布作为可以迁移的知识, 迁移到贝叶斯后验分布, 实现辅助量测数据的充分利用. 其次, 利用KL (Kullback-Leibler) 散度度量知识迁移前后任务间的差异性, 求解最优的贝叶斯迁移估计器. 同时, 结合慢速率量测, 利用平滑策略获取待迁移的估计值, 解决多率量测下的迁移估计难题. 然后, 利用影响力函数构建辅助量测数据与估计性能之间的解析关系, 从而对迁移效果进行定量评价. 最后, 通过在目标跟踪实例中的应用, 表明所提方法的有效性及优越性.
  • 由于测量手段的不同, 导致量测数据具有不同的特征, 如常规传感器量测数据与在线分析仪数据相比, 虽然采样速率高, 但数据精度较低[1-3]; 对于飞航导弹而言, 高采样速率的惯导数据短期动态品质好, 而双星定位系统在较长的时间内, 可以提供精度较高的位置信息[4]. 因此, 为了获得更精确的状态估计值, 在立足常规量测值时, 如何更好地利用辅助量测数据引起了国内外学者的广泛关注. 其中, 融合策略是一种常见的方法, 如航迹融合方法[5](Track to track fusion, TTF) 利用相关性对不同滤波器的估计值进行融合, 并广泛应用于信息融合领域. 后来, 各种延伸的融合估计方法被陆续提出[6]. 然而, 上述融合策略局限于各类传感器采样周期一致的情况, 当采样速率不同时, 估计策略往往在常规量测的基础上, 利用额外的量测数据对其进行修正. 换言之, 额外量测值仅仅是锦上添花. 鉴于此, 学者们提出了不同额外信息利用策略来提升状态估计效果[7-9]. 如文献[10]提出当慢速率数据可获得时, 利用数据融合的方法将不同量测数据下获得的估计值进行融合. 进一步, 最优融合策略[11]也被用来处理不同量测数据下卡尔曼滤波器获得的估计值, 针对最优求解困难的问题, 文献[12-13]从智能学习的角度提出了新的优化策略. 在此基础上, 文献[14]考虑到噪声参数的不确定性, 利用修正后的卡尔曼滤波器估计值进行融合, 并分析了其收敛性. 另一方面, 考虑到多率量测信息之间噪声的相关性, 文献[15]采用矩阵加权的方法, 提出了最小方差意义下的分布式融合估计策略. 进一步, 文献[16]将噪声信息从高斯分布推广到$ \mathrm{t} $分布以增强估计性能的鲁棒性.

    除了上述针对单一模态系统在多率量测下的状态估计, 近年来, 随机多模态系统在多率量测下的状态估计也取得了很大进展. 文献[17]将TTF融合方法从单一模态系统拓展到跳变系统, 然而, 其融合权重依赖于协方差矩阵. 后来, 文献[18-19]利用一致性理论, 在多模型框架下提出了分布式融合策略. 文献[20]则提出了一种基于融合预测的交互多模型算法, 通过修改交互多模型算法 (The interacting multiple model, IMM)融合预测来最小化噪声和低数据率的影响. 文献[21]在高斯混合概率假设的滤波框架下, 提出了多级协同的融合方法. 针对多个局部无序量测数据, 基于最优线性无偏估计, 文献[22]提出了一种具有多个任意阶跃滞后的最优集中估计算法. 文献[23]提出了一种连续多速率采样数据融合方法设计网络滤波器, 解决多传感器异步采样难题. 另一方面, 基于$ H_{\infty} $策略的鲁棒交互式多模型算法也陆续被提出[24-26], 这些文献采用最优信息融合准则实现不同量测信息下的融合. 另外一种可行的思路是借鉴变结构多模型估计思想[27-28], 将慢速率量测的估计值作为一种新的模态嵌入到多模型框架中. 虽然上述融合策略可以借助于额外信息, 从不同角度为多率量测下的状态估计提供了可能, 但其本质是对估计结果的折衷与加权, 即额外信息的利用并没有改变状态估计器的本质结构, 更无法量化慢速率辅助量测信息对估计精度的影响.

    因此, 本文针对具有多率量测信息的随机跳变系统, 从迁移学习的角度设计一种新的交互多模型估计器. 该方法利用源域滤波器处理缓慢、不规则采样且不易获得的高精度辅助量测数据, 而通过目标域滤波器处理快速、规则采样和无延迟的常规量测数据. 同时, 利用平滑策略实现源域慢速率辅助量测信息到目标域快速率数据的知识迁移. 然后, 通过定义利用常规量测数据获得的待估计状态的后验概率与引入高精度辅助量测数据获得的待估计状态的后验概率之间差异性度量方法, 求解最优的贝叶斯迁移估计器, 实现辅助信息的充分利用, 提高了估计精度. 本文的创新点和贡献主要体现在以下4个方面: 1) 不同于融合策略, 在迁移估计器的结构中, 嵌入了迁移平滑步, 实现辅助量测信息有效利用的同时, 解决多率量测下的贝叶斯估计难题; 2) 利用平滑策略不仅架起了源域滤波器与目标域滤波器之间知识传递的桥梁, 也将贝叶斯迁移学习拓展到多率量测下的状态估计领域; 3) 设计的迁移滤波器能同时学习源域和目标域中包含的知识, 可以提高估计精度; 4) 构建了辅助量测数据与估计性能之间的解析关系, 可以定量评价源域数据的引入对估计性能的影响.

    考虑如下马尔科夫跳变系统, 并假设系统可以获得多种量测数据, 以图1中的两种为例.

    图 1  多率量测过程 (实线表示真实状态, 虚线表示目标域量测 (在线快速率数据), 点表示源域量测 (离线化验数据), 其采样时间可能不规律)
    Fig. 1  Multiple source measurements of the process with different sampling rates (Solid lines are true states, and dashed lines represent target measurements. Dots denote source measurements, whose sample time may be irregular)
    $$ {\boldsymbol{x}}_{k} = {\boldsymbol{F}} (r_k){\boldsymbol{x}} _{k-1}+{\boldsymbol{G}} (r_k){\boldsymbol{w}}_{k}\, $$ (1)
    $$ {\boldsymbol{y}} _{k} = {\boldsymbol{H}} (r_k){\boldsymbol{x}} _{k}+{\boldsymbol{v}}_{k}\, $$ (2)
    $$ {\boldsymbol{y}} _{S,k} = \gamma_{k}\big({\boldsymbol{H}} (r_{k}){\boldsymbol{x}} _{k}+{\boldsymbol{v}}_{S,k}\big)\, $$ (3)

    其中, $ k \in {\bf{N}} $表示时间步, $ {\bf{N}} $表示自然数的集合; $ {\bf{R}}^{n} $代表$ n $维欧氏空间; $ {\boldsymbol{x}} _k\in{\bf{R}}^{d_x} $为需要估计的状态; $ {\boldsymbol{y}} _k\in{\bf{R}}^{d_y} $为快速率量测数据; $ \gamma_{k} $表示服从伯努利分布的随机序列, 取值为$ 1 $$ 0 $, 当$ \gamma_{k} = 0 $时, 定义$ {\boldsymbol{y}} _{S,k}\in \emptyset $, 来刻画不规则采样的慢速率量测$ {\boldsymbol{y}} _{S,k}\in{\bf{R}}^{d_y} $; $ r_k $表示在有限集$ {O} = \{1,\; 2,\; \cdots, \; M\} $中取值的离散齐次马尔科夫链, 对于任意$ i, j \in {O} $, 转移概率定义为$ \pi_{ij} = p(r_k = j| r_{k-1} = i) $; $ {\boldsymbol{F}} (r_k) $, $ {\boldsymbol{G}} (r_k) $$ {\boldsymbol{H}} (r_k) $表示与$ r_k $相关的系统矩阵; 噪声项${\boldsymbol{w}}_k \sim \mathrm{N}({\boldsymbol{w}}_k; {\bf{0}}, {\boldsymbol{Q}}_k)$, $ {\boldsymbol{v}}_k\sim \mathrm{N}({\boldsymbol{v}}_k; {\bf{0}}, {\boldsymbol{R}}_k) $$ {\boldsymbol{v}}_{S,k}\sim \mathrm{N}({\boldsymbol{v}}_{S,k}; {\bf{0}}, {\boldsymbol{R}}_{S,k}) $为独立同分布的高斯白噪声, 假设$ {\boldsymbol{x}} _0 \sim \mathrm{N}({\boldsymbol{x}} ;{\hat{\boldsymbol{x}}}_0, {\boldsymbol{P}}_0) $已知, $ {\boldsymbol{x}} _k $, $ {\boldsymbol{w}}_k $, $ {\boldsymbol{v}}_k $$ {\boldsymbol{v}}_{S,k} $相互独立, 为了符号简化, 用$ r^{j}_{k} $表示$ r_k = j $, 定义$ {\boldsymbol{F}} _j = {\boldsymbol{F}} (r^{j}_{k}) $, $ {\boldsymbol{G}} _j = {\boldsymbol{G}} (r^{j}_{k}) $, 以及$ {\boldsymbol{H}} _j = {\boldsymbol{H}} (r^{j}_{k}) $.

    本文的任务是在快速率、规则但不精确的量测情况下, 辅以慢速率、不规则但更精确的源域数据, 设计迁移贝叶斯估计器, 对系统 (1) ~ (3) 的状态进行估计. 假设源域滤波器处理慢速率辅助量测数据, 目标域滤波器处理常规快速率量测数据, 由于源域数据$ {\boldsymbol{y}} _{S,k} $比目标域量测数据$ {\boldsymbol{y}} _{k} $更加精确, 故源域噪声方差$ {\boldsymbol{R}}_{S,k} $比目标域噪声方差$ {\boldsymbol{R}}_k $小. 同时, 通过迁移估计, 将源域滤波器提取的知识迁移到目标贝叶斯滤波器, 实现估计精度的提升.

    在贝叶斯估计中, 后验概率密度函数 (Probability density function, PDF) 提供了状态变量的完整描述[29], 因此根据系统的量测数据${\boldsymbol{Y}} _{k} = \{{\boldsymbol{y}} _0,\cdots, {\boldsymbol{y}} _k\}$, 贝叶斯估计的任务是计算后验概率函数$p({\boldsymbol{x}} _k, r_k|{\boldsymbol{Y}} _{k})$. 基于此, 本文利用概率分布$ {F}_S $刻画从源域滤波器迁移的知识, 因此, 任务转变成求解给定源域知识下的后验分布, 即

    $$ p_S({\boldsymbol{x}} _k,r_k|{F}_S,{\boldsymbol{Y}} _{k})\, $$

    其中, 符号$ p(\cdot) $$ p_S(\cdot) $分别表示没有源域知识迁移的模型和源域知识迁移后的模型. 由于$ r_k $在有限集$ {O} $上服从类别分布, 根据条件概率公式, 求解给定源域知识下的后验分布$ p_S({\boldsymbol{x}} _k,r_k|{F}_S,{\boldsymbol{Y}} _{k}) $可以通过分别计算条件后验分布$ p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k}) $和后验模态概率$ p_S(r_k^j|{\boldsymbol{Y}} _{k}) $求得.

    根据贝叶斯公式, 条件后验分布计算如下

    $$ \begin{split} p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _k) \propto\;& p_S({\boldsymbol{y}} _k|{\boldsymbol{x}} _k,r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1})\;\times\\ & p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1})\, \end{split} $$ (4)

    其中, $ \propto $表示正比符号, 本文假设迁移知识的形式为源域滤波器中量测边缘分布, 即约束似然函数为

    $$ p_S({\boldsymbol{y}} _k|{\boldsymbol{x}} _k,r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1}) = p_S({\boldsymbol{y}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k-1})\, $$

    因此, 知识迁移后的后验分布为

    $$ \begin{split} p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _k) \propto\;& p_S({\boldsymbol{y}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k-1})\;\times\\ &p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1})\, \end{split} $$ (5)

    固定式 (5) 中的似然函数$ p_S({\boldsymbol{y}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k-1}) $, $ p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1}) $作为唯一需要优化的分布, 定义模型的约束集为

    $$ \begin{split} p_S\in {{S}} =\;& \{ \mathrm{model} \, (5) \,\mathrm{with}\, p_S({\boldsymbol{y}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k-1}) \,\mathrm{fixed} \, \\ &\;\mathrm{and}\,\, p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1})\, \mathrm{variational} \}\;\;\;\; \end{split} $$ (6)

    假设理想模型$ p(\cdot) $为没有源域知识迁移下的贝叶斯后验分布$ p({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _k) $, 即

    $$ p({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _k)\propto p({\boldsymbol{y}} _k|{\boldsymbol{x}} _k,r_k^j)p({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _{k-1})\, $$ (7)

    利用KL (Kullback-Leibler) 散度量化引入源域数据的修正分布与贝叶斯后验分布之间的距离[30-31], 即在知识约束的集合内对滤波分布进行优化求解

    $$ {\cal{D}}_\mathrm{KL}( {p_S}(\cdot)\| p(\cdot)) = \iint{{p_S}(\cdot)\ln\frac{ {p_S}(\cdot)}{p(\cdot)}\mathrm{d}{\boldsymbol{x}} _k\mathrm{d}{\boldsymbol{y}} _k}\, $$ (8)

    其中, 最优解$ p_S^0 \in {{S}} $则是在最小KL散度意义上接近$ p(\cdot) $的分布. 根据附录A, 式 (8) 的解如下

    $$ \begin{split} &p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1})\propto p({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _{k-1})\;\times \\ &\qquad\exp \Big( {\rm{E}}_{ p_S({\boldsymbol{y}} _k|r_k^j,{\boldsymbol{Y}} _{S,k-1})} (\ln p({\boldsymbol{y}} _k|{\boldsymbol{x}} _k,r_k^j) )\Big) \end{split} $$ (9)

    式 (9) 展示了预测分布$ p({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _{k-1}) $在知识迁移后修正成$ p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1}) $.

    从式 (9) 的迁移修正步可以看出, 贝叶斯迁移中知识迁移的形式为迁移源域滤波器中量测边缘分布而非源域量测数据, 可用下式计算

    $$ \begin{split} p_S({\boldsymbol{y}} _k|r_k^j,{\boldsymbol{Y}} _{S,k-1}) =\;& \int p_S({\boldsymbol{y}} _k|r_k^j,{\boldsymbol{x}} _k)\;\times \\ & p_S({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _{S,k-1})\mathrm{d}{{\boldsymbol{x}} _k} \, \end{split} $$ (10)

    式 (10) 中的$ p_S({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _{S,k-1}) $进一步推导为

    $$ \begin{split} p_S({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _{S,k-1}) =\;&\int p_S({\boldsymbol{x}} _{k-1}|r_k^j,{\boldsymbol{Y}} _{S,k-1})\;\times\\ &p_S({\boldsymbol{x}} _k|{\boldsymbol{x}} _{k-1},r_k^j)\mathrm{d}{{\boldsymbol{x}} _{k-1}} \\[-10pt] \end{split} $$ (11)

    由于慢速率源域量测数据稀疏, 式 (11) 中上一时刻的源域滤波器后验分布$ p_S({\boldsymbol{x}} _{k-1}|r_k^j,{\boldsymbol{Y}} _{S,k-1}) $难以获得. 且直接利用上一时刻目标域的估计值代替并不能获得满意的结果. 因此, 如何近似求解源域一步滞后估计值是实现迁移的关键. 本文利用平滑策略结合源域当前时刻可获得估计值与目标域上一时刻的估计值, 即用平滑分布$ p_S({\boldsymbol{x}} _{k-1}|r_k^j,{\boldsymbol{Y}} _{S,k}) $近似代替源域滤波器后验分布$ p_S({\boldsymbol{x}} _{k-1}|r_k^j,{\boldsymbol{Y}} _{S,k-1}) $, 进一步推导可得

    $$ \begin{split}& p_S({\boldsymbol{x}} _{k-1}|r_k^j,{\boldsymbol{Y}} _{S,k}) = \\ &\qquad\int{\frac{p_S({\boldsymbol{x}} _k|{\boldsymbol{x}} _{k-1},r_k^j)p_S({\boldsymbol{x}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k})}{p_S({\boldsymbol{x}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k-1})}}\;\times\\ &\qquad p_S({\boldsymbol{x}} _{k-1}|r_k^j,{\boldsymbol{Y}} _{S,k-1})\mathrm{d}{{\boldsymbol{x}} _{k}} \end{split} \, $$ (12)

    定义$ k $时刻源域滤波器后验分布为$p_S({\boldsymbol{x}} _{k}|r_k^j, {\boldsymbol{Y}} _{S,k}) = \mathrm{N}({\boldsymbol{x}} _{k};{{\boldsymbol{m}}}_{k}^{j},{\boldsymbol{D}}_{k}^{j})$, 根据附录B, 源域滤波器中的平滑分布$p_S({\boldsymbol{x}} _{k-1}|r_k^j,{\boldsymbol{Y}} _{S,k}) = \mathrm{N}({\boldsymbol{x}} _{k-1};{{\acute{\boldsymbol{m}}}}_{k-1}^{j}, {\acute{\boldsymbol{D}}}_{k-1}^{j})$, 求解如下

    $$ {{\acute{\boldsymbol{m}}}}_{k-1}^{j} = {{\hat{\boldsymbol{x}} }}_{k-1}+{{\boldsymbol{L}}_j}({\boldsymbol{m}}_{k}^{j}-{\boldsymbol{F}} _j{\hat{\boldsymbol{x}} }_{k-1}) \, $$ (13)
    $$ {\acute{\boldsymbol{D}}}_{k-1}^{j} = {\boldsymbol{L}}_j({\boldsymbol{D}}_{k}^{j}-{\boldsymbol{F}} _j{\boldsymbol{P}}_{k-1}{\boldsymbol{F}} _j^\mathrm{T}-{\boldsymbol{Q}}_{k} ){\boldsymbol{L}}_j^\mathrm{T}+{\boldsymbol{P}}_{k-1} $$ (14)

    其中, 平滑增益$ {{\boldsymbol{L}}}_j = {\boldsymbol{P}}_{k-1}{\boldsymbol{F}} _j^\mathrm{T}({\boldsymbol{F}} _j {\boldsymbol{P}}_{k-1}{\boldsymbol{F}} _j^\mathrm{T}+{\boldsymbol{Q}}_{k})^{-1} $, $ {\hat{\boldsymbol{x}} }_{k-1} $表示上一时刻目标域滤波器的估计均值. 可以看出$ {{\acute{\boldsymbol{m}}}}_{k-1}^j $同时结合了源域与目标域的知识. 基于此, 待迁移的源域滤波器中量测边缘分布表示为

    $$ p_S({\boldsymbol{y}} _k|r_k^j,{\boldsymbol{Y}} _{S,k-1}) = \mathrm{N}({\boldsymbol{y}} _{k};{{\boldsymbol{u}}}_{S,k}^j,{\boldsymbol{U}}_{S,k}^j)\, $$ (15)

    其中, $ {\boldsymbol{u}}_{S,k}^j = {\boldsymbol{H}} _j{\boldsymbol{F}} _j{{\acute{\boldsymbol{m}}}}_{k-1}^{j} $表示在多率量测下, 从源域滤波器迁移到目标域滤波器的知识.

    注1. 不同于传统处理当前与未来量测值的平滑策略, 本文所提平滑策略结合源域与目标域滤波器的估计值, 获取待迁移的估计值.

    基于上述分析, 面对多率量测信息时, 针对马尔科夫跳变系统, 可设计如图2所示的迁移估计器结构, 混合交互步与IMM形式一致, 即

    图 2  迁移交互多模型估计器结构图
    Fig. 2  Basic operation diagram of the transfer interacting multiple model state estimator
    $$ {\hat{\boldsymbol{x}} }_{k-1}^{0j} = \sum\limits_{i = 1}^{M}\frac{\pi_{ij}\mu_{k-1}^i}{\mu_j^-}{\hat{\boldsymbol{x}} }_{k-1}^{i} \, $$ (16)
    $$ \begin{split} {\boldsymbol{P}}_{k-1}^{0j} =\;& \sum\limits_{i = 1}^{M}\frac{\pi_{ij}\mu_{k-1}^i}{\mu_j^-}\big( {\boldsymbol{P}}_{k-1}^{i}+({\hat{\boldsymbol{x}} }_{k-1}^{i}-{\hat{\boldsymbol{x}} }_{k-1}^{0j})\;\times\\ &({\hat{\boldsymbol{x}} }_{k-1}^{i}-{\hat{\boldsymbol{x}} }_{k-1}^{0j})^\mathrm{T}\big) \, \end{split} $$ (17)

    其中, $ \pi_{ij} $代表从$ k-1 $时刻模态$ i $$ k $时刻模态$ j $的转移概率, $ \mu_j^- = \sum_{i = 1}^{M}\pi_{ij}\mu_{k-1}^i $代表第$ j $个模态的预测概率. 根据预测步推导, $ p({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _{k-1}) $可由下式直接获得

    $$ {\hat{\boldsymbol{x}} }_k^{j-} = {\boldsymbol{F}} _j{\hat{\boldsymbol{x}} }_{k-1}^{0j} \, $$ (18)
    $$ {\boldsymbol{P}}_k^{j-} = {\boldsymbol{F}} _j{\boldsymbol{P}}_{k-1}^{0j}{\boldsymbol{F}} _j^\mathrm{T}+{\boldsymbol{G}} _j{\boldsymbol{Q}}_{k}{\boldsymbol{G}} _j^\mathrm{T} $$ (19)

    为了便于表达, 知识迁移的形式定义为$p_S({\boldsymbol{y}} _k|r_k^j,{\boldsymbol{Y}} _{S,k-1}) = \mathrm{N}({\boldsymbol{y}} _{k};{{\boldsymbol{u}}}_{S,k}^j,{\boldsymbol{U}}_{S,k}^j)$, 根据附录C提供的推导, 可计算迁移分布如下:

    1) 根据式 (C1) ~ 式(C3), $ {\boldsymbol{x}} _k $的修正分布为$ \mathrm{N}({\boldsymbol{x}} _k;{\bar{\boldsymbol{x}} }_k^j,{\bar{\boldsymbol{P}}}_{k}^{j}) $

    $$ {\bar{\boldsymbol{x}} }_k^j = {\hat{\boldsymbol{x}} }_k^{j-}+\bar{{\boldsymbol{K}}}_j({\boldsymbol{u}}_{S,k}^j-{\boldsymbol{H}} _j{\hat{\boldsymbol{x}} }_k^{j-}) \, $$ (20)
    $$ {\bar{\boldsymbol{P}}}_k^j = {\boldsymbol{P}}_k^{j-}-\bar{{\boldsymbol{K}}}_j{\boldsymbol{H}} _j{\boldsymbol{P}}_k^{j-} \, $$ (21)

    其中, 式 (20) 和式 (21) 中滤波器增益计算为$\bar{{\boldsymbol{K}}}_j = {\boldsymbol{P}}_k^{j-}{{\boldsymbol{H}} _j}^\mathrm{T}({\boldsymbol{H}} _j {\boldsymbol{P}}_k^{j-}{{\boldsymbol{H}} _j}^\mathrm{T}+{\boldsymbol{R}}_k)^{-1}$.

    2) 根据式 (C4)、式(C5), $ {\boldsymbol{x}} _k $的后验分布为$ \mathrm{N}({\boldsymbol{x}} _k;{\hat{\boldsymbol{x}} }_k^j,{{\boldsymbol{P}}}_{k}^{j}) $

    $$ {\hat{\boldsymbol{x}} }_k^j = {\bar{\boldsymbol{x}} }_k^{j}+{{\boldsymbol{K}}}_j({\boldsymbol{y}} _{k}-{\boldsymbol{H}} _j{\bar{\boldsymbol{x}} }_k^{j}) \, $$ (22)
    $$ {{\boldsymbol{P}}}_k^j = {\bar{\boldsymbol{P}}}_k^{j}-{{\boldsymbol{K}}}_j{\boldsymbol{H}} _j{\bar{\boldsymbol{P}}}_k^{j} \, $$ (23)

    其中, 式 (22) 和式 (23) 中滤波器增益计算为$ {{\boldsymbol{K}}}_j = {\bar{\boldsymbol{P}}}_k{{\boldsymbol{H}} _j}^\mathrm{T}({\boldsymbol{H}} _j {\bar{\boldsymbol{P}}}_k{{\boldsymbol{H}} _j}^\mathrm{T}+{\boldsymbol{R}}_k)^{-1} $.

    模态的后验概率通过贝叶斯公式获得

    $$ \begin{split} p(r_k^j| {\boldsymbol{Y}} _k) = \;& \frac{p({\boldsymbol{y}} _k, r_k^j|{\boldsymbol{Y}} _{k-1}) }{p({\boldsymbol{y}} _k|{\boldsymbol{Y}} _{k-1})}\propto\\ &\int p({\boldsymbol{y}} _k,{\boldsymbol{x}} _k |{\boldsymbol{Y}} _{k-1})\mathrm{d}{{\boldsymbol{x}} _k}\, \end{split} $$ (24)

    其中, $ p({\boldsymbol{y}} _k|{\boldsymbol{Y}} _{k-1}) $为归一化系数, 在共轭分布中很容易计算, 即

    $$ \int p({\boldsymbol{y}} _k,{\boldsymbol{x}} _k |{\boldsymbol{Y}} _{k-1})\mathrm{d}{{\boldsymbol{x}} _k} = \Lambda_j({\boldsymbol{y}} _k)\mu_k^{j-}\, $$ (25)

    其中, $ \Lambda_j({\boldsymbol{y}} _k) = \mathrm{N}({\boldsymbol{y}} _k;{\boldsymbol{H}} _j{\boldsymbol{x}} _k^{j-},{\boldsymbol{H}} _j {\boldsymbol{P}}_k^{j-}{{\boldsymbol{H}} _j}^\mathrm{T}+{\boldsymbol{R}}_k) $. 归一化后, 模态后验概率为

    $$ \mu_k^{j}\propto \Lambda_j({\boldsymbol{y}} _k)\mu_k^{j-}\, $$ (26)

    可以看出, 似然函数$ \Lambda_j({\boldsymbol{y}} _k) $用于更新模态预测概率$ \mu_k^{j-} $, 这一点和IMM相似. 因为模态后验概率$ \mu_k^{j} $展示了在$ k $时刻每个模态$ j $的可能性, 因此最终输出为

    $$ {\hat{\boldsymbol{x}} }_k = \sum\limits_{j = 1}^{M}\mu_{k}^j {\hat{\boldsymbol{x}} }_{k}^{j} \, $$ (27)
    $$ {\boldsymbol{P}}_{k} = \sum\limits_{j = 1}^{M}\mu_{k}^j\big( {\boldsymbol{P}}_{k}^{j}+({\hat{\boldsymbol{x}} }_{k}^{j}-{\hat{\boldsymbol{x}} }_{k})({\hat{\boldsymbol{x}} }_{k}^{j}-{\hat{\boldsymbol{x}} }_{k})^\mathrm{T}\big)\, $$ (28)

    为了定量分析源域数据的引入对估计性能的影响, 本节利用影响力函数[32-33]来刻画源域数据迁移对估计性能的影响, 量化源域数据的引入对估计精度影响的程度. 定义损失函数如下

    $$ \begin{split} {\boldsymbol{F}} ({\boldsymbol{x}} _k,{\boldsymbol{y}} _k) = \;&({\boldsymbol{y}} _k-{\boldsymbol{H}} _k{\boldsymbol{x}} _k)^{\mathrm{T}}{\boldsymbol{R}}^{-1}_k({\boldsymbol{y}} _k-{\boldsymbol{H}} _k{\boldsymbol{x}} _k)\;+\\ &({\boldsymbol{x}} _k-{\hat{\boldsymbol{x}} }_k^-)^{\mathrm{T}}{\boldsymbol{Q}}_k^{-1}({\boldsymbol{x}} _k-{\hat{\boldsymbol{x}} }_k^-) \, \end{split} $$ (29)

    为了弱化模态跳变对估计性能的影响, $ {\hat{\boldsymbol{x}} }_k^{-} $定义为$ j = 1 $时的预测$ {\hat{\boldsymbol{x}} }_k^{j-} $. 为了描述源域数据对估计精度的影响, 定义影响力函数如下

    $$ {\boldsymbol{L}}({\hat{\boldsymbol{x}} }_k(\varepsilon,\varrho),{\boldsymbol{y}} _k^\varrho)^{\mathrm{T}} = \nabla_{\varrho}{\boldsymbol{F}} ({\hat{\boldsymbol{x}} }_k(\varepsilon,\varrho),{\boldsymbol{y}} _k^\varrho)^{\mathrm{T}}\mid_{\varrho = 0} $$ (30)

    其中, $ {\boldsymbol{y}} _k^\varrho $表示不同质量的源域数据, 即观测噪声方差不同的辅助量测数据. 在这里为了一般性表达, 用下式代替

    $$ {\boldsymbol{y}} _k^\varrho = {\boldsymbol{y}} _k+\varrho\, $$ (31)

    定义如下代价函数表示不同质量的源域数据对状态估计值$ {\hat{\boldsymbol{x}} }_k $的影响

    $$ \begin{split} {\hat{\boldsymbol{x}} }_k(\varepsilon,\varrho) =\;& \arg\min\sum\limits_{i = 0}^k{\boldsymbol{F}} ({\boldsymbol{x}} _i,{\boldsymbol{y}} _i)\;+\\ & \varepsilon\Big({\boldsymbol{F}} ({\hat{\boldsymbol{x}} }_k(\varepsilon,\varrho),{\boldsymbol{y}} _k^\varrho)-{\boldsymbol{F}} ({\boldsymbol{x}} _k,{\boldsymbol{y}} _k)\Big)\, \end{split} $$ (32)

    根据附录D提供的推导, 源域数据对估计精度的影响力值可由下式计算得到

    $$ {\boldsymbol{L}}({\hat{\boldsymbol{x}} }_k(\varepsilon,\varrho),{\boldsymbol{y}} _k^\varrho)^{\mathrm{T}} = -\Psi_k\Phi_k\Theta_k\, $$ (33)

    其中,

    $$ \Psi_k = \big({\boldsymbol{Q}}_k^{-1}({\hat{\boldsymbol{x}} }_k-{\hat{\boldsymbol{x}} }_k^-)- {\boldsymbol{H}} _k^{\mathrm{T}}{\boldsymbol{R}}_k^{-1}({\boldsymbol{y}} _k^\varrho-{\boldsymbol{H}} _k{\hat{\boldsymbol{x}} }_k)\big)^{\mathrm{T}} $$ (34)
    $$ \Phi_k = ({\boldsymbol{Q}}_k^{-1}+{\boldsymbol{H}} _k^{\mathrm{T}}{\boldsymbol{R}}_k^{-1}{\boldsymbol{H}} _k)^{-1}\, $$ (35)
    $$ \Theta_k = {\boldsymbol{H}} _k^{\mathrm{T}}{\boldsymbol{R}}_k^{-1}\, $$ (36)

    图3展示了源域数据的引入对迁移估计器的影响力函数 (Influence function, IF) 曲线和均方根误差 (Root mean square errors, RMSEs) 曲线, 可以看出IF曲线变化趋势与RMSEs趋势一致, 即影响力函数可以有效地用于量化源域数据引入后对估计精度的影响, 在对估计性能进行定量分析的同时, 也为源域数据质量的评价提供了新的手段, 可以有效避免负迁移.

    图 3  源域数据对迁移估计器的影响力曲线
    Fig. 3  The influence function of source measurements on the transfer state estimator

    本节利用运动目标跟踪例子来说明所提迁移交互多模型估计算法 (Transfer interacting multiple model state estimator, IMM-TF) 的有效性, 并与如下3种方法进行对比: 1) 交互多模型算法 (Interacting multiple model, IMM), 该算法没有源域数据迁移, 在这里作为基准; 2) 交互多模型融合算法 (Interacting multiple model fusion, IMM-FU), 该算法是多模型下的TTF常规融合方法; 3) 变结构交互多模型算法[34](Variable structure interacting multiple model, VSIMM), 该方法把利用源域数据得到的估计值作为新的模态嵌入到IMM结构中. 基于蒙特卡洛采样计算的RMSEs作为估计性能指标. 假设目标的加速度根据有限状态马尔科夫链演化, 动力学方程可描述为

    $$ \left[ {\begin{array}{*{20}{c}} p_{k+1} \\ v_{k+1} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 1 & T \\ 0 &1 \end{array}} \right] \underbrace{ \left[ {\begin{array}{*{20}{c}} p_k \\ v_k \end{array}} \right]}_{{\boldsymbol{x}}_k} +\left[ {\begin{array}{*{20}{c}} \dfrac{T^2}{2} \\ T \end{array}} \right] \left(a_k+\omega_k \right) $$ (37)

    其中, $ p_k $, $ v_k $$ a_k $分别代表目标位置、速度和加速度. 初始状态为高斯分布$ \mathrm{N}({\boldsymbol{x}} _0;{\hat{\boldsymbol{x}} }_0,{\boldsymbol{P}}_0) $, 均值为$ {\hat{\boldsymbol{x}} }_0 = \left[ 10 \,\, 10\right] ^\mathrm{T} $, 方差为${\boldsymbol{P}}_0 = \left[ \begin{align} 100\;\; 1 \;\;\\ 1 \;\;100 \end{align} \right]\,$, 运行100步. 加速度$ a_k $为在集合$ \left\lbrace 0.25, 0, -0.25\right\rbrace $中取值的有限状态马尔科夫链, 转移概率矩阵为

    $$ {\boldsymbol{\Pi}} = \left[ {\begin{array}{*{20}{c}} 0.50 & 0.25 & 0.25 \\ 0.25 &0.50 & 0.25 \\ 0.25 &0.25 &0.50 \end{array}} \right]\, $$ (38)

    过程噪声$ \omega_k\sim \mathrm{N}(\omega_k; 0, 1) $代表了加速度的轻微变化. 假设只有位置信息可以被测量, 即$y_k = p_k\;+ v_k$$ y_{S,k} = p_k+v_{S,k} $, 其中, $ v_k\sim\mathrm{N}(v_k;0,100) $$ v_{S,k}\sim\mathrm{N}(v_{S,k};0,10) $分别表示来自目标域和源域的噪声.

    在仿真中, 源域量测数据与目标域量测数据的比例为3:5. 基于400次蒙特卡洛仿真, 图4给出了不同算法下的均方根误差, 可以看出, IMM-TF估计性能明显优于IMM、IMM-FU和VSIMM算法.

    图 4  不同算法在运动目标跟踪中的均方根误差
    Fig. 4  RMSEs of different algorithms for the moving target tracking

    此外, 本文分析了源域数据数量和质量对估计性能的影响, 表1展示了估计精度随着源域数据比重的增加而增加, 说明该方法具有正迁移特性. 在图5中, 本文用不同的量测噪声方差$ {R}_{S} $刻画源域数据质量, 让$ {R}_{S} $$ \{0.1,1,10,100,1\,000\} $中取值, 分别对应5种情况, 图中以位置估计效果为例, 可以看出当$ {R}_{S}<{R} $时, 即源域数据质量高于目标域数据质量时, 源域数据质量越高, 迁移效果越好, 当源域数据质量低于目标域数据质量时, 迁移效果甚至不如IMM. 图6进一步展示了利用本文所提的基于影响力值的迁移估计器算法 (Influence function transfer state estimator, IF-TF) 可以有效避免负迁移的产生, 当源域数据质量较差时, 该算法根据影响力值自动滤除该源域数据, 提高算法的鲁棒性.

    表 1  不同数量的源域数据迁移后的 RMSEs
    Table 1  Average RMSEs (per sample) of IMM-TF in the presence of different amount source measurements
    源域数据比重 (%)位置 (m)速度 (m/s)
    105.87552.0266
    305.40701.9567
    504.88681.8798
    704.53141.8465
    994.09991.7674
    下载: 导出CSV 
    | 显示表格
    图 5  源域数据质量对迁移估计器算法性能的影响
    Fig. 5  Demonstration of the performance of IMM-TF in the presence of source measurements of different quality
    图 6  基于影响力值的迁移估计器算法性能
    Fig. 6  Demonstration of the performance of IF-TF

    针对多率量测背景下跳变系统的状态估计问题, 本文提出了一种迁移交互多模型估计算法, 并利用平滑策略推导了知识迁移的形式, 设计了迁移平滑估计器结构, 实现了对辅助源域数据的有效利用. 同时, 通过构建源域量测数据与估计性能之间的解析关系, 定量分析了源域量测数据的引入对估计性能的影响. 仿真结果表明, 本文所提出的迁移估计器IMM-TF优于VSIMM、IMM和IMM-FU, 同时避免了负迁移的产生. 由于从源域到目标域的可迁移性和可迁移程度对估计性能起着重要的作用, 因此在该框架下如何定义和设计可迁移程度仍然是开放问题.

    将式 $(5) $ 和式$(7) $ 代入式 $(8) $ 得到

    $$ \begin{split}& {\cal{D}}_\mathrm{KL}( {p_S}(\cdot)\| p(\cdot)) = \\ &\quad \iint p_S({\boldsymbol{y}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k-1}) p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1})\;\times \\ &\quad \ln\frac{p_S({\boldsymbol{y}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k-1}) p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1}) }{p({\boldsymbol{y}} _k|{\boldsymbol{x}} _k,r_k^j)p({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _{k-1})}\mathrm{d}{\boldsymbol{x}} _k \mathrm{d}{\boldsymbol{y}} _k = \;\\ &\quad\int p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1}) (\int p_S({\boldsymbol{y}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k-1})\;\times\\ &\quad \ln\frac{p_S({\boldsymbol{y}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k-1}) }{p({\boldsymbol{y}} _k|{\boldsymbol{x}} _k,r_k^j)} \mathrm{d}{\boldsymbol{y}} _k)\mathrm{d}{\boldsymbol{x}} _k\;+\\ &\quad \int p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1})\;\times\\ &\quad\ln\frac{ p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1}) }{p({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _{k-1})}\mathrm{d}{\boldsymbol{x}} _k+ {\cal{C}}_0\, \end{split}\tag{A1}$$

    其中, ${\cal{C}}_0 =\displaystyle \int {p_S({\boldsymbol{y}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k-1}) \ln p_S({\boldsymbol{y}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k-1}) \mathrm{d}{\boldsymbol{y}} _k} $是与$ {\boldsymbol{x}} _k $无关项.

    定义源域滤波器后验分布$p_S({\boldsymbol{x}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k}) = \mathrm{N}({\boldsymbol{x}} _{k};{{\boldsymbol{m}}}_{k}^{j}, {\boldsymbol{D}}_{k}^{j})$. 根据高斯联合分布引理, $ {\boldsymbol{x}} _{k} $$ {\boldsymbol{x}} _{k-1} $的联合分布可由下式计算

    $$ \begin{split}& p_S({\boldsymbol{x}} _{k},{\boldsymbol{x}} _{k-1}|r_k^j,{\boldsymbol{Y}} _{S,k-1}) = \\ &\qquad p_S({\boldsymbol{x}} _k|{\boldsymbol{x}} _{k-1},r_k^j) p_S({\boldsymbol{x}} _{k-1}|r_k^j,{\boldsymbol{Y}} _{S,k-1}) = \\ &\qquad\mathrm{N} \left( \left[ {\begin{array}{*{20}{c}} {\boldsymbol{x}} _{k-1}\\ {\boldsymbol{x}} _{k} \end{array}} \right]\bigg| {\tilde{\boldsymbol{m}}}_1, {\tilde{\boldsymbol{P}}}_1\right)\, \end{split}\tag{B1} $$

    其中, ${\tilde{\boldsymbol{P}}}_1 = \left[ {\begin{aligned} {{\boldsymbol{P}}}_{k-1}^j \;\;\qquad {{\boldsymbol{P}}}_{k-1}^j{\boldsymbol{F}} _j^\mathrm{T}\quad\;\; \;\\ {\boldsymbol{F}} _j{{\boldsymbol{P}}}_{k-1}^j \;\; {\boldsymbol{F}} _j{{\boldsymbol{P}}}_{k-1}^j{\boldsymbol{F}} _j^\mathrm{T}+{\boldsymbol{Q}}_k \end{aligned}} \right]$, ${\tilde{\boldsymbol{m}}}_1 = \left[ {\begin{aligned} {\hat{\boldsymbol{x}} }_{k-1}^j\;\;\\ {\boldsymbol{F}} _j{\hat{\boldsymbol{x}} }_{k-1}^j \end{aligned}} \right]$. 根据高斯条件分布引理, 条件分布可由下式计算

    $$ p_S({\boldsymbol{x}} _{k-1}|{\boldsymbol{x}} _k,r_k^j,{\boldsymbol{Y}} _{S,k-1}) = \mathrm{N}({\boldsymbol{x}} _{k-1}; {\tilde{\boldsymbol{m}}}_2, {\tilde{\boldsymbol{P}}}_2) \tag{B2}$$

    其中,

    $$ {{\boldsymbol{L}}}_j = {\boldsymbol{P}}_{k-1}{\boldsymbol{F}} _j^\mathrm{T}({\boldsymbol{F}} _j {\boldsymbol{P}}_{k-1}{\boldsymbol{F}} _j^\mathrm{T}+{\boldsymbol{Q}}_{k})^{-1}\,\tag{B3} $$
    $$ {\tilde{\boldsymbol{m}}}_2 = {\hat{\boldsymbol{x}} }_{k-1}+{\boldsymbol{L}}_j({\boldsymbol{x}} _{k}-{\boldsymbol{F}} _j{\hat{\boldsymbol{x}} }_{k-1})\, \tag{B4}$$
    $$ {\tilde{\boldsymbol{P}}}_2 = {\boldsymbol{P}}_{k-1}-{\boldsymbol{L}}_j({\boldsymbol{F}} _j {\boldsymbol{P}}_{k-1}{\boldsymbol{F}} _j^\mathrm{T}+{\boldsymbol{Q}}_{k}){\boldsymbol{L}}_j^\mathrm{T}\, \tag{B5}$$

    联合分布$ p_S({\boldsymbol{x}} _{k-1},{\boldsymbol{x}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k}) $可由下式计算

    $$ \begin{split}& p_S({\boldsymbol{x}} _{k-1},{\boldsymbol{x}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k}) = \\&\qquad p_S({\boldsymbol{x}} _{k-1}|{\boldsymbol{x}} _k,r_k^j,{\boldsymbol{Y}} _{S,k-1})p_S({\boldsymbol{x}} _{k}|r_k^j,{\boldsymbol{Y}} _{S,k}) = \,\\ &\qquad\mathrm{N}({\boldsymbol{x}} _{k-1}; {\tilde{\boldsymbol{m}}}_2, {\tilde{\boldsymbol{P}}}_2)\mathrm{N}({\boldsymbol{x}} _{k};{{\boldsymbol{m}}}_{k}^{j},{\boldsymbol{D}}_{k}^{j})\, = \\ &\qquad\mathrm{N} \left( \left[ {\begin{array}{*{20}{c}} {\boldsymbol{x}} _{k}\\ {\boldsymbol{x}} _{k-1} \end{array}} \right]\bigg| {\tilde{\boldsymbol{m}}}_3, {\tilde{\boldsymbol{P}}}_3\right)\, \end{split} \tag{B6}$$

    其中, ${\tilde{\boldsymbol{m}}}_3 \;=\; \left[ {\begin{aligned} {\boldsymbol{m}}_{k}^{j}\qquad\qquad\quad\\ {\hat{\boldsymbol{x}} }_{k-1}\;+\;{\boldsymbol{L}}_j({\boldsymbol{m}}_{k}^{j}\;-\;{\boldsymbol{F}} _j{\hat{\boldsymbol{x}} }_{k-1}) \end{aligned}} \right]$, ${\tilde{\boldsymbol{P}}}_3 = $ $\left[ {\begin{aligned} {{\boldsymbol{D}}}_{k}^j \;\;\;\;\qquad {{\boldsymbol{D}}}_{k}^j{\boldsymbol{L}}_j^\mathrm{T}\qquad \\ {\boldsymbol{L}}_j{{\boldsymbol{D}}}_{k}^j \;\; {\boldsymbol{L}}_j{{\boldsymbol{D}}}_{k}^j{\boldsymbol{L}}_j^\mathrm{T}+ {\tilde{\boldsymbol{P}}}_2 \end{aligned}} \right]$. 因此, 再次利用高斯条件分布引理, $ {\boldsymbol{x}} _{k-1} $的边缘分布为 $p_S({\boldsymbol{x}} _{k-1}|r_k^j,{\boldsymbol{Y}} _{S,k}) = \mathrm{N}({\boldsymbol{x}} _{k-1}; {{\acute{\boldsymbol{m}}}}_{k-1}^{j}, {\acute{\boldsymbol{D}}}_{k-1}^{j})$, 其中, $ {\acute{\boldsymbol{m}}}_{k-1}^{j} $$ {\acute{\boldsymbol{D}}}_{k-1}^{j} $由式 (13) 和式 (14) 表示.

    根据式 (9)可知

    $$ \begin{split}& p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1})\propto\\&\qquad \exp \Big( {\rm{E}}_{ p_S({\boldsymbol{y}} _k|r_k^j,{\boldsymbol{Y}} _{S,k-1})}(\ln p({\boldsymbol{y}} _k|{\boldsymbol{x}} _k,r_k^j) )\Big)\;\times\\&\qquad p({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _{k-1}) \, \end{split}\tag{C1}$$

    其中, ${\rm{E}}_{ p_S(\cdot)} (f(\cdot)) = \int f(\cdot) p_S(\cdot)\mathrm{d}{\boldsymbol{y}} _k$. 对式 (C1) 两边取$ \ln $, 根据特性$\mathrm{N}({\boldsymbol{x}} _k;{\hat{\boldsymbol{x}} }_k,{\boldsymbol{\Delta}}_k) \propto |{\boldsymbol{\Delta}}_k|^{-0.5}\exp(-0.5({\boldsymbol{x}} _k-{\hat{\boldsymbol{x}} }_k)^\mathrm{T} {\boldsymbol{\Delta}}_k^{-1}({\boldsymbol{x}} _k- {\hat{\boldsymbol{x}} }_k))$, 可以得到

    $$ \begin{split} &\ln p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1})\propto\\ &\qquad{\rm{E}}_{p_S({\boldsymbol{y}} _k|r_k^j,{\boldsymbol{Y}} _{S,k-1})}(\ln p({\boldsymbol{y}} _k|{\boldsymbol{x}} _k,r_k^j) )\;+\\ &\qquad\ln p({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _{k-1})\, \end{split}\tag{C2} $$

    根据预先设定的分布$p_S({\boldsymbol{y}} _k|r_k^j,{\boldsymbol{Y}} _{S,k-1}) = \mathrm{N}({\boldsymbol{y}} _{k}; {{\boldsymbol{u}}}_{S,k}^j, {\boldsymbol{U}}_{S,k}^j)$, 可以获得

    $$ \begin{split} & \ln p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1})\propto\\ &\qquad-\frac{1}{2}({\boldsymbol{x}} _k- {\hat{\boldsymbol{x}} }_k^{j-})^\mathrm{T}({\boldsymbol{P}}_k^{j-})^{-1}({\boldsymbol{x}} _k-{\hat{\boldsymbol{x}} }_k^{j-})\;-\\ &\qquad\frac{1}{2}({\boldsymbol{u}}_{S,k}^j- {\boldsymbol{H}} _j{\boldsymbol{x}} _k)^\mathrm{T}({\boldsymbol{R}}_k)^{-1}({\boldsymbol{u}}_{S,k}^j- {\boldsymbol{H}} _j{\boldsymbol{x}} _k)\;-\\ &\qquad\frac{1}{2}\mathrm{tr}({\boldsymbol{U}}_{S,k}^j{\boldsymbol{R}}_k^{-1})\, \end{split} \tag{C3}$$

    舍弃$ {\boldsymbol{x}} _k $无关项, $ p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1}) $恢复成高斯分布$ p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1}) = \mathrm{N}({\boldsymbol{x}} _k;{\bar{\boldsymbol{x}} }_k^j,{\bar{\boldsymbol{P}}}_{k}^j) $, 其中, $ {\bar{\boldsymbol{x}} }_k^j $$ {\bar{\boldsymbol{P}}}_{k}^{j} $分别由式 (20) 和式 (21) 表示. 同样地, $ {\boldsymbol{x}} _k $的后验分布可由下式计算

    $$ \begin{split} \ln{p}({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _{k}) \propto\;& \ln p({\boldsymbol{y}} _k| {\boldsymbol{x}} _{k},r_k^j )\;+\,\\ & \ln p_S({\boldsymbol{x}} _k|r_k^j,{F}_S,{\boldsymbol{Y}} _{k-1}) \, \end{split}\tag{C4} $$

    将式 (20) 和式 (21) 代入式 (C4), 式 (C4) 等同于

    $$ \begin{split} \ln p({\boldsymbol{x}} _k|r_k^j,{\boldsymbol{Y}} _{k}) \propto\;& -\frac{1}{2}({\boldsymbol{x}} _k- {\bar{\boldsymbol{x}} }_k^{j})^\mathrm{T}({\bar{\boldsymbol{P}}}_k^{j})^{-1}({\boldsymbol{x}} _k-{\bar{\boldsymbol{x}} }_k^{j})\;-\\ & \frac{1}{2}({\boldsymbol{y}} _{k}- {\boldsymbol{H}} _j{\boldsymbol{x}} _k)^\mathrm{T}{\boldsymbol{R}}_k^{-1}({\boldsymbol{y}} _{k}- {\boldsymbol{H}} _j{\boldsymbol{x}} _k)\, \end{split} \tag{C5}$$

    舍弃$ {\boldsymbol{x}} _k $无关项. 将式 (C5) 恢复成高斯分布, 可以得到$ \mathrm{N}({\boldsymbol{x}} _k;{\hat{\boldsymbol{x}} }_k^j,{{\boldsymbol{P}}}_{k}^{j}) $, 其中, $ {\hat{\boldsymbol{x}} }_k^j $$ {{\boldsymbol{P}}}_{k}^{j} $由式 (22) 和式 (23) 表示.

    根据影响力函数式 (30), 进一步推导如下

    $$ \begin{split} {\boldsymbol{L}}(\cdot)^{\mathrm{T}} =\;& \frac{\partial{\boldsymbol{F}} ({\hat{\boldsymbol{x}} }_k(\varepsilon,\varrho),{\boldsymbol{y}} _k^\varrho)^{\mathrm{T}}}{\partial\varrho}\bigg|_{\varrho = 0} \;= \\ & \frac{\partial{\boldsymbol{F}} ({\hat{\boldsymbol{x}} }_k(\varepsilon,\varrho),{\boldsymbol{y}} _k^\varrho)^{\mathrm{T}}}{\partial{\hat{\boldsymbol{x}} }_k(\varepsilon,\varrho)}\bigg|_{\varrho = 0} \frac{\partial{\hat{\boldsymbol{x}} }_k(\varepsilon,\varrho)}{\partial\varrho}\bigg|_{\varrho = 0} \;= \\ & \frac{\partial{\boldsymbol{F}} ({{\boldsymbol{x}} }_k,{\boldsymbol{y}} _k^\varrho)^{\mathrm{T}}}{\partial{{\boldsymbol{x}} }_k}\bigg|_{{{\boldsymbol{x}} }_k = {\hat{\boldsymbol{x}} }_k}\frac{\partial^2{\boldsymbol{F}} ({{\boldsymbol{x}} }_k,{\boldsymbol{y}} _k^\varrho)^{\mathrm{T}}}{\partial{{\boldsymbol{x}} }_k\partial{\boldsymbol{y}} _k}\bigg|_{{{\boldsymbol{x}} }_k = {\hat{\boldsymbol{x}} }_k} \;\times\\ &\left(\frac{\partial^2{\boldsymbol{F}} ({{\boldsymbol{x}} }_k,{\boldsymbol{y}} _k^\varrho)^{\mathrm{T}}}{\partial^2{{\boldsymbol{x}} }_k}\bigg|_{{{\boldsymbol{x}} }_k = {\hat{\boldsymbol{x}} }_k}\right)^{-1}\, \end{split}\tag{D1}$$

    其中, ${\boldsymbol{L}}(\cdot)^{\mathrm{T}} = {\boldsymbol{L}}({\hat{\boldsymbol{x}} }_k(\varepsilon,\varrho),{\boldsymbol{y}} _k^\varrho)^{\mathrm{T}}$, 将式 (29) 代入式(D1) 即可推导出影响力值的表达式 (33).

  • 图  1  多率量测过程 (实线表示真实状态, 虚线表示目标域量测 (在线快速率数据), 点表示源域量测 (离线化验数据), 其采样时间可能不规律)

    Fig.  1  Multiple source measurements of the process with different sampling rates (Solid lines are true states, and dashed lines represent target measurements. Dots denote source measurements, whose sample time may be irregular)

    图  2  迁移交互多模型估计器结构图

    Fig.  2  Basic operation diagram of the transfer interacting multiple model state estimator

    图  3  源域数据对迁移估计器的影响力曲线

    Fig.  3  The influence function of source measurements on the transfer state estimator

    图  4  不同算法在运动目标跟踪中的均方根误差

    Fig.  4  RMSEs of different algorithms for the moving target tracking

    图  5  源域数据质量对迁移估计器算法性能的影响

    Fig.  5  Demonstration of the performance of IMM-TF in the presence of source measurements of different quality

    图  6  基于影响力值的迁移估计器算法性能

    Fig.  6  Demonstration of the performance of IF-TF

    表  1  不同数量的源域数据迁移后的 RMSEs

    Table  1  Average RMSEs (per sample) of IMM-TF in the presence of different amount source measurements

    源域数据比重 (%)位置 (m)速度 (m/s)
    105.87552.0266
    305.40701.9567
    504.88681.8798
    704.53141.8465
    994.09991.7674
    下载: 导出CSV
  • [1] Wu Y, Luo X L. A novel calibration approach of soft sensor based on multirate data fusion technology. Journal of Process Control, 2010, 20(10): 1252-1260 doi: 10.1016/j.jprocont.2010.09.003
    [2] Fatehi A, Huang B. Kalman filtering approach to multi-rate information fusion in the presence of irregular sampling rate and variable measurement delay. Journal of Process Control, 2017, 53: 15-25 doi: 10.1016/j.jprocont.2017.02.010
    [3] Fatehi A, Huang B. State estimation and fusion in the presence of integrated measurement. IEEE Transactions on Instrumentation and Measurement, 2017, 66(9): 2490-2499 doi: 10.1109/TIM.2017.2701143
    [4] Gou B, Cheng Y M, de Ruiter A H J. INS/CNS navigation system based on multi-star pseudo measurements. Aerospace Science and Technology, 2019, 95: Article No. 105506 doi: 10.1016/j.ast.2019.105506
    [5] Bar-Shalom Y, Campo L. The effect of the common process noise on the two-sensor fused-track covariance. IEEE Transactions on Aerospace and Electronic Systems, 1986, 22(6): 803-805
    [6] Gao J B, Harris C J. Some remarks on Kalman filters for the multisensor fusion. Information Fusion, 2002, 3(3): 191-201 doi: 10.1016/S1566-2535(02)00070-2
    [7] Xie L, Zhu Y J, Huang B, Zheng Y S. Kalman filtering approach to multirate information fusion for soft sensor development. In: Proceedings of the 15th International Conference on Information Fusion. Singapore: IEEE, 2012. 641−648
    [8] Tian T, Sun S L. Distributed fusion estimation for multisensor multirate systems with packet dropout compensations and correlated noises. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2021, 51(9): 5762-5772 doi: 10.1109/TSMC.2019.2956259
    [9] Gopalakrishnan A, Kaisare N S, Narasimhan S. Incorporating delayed and infrequent measurements in Extended Kalman Filter based nonlinear state estimation. Journal of Process Control, 2011, 21(1): 119-129 doi: 10.1016/j.jprocont.2010.10.013
    [10] Guo Y F, Zhao Y, Huang B. Development of soft sensor by incorporating the delayed infrequent and irregular measurements. Journal of Process Control, 2014, 24(11): 1733-1739 doi: 10.1016/j.jprocont.2014.09.006
    [11] Zhou J, Zhu Y M, You Z S, Song E B. An efficient algorithm for optimal linear estimation fusion in distributed multisensor systems. IEEE Transactions on Systems, Man, and Cybernetics-Part A: Systems and Humans, 2006, 36(5): 1000-1009 doi: 10.1109/TSMCA.2006.878986
    [12] Wang D, Ha M M, Zhao M M. The intelligent critic framework for advanced optimal control. Artificial Intelligence Review, 2022, 55(1): 1-22 doi: 10.1007/s10462-021-10118-9
    [13] 王鼎, 赵明明, 哈明鸣. 基于折扣广义值迭代的智能最优跟踪及应用验证. 自动化学报, 2022, 48(1): 182-193

    Wang Ding, Zhao Ming-Ming, Ha Ming-Ming. Intelligent optimal tracking with application verifications via discounted generalized value iteration. Acta Automatica Sinica, 2022, 48(1): 182-193
    [14] Salehi Y, Fatehi A, Nayebi M A. State estimation of slow-rate integrated measurement systems in the presence of parametric uncertainties. IEEE Transactions on Instrumentation and Measurement, 2018, 68(10): 3983-3991
    [15] Lin H L, Sun S L. Distributed fusion estimator for multisensor multirate systems with correlated noises. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2017, 48(7): 1131-1139
    [16] Yan L P, Di C Y, Wu Q M J, Xia Y Q. Sequential fusion for multirate multisensor systems with heavy-tailed noises and unreliable measurements. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2020, 52(1): 523-532
    [17] Smith D, Singh S. Approaches to multisensor data fusion in target tracking: A survey. IEEE Transactions on Knowledge and Data Engineering, 2006, 18(12): 1696-1710 doi: 10.1109/TKDE.2006.183
    [18] Li W L, Jia Y M. Consensus-based distributed multiple model UKF for jump Markov nonlinear systems. IEEE Transactions on Automatic Control, 2011, 57(1): 227-233
    [19] Li W L, Jia Y M. Distributed consensus filtering for discrete-time nonlinear systems with non-Gaussian noise. Signal Processing, 2012, 92(10): 2464-2470 doi: 10.1016/j.sigpro.2012.03.009
    [20] Song H, Shin V, Jeon M. Mobile node localization using fusion prediction-based interacting multiple model in cricket sensor network. IEEE Transactions on Industrial Electronics, 2012, 59(11): 4349-4359 doi: 10.1109/TIE.2011.2151821
    [21] Fu Z, Angelini F, Chambers J, Naqvi S M. Multi-level cooperative fusion of GM-PHD filters for online multiple human tracking. IEEE Transactions on Multimedia, 2019, 21(9): 2277-2291 doi: 10.1109/TMM.2019.2902480
    [22] Shen X J, Zhu Y M, Song E B, Luo Y T. Optimal centralized update with multiple local out-of-sequence measurements. IEEE Transactions on Signal Processing, 2009, 57(4): 1551-1562 doi: 10.1109/TSP.2009.2012885
    [23] Chi X B, Jia X C, Cheng F Q, Fan M H. Networked H filtering for Takagi-Sugeno fuzzy systems under multi-output multi-rate sampling. Journal of the Franklin Institute, 2019, 356(6): 3661-3691 doi: 10.1016/j.jfranklin.2018.10.040
    [24] Zhou W D, Liu M M. Robust interacting multiple model algorithms based on multi-sensor fusion criteria. International Journal of Systems Science, 2016, 47(1): 92-106 doi: 10.1080/00207721.2015.1029566
    [25] Fu X, Jia Y, Du J, Yu F. New interacting multiple model algorithms for the tracking of the manoeuvring target. IET Control Theory and Applications, 2010, 4(10): 2184-2194 doi: 10.1049/iet-cta.2009.0583
    [26] Li Z, Teng J, Qiu J B, Gao H J. Filtering design for multirate sampled-data systems. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2020, 50(11): 4224-4232 doi: 10.1109/TSMC.2018.2839674
    [27] Li X R, Bar-Shalom Y. Multiple-model estimation with variable structure. IEEE Transactions on Automatic Control, 1996, 41(4): 478-493 doi: 10.1109/9.489270
    [28] Katsikas S K, Likothanassis S D, Beligiannis G N, Berkeris K G, Fotakis D A. Genetically determined variable structure multiple model estimation. IEEE Transactions on Signal Processing, 2001, 49(10): 2253-2261 doi: 10.1109/78.950781
    [29] Zhao S Y, Ahn C K, Shi P, Shmaliy Y S, Liu F. Bayesian state estimation for Markovian jump systems: Employing recursive steps and pseudocodes. IEEE Systems Man and Cybernetics Magazine, 2019, 5(2): 27-36 doi: 10.1109/MSMC.2018.2882145
    [30] Wen L, Gao L, Li X Y. A new deep transfer learning based on sparse auto-encoder for fault diagnosis. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2019, 49(1): 136-144 doi: 10.1109/TSMC.2017.2754287
    [31] Wang B, Li Z C, Dai Z W, Lawrence N, Yan X F. Data-driven mode identification and unsupervised fault detection for nonlinear multimode processes. IEEE Transactions on Industrial Informatics, 2019, 16(6): 3651-3661
    [32] Sun L, Ho W K, Ling K V, Chen T P, Maciejowski J. Recursive maximum likelihood estimation with t-distribution noise model. Automatica, 2021, 132: Article No. 109789 doi: 10.1016/j.automatica.2021.109789
    [33] Xue W, Luan X L, Zhao S Y, Liu F. A fusion Kalman filter and UFIR estimator using the influence function method. IEEE/CAA Journal of Automatica Sinica, 2021, 9(4): 709-718
    [34] Li X R. Multiple-model estimation with variable structure. II. Model-set adaptation. IEEE Transactions on Automatic Control, 2000, 45(11): 2047-2060 doi: 10.1109/9.887626
  • 期刊类型引用(0)

    其他类型引用(1)

  • 加载中
图(6) / 表(1)
计量
  • 文章访问数:  712
  • HTML全文浏览量:  84
  • PDF下载量:  189
  • 被引次数: 1
出版历程
  • 收稿日期:  2022-01-04
  • 录用日期:  2022-07-21
  • 网络出版日期:  2022-11-02
  • 刊出日期:  2023-01-07

目录

/

返回文章
返回