2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

线性离散系统的有限频域集员故障检测观测器设计

李佶桃 王振华 沈毅

王可, 徐明亮, 李亚飞, 姜晓恒, 鲁爱国, 李鉴. 一种面向航空母舰甲板运动状态预估的鲁棒学习模型. 自动化学报, 2024, 50(9): 1785−1793 doi: 10.16383/j.aas.c210664
引用本文: 李佶桃, 王振华, 沈毅. 线性离散系统的有限频域集员故障检测观测器设计. 自动化学报, 2020, 46(7): 1531-1538. doi: 10.16383/j.aas.c170725
Wang Ke, Xu Ming-Liang, Li Ya-Fei, Jiang Xiao-Heng, Lu Ai-Guo, Li Jian. A robust learning model for deck motion prediction of aircraft carrier. Acta Automatica Sinica, 2024, 50(9): 1785−1793 doi: 10.16383/j.aas.c210664
Citation: LI Ji-Tao, WANG Zhen-Hua, SHEN Yi. Set-membership Fault Detection Observer Design in Finite-Frequency Domain for Linear Discrete-Time System. ACTA AUTOMATICA SINICA, 2020, 46(7): 1531-1538. doi: 10.16383/j.aas.c170725

线性离散系统的有限频域集员故障检测观测器设计

doi: 10.16383/j.aas.c170725
基金项目: 

国家自然科学基金 61973098

国家自然科学基金 61773145

国家重点研发计划项目 2019YFC0117400

详细信息
    作者简介:

    李佶桃  哈尔滨工业大学航天学院博士研究生.主要研究方向为基于区间分析的故障诊断与容错控制. E-mail:lijitaonuaa5@gmail.com

    王振华  哈尔滨工业大学航天学院副教授.主要研究方向为故障诊断与容错控制技术. E-mail:zhenhua.wang@hit.edu.cn

    通讯作者:

    沈毅  哈尔滨工业大学航天学院教授.主要研究方向为故障诊断, 飞行器控制, 超声信号处理.本文通信作者. E-mail: yishen_hit@126.com

Set-membership Fault Detection Observer Design in Finite-Frequency Domain for Linear Discrete-Time System

Funds: 

National Natural Science Foundation of China 61973098

National Natural Science Foundation of China 61773145

National Key Research and Development Program of China 2019YFC0117400

More Information
    Author Bio:

    LI Ji-Tao Ph.D. candidate at the School of Astronautics, Harbin Institute of Technology. His research interest covers fault diagnosis and fault-tolerant control based on interval analysis

    WANG Zhen-Hua Associate professor at the School of Astronautics, Harbin Institute of Technology. His research interest covers fault diagnosis and fault-tolerant control

    Corresponding author: SHEN Yi Professor at the School of Astronautics, Harbin Institute of Technology. His research interest covers fault diagnosis, flight vehicle control, and ultrasound signal processing. Corresponding author of this paper.
  • 摘要: 本文针对线性离散系统, 提出了一种新的有限频域执行器故障检测方法.利用中心对称多胞体近似未知扰动边界, 本文提出的中心对称多胞体集员故障检测观测器可实时估计残差范围.通过观测零点是否脱离残差生成的中心对称多胞体的范围, 判断故障是否发生.为了提高对干扰的鲁棒性和对故障的敏感性, 基于P半径准则和广义Kalman-Yakubovich-Popov引理, 本文给出了故障检测观测器的设计条件, 并将其转化为便于求解的矩阵不等式形式.最后, 车辆横向动态系统的仿真结果验证了所提方法的有效性.
    Recommended by Associate Editor MENG Fan-Li
  • 航空母舰搭载投放的舰载机是航母战斗群的核心攻防力量. 航母舰载机的着舰作业直接决定了航母舰载机的出动回收能力, 而舰载机的出动回收能力是影响整个航母编队作战效能的核心要素. 航母舰载机的着舰作业不同于陆上机场着陆, 需要借助拦阻系统进行拉制减速[1]. 现代中、大型航母一般设置有4道拦阻索, 第1道拦阻索位于距舰尾约50 m处, 每道拦阻索之间相隔12 ~ 18 m. 飞行员在着舰前放下尾钩, 着舰后驾驶舰载机滑行, 使尾钩在甲板上拖行. 理想状态下, 舰载机尾钩、主起落架三点同时着舰, 尾钩垂直钩住第2道或第3道拦阻索的中间区域. 然而海面上风、浪、流等环境因素造成航母航空甲板进行复杂不规则运动, 而甲板的运动又不可避免地导致舰载机的理想着舰点成为三维空间中的活动点, 影响舰载机着舰的精度, 增加着舰作业的难度, 威胁舰载机着舰的安全性. 仿真结果表明, 当理想着舰点上升或下沉幅度大于0.8 m时极易造成着舰失败或撞舰事故[2]. 为消除航母甲板运动对舰载机着舰的不利影响, 当舰载机接近触舰时, 应进行甲板运动预估(Deck motion prediction), 可将甲板运动信息提前引入着舰引导律信息中. 航母甲板运动预估是舰载机自动着舰系统的重要功能之一, 也是航母进行舰机安全协同作业的关键技术之一[3]. 根据甲板运动预估的结果, 舰载机能够跟踪甲板运动, 及时进行航迹纠偏, 减小着舰误差, 提高着舰安全性[4].

    舰船在海上航行和作业过程中, 受到海风、海浪、洋流等因素的影响, 船体会产生平移运动和摇荡运动[5]. 船体的平移运动包括横荡(Sway)、纵荡(Surge)和垂荡(Heave), 摇荡运动包括横摇(Roll)、纵摇(Pitch)和艏摇(Yaw), 共计6个自由度. 如图1所示, 横荡、纵荡和垂荡为沿三个坐标轴的直线运动, 横摇、纵摇和艏摇为绕三个坐标轴的旋转运动. 描述甲板平移运动时通常以“米 (m)”为单位, 描述甲板摇荡运动时通常以“度 (°)”为单位. 甲板横向运动和纵向运动之间的耦合影响很小, 从工程应用的角度研究甲板运动时, 一般在保证模型能够描述运动主要特性的基础上, 把不同状态的运动视为彼此独立的过程. 从机器学习的视角, 可将甲板运动预估问题定义如下:

    图 1  舰船平移运动及摇荡运动
    Fig. 1  The translational motion and swaying motion of a ship

    对于舰船在任意一个自由度上的运动, 假设在$ t $时刻已获得的历史运动状态可表示为 ${\boldsymbol{X}}(t) = \left[ {x(t),x(t - 1),\cdots,x(t - T + 1)} \right]$, 其中, $( t - T + 1 \sim t)$代表历史状态的时间窗口, $ T $为窗口内采样数据点的个数, $ x(t) $为$ t $时刻的描述运动状态的标量值. 从$ t $时刻起, 在接下来$ \left( {t + 1 \sim t + M} \right) $的时间窗口内, 甲板的运动状态可表示为${\boldsymbol{Y}}\left( t \right) = [ y\left( {t + 1} \right), y( t \;+ 2 ), \cdots ,y\left( {t + M} \right) ]$, 其中, $ y(t) $为$ t $时刻的描述运动状态的标量值, $M$为预估时间窗口的大小. 甲板运动预估的目标是找到一个函数$f:{\boldsymbol{X}}\left( t \right) \to {\boldsymbol{Y}}^\prime{\left( t \right) }$, 根据历史运动状态${\boldsymbol{X}}\left( t \right)$预估下一个时间窗口内的运动状态${\boldsymbol{Y}}^\prime{\left( t \right) }$. 损失函数可定义为

    $$ L = \frac{1}{M}\sum\limits_{i = 1}^M {\left\| {{\boldsymbol{Y}}\left( {t + i} \right) - {\boldsymbol{Y}}^\prime{{\left( {t + i} \right)}}} \right\|} _2^2 $$ (1)

    其中, ${\boldsymbol{Y}}^\prime{\left( {{t_i}} \right)} = \left[ {y^\prime{{\left( {{t_i} + 1} \right)} },y^\prime{{\left( {{t_i} + 2} \right)} }, \cdots ,y^\prime{{\left( {{t_i} + M} \right)} }} \right]$为$ \left( {{t_i} + 1\sim {t_i} + M} \right) $时间内的运动状态预估结果. 函数$f$即为甲板运动预估模型.

    目前甲板运动预估主要包括基于物理建模的方法和基于机器学习的方法. 在基于物理建模的方法中, 甲板的运动模型包括基于正弦波组合的运动模型、基于功率谱的运动模型和基于Conolly线性理论的运动模型[4]. 基于正弦波组合的运动模型将甲板运动合理假设为具有窄频带的平稳随机过程, 理论上可建模为不同的正弦波的叠加. 基于功率谱的运动模型将一定航速、航向和海情条件下运动的舰船视为一个线性定常系统, 可通过大量仿真实验得到功率谱密度函数, 并据此计算舰船运动成形滤波器的传递函数, 再通过成形滤波器得到舰船的运动状态. 基于Conolly线性理论的运动模型假设海浪具有各态历经性且海浪的波能谱满足 ITTC (International Towing Tank Conference) 单参数谱. 舰船在航行时, 可以把反映扰动力矩的波倾角(波浪表面与水平面间的夹角)信号作为舰船横滚和俯仰运动的输入信号, 把反映扰动力的波高信号作为舰船升沉运动的输入信号, 由能量法和海浪理论得到舰船的运动模型[6]. 基于物理建模的方法理论基础完备, 但对海况海情等条件有较为严格的要求, 通过仿真实验难以完全模拟复杂、多变的航行条件, 因此模型通用性不强, 尤其是在特殊环境下难以保证运动模型的有效性. 与基于物理建模的方法不同, 基于机器学习的方法是数据驱动的方法, 不需要建立舰船运动的理论模型, 而是根据当前及历史运动状态数据对未来的运动状态进行短周期预估. 据公开披露的文献中的报道, 这类方法主要包括: 1)时间序列分析法. 例如张永花等[6]、周鑫等[7]在设计的甲板运动补偿器中利用自回归模型进行甲板运动预估; Xue等[8]在无人机自动着舰系统中采用基于自回归的甲板运动预估方法. 2)基于神经网络的方法. 例如Nicolau等[9]、Liu等[10]、Li等[11]提出的基于神经网络的舰船运动状态预估模型. 3)基于滤波技术的方法. Sidar等[12]早在1983年就验证了卡尔曼滤波理论在舰船升沉运动预估中的有效性. 在后续的相关工作中, 卡尔曼滤波法常用于甲板运动的预估[13-14]; Zhen等[15-16]在其设计的自动着舰系统中采用基于粒子滤波的甲板运动预估方法. 除上述方法外, 还有一些其他方法, 例如伏尔特拉级数模型[17]、基于灰色系统理论(Grey system theory)的方法[18]等. 上述基于机器学习的方法在特定的场景和约束条件下能够取得良好的预估效果, 但存在如下局限性: 1)时间序列分析法适合于较短周期的预估, 预估精度受预估周期的影响较大. 2)真实海况海情往往不能满足卡尔曼滤波法关于模型线性和噪声约束. 3)早期的运动状态预估神经网络架构通常较为简单, 学习能力不强; 较复杂的网络架构又缺乏针对特殊应用场景的有效设计原则, 且训练效率低、调参难度大, 缺乏应对真实环境中噪声和非预知干扰因素的鲁棒性. 针对上述局限性, 本文提出一种面向甲板运动预估的鲁棒神经网络模型, 该模型能实现由数据驱动的自适应动态构建, 采用引入了鲁棒性约束的非梯度快速学习算法, 提高模型的训练效率和鲁棒性.

    本文提出一种面向甲板运动预估的鲁棒学习模型, 通过基本的学习器动态演化, 构建出子网络, 再将子网络作为更复杂的学习器, 演化出规模更大的学习系统. 学习器的训练采用非梯度的伪逆学习策略, 简化了学习控制超参数调优; 学习器的架构设计采用数据驱动的策略, 简化了架构超参数调优; 采用图拉普拉斯正则化方法, 提高了模型对噪声和非预知干扰因素的鲁棒性.

    本文所提预估模型的基本学习器具体实现为伪逆学习自编码器(Pseuodoinverse learning based autoencoder, PILAE)[19-21]. 伪逆学习自编码器本质上是一种单隐层前馈神经网络, 其采用的伪逆学习算法[22]是一种训练单隐层前馈神经网络的有监督学习算法, 基本思想是找到一组正交向量基将输入数据映射到隐层特征空间, 并利用非线性激活函数使得隐层神经元的输出向量趋向正交, 然后通过计算伪逆得到网络的输出权重的最优近似解.

    假设在一个有监督的学习问题中, 由$ N $个样本构成的训练集记为$D = \left\{ {{{\boldsymbol{x}}^i},{{\boldsymbol{o}}^i}} \right\}_{i = 1}^N$, 其中 ${{\boldsymbol{x}}^i} = ( {x_1}, {x_2},\cdots, {x_d} )^{\text{T}}\in {{\bf{R}}^d}$为第$ i $个$ d $维的训练样本, 与其对应的输出标签为${{\boldsymbol{o}}^i} = {\left( {{o_1},{o_2},\cdots,{o_m}} \right)^{\text{T}}} \in {{\bf{R}}^m}$. 以矩阵$ {\boldsymbol{X}} $表示训练数据, ${\boldsymbol{X}} = \left[ {{{\boldsymbol{x}}^1},{{\boldsymbol{x}}^2},\cdots,{{\boldsymbol{x}}^N}} \right] \in {{\bf{R}}^{d \times N}}$, 以矩阵$ {\boldsymbol{O}} $表示监督信息(自编码器中${\boldsymbol{O = X}}$), ${\boldsymbol{O}} = \left[ {{{\boldsymbol{o}}^1},{{\boldsymbol{o}}^2},\cdots,{{\boldsymbol{o}}^N}} \right] \in {{\bf{R}}^{m \times N}}.$ 对误差函数具有权重衰减正则化形式的单隐层网络, 不失一般性地假设网络输出权重矩阵$ {{\boldsymbol{W}}_o} $符合标准差为$ \sigma $的正态分布, 则训练网络的优化目标可定义为

    $$ \begin{split} J\left( {{{\boldsymbol{W}}_o}} \right) =\;& - \lg P\left( {{{\boldsymbol{W}}_o}|{\boldsymbol{X}}} \right)=- ( \lg P\left( {{\boldsymbol{X}}{\text{|}}{{\boldsymbol{W}}_o}} \right) \,+ \\ &\lg P\left( {{{\boldsymbol{W}}_o}} \right) - \lg P\left( {\boldsymbol{X}} \right) ) \end{split}$$ (2)

    根据平均场和变分推理理论, 假设数据集${\boldsymbol{X}}\sim {\rm N}\left( {\mu ,1} \right)$, 则有

    $$ \lg P({{\boldsymbol{W}}_o}) \approx - \frac{1}{{2{\sigma ^2}}}\sum\limits_i^{} {{{\left( {{\boldsymbol{W}}_o^{\left( i \right)}} \right)}^2}} $$ (3)
    $$ \lg P\left( {{{\boldsymbol{W}}_o}{\text{|}}{\boldsymbol{X}}} \right) \approx \frac{1}{2}\sum\limits_i^{} {{{\left( {{{\boldsymbol{W}}_o}\partial \left( {{{\boldsymbol{W}}_i}{{\boldsymbol{X}}_i}} \right) - {{\boldsymbol{X}}_i}} \right)}^2}} $$ (4)

    联合式(2) ~ (4)可得到优化目标的矩阵形式为

    $$ J\left( {\boldsymbol{W}} \right) = \frac{1}{2}\left\| {{{\boldsymbol{W}}_o}\partial \left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right) - {\boldsymbol{O}}} \right\|_2^2 + \frac{\lambda }{2}\left\| {\boldsymbol{W}} \right\|_2^2 $$ (5)

    式中, $ {\boldsymbol{W}} $为网络的连接权重矩阵, 包括输入权重和输出权重, 其中$ {{\boldsymbol{W}}_i} $代表输入权重矩阵, $ {{\boldsymbol{W}}_o} $代表输出权重矩阵, $\partial \left( \cdot \right)$为激活函数, $ \lambda $为权重衰减正则化($ {L_2} $范数)项系数. 伪逆学习算法中使用预设的初始输入权重矩阵$ {{\boldsymbol{W}}_i} $, 在具体实现上, 可通过具有低秩约束的截断奇异值分解(Truncated singular value decomposition, TSVD)得到[19-20]. 根据伪逆学习的基本思想, 目标函数的最优近似解析解作为输出权重, 即

    $${{\boldsymbol{W}}_o} = {\boldsymbol{O}}\partial {\left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right)^{\rm{T}}}{\left( {\partial \left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right)\partial {{\left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right)}^{\rm{T}}} + \lambda {\boldsymbol{I}}} \right)^{ - 1}} $$ (6)

    最后通过权重捆绑, 将输出权重$ {{\boldsymbol{W}}_o} $的转置作为最终的输入权重, 即${\boldsymbol W}'_i = {\boldsymbol{W}}_o^{\text{T}}$. 训练完成后, 通过前向传播实现特征抽取, 令输入数据$ {\boldsymbol{X}} $在隐层特征空间中的映射为矩阵$ {\boldsymbol{H}} $, 则${\boldsymbol{H}} = \partial ({{{\boldsymbol W}'_i}}{\boldsymbol{X}})$.

    为提高学习模型对真实、复杂环境中噪声和非预知干扰因素的鲁棒性, 除权重衰减正则化项之外, 本文在式(5)中引入雅克比正则化项[23]. 由于直接使用雅克比正则化会造成优化求解困难, 因此使用图拉普拉斯正则化对其进行近似[24-26]. 为此, 定义如下惩罚项:

    $$ P = T\left( {{\boldsymbol{\hat XL}}{{{\boldsymbol{\hat X}}}^{\text{T}}}} \right) $$ (7)

    其中, 函数$T\left( \cdot \right)$返回矩阵的秩, 矩阵${\boldsymbol{\hat X }}={{\boldsymbol{W}}_o}{\boldsymbol{H}}$为重构出的$ {\boldsymbol{X}} $, 矩阵$ {\boldsymbol{L}} = {\boldsymbol{D}} - {\boldsymbol{S}} $为拉普拉斯矩阵, 矩阵$ {\boldsymbol{S}} $为输入数据的相似度矩阵, 矩阵 $ {\boldsymbol{D}} $为按 $ {{\boldsymbol{D}}_{ii}} = \sum\nolimits_j^N {{s_{ij}}} $计算得到的对角阵. 式(5)定义的损失函数修改为

    $$ \begin{split} J\left( {\boldsymbol{W}} \right) =\;& \frac{1}{2}\left\| {{{\boldsymbol{W}}_o}\partial \left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right) - {\boldsymbol{O}}} \right\|_2^2 + \frac{\lambda }{2}\left\| {\boldsymbol{W}} \right\|_2^2 \,+ \\ &\eta T\left( {{{\boldsymbol{W}}_o}{\boldsymbol{HL}}{{\boldsymbol{H}}^{\text{T}}}{\boldsymbol{W}}_o^{\text{T}}} \right) \end{split}$$ (8)

    其中, $\eta $为图拉普拉斯正则化项系数. 根据式(8)可求得输出权重的最优近似解为

    $$ {{\boldsymbol{W}}_o} = {\boldsymbol{X}}{{\boldsymbol{H}}^{\rm{T}}}{\left( {{\boldsymbol{H}}{{\boldsymbol{H}}^{\rm{T}}} + \lambda {\boldsymbol{I}} + 2\eta {\boldsymbol{HL}}{\boldsymbol{H}^{\rm{T}}}} \right)^{ - 1}} $$ (9)

    使用伪逆学习自编码器作为基本学习器可以构建出多隐层网络. 具体而言, 采用逐层贪婪训练的策略, 逐层训练过的自编码器(去掉解码器)再堆叠为多层网络模型. 多层模型中前一层自编码器的隐层输出作为后一层自编码器的输入, 网络最后一层的输出可作为原始数据的高层抽象特征. 对于一个含有$l\,\,(l > 1)$个隐层的网络模型, 则有

    $$ \begin{split} {{\boldsymbol{H}}^{\left( l \right)}} =\;& \partial \left( {{\left( {{\boldsymbol{W}}_o^{\left( {l - 1} \right)}} \right)}^{\text{T}}} \cdots \partial \left( {{\left( {{\boldsymbol{W}}_o^{\left( 2 \right)}} \right)}^{\text{T}}}\,\,\times\right.\right.\\ &\left.\left.\partial \left( {{{\left( {{\boldsymbol{W}}_o^{\left( 1 \right)}} \right)}^{\text{T}}}{\boldsymbol{X}}} \right) \right) \cdots \right)\end{split} $$ (10)

    在甲板运动状态预估任务中, 可将输出的特征$ {{\boldsymbol{H}}^{\left( l \right)}} $作为回归器的输入. 回归器以有监督的方式进行训练.

    构建多层学习模型时, 需要确定每个隐层的神经元个数与学习模型的层数(即深度)两个架构超参数. 对于隐层神经元个数, 原始伪逆学习算法将其设置为训练样本个数. 但原始伪逆学习算法针对的是小数据集上的精确学习, 而本文中伪逆学习自编码器的目标是表征学习. 隐层神经元的个数过小会造成模型学习能力不足, 重构误差过大; 隐层神经元的个数过大则容易导致过拟合. 为此, 本文根据训练数据的维度和秩, 约减隐层神经元个数的超参数搜索空间. 具体而言, 可将隐层神经元的个数设置为大于训练样本的秩而小于样本维度[19], 这是规避欠拟合与过拟合风险的一种折中策略. 训练集的秩可在计算初始输入权重矩阵${{\boldsymbol{W}}_i}$的过程中得到, 不会增加额外的计算代价. 对于学习模型的层数, 可以采用动态生长的方式自适应地确定, 即先构建一个单隐层的学习模型, 然后逐渐增加层数. 如果添加一个隐层可以提高模型在验证集上的性能则以较大的概率继续添加新的隐层, 否则以较大的概率终止增加新的隐层. 通过上述方法可以较容易地获得一组较优的架构超参数, 在实际问题中可根据实际需要以此为基线再进行人工调优. 与同类工作[27-28]中的模型架构设计过程相比, 上述策略能够约减架构超参数的搜索空间, 简化架构超参数的调优.

    本文中多隐层网络用于从输入数据中学习高层特征. 在甲板运动预估问题中, 还需要在第$l$个隐层后添加一个回归器, 以多隐层网络学习到的特征作为输入, 以甲板运动状态的预测结果作为输出. 本文使用一个单隐层神经网络作为回归器. 该回归器同样可采用非梯度的伪逆学习算法以有监督的方式进行训练. 与伪逆学习自编码器的训练过程类似, 将式(9)中${\boldsymbol{X}}$替换为标记矩阵${\boldsymbol{O}} $, 得到回归器输出权重为

    $$\begin{split} {\boldsymbol{W}}_o^{\left( r \right)} =\;& {\boldsymbol{{{O}}}}{\left( {{{\boldsymbol{H}}^{\left( r \right)}}} \right)^{\rm{T}}}\left( {{\boldsymbol{H}}^{\left( r \right)}}{{\left( {{{\boldsymbol{H}}^{\left( r \right)}}} \right)}^{\rm{T}}} \,+\right.\\ &\left.\lambda {\boldsymbol{I}} + 2\eta {{\boldsymbol{H}}^{\left( r \right)}}{{\boldsymbol{L}}^{\left( r \right)}}{{\left( {{{\boldsymbol{H}}^{\left( r \right)}}} \right)}^{\rm{T}}} \right)^{ - 1} \end{split}$$ (11)

    其中, ${{\boldsymbol{H}}^{\left( r \right)}}$为回归器的隐层神经元输出矩阵, ${{\boldsymbol{L}}^{\left( r \right)}}$为根据${{\boldsymbol{H}}^{\left( r \right)}}$计算得到的拉普拉斯矩阵. 最终的甲板运动预估结果为${\boldsymbol{Y}} = {\boldsymbol{W}}_o^{\left( r \right)}{{\boldsymbol{H}}^{\left( r \right)}}$.

    为进一步提升模型的预估性能, 本文由一系列独立训练的多层自编码器网络构建更复杂的集成学习系统, 其架构如图2 所示, 其中的每个子模型都是一个基于自编码器构建的多隐层网络. 图中虚线方框内为一个基本的伪逆学习自编码器, 作为整个学习系统的基本构建单元. 训练子模型时通过bootstrap采样不同的数据子集, 既可以减少训练耗时又可以保证子模型之间的差异性. 所有子模型的预估结果通过加权平均进行集成以纠正单独子模型的学习错误, 提高学习系统的泛化性能. 每个子模型的权重与其在验证集上的预估误差成反比. 构建集成学习系统时采用与构建一个多隐层网络类似的动态生长方式, 即先构建一个只含有一个子模型的学习系统, 然后逐个添加新的子模型. 如果添加新的子模型可以提高学习系统在验证集上的性能, 则以较大的概率继续添加新的子模型, 否则以较大的概率终止训练.

    图 2  多个子模型集成学习系统架构
    Fig. 2  The architecture of the ensemble learning system with multiple sub-models

    甲板的运动一般可作为平稳随机过程处理, 本文在实验中采用工程中广泛使用的基于组合正弦波的甲板运动模型获取仿真数据, 再通过加入高斯随机噪声模拟航母甲板的运动过程. 仿真数据以某型航母30节 (kn)的典型航速巡航时, 在中等海况(有义波高1.25 ~ 2.5 m)条件下的场景为例, 选取与着舰安全密切相关的纵摇、横摇、垂荡三个自由度上的运动. 考虑到在着舰引导系统中, 如果能够提前10 ~ 13 s获取甲板运动状态并进行运动补偿, 则能够显著提升舰载机着舰安全性[3-4]. 因此, 实验中将运动状态预估窗口的大小设为15 s, 甲板历史运动状态采集窗口设定为50 s, 即通过过去50 s的甲板运动预估未来15 s的运动状态. 运动状态的采样频率为1 Hz, 仿真数据总时长为2800 s, 其中前500 s数据作为训练集, 第501 ~ 1000 s的数据用作验证集, 第1001 ~ 2800 s的数据作为测试集. 实验中学习模型的权重衰减正则化项系数$\lambda $和图拉普拉斯正则化项系数$\eta $分别设置为0.001和0.0001, 子模型训练集的采样率为0.7.

    4.2.1   鲁棒性分析

    为了验证本文所提方法在不同噪声等级下的性能, 在仿真数据中加入白高斯噪声, 定义了5种不同的噪声等级, 信噪比(Signal to noise ratio, SNR)分别为20, 15, 10, 5, 1. 不同噪声等级下的甲板纵摇、横摇、垂荡运动的预估结果分别如图3 ~ 5所示. 从预估结果可以看出, 本文所提方法在不同的噪声等级下均能够得到较为理想的预估结果, 证明了本文模型在甲板运动预估问题中的有效性. 图6 ~ 8为关于鲁棒性的消融实验结果. 图中实线为PILAE模型在不同噪声等级下预估结果的均方误差(Mean square error, MSE), 虚线代表引入图拉普拉斯正则化项的伪逆学习自编码器(Pseuodoinverse learning based autoencoder with graph Laplace, PILAE-Lap). 从实验结果可以看出, 随着信噪比降低, 模型的预估性能整体呈下降趋势, 但通过引入图拉普拉斯正则化项能够抑制噪声对预估效果的负面影响, 尤其是当信噪比小于10时, 针对鲁棒性进行优化后的模型PILAE-Lap的预估误差明显小于PILAE模型, 证明了引入图拉普拉斯正则化项能够有效地提高甲板预估模型对噪声的鲁棒性.

    图 3  不同信噪比下的甲板纵摇预估结果
    Fig. 3  The prediction results of deck pitch with different SNR
    图 5  不同信噪比下的甲板垂荡预估结果
    Fig. 5  The prediction results of deck heave with different SNR
    图 7  PILAE 与 PILAE-Lap 的甲板横摇预估结果对比
    Fig. 7  The deck roll prediction results comparison between PILAE and PILAE-Lap
    图 4  不同信噪比下的甲板横摇预估结果
    Fig. 4  The prediction results of deck roll with different SNR
    图 6  PILAE 与 PILAE-Lap 的甲板纵摇预估结果对比
    Fig. 6  The deck pitch prediction results comparison between PILAE and PILAE-Lap
    图 8  PILAE与PILAE-Lap的甲板垂荡预估结果对比
    Fig. 8  The deck heave prediction results comparison between PILAE and PILAE-Lap
    4.2.2   训练效率分析

    为了评估本文所提模型的训练效率, 对比了其与基线模型的训练耗时. 实验中的基线方法包括反向传播神经网络(Back propagation neural network, BPNN)和极限学习机(Extreme learning machine, ELM)两种基于神经网络的方法, 其中ELM同样采用了类似的非梯度学习算法. 不同于基线方法, 本文方法能够自动确定网络架构, 因此实验中基线方法采用与本文方法完全相同的网络架构, 以保证对比实验的公平性. 实验结果如图9所示. 从对比实验结果可以看出, 本文模型与ELM的训练耗时与BPNN相比具有明显的优势, 证明了非梯度学习算法的效率优于基于梯度下降的学习算法. 与ELM相比, 本文模型的训练耗时略长, 这是由于本文模型采用具有低秩约束的截断奇异值分解初始化输入层与隐层间的连接权重, 而ELM采用随机连接权重. 虽然ELM训练速度较快, 但随机连接权重的有效性难以保证, 某些情况下会导致泛化性能不佳.

    图 9  本文所提方法与其他方法的训练耗时对比
    Fig. 9  Training time comparison between our proposed method and others
    4.2.3   网络架构性能分析

    对于单个子模型, 实验中对比了本文所提方法生成的网络架构与手动设计的网络架构的性能. 具体而言, 首先通过网格搜索的策略得到网络架构超参数(隐层神经元个数与网络深度)与预估性能之间的关系, 再将本文所提方法自动确定的超参数映射到超参数空间中. 实验结果如图10所示, 从左到右分别为纵摇、横摇、垂荡的实验结果, 其中折线代表本文方法生成的网络架构. 可以看出, 本文方法得到的架构超参数接近最(较)优值. 对于由多个子模型组成的学习模型, 实验中分析了模型性能与子模型个数的关系. 实验结果如图11所示, 为便于显示, 纵轴为归一化后的预估误差. 可以看出, 采用多个子模型构建出集成学习系统能有效提升最终的预测性能. 以上两组实验结果证明了本文所提模型构建方法的有效性.

    图 10  本文方法生成的网络架构及运动预估性能
    Fig. 10  The network architectures generated by our proposed method and its motion prediction performance
    图 11  预估性能与子模型个数的关系
    Fig. 11  The prediction performance with different number of sub-model
    4.2.4   与同类工作对比

    表1为本文方法与公开报道的同类工作[10]在相同实验设置下的对比实验结果. 实验中基线方法包括反向传播神经网络(BPNN)、极限学习机(ELM)、带有粒子群优化的核极限学习机(Kernel extreme learning machine with particle swarm optimization, KELM-PSO)、基于卡尔曼滤波的方法(Kalman filter)和基于自回归的方法(Autoregression). 从实验结果可以看出, 本文方法的甲板纵摇和垂荡运动的预估效果明显优于其他基线算法, 横摇运动预估的均方误差大于BPNN, KELM-PSO和Autoregression, 小于ELM和Kalman filter, 但本文模型在超参数调优和网络架构设计方面具有优势.

    表 1  本文所提方法与其他方法的预测均方误差对比
    Table 1  Comparison of prediction MSE between our proposed method with others
    方法PitchRollHeave
    BPNN0.021 20.016 50.075 4
    ELM0.019 80.116 50.076 5
    KELM-PSO0.012 40.013 70.056 0
    Kalman filter0.022 40.573 70.026 1
    Autoregression0.006 60.016 80.020 8
    本文方法0.001 50.025 40.002 9
    注: 加粗字体表示各列最优结果.
    下载: 导出CSV 
    | 显示表格

    本文模型采用数据驱动的自适应动态构建策略, 与基于物理模型的方法相比, 不需要建立舰船运动的精确动力学模型, 而是根据当前及历史运动状态数据对未来的运动状态进行短周期预估, 具有更好的通用性. 与其他基于神经网络的方法相比, 本文模型采用的非梯度伪逆学习算法是误差正向传播, 并在传播的过程中根据数据的固有性质动态确定复杂网络的架构, 简化了模型超参数调试, 提高了训练速度, 且不要求激活函数可微. 另外, 与其他采用随机映射的非梯度学习算法相比, 本文方法采用输入数据的伪逆矩阵的截断奇异值分解作为正交投影算子, 能够抑制噪声中的不稳定特征, 再通过引入基于图拉普拉斯的正则化技术, 进一步提高模型鲁棒性.

    本文提出一种面向航空母舰甲板运动预估的鲁棒学习模型, 通过基本的伪逆自编码器逐层动态构建子网络, 再以分治策略通过子网络构建规模更大的学习模型. 模型的训练采用非梯度训练算法, 不仅能提高训练效率, 而且能简化网络架构设计. 通过采用基于图拉普拉斯的正则化方法, 有效提高了模型对噪声的鲁棒性. 通过某型航母在中等海况条件下以典型航速巡航时, 纵摇、横摇及垂荡运动预估的仿真对比实验, 验证了本文所提模型在航空母舰甲板运动预估问题中的有效性及鲁棒性.


  • 本文责任编委 孟凡利
  • 图  1  考虑有限频域特性的残差生成中心对称多胞体$ \mathcal{Z}_r $的变化过程

    Fig.  1  Zonotopes $ \mathcal{Z}_r $ generated by residual considering the finite-frequency characteristics

    图  2  考虑有限频域特性的故障检测结果

    Fig.  2  Result of fault detection by considering the finite-frequency characteristics

    图  3  不考虑有限频域特性的残差生成中心对称多胞体$ \mathcal{Z}_r $的变化过程

    Fig.  3  Zonotopes $ \mathcal{Z}_r $ generated by residual without considering the finite-frequency characteristics

    图  4  不考虑有限频域特性的故障检测结果

    Fig.  4  Result of fault detection without considering the finite-frequency characteristics

    图  5  本文的方法和文献[19]的方法所得残差r的变化过程

    Fig.  5  Residual r generated by the proposed method and the method in [19]

    图  6  本文方法和文献[19]方法所得故障到残差传递函数的最小奇异值和扰动到残差传递函数的最大奇异值的比值

    Fig.  6  Ratios of the minimum singular value of transfer function from fault to residual to the maximum singular value of transfer function from disturbance to residual by the the proposed method and the method in [19]

    表  1  集合$\Theta $与矩阵$\Xi $在不同频域的取值

    Table  1  $\Theta $ and $\Xi $ for different frequency ranges

    $\Theta $ $\Xi $
    低频 $|\theta | \le {\vartheta _1}$ $\left[ {\begin{array}{*{20}{c}} { - P}&Q\\ Q&{P - 2{\rm{cos}}{\vartheta _l}Q} \end{array}} \right]$
    中频 ${\vartheta _1} \le \theta \le {\vartheta _2}$ $\left[ {\begin{array}{*{20}{c}} { - P}&{{e^{j\theta }}cQ}\\ {{e^{ - j\theta c}}Q}&{P - 2{\rm{cos}}{\vartheta _w}Q} \end{array}} \right]$
    高频 $|\theta | \ge {\vartheta _h}$ $\left[ {\begin{array}{*{20}{c}} { - P}&{ - Q}\\ { - Q}&{P + 2{\rm{cos}}{\vartheta _h}Q} \end{array}} \right]$
    下载: 导出CSV
  • [1] Chen J, Patton R J. Robust Model-Based Fault Diagnosis for Dynamic Systems Norwell, MA, USA: Kluwer Academic Publishers, 1999.
    [2] Zhang K, Jiang B, Shi P. Observer-Based Fault Estimation and Accomodation for Dynamic Systems Berlin: Springer, 2012.
    [3] 周东华, 叶银忠.现代故障诊断与容错控制.北京:清华大学出版社, 2000.

    Zhou Dong-Hua, Ye Yin-Zhong. Modern Fault Diagnosis and Fault Tolerant Control Beijing: Tsinghua University Press, 2000.
    [4] 姜斌, 冒泽慧, 杨浩, 张友民.控制系统的故障诊断与故障调节.北京:国防工业出版社, 2009.

    Jiang Bin, Mao Ze-Hui, Yang Hao, Zhang You-Ming. Fault Diagnosis and Fault Accommodation for Control Systems Beijing: National Defend Industry Press, 2009.
    [5] 李岳炀, 钟麦英.具有多测量数据包丢失的线性离散时变系统故障检测滤波器设计.自动化学报, 2015, 41(9): 1638-1648 doi: 10.16383/j.aas.2015.c150075

    Li Yue-Yang, Zhong Mai-Ying. Fault detection filter design for linear discrete time-varying systems with multiple packet dropouts. Acta Automatica Sinica 2015, 41(9): 1638-1648 doi: 10.16383/j.aas.2015.c150075
    [6] Zhong M Y, Song Y, Ding S X. Parity space-based fault detection for linear discrete time-varying systems with unknown input. Automatica 2015, 59: 120-126 doi: 10.1016/j.automatica.2015.06.013
    [7] 汤文涛, 王振华, 王烨, 沈毅.基于未知输入集员滤波器的不确定系统故障诊断.自动化学报, 2018, 44(9): 1717-1724 doi: 10.16383/j.aas.2017.c170123

    Tang Wen-Tao, Wang Zhen-Hua, Wang Ye, Shen Yi. Fault diagnosis for uncertain systems based on unknown input set-membership filters. Acta Automatica Sinica 2018, 44(9): 1717-1724 doi: 10.16383/j.aas.2017.c170123
    [8] Xu F, Puig V, Ocampo-Martinez C, Stoican F, Olaru S. Actuator-fault detection and isolation based on set-theoretic approaches. Journal of Process Control 2014, 24(6): 947-956 doi: 10.1016/j.jprocont.2014.04.016
    [9] Xu F, Tan J B, Wang X Q, Puig V, Liang B, Yuan B, et al. Generalized set-theoretic unknown input observer for LPV systems with application to state estimation and robust fault detection. International Journal of Robust and Nonlinear Control 2017, 27(17): 3812-3832 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=a13fcaecedf66bfeba0f9263a713c33d
    [10] Wang Y, Zhou M, Puig V, Cembrano G, Wang Z H. Zonotopic fault detection observer with H_ performance. In: Proceedings of the 36th Chinese Control Conference. Dalian, China: IEEE, 2017. 7230-7235
    [11] Zhou M, Wang Z H, Shen Y, Shen M Q. H_/H fault detection observer design in finite-frequency domain for lipschitz non-linear systems. IET Control Theory and Applications 2017, 11(14): 2361-2369 doi: 10.1049/iet-cta.2017.0357
    [12] Liu J, Wang J L, Yang G H. An LMI approach to minimum sensitivity analysis with application to fault detection. Automatica 2005, 41(11): 1995-2004 doi: 10.1016/j.automatica.2005.06.005
    [13] Li X J, Yang G H. Fault detection in finite frequency domain for Takagi-Sugeno fuzzy systems with sensor faults. IEEE Transactions on Cybernetics 2014, 44(8): 1446-1458 doi: 10.1109/TCYB.2013.2286209
    [14] Iwasake T, Hara S. Generalized KYP lemma: unified frequency domain inequalities with design applications. IEEE Transactions on Automatic Control 2005, 50(1): 41-59 https://ieeexplore.ieee.org/document/1381647/
    [15] Li X J, Yang G H. Fault detection in finite frequency domains for multi-delay uncertain systems with application to ground vehicle. International Journal of Robust and Nonlinear Control 2015, 25(18): 3780-3798 doi: 10.1002/rnc.3296
    [16] Wang Z H, Shi P, Lim C C. H_/H fault detection observer in finite frequency domain for linear parameter-varying descriptor systems. Automatica 2017, 86: 38-45 doi: 10.1016/j.automatica.2017.08.021
    [17] Zhang K, Jiang B, Shi P, Xu J F. Analysis and design of robust H fault estimation observer with finite-frequency specifications for discrete-time fuzzy systems. IEEE Transactions on Cybernetics 2015, 45(7): 1225-1235 doi: 10.1109/TCYB.2014.2347697
    [18] Chen J L, Cao Y Y, Zhang W D. A fault detection observer design for LPV systems in finite frequency domain. International Journal of Control 2015, 88(3): 571-584 doi: 10.1080/00207179.2014.966326
    [19] Wang H, Yang G H. A finite frequency domain approach to fault detection for linear discrete-time systems. International Journal of Control 2008, 81(7): 1162-1171 doi: 10.1080/00207170701691513
    [20] Zhai D, An L W, Li J H, Zhang Q L. Finite frequency fault detection for T-S fuzzy singular multiple timedelay systems. International Journal of Control, Automation and Systems 2016, 14(4): 977-985 doi: 10.1007/s12555-014-0509-2
    [21] Le V T H, Stoica C, Alamo T, Camacho E F, Dumur D. Zonotopes: From Guaranteed State-Estimation to Control Hoboken, NJ: John Wiley & Sons, 2013. http://d.old.wanfangdata.com.cn/Periodical/kzllyyy200802018
    [22] Combastel C. Zonotopes and Kalman observers: gain optimality under distinct uncertainty paradigms and robust convergence. Automatica 2015, 55: 265-273 doi: 10.1016/j.automatica.2015.03.008
    [23] 李贤伟, 高会军.有限频域分析与设计的广义KYP引理方法综述.自动化学报, 2016, 42(11): 1605-1619 doi: 10.16383/j.aas.2016.c160303

    Li Xian-Wei, Gao Hui-Jun. An overview of generalized KYP lemma based methods for finite frequency analysis and design. Acta Automatica Sinica 2016, 42(11): 1605-1619 doi: 10.16383/j.aas.2016.c160303
    [24] 杨光红, 王恒, 李霄剑.基于模型的线性控制系统故障检测方法.北京:科学出版社, 2010.

    Yang Guang-Hong, Wang Heng, Li Xiao-Jian. Model Based Fault Detection Methods for Linear Control System Beijing: Science Press, 2010.
    [25] Le V T H, Stoica C, Alamo T, Camacho E F, Dumur D. Zonotopic guaranteed state estimation for uncertain systems. Automatica 2013, 49(11): 3418-3424 doi: 10.1016/j.automatica.2013.08.014
    [26] Varrier S, Koenig D, Martinez J J. Robust fault detection for uncertain unknown inputs LPV system. Control Engineering Practice 2014, 22: 125-134 doi: 10.1016/j.conengprac.2013.10.002
  • 加载中
  • 图(6) / 表(1)
    计量
    • 文章访问数:  1700
    • HTML全文浏览量:  257
    • PDF下载量:  217
    • 被引次数: 0
    出版历程
    • 收稿日期:  2017-12-25
    • 录用日期:  2018-05-30
    • 刊出日期:  2020-07-24

    目录

    /

    返回文章
    返回