2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种面向航空母舰甲板运动状态预估的鲁棒学习模型

王可 徐明亮 李亚飞 姜晓恒 鲁爱国 李鉴

王可, 徐明亮, 李亚飞, 姜晓恒, 鲁爱国, 李鉴. 一种面向航空母舰甲板运动状态预估的鲁棒学习模型. 自动化学报, 2024, 50(9): 1785−1793 doi: 10.16383/j.aas.c210664
引用本文: 王可, 徐明亮, 李亚飞, 姜晓恒, 鲁爱国, 李鉴. 一种面向航空母舰甲板运动状态预估的鲁棒学习模型. 自动化学报, 2024, 50(9): 1785−1793 doi: 10.16383/j.aas.c210664
Wang Ke, Xu Ming-Liang, Li Ya-Fei, Jiang Xiao-Heng, Lu Ai-Guo, Li Jian. A robust learning model for deck motion prediction of aircraft carrier. Acta Automatica Sinica, 2024, 50(9): 1785−1793 doi: 10.16383/j.aas.c210664
Citation: Wang Ke, Xu Ming-Liang, Li Ya-Fei, Jiang Xiao-Heng, Lu Ai-Guo, Li Jian. A robust learning model for deck motion prediction of aircraft carrier. Acta Automatica Sinica, 2024, 50(9): 1785−1793 doi: 10.16383/j.aas.c210664

一种面向航空母舰甲板运动状态预估的鲁棒学习模型

doi: 10.16383/j.aas.c210664 cstr: 32138.14.j.aas.c210664
基金项目: 国家自然科学基金 (62036010, 61972362, 61802351), 中国博士后科学基金 (2020M682348), 海洋防务技术创新中心创新基金 (JJ-2022-709-01), 河南省自然科学基金 (232300421235)资助
详细信息
    作者简介:

    王可:郑州大学计算机与人工智能学院讲师. 主要研究方向为基于计算智能的优化与学习. E-mail: iekwang@zzu.edu.cn

    徐明亮:郑州大学计算机与人工智能学院教授. 主要研究方向为计算机图形学, 人工智能. 本文通信作者. E-mail: iexumingliang@zzu.edu.cn

    李亚飞:郑州大学计算机与人工智能学院教授. 主要研究方向为群体智能与机器学习.E-mail: ieyfei@zzu.edu.cn

    姜晓恒:郑州大学计算机与人工智能学院副教授. 主要研究方向为深度学习, 机器视觉.E-mail: jiangxiaoheng@zzu.edu.cn

    鲁爱国:武汉数字工程研究所研究员. 主要研究方向为信息系统与软件, 人机交互.E-mail: aigwx@163.edu.com

    李鉴:武汉数字工程研究所研究员. 主要研究方向为信息系统与软件. E-mail: lij1015@sina.com

A Robust Learning Model for Deck Motion Prediction of Aircraft Carrier

Funds: Supported by National Natural Science Foundation of China (62036010, 61972362, 61802351), China Postdoctoral Science Foundation (2020M682348), Innovation Foundation of Ocean Defense Technology Innovation Center (JJ-2022-709-01), and Natural Science Foundation of Henan Province (232300421235)
More Information
    Author Bio:

    WANG Ke Lecturer at the School of Computer and Artificial Intelligence, Zhengzhou University. His research interest covers computational intelligence based optimization and learning

    XU Ming-Liang Professor at the School of Computer and Artificial Intelligence, Zhengzhou University. His research interest covers computer graphics and artificial intelligence. Corresponding author of this paper

    LI Ya-Fei Professor at the School of Computer and Artificial Intelligence, Zhengzhou University. His research interest covers swarm intelligence and machine learning

    JIANG Xiao-Heng Associate professor at the School of Computer and Artificial Intelligence, Zhengzhou University. His research interest covers deep learning and computer vision

    LU Ai-Guo Professor at Wuhan Digital Engineering Institute. His research interest covers information system and software, and human-computer interaction

    LI Jian Professor at Wuhan Digital Engineering Institute. His research interest covers information system and software

  • 摘要: 航母甲板在风、浪、流等因素影响下做六自由度不规则运动, 影响舰载机着舰精度. 航母甲板运动预估与补偿是自动着舰系统的重要功能之一, 也是提高舰载机着舰安全性与成功率的关键技术之一. 为此, 提出一种面向甲板运动预估的鲁棒学习模型, 通过基本构建单元自适应演化出复杂学习系统. 构建单元的训练采用非梯度的伪逆学习策略, 提高了训练效率, 简化了学习控制超参数调优; 构建单元的架构设计采用数据驱动的策略, 简化了架构超参数调优; 采用图拉普拉斯正则化方法提高了模型对噪声和意外扰动的鲁棒性. 通过某型航母在中等海况条件下以典型航速巡航时的仿真实验, 验证了所提方法在甲板纵摇、横摇以及垂荡运动预估问题中的有效性及鲁棒性.
  • 航空母舰搭载投放的舰载机是航母战斗群的核心攻防力量. 航母舰载机的着舰作业直接决定了航母舰载机的出动回收能力, 而舰载机的出动回收能力是影响整个航母编队作战效能的核心要素. 航母舰载机的着舰作业不同于陆上机场着陆, 需要借助拦阻系统进行拉制减速[1]. 现代中、大型航母一般设置有4道拦阻索, 第1道拦阻索位于距舰尾约50 m处, 每道拦阻索之间相隔12 ~ 18 m. 飞行员在着舰前放下尾钩, 着舰后驾驶舰载机滑行, 使尾钩在甲板上拖行. 理想状态下, 舰载机尾钩、主起落架三点同时着舰, 尾钩垂直钩住第2道或第3道拦阻索的中间区域. 然而海面上风、浪、流等环境因素造成航母航空甲板进行复杂不规则运动, 而甲板的运动又不可避免地导致舰载机的理想着舰点成为三维空间中的活动点, 影响舰载机着舰的精度, 增加着舰作业的难度, 威胁舰载机着舰的安全性. 仿真结果表明, 当理想着舰点上升或下沉幅度大于0.8 m时极易造成着舰失败或撞舰事故[2]. 为消除航母甲板运动对舰载机着舰的不利影响, 当舰载机接近触舰时, 应进行甲板运动预估(Deck motion prediction), 可将甲板运动信息提前引入着舰引导律信息中. 航母甲板运动预估是舰载机自动着舰系统的重要功能之一, 也是航母进行舰机安全协同作业的关键技术之一[3]. 根据甲板运动预估的结果, 舰载机能够跟踪甲板运动, 及时进行航迹纠偏, 减小着舰误差, 提高着舰安全性[4].

    舰船在海上航行和作业过程中, 受到海风、海浪、洋流等因素的影响, 船体会产生平移运动和摇荡运动[5]. 船体的平移运动包括横荡(Sway)、纵荡(Surge)和垂荡(Heave), 摇荡运动包括横摇(Roll)、纵摇(Pitch)和艏摇(Yaw), 共计6个自由度. 如图1所示, 横荡、纵荡和垂荡为沿三个坐标轴的直线运动, 横摇、纵摇和艏摇为绕三个坐标轴的旋转运动. 描述甲板平移运动时通常以“米 (m)”为单位, 描述甲板摇荡运动时通常以“度 (°)”为单位. 甲板横向运动和纵向运动之间的耦合影响很小, 从工程应用的角度研究甲板运动时, 一般在保证模型能够描述运动主要特性的基础上, 把不同状态的运动视为彼此独立的过程. 从机器学习的视角, 可将甲板运动预估问题定义如下:

    图 1  舰船平移运动及摇荡运动
    Fig. 1  The translational motion and swaying motion of a ship

    对于舰船在任意一个自由度上的运动, 假设在$ t $时刻已获得的历史运动状态可表示为 ${\boldsymbol{X}}(t) = \left[ {x(t),x(t - 1),\cdots,x(t - T + 1)} \right]$, 其中, $( t - T + 1 \sim t)$代表历史状态的时间窗口, $ T $为窗口内采样数据点的个数, $ x(t) $为$ t $时刻的描述运动状态的标量值. 从$ t $时刻起, 在接下来$ \left( {t + 1 \sim t + M} \right) $的时间窗口内, 甲板的运动状态可表示为${\boldsymbol{Y}}\left( t \right) = [ y\left( {t + 1} \right), y( t \;+ 2 ), \cdots ,y\left( {t + M} \right) ]$, 其中, $ y(t) $为$ t $时刻的描述运动状态的标量值, $M$为预估时间窗口的大小. 甲板运动预估的目标是找到一个函数$f:{\boldsymbol{X}}\left( t \right) \to {\boldsymbol{Y}}^\prime{\left( t \right) }$, 根据历史运动状态${\boldsymbol{X}}\left( t \right)$预估下一个时间窗口内的运动状态${\boldsymbol{Y}}^\prime{\left( t \right) }$. 损失函数可定义为

    $$ L = \frac{1}{M}\sum\limits_{i = 1}^M {\left\| {{\boldsymbol{Y}}\left( {t + i} \right) - {\boldsymbol{Y}}^\prime{{\left( {t + i} \right)}}} \right\|} _2^2 $$ (1)

    其中, ${\boldsymbol{Y}}^\prime{\left( {{t_i}} \right)} = \left[ {y^\prime{{\left( {{t_i} + 1} \right)} },y^\prime{{\left( {{t_i} + 2} \right)} }, \cdots ,y^\prime{{\left( {{t_i} + M} \right)} }} \right]$为$ \left( {{t_i} + 1\sim {t_i} + M} \right) $时间内的运动状态预估结果. 函数$f$即为甲板运动预估模型.

    目前甲板运动预估主要包括基于物理建模的方法和基于机器学习的方法. 在基于物理建模的方法中, 甲板的运动模型包括基于正弦波组合的运动模型、基于功率谱的运动模型和基于Conolly线性理论的运动模型[4]. 基于正弦波组合的运动模型将甲板运动合理假设为具有窄频带的平稳随机过程, 理论上可建模为不同的正弦波的叠加. 基于功率谱的运动模型将一定航速、航向和海情条件下运动的舰船视为一个线性定常系统, 可通过大量仿真实验得到功率谱密度函数, 并据此计算舰船运动成形滤波器的传递函数, 再通过成形滤波器得到舰船的运动状态. 基于Conolly线性理论的运动模型假设海浪具有各态历经性且海浪的波能谱满足 ITTC (International Towing Tank Conference) 单参数谱. 舰船在航行时, 可以把反映扰动力矩的波倾角(波浪表面与水平面间的夹角)信号作为舰船横滚和俯仰运动的输入信号, 把反映扰动力的波高信号作为舰船升沉运动的输入信号, 由能量法和海浪理论得到舰船的运动模型[6]. 基于物理建模的方法理论基础完备, 但对海况海情等条件有较为严格的要求, 通过仿真实验难以完全模拟复杂、多变的航行条件, 因此模型通用性不强, 尤其是在特殊环境下难以保证运动模型的有效性. 与基于物理建模的方法不同, 基于机器学习的方法是数据驱动的方法, 不需要建立舰船运动的理论模型, 而是根据当前及历史运动状态数据对未来的运动状态进行短周期预估. 据公开披露的文献中的报道, 这类方法主要包括: 1)时间序列分析法. 例如张永花等[6]、周鑫等[7]在设计的甲板运动补偿器中利用自回归模型进行甲板运动预估; Xue等[8]在无人机自动着舰系统中采用基于自回归的甲板运动预估方法. 2)基于神经网络的方法. 例如Nicolau等[9]、Liu等[10]、Li等[11]提出的基于神经网络的舰船运动状态预估模型. 3)基于滤波技术的方法. Sidar等[12]早在1983年就验证了卡尔曼滤波理论在舰船升沉运动预估中的有效性. 在后续的相关工作中, 卡尔曼滤波法常用于甲板运动的预估[13-14]; Zhen等[15-16]在其设计的自动着舰系统中采用基于粒子滤波的甲板运动预估方法. 除上述方法外, 还有一些其他方法, 例如伏尔特拉级数模型[17]、基于灰色系统理论(Grey system theory)的方法[18]等. 上述基于机器学习的方法在特定的场景和约束条件下能够取得良好的预估效果, 但存在如下局限性: 1)时间序列分析法适合于较短周期的预估, 预估精度受预估周期的影响较大. 2)真实海况海情往往不能满足卡尔曼滤波法关于模型线性和噪声约束. 3)早期的运动状态预估神经网络架构通常较为简单, 学习能力不强; 较复杂的网络架构又缺乏针对特殊应用场景的有效设计原则, 且训练效率低、调参难度大, 缺乏应对真实环境中噪声和非预知干扰因素的鲁棒性. 针对上述局限性, 本文提出一种面向甲板运动预估的鲁棒神经网络模型, 该模型能实现由数据驱动的自适应动态构建, 采用引入了鲁棒性约束的非梯度快速学习算法, 提高模型的训练效率和鲁棒性.

    本文提出一种面向甲板运动预估的鲁棒学习模型, 通过基本的学习器动态演化, 构建出子网络, 再将子网络作为更复杂的学习器, 演化出规模更大的学习系统. 学习器的训练采用非梯度的伪逆学习策略, 简化了学习控制超参数调优; 学习器的架构设计采用数据驱动的策略, 简化了架构超参数调优; 采用图拉普拉斯正则化方法, 提高了模型对噪声和非预知干扰因素的鲁棒性.

    本文所提预估模型的基本学习器具体实现为伪逆学习自编码器(Pseuodoinverse learning based autoencoder, PILAE)[19-21]. 伪逆学习自编码器本质上是一种单隐层前馈神经网络, 其采用的伪逆学习算法[22]是一种训练单隐层前馈神经网络的有监督学习算法, 基本思想是找到一组正交向量基将输入数据映射到隐层特征空间, 并利用非线性激活函数使得隐层神经元的输出向量趋向正交, 然后通过计算伪逆得到网络的输出权重的最优近似解.

    假设在一个有监督的学习问题中, 由$ N $个样本构成的训练集记为$D = \left\{ {{{\boldsymbol{x}}^i},{{\boldsymbol{o}}^i}} \right\}_{i = 1}^N$, 其中 ${{\boldsymbol{x}}^i} = ( {x_1}, {x_2},\cdots, {x_d} )^{\text{T}}\in {{\bf{R}}^d}$为第$ i $个$ d $维的训练样本, 与其对应的输出标签为${{\boldsymbol{o}}^i} = {\left( {{o_1},{o_2},\cdots,{o_m}} \right)^{\text{T}}} \in {{\bf{R}}^m}$. 以矩阵$ {\boldsymbol{X}} $表示训练数据, ${\boldsymbol{X}} = \left[ {{{\boldsymbol{x}}^1},{{\boldsymbol{x}}^2},\cdots,{{\boldsymbol{x}}^N}} \right] \in {{\bf{R}}^{d \times N}}$, 以矩阵$ {\boldsymbol{O}} $表示监督信息(自编码器中${\boldsymbol{O = X}}$), ${\boldsymbol{O}} = \left[ {{{\boldsymbol{o}}^1},{{\boldsymbol{o}}^2},\cdots,{{\boldsymbol{o}}^N}} \right] \in {{\bf{R}}^{m \times N}}.$ 对误差函数具有权重衰减正则化形式的单隐层网络, 不失一般性地假设网络输出权重矩阵$ {{\boldsymbol{W}}_o} $符合标准差为$ \sigma $的正态分布, 则训练网络的优化目标可定义为

    $$ \begin{split} J\left( {{{\boldsymbol{W}}_o}} \right) =\;& - \lg P\left( {{{\boldsymbol{W}}_o}|{\boldsymbol{X}}} \right)=- ( \lg P\left( {{\boldsymbol{X}}{\text{|}}{{\boldsymbol{W}}_o}} \right) \,+ \\ &\lg P\left( {{{\boldsymbol{W}}_o}} \right) - \lg P\left( {\boldsymbol{X}} \right) ) \end{split}$$ (2)

    根据平均场和变分推理理论, 假设数据集${\boldsymbol{X}}\sim {\rm N}\left( {\mu ,1} \right)$, 则有

    $$ \lg P({{\boldsymbol{W}}_o}) \approx - \frac{1}{{2{\sigma ^2}}}\sum\limits_i^{} {{{\left( {{\boldsymbol{W}}_o^{\left( i \right)}} \right)}^2}} $$ (3)
    $$ \lg P\left( {{{\boldsymbol{W}}_o}{\text{|}}{\boldsymbol{X}}} \right) \approx \frac{1}{2}\sum\limits_i^{} {{{\left( {{{\boldsymbol{W}}_o}\partial \left( {{{\boldsymbol{W}}_i}{{\boldsymbol{X}}_i}} \right) - {{\boldsymbol{X}}_i}} \right)}^2}} $$ (4)

    联合式(2) ~ (4)可得到优化目标的矩阵形式为

    $$ J\left( {\boldsymbol{W}} \right) = \frac{1}{2}\left\| {{{\boldsymbol{W}}_o}\partial \left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right) - {\boldsymbol{O}}} \right\|_2^2 + \frac{\lambda }{2}\left\| {\boldsymbol{W}} \right\|_2^2 $$ (5)

    式中, $ {\boldsymbol{W}} $为网络的连接权重矩阵, 包括输入权重和输出权重, 其中$ {{\boldsymbol{W}}_i} $代表输入权重矩阵, $ {{\boldsymbol{W}}_o} $代表输出权重矩阵, $\partial \left( \cdot \right)$为激活函数, $ \lambda $为权重衰减正则化($ {L_2} $范数)项系数. 伪逆学习算法中使用预设的初始输入权重矩阵$ {{\boldsymbol{W}}_i} $, 在具体实现上, 可通过具有低秩约束的截断奇异值分解(Truncated singular value decomposition, TSVD)得到[19-20]. 根据伪逆学习的基本思想, 目标函数的最优近似解析解作为输出权重, 即

    $${{\boldsymbol{W}}_o} = {\boldsymbol{O}}\partial {\left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right)^{\rm{T}}}{\left( {\partial \left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right)\partial {{\left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right)}^{\rm{T}}} + \lambda {\boldsymbol{I}}} \right)^{ - 1}} $$ (6)

    最后通过权重捆绑, 将输出权重$ {{\boldsymbol{W}}_o} $的转置作为最终的输入权重, 即${\boldsymbol W}'_i = {\boldsymbol{W}}_o^{\text{T}}$. 训练完成后, 通过前向传播实现特征抽取, 令输入数据$ {\boldsymbol{X}} $在隐层特征空间中的映射为矩阵$ {\boldsymbol{H}} $, 则${\boldsymbol{H}} = \partial ({{{\boldsymbol W}'_i}}{\boldsymbol{X}})$.

    为提高学习模型对真实、复杂环境中噪声和非预知干扰因素的鲁棒性, 除权重衰减正则化项之外, 本文在式(5)中引入雅克比正则化项[23]. 由于直接使用雅克比正则化会造成优化求解困难, 因此使用图拉普拉斯正则化对其进行近似[24-26]. 为此, 定义如下惩罚项:

    $$ P = T\left( {{\boldsymbol{\hat XL}}{{{\boldsymbol{\hat X}}}^{\text{T}}}} \right) $$ (7)

    其中, 函数$T\left( \cdot \right)$返回矩阵的秩, 矩阵${\boldsymbol{\hat X }}={{\boldsymbol{W}}_o}{\boldsymbol{H}}$为重构出的$ {\boldsymbol{X}} $, 矩阵$ {\boldsymbol{L}} = {\boldsymbol{D}} - {\boldsymbol{S}} $为拉普拉斯矩阵, 矩阵$ {\boldsymbol{S}} $为输入数据的相似度矩阵, 矩阵 $ {\boldsymbol{D}} $为按 $ {{\boldsymbol{D}}_{ii}} = \sum\nolimits_j^N {{s_{ij}}} $计算得到的对角阵. 式(5)定义的损失函数修改为

    $$ \begin{split} J\left( {\boldsymbol{W}} \right) =\;& \frac{1}{2}\left\| {{{\boldsymbol{W}}_o}\partial \left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right) - {\boldsymbol{O}}} \right\|_2^2 + \frac{\lambda }{2}\left\| {\boldsymbol{W}} \right\|_2^2 \,+ \\ &\eta T\left( {{{\boldsymbol{W}}_o}{\boldsymbol{HL}}{{\boldsymbol{H}}^{\text{T}}}{\boldsymbol{W}}_o^{\text{T}}} \right) \end{split}$$ (8)

    其中, $\eta $为图拉普拉斯正则化项系数. 根据式(8)可求得输出权重的最优近似解为

    $$ {{\boldsymbol{W}}_o} = {\boldsymbol{X}}{{\boldsymbol{H}}^{\rm{T}}}{\left( {{\boldsymbol{H}}{{\boldsymbol{H}}^{\rm{T}}} + \lambda {\boldsymbol{I}} + 2\eta {\boldsymbol{HL}}{\boldsymbol{H}^{\rm{T}}}} \right)^{ - 1}} $$ (9)

    使用伪逆学习自编码器作为基本学习器可以构建出多隐层网络. 具体而言, 采用逐层贪婪训练的策略, 逐层训练过的自编码器(去掉解码器)再堆叠为多层网络模型. 多层模型中前一层自编码器的隐层输出作为后一层自编码器的输入, 网络最后一层的输出可作为原始数据的高层抽象特征. 对于一个含有$l\,\,(l > 1)$个隐层的网络模型, 则有

    $$ \begin{split} {{\boldsymbol{H}}^{\left( l \right)}} =\;& \partial \left( {{\left( {{\boldsymbol{W}}_o^{\left( {l - 1} \right)}} \right)}^{\text{T}}} \cdots \partial \left( {{\left( {{\boldsymbol{W}}_o^{\left( 2 \right)}} \right)}^{\text{T}}}\,\,\times\right.\right.\\ &\left.\left.\partial \left( {{{\left( {{\boldsymbol{W}}_o^{\left( 1 \right)}} \right)}^{\text{T}}}{\boldsymbol{X}}} \right) \right) \cdots \right)\end{split} $$ (10)

    在甲板运动状态预估任务中, 可将输出的特征$ {{\boldsymbol{H}}^{\left( l \right)}} $作为回归器的输入. 回归器以有监督的方式进行训练.

    构建多层学习模型时, 需要确定每个隐层的神经元个数与学习模型的层数(即深度)两个架构超参数. 对于隐层神经元个数, 原始伪逆学习算法将其设置为训练样本个数. 但原始伪逆学习算法针对的是小数据集上的精确学习, 而本文中伪逆学习自编码器的目标是表征学习. 隐层神经元的个数过小会造成模型学习能力不足, 重构误差过大; 隐层神经元的个数过大则容易导致过拟合. 为此, 本文根据训练数据的维度和秩, 约减隐层神经元个数的超参数搜索空间. 具体而言, 可将隐层神经元的个数设置为大于训练样本的秩而小于样本维度[19], 这是规避欠拟合与过拟合风险的一种折中策略. 训练集的秩可在计算初始输入权重矩阵${{\boldsymbol{W}}_i}$的过程中得到, 不会增加额外的计算代价. 对于学习模型的层数, 可以采用动态生长的方式自适应地确定, 即先构建一个单隐层的学习模型, 然后逐渐增加层数. 如果添加一个隐层可以提高模型在验证集上的性能则以较大的概率继续添加新的隐层, 否则以较大的概率终止增加新的隐层. 通过上述方法可以较容易地获得一组较优的架构超参数, 在实际问题中可根据实际需要以此为基线再进行人工调优. 与同类工作[27-28]中的模型架构设计过程相比, 上述策略能够约减架构超参数的搜索空间, 简化架构超参数的调优.

    本文中多隐层网络用于从输入数据中学习高层特征. 在甲板运动预估问题中, 还需要在第$l$个隐层后添加一个回归器, 以多隐层网络学习到的特征作为输入, 以甲板运动状态的预测结果作为输出. 本文使用一个单隐层神经网络作为回归器. 该回归器同样可采用非梯度的伪逆学习算法以有监督的方式进行训练. 与伪逆学习自编码器的训练过程类似, 将式(9)中${\boldsymbol{X}}$替换为标记矩阵${\boldsymbol{O}} $, 得到回归器输出权重为

    $$\begin{split} {\boldsymbol{W}}_o^{\left( r \right)} =\;& {\boldsymbol{{{O}}}}{\left( {{{\boldsymbol{H}}^{\left( r \right)}}} \right)^{\rm{T}}}\left( {{\boldsymbol{H}}^{\left( r \right)}}{{\left( {{{\boldsymbol{H}}^{\left( r \right)}}} \right)}^{\rm{T}}} \,+\right.\\ &\left.\lambda {\boldsymbol{I}} + 2\eta {{\boldsymbol{H}}^{\left( r \right)}}{{\boldsymbol{L}}^{\left( r \right)}}{{\left( {{{\boldsymbol{H}}^{\left( r \right)}}} \right)}^{\rm{T}}} \right)^{ - 1} \end{split}$$ (11)

    其中, ${{\boldsymbol{H}}^{\left( r \right)}}$为回归器的隐层神经元输出矩阵, ${{\boldsymbol{L}}^{\left( r \right)}}$为根据${{\boldsymbol{H}}^{\left( r \right)}}$计算得到的拉普拉斯矩阵. 最终的甲板运动预估结果为${\boldsymbol{Y}} = {\boldsymbol{W}}_o^{\left( r \right)}{{\boldsymbol{H}}^{\left( r \right)}}$.

    为进一步提升模型的预估性能, 本文由一系列独立训练的多层自编码器网络构建更复杂的集成学习系统, 其架构如图2 所示, 其中的每个子模型都是一个基于自编码器构建的多隐层网络. 图中虚线方框内为一个基本的伪逆学习自编码器, 作为整个学习系统的基本构建单元. 训练子模型时通过bootstrap采样不同的数据子集, 既可以减少训练耗时又可以保证子模型之间的差异性. 所有子模型的预估结果通过加权平均进行集成以纠正单独子模型的学习错误, 提高学习系统的泛化性能. 每个子模型的权重与其在验证集上的预估误差成反比. 构建集成学习系统时采用与构建一个多隐层网络类似的动态生长方式, 即先构建一个只含有一个子模型的学习系统, 然后逐个添加新的子模型. 如果添加新的子模型可以提高学习系统在验证集上的性能, 则以较大的概率继续添加新的子模型, 否则以较大的概率终止训练.

    图 2  多个子模型集成学习系统架构
    Fig. 2  The architecture of the ensemble learning system with multiple sub-models

    甲板的运动一般可作为平稳随机过程处理, 本文在实验中采用工程中广泛使用的基于组合正弦波的甲板运动模型获取仿真数据, 再通过加入高斯随机噪声模拟航母甲板的运动过程. 仿真数据以某型航母30节 (kn)的典型航速巡航时, 在中等海况(有义波高1.25 ~ 2.5 m)条件下的场景为例, 选取与着舰安全密切相关的纵摇、横摇、垂荡三个自由度上的运动. 考虑到在着舰引导系统中, 如果能够提前10 ~ 13 s获取甲板运动状态并进行运动补偿, 则能够显著提升舰载机着舰安全性[3-4]. 因此, 实验中将运动状态预估窗口的大小设为15 s, 甲板历史运动状态采集窗口设定为50 s, 即通过过去50 s的甲板运动预估未来15 s的运动状态. 运动状态的采样频率为1 Hz, 仿真数据总时长为2800 s, 其中前500 s数据作为训练集, 第501 ~ 1000 s的数据用作验证集, 第1001 ~ 2800 s的数据作为测试集. 实验中学习模型的权重衰减正则化项系数$\lambda $和图拉普拉斯正则化项系数$\eta $分别设置为0.001和0.0001, 子模型训练集的采样率为0.7.

    4.2.1   鲁棒性分析

    为了验证本文所提方法在不同噪声等级下的性能, 在仿真数据中加入白高斯噪声, 定义了5种不同的噪声等级, 信噪比(Signal to noise ratio, SNR)分别为20, 15, 10, 5, 1. 不同噪声等级下的甲板纵摇、横摇、垂荡运动的预估结果分别如图3 ~ 5所示. 从预估结果可以看出, 本文所提方法在不同的噪声等级下均能够得到较为理想的预估结果, 证明了本文模型在甲板运动预估问题中的有效性. 图6 ~ 8为关于鲁棒性的消融实验结果. 图中实线为PILAE模型在不同噪声等级下预估结果的均方误差(Mean square error, MSE), 虚线代表引入图拉普拉斯正则化项的伪逆学习自编码器(Pseuodoinverse learning based autoencoder with graph Laplace, PILAE-Lap). 从实验结果可以看出, 随着信噪比降低, 模型的预估性能整体呈下降趋势, 但通过引入图拉普拉斯正则化项能够抑制噪声对预估效果的负面影响, 尤其是当信噪比小于10时, 针对鲁棒性进行优化后的模型PILAE-Lap的预估误差明显小于PILAE模型, 证明了引入图拉普拉斯正则化项能够有效地提高甲板预估模型对噪声的鲁棒性.

    图 3  不同信噪比下的甲板纵摇预估结果
    Fig. 3  The prediction results of deck pitch with different SNR
    图 5  不同信噪比下的甲板垂荡预估结果
    Fig. 5  The prediction results of deck heave with different SNR
    图 7  PILAE 与 PILAE-Lap 的甲板横摇预估结果对比
    Fig. 7  The deck roll prediction results comparison between PILAE and PILAE-Lap
    图 4  不同信噪比下的甲板横摇预估结果
    Fig. 4  The prediction results of deck roll with different SNR
    图 6  PILAE 与 PILAE-Lap 的甲板纵摇预估结果对比
    Fig. 6  The deck pitch prediction results comparison between PILAE and PILAE-Lap
    图 8  PILAE与PILAE-Lap的甲板垂荡预估结果对比
    Fig. 8  The deck heave prediction results comparison between PILAE and PILAE-Lap
    4.2.2   训练效率分析

    为了评估本文所提模型的训练效率, 对比了其与基线模型的训练耗时. 实验中的基线方法包括反向传播神经网络(Back propagation neural network, BPNN)和极限学习机(Extreme learning machine, ELM)两种基于神经网络的方法, 其中ELM同样采用了类似的非梯度学习算法. 不同于基线方法, 本文方法能够自动确定网络架构, 因此实验中基线方法采用与本文方法完全相同的网络架构, 以保证对比实验的公平性. 实验结果如图9所示. 从对比实验结果可以看出, 本文模型与ELM的训练耗时与BPNN相比具有明显的优势, 证明了非梯度学习算法的效率优于基于梯度下降的学习算法. 与ELM相比, 本文模型的训练耗时略长, 这是由于本文模型采用具有低秩约束的截断奇异值分解初始化输入层与隐层间的连接权重, 而ELM采用随机连接权重. 虽然ELM训练速度较快, 但随机连接权重的有效性难以保证, 某些情况下会导致泛化性能不佳.

    图 9  本文所提方法与其他方法的训练耗时对比
    Fig. 9  Training time comparison between our proposed method and others
    4.2.3   网络架构性能分析

    对于单个子模型, 实验中对比了本文所提方法生成的网络架构与手动设计的网络架构的性能. 具体而言, 首先通过网格搜索的策略得到网络架构超参数(隐层神经元个数与网络深度)与预估性能之间的关系, 再将本文所提方法自动确定的超参数映射到超参数空间中. 实验结果如图10所示, 从左到右分别为纵摇、横摇、垂荡的实验结果, 其中折线代表本文方法生成的网络架构. 可以看出, 本文方法得到的架构超参数接近最(较)优值. 对于由多个子模型组成的学习模型, 实验中分析了模型性能与子模型个数的关系. 实验结果如图11所示, 为便于显示, 纵轴为归一化后的预估误差. 可以看出, 采用多个子模型构建出集成学习系统能有效提升最终的预测性能. 以上两组实验结果证明了本文所提模型构建方法的有效性.

    图 10  本文方法生成的网络架构及运动预估性能
    Fig. 10  The network architectures generated by our proposed method and its motion prediction performance
    图 11  预估性能与子模型个数的关系
    Fig. 11  The prediction performance with different number of sub-model
    4.2.4   与同类工作对比

    表1为本文方法与公开报道的同类工作[10]在相同实验设置下的对比实验结果. 实验中基线方法包括反向传播神经网络(BPNN)、极限学习机(ELM)、带有粒子群优化的核极限学习机(Kernel extreme learning machine with particle swarm optimization, KELM-PSO)、基于卡尔曼滤波的方法(Kalman filter)和基于自回归的方法(Autoregression). 从实验结果可以看出, 本文方法的甲板纵摇和垂荡运动的预估效果明显优于其他基线算法, 横摇运动预估的均方误差大于BPNN, KELM-PSO和Autoregression, 小于ELM和Kalman filter, 但本文模型在超参数调优和网络架构设计方面具有优势.

    表 1  本文所提方法与其他方法的预测均方误差对比
    Table 1  Comparison of prediction MSE between our proposed method with others
    方法PitchRollHeave
    BPNN0.021 20.016 50.075 4
    ELM0.019 80.116 50.076 5
    KELM-PSO0.012 40.013 70.056 0
    Kalman filter0.022 40.573 70.026 1
    Autoregression0.006 60.016 80.020 8
    本文方法0.001 50.025 40.002 9
    注: 加粗字体表示各列最优结果.
    下载: 导出CSV 
    | 显示表格

    本文模型采用数据驱动的自适应动态构建策略, 与基于物理模型的方法相比, 不需要建立舰船运动的精确动力学模型, 而是根据当前及历史运动状态数据对未来的运动状态进行短周期预估, 具有更好的通用性. 与其他基于神经网络的方法相比, 本文模型采用的非梯度伪逆学习算法是误差正向传播, 并在传播的过程中根据数据的固有性质动态确定复杂网络的架构, 简化了模型超参数调试, 提高了训练速度, 且不要求激活函数可微. 另外, 与其他采用随机映射的非梯度学习算法相比, 本文方法采用输入数据的伪逆矩阵的截断奇异值分解作为正交投影算子, 能够抑制噪声中的不稳定特征, 再通过引入基于图拉普拉斯的正则化技术, 进一步提高模型鲁棒性.

    本文提出一种面向航空母舰甲板运动预估的鲁棒学习模型, 通过基本的伪逆自编码器逐层动态构建子网络, 再以分治策略通过子网络构建规模更大的学习模型. 模型的训练采用非梯度训练算法, 不仅能提高训练效率, 而且能简化网络架构设计. 通过采用基于图拉普拉斯的正则化方法, 有效提高了模型对噪声的鲁棒性. 通过某型航母在中等海况条件下以典型航速巡航时, 纵摇、横摇及垂荡运动预估的仿真对比实验, 验证了本文所提模型在航空母舰甲板运动预估问题中的有效性及鲁棒性.

  • 图  1  舰船平移运动及摇荡运动

    Fig.  1  The translational motion and swaying motion of a ship

    图  2  多个子模型集成学习系统架构

    Fig.  2  The architecture of the ensemble learning system with multiple sub-models

    图  3  不同信噪比下的甲板纵摇预估结果

    Fig.  3  The prediction results of deck pitch with different SNR

    图  5  不同信噪比下的甲板垂荡预估结果

    Fig.  5  The prediction results of deck heave with different SNR

    图  7  PILAE 与 PILAE-Lap 的甲板横摇预估结果对比

    Fig.  7  The deck roll prediction results comparison between PILAE and PILAE-Lap

    图  4  不同信噪比下的甲板横摇预估结果

    Fig.  4  The prediction results of deck roll with different SNR

    图  6  PILAE 与 PILAE-Lap 的甲板纵摇预估结果对比

    Fig.  6  The deck pitch prediction results comparison between PILAE and PILAE-Lap

    图  8  PILAE与PILAE-Lap的甲板垂荡预估结果对比

    Fig.  8  The deck heave prediction results comparison between PILAE and PILAE-Lap

    图  9  本文所提方法与其他方法的训练耗时对比

    Fig.  9  Training time comparison between our proposed method and others

    图  10  本文方法生成的网络架构及运动预估性能

    Fig.  10  The network architectures generated by our proposed method and its motion prediction performance

    图  11  预估性能与子模型个数的关系

    Fig.  11  The prediction performance with different number of sub-model

    表  1  本文所提方法与其他方法的预测均方误差对比

    Table  1  Comparison of prediction MSE between our proposed method with others

    方法PitchRollHeave
    BPNN0.021 20.016 50.075 4
    ELM0.019 80.116 50.076 5
    KELM-PSO0.012 40.013 70.056 0
    Kalman filter0.022 40.573 70.026 1
    Autoregression0.006 60.016 80.020 8
    本文方法0.001 50.025 40.002 9
    注: 加粗字体表示各列最优结果.
    下载: 导出CSV
  • [1] 甄子洋. 舰载无人机自主着舰回收制导与控制研究进展. 自动化学报, 2019, 45(4): 669−681

    Zhen Zi-Yang. Research development in autonomous carrier-landing/ship-recovery guidance and control of unmanned aerial vehicles. Acta Automatica Sinica, 2019, 45(4): 669−681
    [2] 石明, 屈香菊, 王萌辉. 甲板运动对舰载机人工着舰的影响和补偿. 飞行力学, 2006, 24(1): 5−8 doi: 10.3969/j.issn.1002-0853.2006.01.002

    Shi Ming, Qu Xiang-Ju, Wang Meng-Hui. The influence and compensation of deck motion in carrier landing approach. Flight Dynmics, 2006, 24(1): 5−8 doi: 10.3969/j.issn.1002-0853.2006.01.002
    [3] 张志冰, 甄子洋, 江驹, 薛艺璇. 舰载机自动着舰引导与控制综述. 南京航空航天大学学报, 2018, 50(6): 734−744

    Zhang Zhi-Bing, Zhen Zi-Yang, Jiang Ju, Xue Yi-Xuan. Review on development in guidance and control of automatic carrier landing of carrier-based aircraft. Journal of Nanjing University of Aeronautics and Astronautics, 2018, 50(6): 734−744
    [4] 江驹, 王新华, 甄子洋, 杨一栋, 袁锁中, 周鑫. 舰载机起飞着舰引导与控制. 北京: 科学出版社, 2019.

    Jiang Ju, Wang Xin-Hua, Zhen Zi-Yang, Yang Yi-Dong, Yuan Suo-Zhong, Zhou Xin. Guidance and Control of Carrier-Based Aircraft Launching and Landing. Beijing: Science Press, 2019.
    [5] 王能建, 刘钦辉, 李江, 商振. 舰载机出动回收能力仿真研究. 北京: 科学出版社, 2018.

    Wang Neng-Jian, Liu Qin-Hui, Li Jiang, Shang Zhen. Simulation on Ircraft Sortie Generation Rate. Beijing: Science Press, 2018.
    [6] 张永花, 周鑫. 舰载机着舰点垂直运动补偿技术仿真研究. 系统仿真学报, 2013, 25(4): 826−830

    Zhang Yong-Hua, Zhou Xin. Simulation study on landing point vertical motion in carrier landing. Journal of System Simulation, 2013, 25(4): 826−830
    [7] 周鑫, 彭荣鲲, 袁锁中. 舰载机理想着舰点垂直运动的预估与补偿. 航空学报, 2013, 34(7): 1663−1669

    Zhou Xin, Peng Rong-Kun, Yuan Suo-Zhong. Prediction and compensation for vertical motion of ideal touchdown point in carrier landing. Acta Aeronautica ET Astronautica Sinica, 2013, 34(7): 1663−1669
    [8] Xue Y X, Zhen Z Y, Yang L Q, Wen L D. Adaptive fault-tolerant control for carrier-based UAV with actuator failures. Aerospace Science and Technology, 2020, 107: Article No. 106227 doi: 10.1016/j.ast.2020.106227
    [9] Nicolau V, Aiordachioaie D, Popa R. Neural network prediction of the wave influence on the yaw motion of a ship. In: Proceedings of the IEEE International Joint Conference on Neural Networks. Budapest, Hungary: IEEE, 2004. 2801−2806
    [10] Liu X X, Wang Q M, Huang Y J, Song Q, Zhao L Y. A prediction method for deck motion of aircraft carrier based on particle swarm optimization and kernel extreme learning machine. Sensors and Materials, 2017, 29(9): 1291−1303
    [11] Li G Y, Kawan B, Wang H, Zhang H X. Neural-network-based modelling and analysis for time series prediction of ship motion. Ship Technology Research, 2017, 64(1): 30−39 doi: 10.1080/09377255.2017.1309786
    [12] Sidar M, Doolin B. On the feasibility of real-time prediction of aircraft carrier motion at sea. IEEE Transactions on Automatic Control, 1983, 28(3): 350−356 doi: 10.1109/TAC.1983.1103227
    [13] 邢伯阳, 潘峰, 王位, 冯肖雪. 基于复合地标导航的动平台四旋翼飞行器自主优化降落技术. 航空学报, 2019, 40(6): Article No. 322601

    Xing Bo-Yang, Pan Feng, Wang Wei, Feng Xiao-Xue. Moving platform self-optimization landing technology for quadrotor based on hybrid landmark. Acta Aeronautica et Astronautica Sinica, 2019, 40(6): Article No. 322601
    [14] Bhatia A K, Ju J, Kumar A, Shah S, Zhen Z Y. Adaptive preview control with deck motion compensation for autonomous carrier landing of an aircraft. International Journal of Adaptive Control Signal Processing, 2021, 35(5): 769−785 doi: 10.1002/acs.3228
    [15] Zhen Z Y, Jiang S Y, Ma K. Automatic carrier landing control for unmanned aerial vehicles based on preview control and particle filtering. Aerospace Science and Technology, 2018, 81: 99−107 doi: 10.1016/j.ast.2018.07.039
    [16] Zhen Z Y, Jiang S Y, Jiang J. Preview control and particle filtering for automatic carrier landing. IEEE Transactions on Aerospace and Electronic Systems, 2018, 54(6): 2662−2674 doi: 10.1109/TAES.2018.2826398
    [17] 杨柳, 徐东昊. 基于极短期运动预报的舰载机着舰过程仿真分析. 中国舰船研究, 2018, 13(4): 99−103

    Yang Liu, Xu Dong-Hao. Aircraft carrier landing process simulation based on extremely short-term prediction of ship motion. Chinese Journal of Ship Research, 2018, 13(4): 99−103
    [18] Yin J C, Zou Z J, Xu F, Wang N N. Online ship roll motion prediction based on grey sequential extreme learning machine. Neurocomputing, 2014, 129(10): 168−174
    [19] Wang K, Guo P, Xin X, Ye Z B. Autoencoder, low rank approximation and pseudoinverse learning algorithm. In: Proceedings of the IEEE International Conference on Systems, Man, and Cybernetics. Banff, Canada: IEEE, 2017. 948−953
    [20] Guo P, Wang K, Zhou X L. PILAE: A non-gradient descent learning scheme for deep feedforward neural networks [Online], available: https://arxiv.org/abs/1811.01545v3, November 9, 2021
    [21] Wang K, Guo P. An ensemble classification model with unsupervised representation learning for driving stress recognition using physiological signals. IEEE Transactions on Intelligent Transportation Systems, 2021, 22(6): 3303−3315 doi: 10.1109/TITS.2020.2980555
    [22] Guo P, Lv M R. A pseudoinverse learning algorithm for feedforward neural networks with stacked generalization applications to software reliability growth data. Neurocomputing, 2004, 56(1): 101−121
    [23] Rifai S, Vincent P, Muller X, Glorot X, Bengio Y. Contractive auto-encoders: Explicit invariance during feature extraction. In: Proceedings of the 28th International Conference on Machine Learning. Bellevue, Washington, USA: Omnipress, 2011. 833−840
    [24] Wang K, Guo P. A robust automated machine learning system with pseudoinverse learning. Cognitive Computation, 2021, 13(3): 724−735 doi: 10.1007/s12559-021-09853-6
    [25] Diallo B, Hu J, Li T R, Khan G A, Liang X Y, Zhao Y M. Deep embedding clustering based on contractive autoencoder. Neurocomputing, 2021, 433: 96−107 doi: 10.1016/j.neucom.2020.12.094
    [26] Wu E Q, Peng X Y, Zhang C Z, Lin J X, Sheng R S F. Pilots' fatigue status recognition using deep contractive autoencoder network. IEEE Transactions on Instrumentation and Measurement, 2019, 68(10): 3907−3919 doi: 10.1109/TIM.2018.2885608
    [27] 陈晓云, 陈媛. 子空间结构保持的多层极限学习机自编码器. 自动化学报, 2022, 48(4): 1091−1104

    Chen Xiao-Yun, Chen Yuan. Multi-layer extreme learning machine autoencoder with subspace structure preserving. Acta Automatica Sinica, 2022, 48(4): 1091−1104
    [28] 张万栋, 李庆忠, 黎明, 武庆明. 基于最优误差自校正极限学习机的高频地波雷达RD谱图海面目标检测算法. 自动化学报, 2021, 47(1): 108−120

    Zhang Wan-Dong, Li Qing-Zhong, Li Ming, Q. M. Jonathan Wu. Sea surface target detection for RD images of HFSWR based on optimized error self-adjustment extreme learning machine. Acta Automatica Sinica, 2021, 47(1): 108−120
  • 加载中
图(11) / 表(1)
计量
  • 文章访问数:  1338
  • HTML全文浏览量:  380
  • PDF下载量:  171
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-07-19
  • 网络出版日期:  2021-11-29
  • 刊出日期:  2024-09-19

目录

/

返回文章
返回