2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

具有拓扑切换特性的离散型不确定时空网络的指数同步

韩昌辉 葛连珺 高丽宇 吕翎

王可, 徐明亮, 李亚飞, 姜晓恒, 鲁爱国, 李鉴. 一种面向航空母舰甲板运动状态预估的鲁棒学习模型. 自动化学报, 2024, 50(9): 1785−1793 doi: 10.16383/j.aas.c210664
引用本文: 韩昌辉, 葛连珺, 高丽宇, 吕翎. 具有拓扑切换特性的离散型不确定时空网络的指数同步.自动化学报, 2021, 47(3): 706-714 doi: 10.16383/j.aas.c180575
Wang Ke, Xu Ming-Liang, Li Ya-Fei, Jiang Xiao-Heng, Lu Ai-Guo, Li Jian. A robust learning model for deck motion prediction of aircraft carrier. Acta Automatica Sinica, 2024, 50(9): 1785−1793 doi: 10.16383/j.aas.c210664
Citation: Han Chang-Hui, Ge Lian-Jun, Gao Li-Yu, Lv Ling. Exponential synchronization of discrete uncertain spatiotemporal networks with topology switching characteristics. Acta Automatica Sinica, 2021, 47(3): 706-714 doi: 10.16383/j.aas.c180575

具有拓扑切换特性的离散型不确定时空网络的指数同步

doi: 10.16383/j.aas.c180575
基金项目: 

国家自然科学基金 11747318

详细信息
    作者简介:

    韩昌辉  辽宁师范大学物理与电子技术学院硕士研究生. 2016年获得辽宁师范大学学士学位. 主要研究方向为复杂网络的变结构控制与网络同步. E-mail: lnnuhch@163.com

    葛连珺  辽宁师范大学物理与电子技术学院硕士研究生. 2016年获得渤海大学学士学位. 主要研究方向为复杂网络的开环闭环控制与同步. E-mail: 18742068500@163.com

    高丽宇  辽宁师范大学物理与电子技术学院硕士研究生. 2016年获得鞍山师范学院学士学位. 主要研究方向为复杂网络的滑模控制与网络同步. E-mail: 18742050326@163.com

    通讯作者:

    吕翎  辽宁师范大学物理与电子技术学院教授. 主要研究方向为复杂网络的同步控制与参数估计. 本文通信作者. E-mail: luling1960@aliyun.com

Exponential Synchronization of Discrete Uncertain Spatiotemporal Networks With Topology Switching Characteristics

Funds: 

National Natural Science Foundation of China 11747318

More Information
    Author Bio:

    HAN Chang-Hui  Master student at the School of Physics and Electronic Technology, Liaoning Normal University. He received his bachelor degree from Liaoning Normal University in 2016. His research interest covers variable structure control of complex network and network synchronization

    GE Lian-Jun  Master student at the School of Physics and Electronic Technology, Liaoning Normal University. She received her bachelor degree from Bohai University in 2016. Her research interest covers open-plus-closed-loop control and synchronization in complex network

    GAO Li-Yu  Master student at the School of Physics and Electronic Technology, Liaoning Normal University. She received her bachelor degree from Anshan Normal College in 2016. Her research interest covers sliding mode control of complex network and network synchronization

    Corresponding author: LV Ling  Professor at the School of Physics and Electronic Technology, Liaoning Normal University. Her research interest covers synchronization control and parameter estimation in complex network. Corresponding author of this paper
  • 摘要: 研究了具有拓扑切换特性的离散型不确定时空网络的指数同步问题. 基于稳定性理论, 构造了具有指数形式的Lyapunov函数, 并设计了同步控制器的结构方程, 进而获得了时空网络的同步条件. 同时, 我们设计了未知参数的识别律, 有效地识别了网络中的未知参数. 最后, 选取实际的激光相位共轭波空间扩展系统作为网络节点进行仿真模拟, 验证了同步方案的可行性与控制器的有效性. 通过构造具有指数形式的Lyapunov函数, 能够有效地调节网络的同步速率. 并且获得的同步条件中不包含网络的耦合矩阵项, 消除了拓扑切换特性对同步过程的影响, 使得网络同步性能更加稳定.
    Recommended by Associate Editor ZHANG Wei-Dong
  • 航空母舰搭载投放的舰载机是航母战斗群的核心攻防力量. 航母舰载机的着舰作业直接决定了航母舰载机的出动回收能力, 而舰载机的出动回收能力是影响整个航母编队作战效能的核心要素. 航母舰载机的着舰作业不同于陆上机场着陆, 需要借助拦阻系统进行拉制减速[1]. 现代中、大型航母一般设置有4道拦阻索, 第1道拦阻索位于距舰尾约50 m处, 每道拦阻索之间相隔12 ~ 18 m. 飞行员在着舰前放下尾钩, 着舰后驾驶舰载机滑行, 使尾钩在甲板上拖行. 理想状态下, 舰载机尾钩、主起落架三点同时着舰, 尾钩垂直钩住第2道或第3道拦阻索的中间区域. 然而海面上风、浪、流等环境因素造成航母航空甲板进行复杂不规则运动, 而甲板的运动又不可避免地导致舰载机的理想着舰点成为三维空间中的活动点, 影响舰载机着舰的精度, 增加着舰作业的难度, 威胁舰载机着舰的安全性. 仿真结果表明, 当理想着舰点上升或下沉幅度大于0.8 m时极易造成着舰失败或撞舰事故[2]. 为消除航母甲板运动对舰载机着舰的不利影响, 当舰载机接近触舰时, 应进行甲板运动预估(Deck motion prediction), 可将甲板运动信息提前引入着舰引导律信息中. 航母甲板运动预估是舰载机自动着舰系统的重要功能之一, 也是航母进行舰机安全协同作业的关键技术之一[3]. 根据甲板运动预估的结果, 舰载机能够跟踪甲板运动, 及时进行航迹纠偏, 减小着舰误差, 提高着舰安全性[4].

    舰船在海上航行和作业过程中, 受到海风、海浪、洋流等因素的影响, 船体会产生平移运动和摇荡运动[5]. 船体的平移运动包括横荡(Sway)、纵荡(Surge)和垂荡(Heave), 摇荡运动包括横摇(Roll)、纵摇(Pitch)和艏摇(Yaw), 共计6个自由度. 如图1所示, 横荡、纵荡和垂荡为沿三个坐标轴的直线运动, 横摇、纵摇和艏摇为绕三个坐标轴的旋转运动. 描述甲板平移运动时通常以“米 (m)”为单位, 描述甲板摇荡运动时通常以“度 (°)”为单位. 甲板横向运动和纵向运动之间的耦合影响很小, 从工程应用的角度研究甲板运动时, 一般在保证模型能够描述运动主要特性的基础上, 把不同状态的运动视为彼此独立的过程. 从机器学习的视角, 可将甲板运动预估问题定义如下:

    图 1  舰船平移运动及摇荡运动
    Fig. 1  The translational motion and swaying motion of a ship

    对于舰船在任意一个自由度上的运动, 假设在$ t $时刻已获得的历史运动状态可表示为 ${\boldsymbol{X}}(t) = \left[ {x(t),x(t - 1),\cdots,x(t - T + 1)} \right]$, 其中, $( t - T + 1 \sim t)$代表历史状态的时间窗口, $ T $为窗口内采样数据点的个数, $ x(t) $为$ t $时刻的描述运动状态的标量值. 从$ t $时刻起, 在接下来$ \left( {t + 1 \sim t + M} \right) $的时间窗口内, 甲板的运动状态可表示为${\boldsymbol{Y}}\left( t \right) = [ y\left( {t + 1} \right), y( t \;+ 2 ), \cdots ,y\left( {t + M} \right) ]$, 其中, $ y(t) $为$ t $时刻的描述运动状态的标量值, $M$为预估时间窗口的大小. 甲板运动预估的目标是找到一个函数$f:{\boldsymbol{X}}\left( t \right) \to {\boldsymbol{Y}}^\prime{\left( t \right) }$, 根据历史运动状态${\boldsymbol{X}}\left( t \right)$预估下一个时间窗口内的运动状态${\boldsymbol{Y}}^\prime{\left( t \right) }$. 损失函数可定义为

    $$ L = \frac{1}{M}\sum\limits_{i = 1}^M {\left\| {{\boldsymbol{Y}}\left( {t + i} \right) - {\boldsymbol{Y}}^\prime{{\left( {t + i} \right)}}} \right\|} _2^2 $$ (1)

    其中, ${\boldsymbol{Y}}^\prime{\left( {{t_i}} \right)} = \left[ {y^\prime{{\left( {{t_i} + 1} \right)} },y^\prime{{\left( {{t_i} + 2} \right)} }, \cdots ,y^\prime{{\left( {{t_i} + M} \right)} }} \right]$为$ \left( {{t_i} + 1\sim {t_i} + M} \right) $时间内的运动状态预估结果. 函数$f$即为甲板运动预估模型.

    目前甲板运动预估主要包括基于物理建模的方法和基于机器学习的方法. 在基于物理建模的方法中, 甲板的运动模型包括基于正弦波组合的运动模型、基于功率谱的运动模型和基于Conolly线性理论的运动模型[4]. 基于正弦波组合的运动模型将甲板运动合理假设为具有窄频带的平稳随机过程, 理论上可建模为不同的正弦波的叠加. 基于功率谱的运动模型将一定航速、航向和海情条件下运动的舰船视为一个线性定常系统, 可通过大量仿真实验得到功率谱密度函数, 并据此计算舰船运动成形滤波器的传递函数, 再通过成形滤波器得到舰船的运动状态. 基于Conolly线性理论的运动模型假设海浪具有各态历经性且海浪的波能谱满足 ITTC (International Towing Tank Conference) 单参数谱. 舰船在航行时, 可以把反映扰动力矩的波倾角(波浪表面与水平面间的夹角)信号作为舰船横滚和俯仰运动的输入信号, 把反映扰动力的波高信号作为舰船升沉运动的输入信号, 由能量法和海浪理论得到舰船的运动模型[6]. 基于物理建模的方法理论基础完备, 但对海况海情等条件有较为严格的要求, 通过仿真实验难以完全模拟复杂、多变的航行条件, 因此模型通用性不强, 尤其是在特殊环境下难以保证运动模型的有效性. 与基于物理建模的方法不同, 基于机器学习的方法是数据驱动的方法, 不需要建立舰船运动的理论模型, 而是根据当前及历史运动状态数据对未来的运动状态进行短周期预估. 据公开披露的文献中的报道, 这类方法主要包括: 1)时间序列分析法. 例如张永花等[6]、周鑫等[7]在设计的甲板运动补偿器中利用自回归模型进行甲板运动预估; Xue等[8]在无人机自动着舰系统中采用基于自回归的甲板运动预估方法. 2)基于神经网络的方法. 例如Nicolau等[9]、Liu等[10]、Li等[11]提出的基于神经网络的舰船运动状态预估模型. 3)基于滤波技术的方法. Sidar等[12]早在1983年就验证了卡尔曼滤波理论在舰船升沉运动预估中的有效性. 在后续的相关工作中, 卡尔曼滤波法常用于甲板运动的预估[13-14]; Zhen等[15-16]在其设计的自动着舰系统中采用基于粒子滤波的甲板运动预估方法. 除上述方法外, 还有一些其他方法, 例如伏尔特拉级数模型[17]、基于灰色系统理论(Grey system theory)的方法[18]等. 上述基于机器学习的方法在特定的场景和约束条件下能够取得良好的预估效果, 但存在如下局限性: 1)时间序列分析法适合于较短周期的预估, 预估精度受预估周期的影响较大. 2)真实海况海情往往不能满足卡尔曼滤波法关于模型线性和噪声约束. 3)早期的运动状态预估神经网络架构通常较为简单, 学习能力不强; 较复杂的网络架构又缺乏针对特殊应用场景的有效设计原则, 且训练效率低、调参难度大, 缺乏应对真实环境中噪声和非预知干扰因素的鲁棒性. 针对上述局限性, 本文提出一种面向甲板运动预估的鲁棒神经网络模型, 该模型能实现由数据驱动的自适应动态构建, 采用引入了鲁棒性约束的非梯度快速学习算法, 提高模型的训练效率和鲁棒性.

    本文提出一种面向甲板运动预估的鲁棒学习模型, 通过基本的学习器动态演化, 构建出子网络, 再将子网络作为更复杂的学习器, 演化出规模更大的学习系统. 学习器的训练采用非梯度的伪逆学习策略, 简化了学习控制超参数调优; 学习器的架构设计采用数据驱动的策略, 简化了架构超参数调优; 采用图拉普拉斯正则化方法, 提高了模型对噪声和非预知干扰因素的鲁棒性.

    本文所提预估模型的基本学习器具体实现为伪逆学习自编码器(Pseuodoinverse learning based autoencoder, PILAE)[19-21]. 伪逆学习自编码器本质上是一种单隐层前馈神经网络, 其采用的伪逆学习算法[22]是一种训练单隐层前馈神经网络的有监督学习算法, 基本思想是找到一组正交向量基将输入数据映射到隐层特征空间, 并利用非线性激活函数使得隐层神经元的输出向量趋向正交, 然后通过计算伪逆得到网络的输出权重的最优近似解.

    假设在一个有监督的学习问题中, 由$ N $个样本构成的训练集记为$D = \left\{ {{{\boldsymbol{x}}^i},{{\boldsymbol{o}}^i}} \right\}_{i = 1}^N$, 其中 ${{\boldsymbol{x}}^i} = ( {x_1}, {x_2},\cdots, {x_d} )^{\text{T}}\in {{\bf{R}}^d}$为第$ i $个$ d $维的训练样本, 与其对应的输出标签为${{\boldsymbol{o}}^i} = {\left( {{o_1},{o_2},\cdots,{o_m}} \right)^{\text{T}}} \in {{\bf{R}}^m}$. 以矩阵$ {\boldsymbol{X}} $表示训练数据, ${\boldsymbol{X}} = \left[ {{{\boldsymbol{x}}^1},{{\boldsymbol{x}}^2},\cdots,{{\boldsymbol{x}}^N}} \right] \in {{\bf{R}}^{d \times N}}$, 以矩阵$ {\boldsymbol{O}} $表示监督信息(自编码器中${\boldsymbol{O = X}}$), ${\boldsymbol{O}} = \left[ {{{\boldsymbol{o}}^1},{{\boldsymbol{o}}^2},\cdots,{{\boldsymbol{o}}^N}} \right] \in {{\bf{R}}^{m \times N}}.$ 对误差函数具有权重衰减正则化形式的单隐层网络, 不失一般性地假设网络输出权重矩阵$ {{\boldsymbol{W}}_o} $符合标准差为$ \sigma $的正态分布, 则训练网络的优化目标可定义为

    $$ \begin{split} J\left( {{{\boldsymbol{W}}_o}} \right) =\;& - \lg P\left( {{{\boldsymbol{W}}_o}|{\boldsymbol{X}}} \right)=- ( \lg P\left( {{\boldsymbol{X}}{\text{|}}{{\boldsymbol{W}}_o}} \right) \,+ \\ &\lg P\left( {{{\boldsymbol{W}}_o}} \right) - \lg P\left( {\boldsymbol{X}} \right) ) \end{split}$$ (2)

    根据平均场和变分推理理论, 假设数据集${\boldsymbol{X}}\sim {\rm N}\left( {\mu ,1} \right)$, 则有

    $$ \lg P({{\boldsymbol{W}}_o}) \approx - \frac{1}{{2{\sigma ^2}}}\sum\limits_i^{} {{{\left( {{\boldsymbol{W}}_o^{\left( i \right)}} \right)}^2}} $$ (3)
    $$ \lg P\left( {{{\boldsymbol{W}}_o}{\text{|}}{\boldsymbol{X}}} \right) \approx \frac{1}{2}\sum\limits_i^{} {{{\left( {{{\boldsymbol{W}}_o}\partial \left( {{{\boldsymbol{W}}_i}{{\boldsymbol{X}}_i}} \right) - {{\boldsymbol{X}}_i}} \right)}^2}} $$ (4)

    联合式(2) ~ (4)可得到优化目标的矩阵形式为

    $$ J\left( {\boldsymbol{W}} \right) = \frac{1}{2}\left\| {{{\boldsymbol{W}}_o}\partial \left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right) - {\boldsymbol{O}}} \right\|_2^2 + \frac{\lambda }{2}\left\| {\boldsymbol{W}} \right\|_2^2 $$ (5)

    式中, $ {\boldsymbol{W}} $为网络的连接权重矩阵, 包括输入权重和输出权重, 其中$ {{\boldsymbol{W}}_i} $代表输入权重矩阵, $ {{\boldsymbol{W}}_o} $代表输出权重矩阵, $\partial \left( \cdot \right)$为激活函数, $ \lambda $为权重衰减正则化($ {L_2} $范数)项系数. 伪逆学习算法中使用预设的初始输入权重矩阵$ {{\boldsymbol{W}}_i} $, 在具体实现上, 可通过具有低秩约束的截断奇异值分解(Truncated singular value decomposition, TSVD)得到[19-20]. 根据伪逆学习的基本思想, 目标函数的最优近似解析解作为输出权重, 即

    $${{\boldsymbol{W}}_o} = {\boldsymbol{O}}\partial {\left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right)^{\rm{T}}}{\left( {\partial \left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right)\partial {{\left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right)}^{\rm{T}}} + \lambda {\boldsymbol{I}}} \right)^{ - 1}} $$ (6)

    最后通过权重捆绑, 将输出权重$ {{\boldsymbol{W}}_o} $的转置作为最终的输入权重, 即${\boldsymbol W}'_i = {\boldsymbol{W}}_o^{\text{T}}$. 训练完成后, 通过前向传播实现特征抽取, 令输入数据$ {\boldsymbol{X}} $在隐层特征空间中的映射为矩阵$ {\boldsymbol{H}} $, 则${\boldsymbol{H}} = \partial ({{{\boldsymbol W}'_i}}{\boldsymbol{X}})$.

    为提高学习模型对真实、复杂环境中噪声和非预知干扰因素的鲁棒性, 除权重衰减正则化项之外, 本文在式(5)中引入雅克比正则化项[23]. 由于直接使用雅克比正则化会造成优化求解困难, 因此使用图拉普拉斯正则化对其进行近似[24-26]. 为此, 定义如下惩罚项:

    $$ P = T\left( {{\boldsymbol{\hat XL}}{{{\boldsymbol{\hat X}}}^{\text{T}}}} \right) $$ (7)

    其中, 函数$T\left( \cdot \right)$返回矩阵的秩, 矩阵${\boldsymbol{\hat X }}={{\boldsymbol{W}}_o}{\boldsymbol{H}}$为重构出的$ {\boldsymbol{X}} $, 矩阵$ {\boldsymbol{L}} = {\boldsymbol{D}} - {\boldsymbol{S}} $为拉普拉斯矩阵, 矩阵$ {\boldsymbol{S}} $为输入数据的相似度矩阵, 矩阵 $ {\boldsymbol{D}} $为按 $ {{\boldsymbol{D}}_{ii}} = \sum\nolimits_j^N {{s_{ij}}} $计算得到的对角阵. 式(5)定义的损失函数修改为

    $$ \begin{split} J\left( {\boldsymbol{W}} \right) =\;& \frac{1}{2}\left\| {{{\boldsymbol{W}}_o}\partial \left( {{{\boldsymbol{W}}_i}{\boldsymbol{X}}} \right) - {\boldsymbol{O}}} \right\|_2^2 + \frac{\lambda }{2}\left\| {\boldsymbol{W}} \right\|_2^2 \,+ \\ &\eta T\left( {{{\boldsymbol{W}}_o}{\boldsymbol{HL}}{{\boldsymbol{H}}^{\text{T}}}{\boldsymbol{W}}_o^{\text{T}}} \right) \end{split}$$ (8)

    其中, $\eta $为图拉普拉斯正则化项系数. 根据式(8)可求得输出权重的最优近似解为

    $$ {{\boldsymbol{W}}_o} = {\boldsymbol{X}}{{\boldsymbol{H}}^{\rm{T}}}{\left( {{\boldsymbol{H}}{{\boldsymbol{H}}^{\rm{T}}} + \lambda {\boldsymbol{I}} + 2\eta {\boldsymbol{HL}}{\boldsymbol{H}^{\rm{T}}}} \right)^{ - 1}} $$ (9)

    使用伪逆学习自编码器作为基本学习器可以构建出多隐层网络. 具体而言, 采用逐层贪婪训练的策略, 逐层训练过的自编码器(去掉解码器)再堆叠为多层网络模型. 多层模型中前一层自编码器的隐层输出作为后一层自编码器的输入, 网络最后一层的输出可作为原始数据的高层抽象特征. 对于一个含有$l\,\,(l > 1)$个隐层的网络模型, 则有

    $$ \begin{split} {{\boldsymbol{H}}^{\left( l \right)}} =\;& \partial \left( {{\left( {{\boldsymbol{W}}_o^{\left( {l - 1} \right)}} \right)}^{\text{T}}} \cdots \partial \left( {{\left( {{\boldsymbol{W}}_o^{\left( 2 \right)}} \right)}^{\text{T}}}\,\,\times\right.\right.\\ &\left.\left.\partial \left( {{{\left( {{\boldsymbol{W}}_o^{\left( 1 \right)}} \right)}^{\text{T}}}{\boldsymbol{X}}} \right) \right) \cdots \right)\end{split} $$ (10)

    在甲板运动状态预估任务中, 可将输出的特征$ {{\boldsymbol{H}}^{\left( l \right)}} $作为回归器的输入. 回归器以有监督的方式进行训练.

    构建多层学习模型时, 需要确定每个隐层的神经元个数与学习模型的层数(即深度)两个架构超参数. 对于隐层神经元个数, 原始伪逆学习算法将其设置为训练样本个数. 但原始伪逆学习算法针对的是小数据集上的精确学习, 而本文中伪逆学习自编码器的目标是表征学习. 隐层神经元的个数过小会造成模型学习能力不足, 重构误差过大; 隐层神经元的个数过大则容易导致过拟合. 为此, 本文根据训练数据的维度和秩, 约减隐层神经元个数的超参数搜索空间. 具体而言, 可将隐层神经元的个数设置为大于训练样本的秩而小于样本维度[19], 这是规避欠拟合与过拟合风险的一种折中策略. 训练集的秩可在计算初始输入权重矩阵${{\boldsymbol{W}}_i}$的过程中得到, 不会增加额外的计算代价. 对于学习模型的层数, 可以采用动态生长的方式自适应地确定, 即先构建一个单隐层的学习模型, 然后逐渐增加层数. 如果添加一个隐层可以提高模型在验证集上的性能则以较大的概率继续添加新的隐层, 否则以较大的概率终止增加新的隐层. 通过上述方法可以较容易地获得一组较优的架构超参数, 在实际问题中可根据实际需要以此为基线再进行人工调优. 与同类工作[27-28]中的模型架构设计过程相比, 上述策略能够约减架构超参数的搜索空间, 简化架构超参数的调优.

    本文中多隐层网络用于从输入数据中学习高层特征. 在甲板运动预估问题中, 还需要在第$l$个隐层后添加一个回归器, 以多隐层网络学习到的特征作为输入, 以甲板运动状态的预测结果作为输出. 本文使用一个单隐层神经网络作为回归器. 该回归器同样可采用非梯度的伪逆学习算法以有监督的方式进行训练. 与伪逆学习自编码器的训练过程类似, 将式(9)中${\boldsymbol{X}}$替换为标记矩阵${\boldsymbol{O}} $, 得到回归器输出权重为

    $$\begin{split} {\boldsymbol{W}}_o^{\left( r \right)} =\;& {\boldsymbol{{{O}}}}{\left( {{{\boldsymbol{H}}^{\left( r \right)}}} \right)^{\rm{T}}}\left( {{\boldsymbol{H}}^{\left( r \right)}}{{\left( {{{\boldsymbol{H}}^{\left( r \right)}}} \right)}^{\rm{T}}} \,+\right.\\ &\left.\lambda {\boldsymbol{I}} + 2\eta {{\boldsymbol{H}}^{\left( r \right)}}{{\boldsymbol{L}}^{\left( r \right)}}{{\left( {{{\boldsymbol{H}}^{\left( r \right)}}} \right)}^{\rm{T}}} \right)^{ - 1} \end{split}$$ (11)

    其中, ${{\boldsymbol{H}}^{\left( r \right)}}$为回归器的隐层神经元输出矩阵, ${{\boldsymbol{L}}^{\left( r \right)}}$为根据${{\boldsymbol{H}}^{\left( r \right)}}$计算得到的拉普拉斯矩阵. 最终的甲板运动预估结果为${\boldsymbol{Y}} = {\boldsymbol{W}}_o^{\left( r \right)}{{\boldsymbol{H}}^{\left( r \right)}}$.

    为进一步提升模型的预估性能, 本文由一系列独立训练的多层自编码器网络构建更复杂的集成学习系统, 其架构如图2 所示, 其中的每个子模型都是一个基于自编码器构建的多隐层网络. 图中虚线方框内为一个基本的伪逆学习自编码器, 作为整个学习系统的基本构建单元. 训练子模型时通过bootstrap采样不同的数据子集, 既可以减少训练耗时又可以保证子模型之间的差异性. 所有子模型的预估结果通过加权平均进行集成以纠正单独子模型的学习错误, 提高学习系统的泛化性能. 每个子模型的权重与其在验证集上的预估误差成反比. 构建集成学习系统时采用与构建一个多隐层网络类似的动态生长方式, 即先构建一个只含有一个子模型的学习系统, 然后逐个添加新的子模型. 如果添加新的子模型可以提高学习系统在验证集上的性能, 则以较大的概率继续添加新的子模型, 否则以较大的概率终止训练.

    图 2  多个子模型集成学习系统架构
    Fig. 2  The architecture of the ensemble learning system with multiple sub-models

    甲板的运动一般可作为平稳随机过程处理, 本文在实验中采用工程中广泛使用的基于组合正弦波的甲板运动模型获取仿真数据, 再通过加入高斯随机噪声模拟航母甲板的运动过程. 仿真数据以某型航母30节 (kn)的典型航速巡航时, 在中等海况(有义波高1.25 ~ 2.5 m)条件下的场景为例, 选取与着舰安全密切相关的纵摇、横摇、垂荡三个自由度上的运动. 考虑到在着舰引导系统中, 如果能够提前10 ~ 13 s获取甲板运动状态并进行运动补偿, 则能够显著提升舰载机着舰安全性[3-4]. 因此, 实验中将运动状态预估窗口的大小设为15 s, 甲板历史运动状态采集窗口设定为50 s, 即通过过去50 s的甲板运动预估未来15 s的运动状态. 运动状态的采样频率为1 Hz, 仿真数据总时长为2800 s, 其中前500 s数据作为训练集, 第501 ~ 1000 s的数据用作验证集, 第1001 ~ 2800 s的数据作为测试集. 实验中学习模型的权重衰减正则化项系数$\lambda $和图拉普拉斯正则化项系数$\eta $分别设置为0.001和0.0001, 子模型训练集的采样率为0.7.

    4.2.1   鲁棒性分析

    为了验证本文所提方法在不同噪声等级下的性能, 在仿真数据中加入白高斯噪声, 定义了5种不同的噪声等级, 信噪比(Signal to noise ratio, SNR)分别为20, 15, 10, 5, 1. 不同噪声等级下的甲板纵摇、横摇、垂荡运动的预估结果分别如图3 ~ 5所示. 从预估结果可以看出, 本文所提方法在不同的噪声等级下均能够得到较为理想的预估结果, 证明了本文模型在甲板运动预估问题中的有效性. 图6 ~ 8为关于鲁棒性的消融实验结果. 图中实线为PILAE模型在不同噪声等级下预估结果的均方误差(Mean square error, MSE), 虚线代表引入图拉普拉斯正则化项的伪逆学习自编码器(Pseuodoinverse learning based autoencoder with graph Laplace, PILAE-Lap). 从实验结果可以看出, 随着信噪比降低, 模型的预估性能整体呈下降趋势, 但通过引入图拉普拉斯正则化项能够抑制噪声对预估效果的负面影响, 尤其是当信噪比小于10时, 针对鲁棒性进行优化后的模型PILAE-Lap的预估误差明显小于PILAE模型, 证明了引入图拉普拉斯正则化项能够有效地提高甲板预估模型对噪声的鲁棒性.

    图 3  不同信噪比下的甲板纵摇预估结果
    Fig. 3  The prediction results of deck pitch with different SNR
    图 5  不同信噪比下的甲板垂荡预估结果
    Fig. 5  The prediction results of deck heave with different SNR
    图 7  PILAE 与 PILAE-Lap 的甲板横摇预估结果对比
    Fig. 7  The deck roll prediction results comparison between PILAE and PILAE-Lap
    图 4  不同信噪比下的甲板横摇预估结果
    Fig. 4  The prediction results of deck roll with different SNR
    图 6  PILAE 与 PILAE-Lap 的甲板纵摇预估结果对比
    Fig. 6  The deck pitch prediction results comparison between PILAE and PILAE-Lap
    图 8  PILAE与PILAE-Lap的甲板垂荡预估结果对比
    Fig. 8  The deck heave prediction results comparison between PILAE and PILAE-Lap
    4.2.2   训练效率分析

    为了评估本文所提模型的训练效率, 对比了其与基线模型的训练耗时. 实验中的基线方法包括反向传播神经网络(Back propagation neural network, BPNN)和极限学习机(Extreme learning machine, ELM)两种基于神经网络的方法, 其中ELM同样采用了类似的非梯度学习算法. 不同于基线方法, 本文方法能够自动确定网络架构, 因此实验中基线方法采用与本文方法完全相同的网络架构, 以保证对比实验的公平性. 实验结果如图9所示. 从对比实验结果可以看出, 本文模型与ELM的训练耗时与BPNN相比具有明显的优势, 证明了非梯度学习算法的效率优于基于梯度下降的学习算法. 与ELM相比, 本文模型的训练耗时略长, 这是由于本文模型采用具有低秩约束的截断奇异值分解初始化输入层与隐层间的连接权重, 而ELM采用随机连接权重. 虽然ELM训练速度较快, 但随机连接权重的有效性难以保证, 某些情况下会导致泛化性能不佳.

    图 9  本文所提方法与其他方法的训练耗时对比
    Fig. 9  Training time comparison between our proposed method and others
    4.2.3   网络架构性能分析

    对于单个子模型, 实验中对比了本文所提方法生成的网络架构与手动设计的网络架构的性能. 具体而言, 首先通过网格搜索的策略得到网络架构超参数(隐层神经元个数与网络深度)与预估性能之间的关系, 再将本文所提方法自动确定的超参数映射到超参数空间中. 实验结果如图10所示, 从左到右分别为纵摇、横摇、垂荡的实验结果, 其中折线代表本文方法生成的网络架构. 可以看出, 本文方法得到的架构超参数接近最(较)优值. 对于由多个子模型组成的学习模型, 实验中分析了模型性能与子模型个数的关系. 实验结果如图11所示, 为便于显示, 纵轴为归一化后的预估误差. 可以看出, 采用多个子模型构建出集成学习系统能有效提升最终的预测性能. 以上两组实验结果证明了本文所提模型构建方法的有效性.

    图 10  本文方法生成的网络架构及运动预估性能
    Fig. 10  The network architectures generated by our proposed method and its motion prediction performance
    图 11  预估性能与子模型个数的关系
    Fig. 11  The prediction performance with different number of sub-model
    4.2.4   与同类工作对比

    表1为本文方法与公开报道的同类工作[10]在相同实验设置下的对比实验结果. 实验中基线方法包括反向传播神经网络(BPNN)、极限学习机(ELM)、带有粒子群优化的核极限学习机(Kernel extreme learning machine with particle swarm optimization, KELM-PSO)、基于卡尔曼滤波的方法(Kalman filter)和基于自回归的方法(Autoregression). 从实验结果可以看出, 本文方法的甲板纵摇和垂荡运动的预估效果明显优于其他基线算法, 横摇运动预估的均方误差大于BPNN, KELM-PSO和Autoregression, 小于ELM和Kalman filter, 但本文模型在超参数调优和网络架构设计方面具有优势.

    表 1  本文所提方法与其他方法的预测均方误差对比
    Table 1  Comparison of prediction MSE between our proposed method with others
    方法PitchRollHeave
    BPNN0.021 20.016 50.075 4
    ELM0.019 80.116 50.076 5
    KELM-PSO0.012 40.013 70.056 0
    Kalman filter0.022 40.573 70.026 1
    Autoregression0.006 60.016 80.020 8
    本文方法0.001 50.025 40.002 9
    注: 加粗字体表示各列最优结果.
    下载: 导出CSV 
    | 显示表格

    本文模型采用数据驱动的自适应动态构建策略, 与基于物理模型的方法相比, 不需要建立舰船运动的精确动力学模型, 而是根据当前及历史运动状态数据对未来的运动状态进行短周期预估, 具有更好的通用性. 与其他基于神经网络的方法相比, 本文模型采用的非梯度伪逆学习算法是误差正向传播, 并在传播的过程中根据数据的固有性质动态确定复杂网络的架构, 简化了模型超参数调试, 提高了训练速度, 且不要求激活函数可微. 另外, 与其他采用随机映射的非梯度学习算法相比, 本文方法采用输入数据的伪逆矩阵的截断奇异值分解作为正交投影算子, 能够抑制噪声中的不稳定特征, 再通过引入基于图拉普拉斯的正则化技术, 进一步提高模型鲁棒性.

    本文提出一种面向航空母舰甲板运动预估的鲁棒学习模型, 通过基本的伪逆自编码器逐层动态构建子网络, 再以分治策略通过子网络构建规模更大的学习模型. 模型的训练采用非梯度训练算法, 不仅能提高训练效率, 而且能简化网络架构设计. 通过采用基于图拉普拉斯的正则化方法, 有效提高了模型对噪声的鲁棒性. 通过某型航母在中等海况条件下以典型航速巡航时, 纵摇、横摇及垂荡运动预估的仿真对比实验, 验证了本文所提模型在航空母舰甲板运动预估问题中的有效性及鲁棒性.


  • 本文责任编委 张卫东
  • 图  1  状态变量$x(m, n)$的时空演化

    Fig.  1  Spatiotemporal evolution of state variable $x(m, n)$

    图  2  拓扑切换信号$s(n)$

    Fig.  2  The topology switching signal $s(n)$

    图  3  4种切换拓扑结构图

    Fig.  3  Four switching topologies

    图  4  误差$e_1(m, n)$随时空的演化

    Fig.  4  Spatiotemporal evolution of error $e_1(m, n)$

    图  5  误差$e_2(m, n)$随时空的演化

    Fig.  5  Spatiotemporal evolution of error $e_2(m, n)$

    图  6  误差$e_3\, (m, n)$随时空的演化

    Fig.  6  Spatiotemporal evolution of error $e_3\, (m, n)$

    图  7  误差$e_4(m, n)$随时空的演化

    Fig.  7  Spatiotemporal evolution of error $e_4(m, n)$

    图  8  误差$e_5(m, n)$随时空的演化

    Fig.  8  Spatiotemporal evolution of error $e_5(m, n)$

    图  9  误差$e_6(m, n)$随时空的演化

    Fig.  9  Spatiotemporal evolution of error $e_6(m, n)$

    图  10  误差$e_7(m, n)$随时空的演化

    Fig.  10  Spatiotemporal evolution of error $e_7(m, n)$

    图  11  未知参数$\varepsilon_1(m, n)$随时空的演化

    Fig.  11  Spatiotemporal evolution of unknown parameter $\varepsilon_1(m, n)$

    图  12  未知参数$\varepsilon_2(m, n)$随时空的演化

    Fig.  12  Spatiotemporal evolution of unknown parameter $\varepsilon_2(m, n)$

    图  13  未知参数$\varepsilon_3\, (m, n)$随时空的演化

    Fig.  13  Spatiotemporal evolution of unknown parameter $\varepsilon_3\, (m, n)$

    图  14  未知参数$\varepsilon_4(m, n)$随时空的演化

    Fig.  14  Spatiotemporal evolution of unknown parameter $\varepsilon_4(m, n)$

    图  15  未知参数$\varepsilon_5(m, n)$随时空的演化

    Fig.  15  Spatiotemporal evolution of unknown parameter $\varepsilon_5(m, n)$

    图  16  未知参数$\varepsilon_6(m, n)$随时空的演化

    Fig.  16  Spatiotemporal evolution of unknown parameter $\varepsilon_6(m, n)$

    图  17  未知参数$\varepsilon_7(m, n)$随时空的演化

    Fig.  17  Spatiotemporal evolution of unknown parameter $\varepsilon_7(m, n)$

  • [1] Xu X F, Zong G D, Hou L L. Passivity-based stabilization and passive synchronization of complex nonlinear networks. Neurocomputing, 2016, 175: 101-109 doi: 10.1016/j.neucom.2015.10.040
    [2] Wang F, Yang Y Q, Hu M F, Xu X Y. Projective cluster synchronization of fractional-order coupled-delay complex network via adaptive pinning control. Physica A, 2015, 434: 134-143 doi: 10.1016/j.physa.2015.03.089
    [3] Xu Y H, Zhou W N, Fang J A, Xie C R, Tong D B. Finite-time synchronization of the complex dynamical network with non-derivative and derivative coupling. Neurocomputing, 2016, 173: 1356-1361 doi: 10.1016/j.neucom.2015.09.008
    [4] Wu H Q, Wang L F, Niu P F, Wang Y. Global projective synchronization in finite time of nonidentical fractionalorder neural networks based on sliding mode control strategy. Neurocomputing, 2017, 235: 264-273 doi: 10.1016/j.neucom.2017.01.022
    [5] Anbuvithya R, Mathiyalagan K, Sakthivel R, PrakashP. Non-fragile synchronization of memristive BAM networks with random feedback gain fluctuations. Communications in Nonlinear Science and Numerical Simulation, 2015, 29: 427-440 doi: 10.1016/j.cnsns.2015.05.020
    [6] Yang Y, Wang Y, Li T Z. Outer synchronization of fractional-order complex dynamical networks. Optik, 2016, 127: 7395-7407 doi: 10.1016/j.ijleo.2016.05.029
    [7] Wang S G, Zheng S, Zhang B W, Cao H T. Modified function projective lag synchronization of uncertaincomplex networks with time-varying coupling strength. Optik, 2016, 127: 4716-4725 doi: 10.1016/j.ijleo.2016.01.085
    [8] Chandrasekar A, Rakkiyappan R. Impulsive controller design for exponential synchronization of delayed stochastic memristor-based recurrent neural networks. Neurocomputing, 2016, 173: 1348-1355 doi: 10.1016/j.neucom.2015.08.088
    [9] Srinivasan K, Chandrasekar V K, Gladwin P R, Murali K, Lakshmanan M. Different types of synchronization in coupled network based chaotic circuits. Communications in Nonlinear Science and Numerical Simulation, 2016, 39: 156-168 doi: 10.1016/j.cnsns.2016.03.002
    [10] Zhai S D. Modulus synchronization in a network of nonlinear systems with antagonistic interactions and switching topologies. Communications in Nonlinear Science and Numerical Simulation, 2016, 33: 184-193 doi: 10.1016/j.cnsns.2015.09.010
    [11] Wang X, Yang G H. Distributed H$_\infty$ consensus tracking control for multi-agent networks with switching directed topologies. Neurocomputing, 2016, 207: 693-699 doi: 10.1016/j.neucom.2016.05.052
    [12] Fan J B, Wang Z X, Jiang G P. Quasi-synchronization of heterogeneous complex networks with switching sequentially disconnected topology. Neurocomputing, 2017, 237: 342-349 doi: 10.1016/j.neucom.2017.01.025
    [13] Dai A D, Zhou W N, Xu Y H, Xiao C. Adaptive exponential synchronization in mean square for Markovian jumping neutral-type coupled neural networks with time-varying delays by pinning control. Neurocomputing, 2016, 173: 809-818 doi: 10.1016/j.neucom.2015.08.034
    [14] Zhang Q J, Chen G R, Wan L. Exponential synchronization of discrete-time impulsive dynamical networks with time-varying delays and stochastic disturbances. Neurocomputing, 2018, 309: 62-69 doi: 10.1016/j.neucom.2018.04.070
    [15] Sakthivel R, Sathishkumar M, Kaviarasan B, Marshal Anthoni S. Synchronization and state estimation for stochastic complex networks with uncertain inner coupling. Neurocomputing, 2017, 238: 44-45 doi: 10.1016/j.neucom.2017.01.035
    [16] Cheng R R, Peng M S, Zuo J. Pinning synchronization of discrete dynamical networks with delay coupling. Physica A, 2016, 450: 444-453 doi: 10.1016/j.physa.2016.01.004
    [17] Mohammadzadeh A, Ghaemi S. A modified sliding mode approach for synchronization of fractional-order chaotic/hype- rchaotic systems by using new self-structuring hierarchical type-2 fuzzy neural network. Neurocomputing, 2016, 191: 200-213 doi: 10.1016/j.neucom.2015.12.098
    [18] Zhao L, Jia Y M. Neural network-based distributed adaptive attitude synchronization control of spacecraft formation under modified fast terminal sliding mode. Neurocomputing, 2016, 171: 230-241 doi: 10.1016/j.neucom.2015.06.063
    [19] Yang L X, Jiang J, Liu X J. Synchronization of fractional-order colored dynamical networks via open-plus-closed-loop control. Physica A, 2016, 443: 200-211 doi: 10.1016/j.physa.2015.09.062
    [20] Fan Y Q, Xing K Y, Wang Y H, Wang L Y. Projective synchronization adaptive control for different chaoticneural networks with mixed time delays. Optik, 2016, 127: 2551-2557 doi: 10.1016/j.ijleo.2015.11.227
    [21] Li J M, He C, Zhang W Y, Chen M L. Adaptive synchronization of delayed reaction-diffusion neural networks with unknown non-identical time-varying coupling strengths. Neurocomputing, 2017, 219: 144-153 doi: 10.1016/j.neucom.2016.09.006
    [22] Ahmed M A A, Liu Y R, Zhang W B, Alsaadi F E. Exponential synchronization via pinning adaptive control for complex networks of networks with time delays. Neurocomputing, 2017, 225: 198-204 doi: 10.1016/j.neucom.2016.11.022
    [23] Xu Q, Zhuang S X, Liu S J, Xiao J. Decentralized adaptive coupling synchronization of fractional-order complex-vari- able dynamical networks. Neurocomputing, 2016, 186: 119-126 doi: 10.1016/j.neucom.2015.12.072
    [24] Han X M, Wu H Q, Fang B L. Adaptive exponential synchronization of memristive neural networks with mixed time-varying delays. Neurocomputing, 2016, 201: 40-50 doi: 10.1016/j.neucom.2015.11.103
    [25] Ahmed M A A, Liu Y R, Zhang W B, Alsaedi A, Hayat T. Exponential synchronization for a class of complex networks of networks with directed topology and time delay. Neurocomputing, 2017, 266: 274-283 doi: 10.1016/j.neucom.2017.05.039
    [26] Dai H, Chen W S, Jia J P, Liu J Y, Zhang Z Q. Exponential synchronization of complex dynamical networks with time-varying inner coupling via event-triggered communication. Robotics and Autonomous Systems, 2017, 245: 124-132
    [27] Beli M R, Stojkov P. Chaos in phase-conjugate resonators as a multimodal mapping. Optical and Quantum Electronics, 1990, 22: 157-165 doi: 10.1007/BF02189951
    [28] Kaneko K. Spatial period-doubling in open flow. Physics Letters A, 1980, 111: 321-325 http://www.sciencedirect.com/science/article/pii/0375960185903597
  • 加载中
  • 图(17)
    计量
    • 文章访问数:  839
    • HTML全文浏览量:  214
    • PDF下载量:  640
    • 被引次数: 0
    出版历程
    • 收稿日期:  2018-08-28
    • 录用日期:  2019-02-15
    • 刊出日期:  2021-04-02

    目录

    /

    返回文章
    返回