2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于模糊神经网络在线自学习的多智能体一致性控制

张宪霞 唐胜杰 俞寅生

陈晓露, 王瑞璇, 王晶, 周靖林. 基于混合型判别分析的工业过程监控及故障诊断. 自动化学报, 2020, 46(8): 1600−1614 doi: 10.16383/j.aas.c180089
引用本文: 张宪霞, 唐胜杰, 俞寅生. 基于模糊神经网络在线自学习的多智能体一致性控制. 自动化学报, 2025, 51(3): 590−603 doi: 10.16383/j.aas.c240451
Chen Xiao-Lu, Wang Rui-Xuan, Wang Jing, Zhou Jing-Lin. Industrial process monitoring and fault diagnosis based on hybrid discriminant analysis. Acta Automatica Sinica, 2020, 46(8): 1600−1614 doi: 10.16383/j.aas.c180089
Citation: Zhang Xian-Xia, Tang Sheng-Jie, Yu Yin-Sheng. Multi-agent consensus control based on online self-learning fuzzy neural network. Acta Automatica Sinica, 2025, 51(3): 590−603 doi: 10.16383/j.aas.c240451

基于模糊神经网络在线自学习的多智能体一致性控制

doi: 10.16383/j.aas.c240451 cstr: 32138.14.j.aas.c240451
基金项目: 国家自然科学基金(62073210)资助
详细信息
    作者简介:

    张宪霞:上海大学机电工程与自动化学院教授. 2008年获得上海交通大学控制理论与控制工程专业博士学位. 主要研究方向为群体智能, 多智能体无模型智能控制, 复杂系统的智能控制与建模, 机器人视觉伺服. 本文通信作者. E-mail: xianxia_zh@t.shu.edu.cn

    唐胜杰:上海大学机电工程与自动化学院硕士研究生. 2023年获得江苏科技大学自动化专业学士学位. 主要研究方向为多智能体协同控制. E-mail: tang_sheng_jie@shu.edu.cn

    俞寅生:上海大学机电工程与自动化学院硕士研究生. 2023年获得上海大学模式识别与智能系统专业硕士学位. 主要研究方向为强化学习和多智能体协同控制. E-mail: 1185121733yss@gmail.com

Multi-agent Consensus Control Based on Online Self-learning Fuzzy Neural Network

Funds: Supported by National Natural Science Foundation of China (62073210)
More Information
    Author Bio:

    ZHANG Xian-Xia Professor at the School of Mechanical and Electrical Engineering and Automation, Shanghai University. She received her Ph.D. degree in control theory and control engineering from Shanghai Jiao Tong University in 2008. Her research interest covers swarm intelligence, multi-agent modeless intelligent control, intelligent control and modeling of complex systems, and robot visual servoing. Corresponding author of this paper

    TANG Sheng-Jie Master student at the School of Mechanical and Electrical Engineering and Automation, Shanghai University. He received his bachelor degree in automation from Jiangsu University of Science and Technology in 2023. His main research interest is multi-agent collaborative control

    YU Yin-Sheng Master student at the School of Mechanical and Electrical Engineering and Automation, Shanghai Universiy. He received his master degree in pattern recognition and intelligent system from Shanghai University in 2023. His research interest covers reinforcement learning and multi-agent collaborative control

  • 摘要: 针对多智能体系统分布式一致性控制问题, 提出一种新的融合动态模糊神经网络(Dynamic fuzzy neural network, DFNN)和自适应动态规划(Adaptive dynamic programming, ADP)算法的无模型自适应控制方法. 类似于强化学习中执行者−评论家结构, DFNN和神经网络(Neural network, NN)分别逼近控制策略和性能指标. 每个智能体的DFNN执行者从零规则开始, 通过在线学习, 与其局部邻域的智能体交互而生成和合并规则. 最终, 每个智能体都有一个独特的DFNN控制器, 具有不同的结构和参数, 实现了最优的分布式同步控制律. 仿真结果表明, 本文提出的在线算法在非线性多智能体系统分布式一致性控制中优于传统基于NN的ADP算法.
  • 数据降维方法在众多领域应用广泛, 其划分依据也不尽相同, 按照数据结构特征保持与否的准则进行划分, 则可根据数据的全局结构保持和局部结构保持分成两类[1], 前者反映了数据的外部形状, 后者反映了数据的内在属性, 可以寻找出高维观测数据中所隐藏的低维流形结构.其中, 主成分分析(Principal component analysis,PCA)[2]、独立元分析[3]和人工神经网络[4]等方法均为数据全局特征结构保持的代表方法, 核主成分分析(Kernel principal component analysis, KPCA)[5]通过非线性映射函数将线性不可分的原始样本数据输入空间通过投影变换到线性可分的高维特征空间, 然后在新的特征空间中利用线性方法完成主成分分析, 从而实现数据整体方差最大化, 但KPCA方法只能够提取数据的全局结构信息, 若数据中低维局部结构中包含较多特征信息的话, 则效果较差.另外, 流形学习能够从高维历史信息中获取数据间有效的内部联系, 从而得以保持局部结构特征, 具有良好的非线性数据内部属性的处理能力[6-7], 代表性的流行学习[8]方法主要包括等距特征映射算法(Isometric feature mapping, ISOMAP)[9], 拉普拉斯特征映射算法(Laplacian eigenmaps, LE)[10], 局部线性嵌入算法(Locally linear embedding, LLE)[11], 局部保持投影算法(Locality preserving projections, LPP)[12]等, 其中, 有学者在LPP算法中引入核方法, 提出核局部保持投影(Kernel locality preserving projection, KLPP)[13], 其在保持局部结构特征的同时实现线性计算, 反映出数据的局部结构特征, 但本质上KLPP是一种基于局部结构保持的降维方法, 它并不能有效提取出数据的全局特征信息[14].

    针对以上问题, 本研究拟对KPCA与KLPP相结合的降维方法进行探讨, 提出了本文的解决办法, 并把新提出的算法命名为改进全局与局部结构保持算法(Global and local structure preserving, GLSP), 在进行原始数据的投影变换时, 既考虑全局结构得以保持, 也兼顾保持局部近邻结构.首先使用局部与全部特征提取方法, 解决数据有效降维的问题, 使用聚类分析中类内距离与类间距离等作为衡量指标, 并使用K近邻(K-nearest neighbor, KNN)方法进行故障的检测[15].本文数据使用柴油机仿真故障数据[16]和TE过程公共数据集, 用于验证方法的有效性.

    作为非线性特征提取的经典方法, KPCA通过非线性映射将线性不可分的原始数据从低维空间变换到一个线性可分的高维特征空间, 运用线性方法进行数据降维与特征提取, 其目标是使得数据方差最大化, 但数据方差指标主要用来描述数据集的全局结构信息.此外, KLPP是通过建立样本点之间的近邻关系来保持数据集的局部结构, 本质是保持原始数据局部结构和内部属性.综合考虑KPCA与KLPP两种投影保持方法的思想, 本文提出GLSP, 其目标函数可以理解为由全局目标函数和局部目标函数共同组成.

    KLPP通过非线性投影映射, 在投影空间建立近邻图, 最大限度地保持了数据集的近邻结构, 其局部结构保持目标函数定义如下[17]:假设数据集$ {\pmb X} = {\left[ {{{\pmb x}_1}, {{\pmb x}_2}, \cdots , {{\pmb x}_n}} \right]^{\rm T}} \in {\textbf{R}^{n \times m}} $, n为样本个数, m为数据维数, 通过非线性映射$ {\pmb \Phi} $将原始数据映射到高维空间中, 记为$ {\pmb \Phi} \left( {{\pmb x}_i} \right) $, $ {{\pmb J}_{\rm{local}}}\left( {\pmb w} \right) $的目标是在特征空间中找到投影向量$ {\pmb w} $, 使得投影$ {{\pmb y}_i} = {\pmb \Phi}^{\rm T} {\left( {{{\pmb x}_i}} \right)}{\pmb w} $在高维特征空间保持数据点之间的近邻关系, 可以认为, 如果$ {\pmb \Phi} \left( {{{\pmb x}_i}} \right) $和$ {\pmb \Phi} \left( {{{\pmb x}_j}} \right) $是近邻, 那么$ {{\pmb y}_i} = {\pmb \Phi}^{\rm T}{\left( {{{\pmb x}_i}} \right)}{\pmb w} $和$ {{\pmb y}_j} = {\pmb \Phi}^{\rm T} {\left( {{{\pmb x}_j}} \right)}{\pmb w} $也是近邻的.其局部结构保持的目标函数定义为:

    $$ \begin{align} &{{\pmb J}_{\rm{local}}}\left( {\pmb w} \right) = \mathop {\min }\limits_{\pmb w} \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^n {{{\left\| {{{\pmb y}_i} - {{\pmb y}_j}} \right\|}^2}{{\pmb s}_{ij}}} } = \\&\quad \mathop {\min }\limits_{\pmb w} \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^n {{{\left\| {{\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_i}} \right)}}{\pmb w} - {\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_j}} \right)}} {\pmb w}} \right\|}^2}{{\pmb s}_{ij}}} } = \\&\quad \mathop {\min }\limits_{\pmb w} \left\{ {{{\pmb w}^{\rm T}}{\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_i}} \right)}}\left( {{\pmb D} - {\pmb S}} \right){\pmb \Phi} \left( {{{\pmb x}_j}} \right){\pmb w}} \right\} \end{align} $$ (1)

    式中, $ {{\pmb s}_{ij}} $为权重参数, 表示数据点之间的近邻关系, $ {\pmb S} $为权重矩阵, $ {\pmb D} $为对角矩阵, $ {{\pmb D}_{ii}} = \sum_{j = 1}^n {{{\pmb s}_{ij}}} $, $ {{\pmb s}_{ij}} $取值一般为:

    $$ \begin{align*} {\pmb s}_{ij} = \begin{cases} \dfrac{{\exp \left( { - {{\left\| {{{\pmb x}_i} - {{\pmb x}_j}} \right\|}^2}} \right)}}{t}, &{{\pmb x}_i} \in \Omega _{{{\pmb x}_j}}^k, {{\pmb x}_j} \in \Omega _{{{\pmb x}_i}}^k\\ 0, &\mbox{其他} \end{cases} \end{align*} $$ (2)

    式中, $ \Omega _{{{\pmb x}_i}}^k $为$ {{\pmb x}_i} $的k邻域.

    引入核函数$ {{\pmb K}_{ij}} = {\pmb K}\left( {{{\pmb x}_i}, {{\pmb x}_j}} \right) = {\pmb \Phi}^{\rm T} {\left( {{{\pmb x}_i}} \right)}{\pmb \Phi} \left( {{{\pmb x}_j}} \right) $, 并存在系数$ {\pmb \alpha} = [{\alpha _1}, {\alpha _2}, \cdots , {\alpha _n}] $对特征空间中的样本线性表示为$ {\pmb w} = \sum_{i = 1}^n {{\alpha _i}{\pmb \Phi} \left( {{{\pmb x}_i}} \right)} $, 局部结构保持的目标函数转化为:

    $$ \begin{align} &{{\pmb J}_{\rm{local}}}\left( {\pmb \alpha} \right) = \mathop {\min }\limits_{\pmb \alpha} \Big\{ {{\pmb \alpha} ^{\rm T}}{\pmb \Phi} \left( {{{\pmb x}_i}} \right){\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_j}} \right)}}\\&\quad \left( {{\pmb D} - {\pmb S}} \right) {\pmb \Phi} \left( {{{\pmb x}_i}} \right)\boldsymbol {\Phi} ^{\rm T}{{\left( {{{\pmb x}_j}} \right)}}\boldsymbol {\alpha} \Big\} = \\&\quad \mathop {\min }\limits_{\pmb \alpha} \left\{ {{\boldsymbol {\alpha} ^{\rm T}}{\pmb \Phi} \left( {{{\pmb x}_i}} \right){\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_j}} \right)}}{\pmb L}{\pmb \Phi} \left( {{{\pmb x}_i}} \right){\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_j}} \right)}}{\pmb \alpha} } \right\} = \\&\quad \mathop {\min }\limits_{\pmb \alpha} {{\pmb \alpha} ^{\rm T}}{\pmb{ KLK}}{\pmb \alpha} = \mathop {\min }\limits_{\pmb \alpha} {{\pmb \alpha} ^{\rm T}}{\pmb L}'{\pmb \alpha} \end{align} $$ (3)

    式中, $ {\pmb L} = {\pmb D} - {\pmb S} $为Laplacian矩阵, $ {\pmb L}' = \pmb{ KLK} $.

    KLPP算法的目的是使数据在高维映射空间中, 仍能保持数据之间的近邻结构, 但是算法本身忽略了对数据集的整体结构特征描述.其本质是因为局部目标函数表达式中没有显式地考虑样本点的全局特征, 只是利用局部结构来代替全局信息, 导致了数据在低维映射中全局特征的扭曲显示.

    PCA算法常用于数据主要成分的分析与维度约简, 其本质是将线性数据变换为各个维度线性无关表示的几组数据, 便于对数据中主要特征分量的提取. KPCA算法由核映射将数据映射到高维核空间, 然后使用PCA方法, 与KLPP算法类似, 通过非线性映射$ {\pmb \Phi} $将原始数据$ {\pmb X} = {\left[ {{{\pmb x}_1}, {{\pmb x}_2}, \cdots , {{\pmb x}_n}} \right]^{\rm T}} \in {\textbf{R}^{n \times m}} $映射到高维空间, 记为$ {\pmb \Phi}( {\pmb x} _i ) $, 经过投影向量$ {\pmb w} $投影后的映射$ {{\pmb y} _i} = {\pmb \Phi}^{\rm T}{\left( {{{\pmb x}_i}} \right)}{\pmb w} $, 在投影方向上保证数据方差最大化, 这样可以充分利用高阶统计信息和全局特征结构保持.其全局结构目标函数定义为:

    $$ \begin{align} {{\pmb J} _{\rm{global}}}\left( {\pmb w} \right) = \, & \mathop {\max }\limits_{\pmb w} \sum\limits_{i = 1}^n {{{\pmb y}_i}^2} = \\& \mathop {\max }\limits_{\pmb w} \sum\limits_{i = 1}^n {{{\left( {{\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_i}} \right)}}{\pmb w}} \right)}^2}} \end{align} $$ (4)

    式中, $ {{\pmb w}^{\rm T}}{\pmb w} = 1 $.

    引入核函数$ {{\pmb K}_{ij}} = {\pmb K}\left( {{{\pmb x}_i}, {{\pmb x}_j}} \right) = {\pmb \Phi}^{\rm T} {\left( {{{\pmb x}_i}} \right)}{\pmb \Phi} \left( {{{\pmb x}_j}} \right) $, 可看出即使不确定核函数的具体表达形式, 但是其转化为映射后的数据的内积运算, 存在系数$ {\pmb \alpha} = [{\alpha _1}, {\alpha _2}, \cdots , {\alpha _n}] $对特征空间中的样本线性表示为$ {\pmb w} = \sum_{i = 1}^n {{\alpha _i}{\pmb \Phi} \left( {{{\pmb x}_i}} \right)} $, 全局结构保持的目标函数转化为:

    $$ \begin{align} {{\pmb J}_{\rm{global}}}\left( {\pmb \alpha} \right) = \, & \mathop {\max }\limits_{\pmb \alpha} \sum\limits_{i = 1}^n {{{\left( {{\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_i}} \right)}}\sum\limits_{j = 1}^n {{\alpha _j}{\pmb \Phi} \left( {{{\pmb x}_j}} \right)} } \right)}^2}} = \\& \mathop {\max }\limits_{\pmb \alpha} \sum\limits_{i = 1}^n {{{\left( {\sum\limits_{j = 1}^n {{{\pmb \alpha}_j} {\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_i}} \right)}} {\pmb \Phi} \left( {{{\pmb x}_j}} \right)} } \right)}^2}} = \\& \mathop {\max }\limits_{\pmb \alpha} {{\pmb \alpha} ^{\rm T}}\pmb{ KK}{\pmb \alpha} = \mathop {\max }\limits_{\pmb \alpha} {{\pmb \alpha}^{\rm T} }{\pmb C}{\pmb \alpha} \end{align} $$ (5)

    式中, $ {{\pmb \alpha} ^{\rm T}}{\pmb K}{\pmb \alpha} = 1 $, $ {\pmb C} = \pmb{ KK} $.

    因为KPCA是一种面向全局的变换方法, 由于其保持了原始数据的大部分方差信息, 所以实现了全局结构的特征提取.然而, 保持全局结构的目标函数中没有考虑各类数据点之间的内部联系, 在低维空间里, 数据点之间的局部几何关系与内在属性可能被忽视, 甚至导致重要信息的丢失.

    全局结构目标保持函数的思想是在最大程度保持全局信息方差不变的情况下, 提取出样本数据的非线性特征; 而局部结构保持目标函数的思想是在投影中保持样本对之间的远近亲疏关系, 在低维空间中最小化近邻样本间的距离加权平方和, 即尽量避免样本集的发散.

    结合全局结构保持目标函数和局部结构保持目标函数的意义, 构造一种新的结构保持目标函数, 使得映射后的特征空间能够保留全局结构的同时, 又可以保持数据间的局部近邻结构[18-19], 构造出如式(6)的最大值选择问题, 由于局部结构保持的目标函数为求取最小值, 所以式(6)中引入其相反数:

    $$ \begin{equation} {\pmb J}\left( {\pmb \alpha} \right) = \mathop {\max }\limits_{\pmb \alpha} \left\{ {{{\pmb J}_{\rm{global}}}\left( {\pmb \alpha} \right), - {{\pmb J}_{\rm{local}}}\left( {\pmb \alpha} \right)} \right\} \end{equation} $$ (6)

    由于式(6)只从两个目标函数中选择其一, 是一个典型的多目标求取最值问题, 由于未考虑两个目标函数的综合效果, 通常很难求解到全局最优解, 因此, 将式(6)中两个目标函数进行求和操作, 求和后的目标函数如式(7)所示:

    $$ \begin{align} {\pmb J}\left( {\pmb \alpha} \right) = \, &\mathop {\max }\limits_{\pmb \alpha} \left( {{{\pmb J}_{\rm{global}}} \left( {\pmb \alpha} \right) - {{\pmb J}_{\rm{local}}} \left( {\pmb \alpha} \right)} \right) = \\& \mathop {\max }\limits_{\pmb \alpha} \left( {{{\pmb \alpha} ^{\rm T}} {\pmb C}{\pmb \alpha} - {{\pmb \alpha} ^{\rm T}}{\pmb L}'{\pmb \alpha} } \right) = \\& \mathop {\max }\limits_{\pmb \alpha} \left( {{{\pmb \alpha} ^{\rm T}} \left( {{\pmb C} - {\pmb L}'} \right) {\pmb \alpha} } \right) \end{align} $$ (7)

    同理, 这两个目标函数很难同时达到最佳效果.考虑到两个目标函数之间的差异, 所以, 引入一个权重参数$ \beta $来平衡上述两个目标函数, $ \beta $是一个介于0和1之间的值, 其值的大小对于新的目标函数$ {\pmb J}\left( {\pmb \alpha} \right) $有很大影响, 因为它决定着两个原始目标函数的重要性问题[20].实际上$ \beta $可以看作是平衡两个目标函数的能量变化. $ \beta $越小越侧重于全局特征的提取, $ \beta $越大越侧重于局部特征的提取, $ \beta $值的选取按照如下准则:

    $$ \begin{equation} \beta {S_{\rm{global}}} = \left( {1 - \beta } \right){S_{\rm{local}}} \end{equation} $$ (8)

    其中, $ {S_{\rm{global}}} $和$ {S_{\rm{local}}} $分别表示$ {{\pmb J}_{\rm{global}}}\left( {\pmb w} \right) $和$ {{\pmb J}_{\rm{local}}}\left( {\pmb w} \right) $的规模大小, 受到参考文献[18, 21]启发, 定义为:

    $$ \begin{equation} {S_{\rm{global}}} = \rho \left( {\pmb C} \right) \end{equation} $$ (9)
    $$ \begin{equation} {S_{\rm{local}}} = \rho \left( {{\pmb L}'} \right) \end{equation} $$ (10)

    式中, $ \rho \left( \cdot \right) $是相关矩阵谱半径.结果表明, 该平衡参数的引入策略能够很好地平衡全局和局部的行为, GLSP的降维性能也可以得到保证.事实上, 权重参数也可以根据不同背景下原始数据的特性, 赋予不同定义, 而不仅限于本文所提方法, 这使得改进的结构保持算法更加灵活.结合式(8)~(10), 可得到权重参数$ \beta $的计算公式如下:

    $$ \begin{equation} {\beta _{\pmb C} } = \frac{{\rho \left( {\pmb C} \right)}}{{\rho \left( {\pmb C} \right) + \rho \left( {{\pmb L}'} \right)}}, \beta _{{\pmb L}'} = 1 - {\beta _{\pmb C}} \end{equation} $$ (11)

    因此, 改进的整体目标函数表示为:

    $$ \begin{align} {\pmb J}\left( {\pmb \alpha} \right) = \, &\mathop {\max } \limits_{\pmb \alpha} \left( {{{\beta _{\pmb C} }{\pmb J}_{\rm{global}}} \left( {\pmb \alpha} \right) - {{\beta _{{\pmb L}'} }{\pmb J}_{\rm{local}}} \left( {\pmb \alpha} \right)} \right) = \\& \mathop {\max }\limits_{\pmb \alpha} \left( {{{\pmb \alpha} ^{\rm T}} \left( {{\beta _{\pmb C} }{\pmb C} - \beta _{{\pmb L}'}{\pmb L}'} \right){\pmb \alpha} } \right) = \\& \mathop {\max }\limits_{\pmb \alpha} {{\pmb \alpha} ^{\rm T}}{\pmb M}{\pmb \alpha} \end{align} $$ (12)

    式中$ {\pmb M} = {\beta _{\pmb C}}{\pmb C} - \beta _{{\pmb L}'}{\pmb L}', 0 \le {\beta _{\pmb C}} \le 1, 0 \le \beta _{{\pmb L}'} \le 1 $.

    最后将上述目标函数的优化问题转化为求解特征向量问题.确定权重参数$ \beta $的值之后, 结合式(5)中的条件, 引入拉格朗日乘子法, 求解特征向量:

    $$ \begin{equation} {\pmb L} = {{\pmb \alpha} ^{\rm T}}{\pmb M}{\pmb \alpha} - \lambda \left( {{{\pmb \alpha} ^{\rm T}}{\pmb K}{\pmb \alpha} - 1} \right) \end{equation} $$ (13)

    当$ \frac{{\partial {\pmb L}}}{{\partial {\pmb \alpha} }} = 0 $, 可得:

    $$ \begin{equation} {\pmb M}{\pmb \alpha} = \lambda {\pmb K}{\pmb \alpha} \end{equation} $$ (14)

    非线性问题的求解过程中, 引入正则化方法, 我们用$ {\pmb K} + \eta {{\pmb I}_n} $来代替式(14)中的$ {\pmb K} $, 其中, $ \eta $是一个很小的正整数, $ {{\pmb I}_n} $是一个$ n \times n $的单位向量.

    与PCA类似, 本文使用累积方差贡献率准则选取满足贡献率达到要求的主成分个数, 依据式(15)选取前$ p $个特征值确定主成分个数, 本研究中贡献率选定为$ 85\, \% $.

    $$ \begin{equation} \frac{{\sum\limits_{k = 1}^p {{\lambda _k}} }}{{\sum\limits_{k = 1}^N {{\lambda _k}} }} > 85\, \% \end{equation} $$ (15)

    原始数据在降维时, 将面临难以全面提取有用信息的困难, 为解决这一问题, 本文提供一种结合全局与局部结构保持的数据降维思想, 实现方法为:采集原始数据, 建立能够从多角度反映数据信息的高维数据集, 并加以验证; 再将数据集输入所提全局与局部结构保持算法中进行降维处理:将低维特征子集输入KNN最近邻分类器, 计算KNN的识别率, 并将聚类分析中类间距与类内距的比值$ {{\pmb S}_B}/{{\pmb S}_W} $作为衡量降维效果指标[22].

    Fisher判别分析是模式识别方法中的一种数据降维与分类方法.其通过投影将测试数据映射到不同方向, 使得不同类别的测试样本的投影的类间离散度最大, 类内离散度最小[23].类内距$ {{\pmb S}_W} $描述同一类样本内部分布的紧密程度, 而类间距$ {{\pmb S}_B} $用反映不同类别之间的分离程度, 定义如下[15, 24]:

    $$ \begin{align} {{\pmb S}_B} = \, & \frac{1}{N}\sum\limits_{i = 1}^C {{N_i}\left( {{{\pmb m}_i} - {\pmb m}} \right){{\left( {{{\pmb m}_i} - {\pmb m}} \right)}^{\rm T}}} \end{align} $$ (16)
    $$ \begin{align} {{\pmb S}_W} = \, & \frac{1}{N}\sum\limits_{i = 1}^C \sum\limits_{j = 1}^{{N_i}} \left[ {{\pmb \Phi} \left( {{\pmb x}_i^j} \right) - {{\pmb m}_i}} \right]\times\\&{{\left[ {{\pmb \Phi} \left( {{\pmb x}_i^j} \right) - {{\pmb m}_i}} \right]}^{\rm T}} \end{align} $$ (17)

    其中, $ {{\pmb m}_i} $表示特征空间中第$ i $类采样均值, $ {\pmb m} $表示所有样本点在特征空间中的均值.显然, $ {{\pmb S}_B}/{{\pmb S}_W} $越大说明该方法的分类与聚类效果越好, 因此将该指标作为降维效果的综合衡量指标之一.

    KNN是对不同类别的数据信息根据训练样本特征进行分类的方法, 具有操作直观、效果稳定、时效性强等优点, 广泛应用到各类数据分类领域, 尤其是故障数据的诊断与分类中.原始数据进行降维操作, 其最终目的是实现不同故障类别的准确分类, 故KNN方法的识别率越高, 其反映出对数据的初始降维方法越好[25-26].

    总结局部与全局结构保持算法的流程图如图 1所示.

    图 1  数据降维方法流程
    Fig. 1  The dimension reduction process of data

    算法主要流程如下.

    步骤1.  对于数据集$ {\pmb X} = {\left[ {{{\pmb x}_1}, {{\pmb x}_2}, \cdots , {{\pmb x}_n}} \right]^{\rm T}} \in $ $ {\textbf{R}^{n \times m}} $, 构造局部结构保持函数$ {{\pmb J}_{\rm{local}}}\left( {\pmb \alpha} \right) $.

    步骤2.  构造全局方差最大目标函数$ {{\pmb J}_{\rm{global}}}\left( {\pmb \alpha} \right) $.

    步骤3.  构造整体目标函数$ {\pmb J}\left( {\pmb \alpha} \right) $.

    步骤4.  根据式(14)求解特征值$ {\lambda _1}, {\lambda _2}, \cdots , {\lambda _n} $与对应的特征向量$ {{\pmb A}} = \left[ {{\alpha _1}, {\alpha _2}, \cdots , {\alpha _n}} \right] $.

    步骤5.  根据式(15)求解前$ p $个特征值$ {\lambda _1} $, $ {\lambda _2} $, $ \cdots $, $ {\lambda _p} $与对应的特征向量$ {{\pmb A'}} = \left[ {{\alpha _1}, {\alpha _2}, \cdots , {\alpha _p}} \right] $.

    步骤6.  根据公式$ {\pmb T} = {{\pmb K}^{\rm T}}{{\pmb A'}} $, 获得样本集在低维正交特征子空间的投影.

    步骤7.  通过映射矩阵对训练及测试样本进行维数约简, 再将得到的低维特征子集输入到KNN, 并计算低维特征子集的$ {{\pmb S}_B} $, $ {{\pmb S}_W} $及$ {{\pmb S}_B}/{{\pmb S}_W} $指标.

    船舶柴油机广泛应用于实际航运工程中, 其安全稳定的运行状态对整个系统起着至关重要的影响.因此, 在船舶柴油机发生故障时, 如果能够准确将故障信号的有效特征提取并分析, 则可提供足够多有效信息, 便于故障的分类和诊断[27-28].

    1) 模型设计

    本文以MAN公司S35ME-B9型柴油机为主要研究对象, 利用专业模拟软件AVL Boost完成柴油机故障模型仿真模拟系统, 图 2为柴油机仿真模型.

    图 2  柴油机模型仿真
    Fig. 2  The diesel engine simulation

    图 2中, SB1、SB2、SB3为系统边界, 外界气体通过SB1进入系统, 系统工质通过SB3排出系统, MP1$ \sim $MP8为测点, MP1和MP2测量中冷器前后的气体压力、温度, MP3和MP4测量气体进入和流出进气管PL1的气体压力、温度, MP5和MP6测量进入和流出1号缸的气体压力、温度, MP7和MP8测量废气进入和流出涡轮增压的气体压力、温度, C1$ \sim $C6为气缸, 1$ \sim $29为管道连接, PL1为进气管, CO1为中冷器, TC1为涡轮增压器.

    本文对正常工况以及三种常见的船舶柴油机故障进行仿真模拟, 包括空冷器冷却不足, 排气口堵塞以及涡轮增压器效率降低, 如表 1所示, 由于本文采用的数值仿真模型, 因此采用设置关键参数的方式对故障进行模拟.在每种工况下, 记录模型中8个测量点的15个状态参数作为原始数据, 分别为功率(kW), 最大爆发压力(100 kPa), 压力机流量(kg/c), 压力机出口温度($ ^\circ $C), 压力机出口压力(100 kPa), 中冷器后温度($ ^\circ $C), 中冷器温差($ ^\circ $C), 中冷器后压力(100 kPa), 中冷器压差(100 kPa), 扫气温度($ ^\circ $C), 扫气压力(100 kPa), 排气管温度($ ^\circ $C), 排气管压力(100 kPa), 废气进涡轮机温度($ ^\circ $C), 涡轮增压出口温度($ ^\circ $C).

    表 1  正常工况与故障工况模拟
    Table 1  The simulation of normal and fault conditions
    No. 工况类型 样本个数 数据维数
    1 正常工况 960 15
    2 故障1_空冷器冷却不足 960 15
    3 故障2_排气口堵塞 960 15
    4 故障3_涡轮增压效率降低 960 15
    下载: 导出CSV 
    | 显示表格

    将故障数据集经本文所提降维方法进行处理, 选取KPCA、KLPP、核Fisher判别分析(Kernel fisher discriminant analysis, KFDA)[29]、局部和全局主成分分析(Local and global principal component analysis, LGPCA)[30]、全局–局部结构张量分析(Tensor global-local structure analysis, TGLSA)[20]和本文共6种算法进行对比, 在本研究中选取的目标维数为3维, 研究中采用了交叉验证方法选取最优高斯核参数, 实验从降维效果可视化、降维效果综合衡量指标和特征提取速度分析三方面验证方法的有效性.

    2) 模型验证

    使用AVL Boost进行柴油机工作状态仿真模型的建立, 选择台架实验的关键状态参数数据和AVL Boost对应状态参数进行对比验证.以柴油机功率、排气温度对柴油机模型正确性进行验证, 以排气阀堵塞和空冷器冷却不足等故障对柴油机模型进行故障模拟验证.

    表 2是使用三种不同的工作状态的特定工作参数平均值与台架实验中对应参数的比较, 可以发现台架实验数据与AVL Boost相差较小, 可以认为使用AVL Boost建立的柴油机模型与台架实验使用柴油机具有相同的工作参数.

    表 2  数据与台架实验数据多工况对比
    Table 2  The data contrast between AVL Boost and bench test under multiple working conditions
    负荷 排气温度(℃) 相对误差(%) 功率(kW) 相对误差(%)
    模型数据 台架实验数据 模型数据 台架实验数据
    90%负荷 329.89 328.50 0.42 3 281.40 3 277.00 0.13
    75%负荷 304.39 307.30 0.95 2 839.20 2 844.00 0.17
    75%推进 319.23 320.90 0.37 2 866.85 2 864.00 0.10
    下载: 导出CSV 
    | 显示表格

    排气口堵塞是采用逐渐减小单个气缸的排气口直径的方法进行仿真验证, 排气口堵塞会造成排气效率不佳, 气缸内废气无法及时排出, 会造成气缸内气体逐渐增加, 缸内压力逐渐增大, 引起扫气压力增大, 进气逐渐减少, 也就是压力机流量减小.排气口堵塞还会造成气缸内高速积碳, 引起后燃现象, 使得排气温度上升, 燃烧效率下降, 但由于上述故障因素只是增加在一个气缸中, 其余五个气缸的燃烧过程影响不大, 因此对柴油机的功率影响不大.使用AVL Boost仿真这种故障, 上述提到的理论上的参数变化均获得了较好的验证.

    空冷器冷却不足是使用逐渐增加冷却液温度, 逐渐降低空冷器冷却效率的方法仿真验证.这种故障最直观的反映就是空冷器前后温差降低, 另外由于空冷器冷却效率下降, 增压之后的气体无法较好地得到冷却, 扫气温度上升, 进入气缸内的气体质量会下降, 随之扫气压力上升, 流经压力机的空气流量会相应减小, 由于进入气缸的新鲜空气减少, 功率和最大爆发压力都会出现下降趋势, 同时由于进入气缸的空气温度上升, 排气温度也会上升.

    3) 降维效果可视化

    为验证本文降维方法的有效性, 将故障数据集经KPCA、KLPP、KFDA、LGPCA、TGLSA和本文所提降维方法进行处理, 选取前480个样本作为训练样本, 后480个样本作为测试样本.根据本文所提算法选取降维后的前三个主成分即可较为直观有效的表现降维效果, 图 3为根据贡献率原则, 选择不同降维维数与对应的主元贡献率, 由图中可知, 本文中选择主成分为前三维, 其贡献率之和即可达到总贡献率的85$ \% $, 因此仿真实验中的贡献率选择为85$ \% $即可.得到降维后的测试样本三维特征量分布见图 4~9.

    图 3  不同维度贡献率统计图
    Fig. 3  The contribution rate of different dimensions
    图 4  KPCA降维结果
    Fig. 4  The dimension reduction based on KPCA
    图 5  KLPP降维结果
    Fig. 5  The dimension reduction based on KLPP
    图 6  KFDA降维结果
    Fig. 6  The dimension reduction based on KFDA
    图 7  LGPCA降维结果
    Fig. 7  The dimension reduction based on LGPCA
    图 8  TGLSA降维结果
    Fig. 8  The dimension reduction based on TGLSA
    图 9  GLSP降维结果
    Fig. 9  The dimension reduction based on GLSP

    图 4可以看出, KPCA可以分辨正常工况与故障1, 但对于故障2和故障3有较严重的数据重叠现象.从图 5可以看出, KLPP对于4种工况均不能较为有效地进行区分.

    图 6~8分别为KFDA、LGPCA、TGLSA三种不同降维方法的对比实验效果图, KFDA效果较差, 样本数据大部分呈现混叠状态, LGPCA和TGLSA算法也综合保持了全局结构和局部结构, 因此其效果略好于KFDA、LGPCA和TGLSA三种算法, 但由于其主要应用于维数较低的数据, 因此对于船舶柴油机的高维复杂数据, 效果一般.

    本文所提降维方法效果图如图 9所示, 其中, 权重参数根据计算得到$ {\beta _{\pmb C}} = 0.79 $, $ {\beta _{{\pmb L}'}} = 0.21 $, 可见对于柴油机故障数据, KPCA方法所侧重的全局特征占主导地位.由于全局和局部结构特征提取过程的综合考虑, 在完成数据约简和可视化的同时, 有效地分离了四种状态, 同时具有良好的聚类能力.因此, 本文提出的方法能够提取故障特征, 解决了数据降维可视化问题.

    4) 降维效果综合衡量指标

    为直观有效地可视化各类方法的降维效果, 将类间距$ {{\pmb S}_B} $, 类内距$ {{\pmb S}_W} $及二者的比值$ {{\pmb S}_B}/{{\pmb S}_W} $作为衡量指标, 类间距$ {{\pmb S}_B} $及二者的比值$ {{\pmb S}_B}/{{\pmb S}_W} $越大, 表明分类效果明显, 得到的评价结果见图 10, 从图中可以看出, 六种方法中, 本文所提GLSP方法对应的类间距及二者的比值具有最大值.分析如下:

    图 10  六类算法降维效果衡量指标
    Fig. 10  The dimension reduction performance of 6 methods

    a) KPCA降维效果及识别率一般, 虽然可以去除特征空间中的数据冗余信息, 但并未达到能够有效表达最佳情况的条件; KLPP局部结构保持的方法的类间距明显提高, 该方法能有效提取出数据集中局部结构, 但对于综合全局与结构方法所得到的类间距与类内距的比值, 还有一定差距; KFDA方法具有较高类内距, 但是对于类内距没有很好的聚合效果; LGPCA和TGLSA两种方法均具有较好类内聚合作用, 但是由于不同类别的类间距离较小, 导致综合类间距与类内距比值较小.

    b) 本文所提方法的降维效果及识别率要高于其他对比方法, 该方法能够避免子空间重构, 更利于故障类别的划分, 且具有较强的全局与局部判别信息的挖掘能力.

    故障诊断的实质是模式识别, 考虑船舶柴油机故障诊断的实船应用性, 选择极限学习机(Extreme learning machine, ELM)、支持向量机(Support vector machine, SVM)、相关向量机(Relevance vector machine, RVM)、KNN四种基础有效的分类方法进行检验, 将低维样本分别应用于上述四种方法进行分类效果比较, 表 3~5给出了测试样本的故障诊断结果, 可知相较传统的分类方法, 对于仿真所得故障数据的诊断率均不高, 但是所提出的GLSP降维方法所获得的低维有效数据在大部分情况下获得最高的故障识别精度, 未获得最高识别精度情况下, 其精度与最高精度相差不大.

    表 3  故障1识别准确率($ \% $)
    Table 3  The accuracy of fault1 diagnosis ($ \% $)
    方法 Fault1
    KPCA KLPP KFDA LGPCA TGLSA GLSP
    ELM 55.32 61.38 60.58 54.21 58.69 62.97
    SVM 58.69 70.61 71.68 65.34 68.49 69.27
    RVM 72.77 69.59 74.21 68.98 63.40 76.35
    KNN 72.26 66.86 70.38 75.49 77.36 78.53
    下载: 导出CSV 
    | 显示表格
    表 4  故障2识别准确率($ \% $)
    Table 4  The accuracy of fault2 diagnosis ($ \% $)
    方法 Fault2
    KPCA KLPP KFDA LGPCA TGLSA GLSP
    ELM 80.95 76.85 79.65 77.49 70.28 82.62
    SVM 78.36 77.32 77.05 74.39 72.15 80.09
    RVM 79.74 74.16 78.66 85.68 81.29 83.62
    KNN 82.35 82.63 75.39 78.91 86.54 88.84
    下载: 导出CSV 
    | 显示表格
    表 5  故障3识别准确率($ \% $)
    Table 5  The accuracy of fault3 diagnosis ($ \% $)
    方法 Fault3
    KPCA KLPP KFDA LGPCA TGLSA GLSP
    ELM 70.65 72.39 77.16 74.29 70.53 79.26
    SVM 66.34 68.29 68.49 65.39 60.87 66.58
    RVM 59.38 62.58 55.21 59.86 60.13 66.34
    KNN 58.62 62.38 65.98 63.24 61.09 65.08
    下载: 导出CSV 
    | 显示表格

    5) 降维效果综合衡量指标

    时间性能比较是在实验室中台式机电脑上进行, 其配置为Intel Core i3 CPU 3.3GHz, RAM 4GB, Win7操作系统, 仿真软件为MATLAB 2010a, 计算结果如表 6所示.由表 6可知, 本文所提方法降维所需时间相对于其他方法有所增加, 但是都是在一个数量级, 且运行速度均在5s以内, 满足实际情况中对于实时的要求.

    表 6  特征提取所需时间(s)
    Table 6  Feature extraction time (s)
    维度 特征提取方法
    KPCA KLPP KFDA LGPCA TGLSA GLSP
    3 0.651 1.155 1.039 2.598 2.134 1.596
    5 0.795 1.159 1.118 2.019 1.495 1.632
    8 0.815 1.209 0.975 1.069 1.396 1.885
    10 0.867 1.344 1.185 1.563 2.098 1.962
    下载: 导出CSV 
    | 显示表格

    TE过程是一个公认的对比各种控制和监控方案的平台, 为验证本文所提方法的通用性, 将本文算法应用于故障检测与诊断领域被广泛使用的TE化工数据集上. TE过程是基于真实工业过程的仿真平台, 包含了一组正常状态和21组不同故障状态, 分别涵盖了12个操纵变量和41个测量变量, 每组状态包含480组训练数据和960组测试数据, 每一组故障从第160个数据点引入, 过程的详细描述、工艺流程图以及其故障形式的具体介绍见文献[31].

    从TE数据集中选取1组正常工况数据和3组故障数据(故障4、故障8和故障14), 使用本文所提GLSP算法得到降维后的前两维特征矢量, 对于TE数据, 前两维即可较好体现降维效果, 本文权重参数根据计算得到$ {\beta _{\pmb C}} = 0.64, {\beta _{{\pmb L}'}} = 0.36 $, 并将本文算法与KPCA、KLPP、KFDA、LGPCA和TGLSA五种降维方法进行比较, 如图 11图 16.

    图 11  KPCA算法降维效果
    Fig. 11  The dimension reduction performance of KPCA on TE data
    图 12  TE数据下KLPP算法降维效果
    Fig. 12  The dimension reduction performance of KLPP on TE data
    图 13  TE数据下KFDA算法降维效果
    Fig. 13  The dimension reduction performance of KLPP on TE data
    图 14  TE数据下LGPCA算法降维效果
    Fig. 14  The dimension reduction performance of LGPCA on TE data
    图 15  TE数据下TGLSA算法降维效果
    Fig. 15  The dimension reduction performance of TGLSA on TE data
    图 16  TE数据下GLSP算法降维效果
    Fig. 16  The dimension reduction performance of GLSP on TE data

    图 11图 12前两维降维效果可以看出, KPCA和KLPP对于4类数据分离效果较差, 特别是正常工况与故障4和故障14存在大量重合现象; 图 13图 14中KFDA和LGPCA方法对于正常工况和故障14难以有效区分; 图 15图 16的特征提取效果略好于前几种方法, 但TGLSA方法虽然能够较好地区分故障4和故障14, 但是正常工况和故障8仍有较大重叠, 而本文所提算法提取了更为丰富的全局与局部结构信息, 在完成数据降维可视化的同时能够将四类数据有效分离.

    本文通过融合全局特征提取KPCA与局部特征提取KLPP两种降维方法, 提出一种结合两种降维方法的数据维数约简方法GLSP, 增强了数据低维可视化效果, 同时提高了识别精度, 并将其应用于故障诊断中.所提方法将流形学习保持局部结构的思想融入核主成分分析的目标函数中, 使得到的特征空间不仅具有原始样本空间的整体结构, 还保持样本空间相似的局部近邻结构, 可以包含更丰富的特征信息.使用AVL Boost软件对船舶柴油机工作过程进行故障仿真, 提取正常工况与故障工况下的仿真数据, 并将AVL Boost软件仿真数据和TE化工公共故障数据应用到所提方法中, 实验结果证明, 本文所提GLSP算法具有较好的维度约简效果, 并具有较高分类精度的优势.

  • 图  1  基于DFNN-ADP的多智能体一致性控制结构

    Fig.  1  Multi-agent consensus control structure based on DFNN-ADP

    图  2  DFNN结构

    Fig.  2  Structure of DFNN

    图  3  多智能体系统的标准一致性问题

    Fig.  3  Standard consensus problem for multi-agent systems

    图  4  智能体状态图

    Fig.  4  Agent state plot

    图  5  局部一致性误差图

    Fig.  5  Local consensus error plot

    图  6  二维相平面图

    Fig.  6  2-D phase plane plot

    图  7  三维相平面图

    Fig.  7  3-D phase plane plot

    图  8  基于NN-ADP和基于DFNN-ADP的一致性误差对比图. (a) ~ (c)中, 上图、下图分别是$x$坐标、$y$坐标误差

    Fig.  8  Comparison plot of consensus error based on NN-ADP and DFNN-ADP. Among (a) ~ (c), the above and below plots show the errors of x-coordinate and y-coordinate, respectively

    图  9  控制策略加入噪声时基于NN-ADP和基于DFNN-ADP的一致性误差对比图. (a) ~ (c)中, 上图、下图分别是$x$坐标、$y$坐标误差

    Fig.  9  Comparison plot of consensus error based on NN-ADP and DFNN-ADP when noise is added to the control strategy. Among (a) ~ (c), the above and below plots show the errors of x-coordinate and y-coordinate, respectively

    图  10  DFNN和NN响应时间对比图

    Fig.  10  Comparison plot of DFNN and NN response times

  • [1] Zhao W, Li R, Zhang H. Leader-follower optimal coordination tracking control for multi-agent systems with unknown internal states. Neurocomputing, 2017, 249: 171−181 doi: 10.1016/j.neucom.2017.03.066
    [2] Cao Y, Yu W, Ren W, Chen G. An overview of recent progress in the study of distributed multi-agent coordination. IEEE Transactions on Industrial Informatics, 2012, 9(1): 427−438
    [3] Sun Y, Shi P, Lim C C. Adaptive consensus control for output-constrained nonlinear multi-agent systems with actuator faults. Journal of the Franklin Institute, 2022, 359(9): 4216−4232 doi: 10.1016/j.jfranklin.2022.03.025
    [4] Zhang L, Che W W, Chen B, Lin C. Adaptive fuzzy output-feedback consensus tracking control of nonlinear multiagent systems in prescribed performance. IEEE Transactions on Cybernetics, 2022, 53(3): 1932−1943
    [5] Zhang Y, Wang D, Peng Z, Li T. Distributed containment maneuvering of uncertain multiagent systems in MIMO strict-feedback form. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2019, 51(2): 1354−1364
    [6] Yan Y C, Li T S, Yang H Q, Wang J H, Chen C L. Fuzzy finite-time consensus control for uncertain nonlinear multi-agent systems with input delay. Information Sciences, 2023, 632: 51−68 doi: 10.1016/j.ins.2023.02.082
    [7] Liu L, Shafiq M, Sonawane V, Murthy M, Reddy P, Reddy K. Spectrum trading and sharing in unmanned aerial vehicles based on distributed blockchain consortium system. Computers and Electrical Engineering, 2022, 103: Article No. 108255 doi: 10.1016/j.compeleceng.2022.108255
    [8] Sridevi K, Saifulla M. LBABC: Distributed controller load balancing using artificial bee colony optimization in an SDN. Peer-to-Peer Networking and Applications, 2023, 16(2): 947−957 doi: 10.1007/s12083-023-01448-2
    [9] Zhang J, Zhang S, Deng X, Huang Z. Adaptive event-triggered dynamic distributed control of switched positive systems with switching faults. Nonlinear Analysis: Hybrid Systems, 2023, 48: Article No. 101328 doi: 10.1016/j.nahs.2022.101328
    [10] Zhang R, Cai K. Localisation-based distributed control of timed discrete-event systems with communication delay. International Journal of Control, 2022, 95(2): 330−339 doi: 10.1080/00207179.2020.1793000
    [11] Tang F, Wang H, Zhang L, Xu N, Ahmad A. Adaptive optimized consensus control for a class of nonlinear multi-agent systems with asymmetric input saturation constraints and hybrid faults. Communications in Nonlinear Science and Numerical Simulation, 2023, 126: Article No. 107446 doi: 10.1016/j.cnsns.2023.107446
    [12] Wang W, Li Y, Tong S. Exact-optimal consensus of uncertain nonlinear multi-agent systems based on fuzzy approximation. IEEE Transactions on Automation Science and Engineering, DOI: 10.1109/TASE.2024.3366999
    [13] Bai N, Duan Z, Wang Q. Distributed optimal consensus of multi-agent systems: A randomized parallel approach. Automatica, 2024, 159: Article No. 111339 doi: 10.1016/j.automatica.2023.111339
    [14] Bai N, Wang Q, Duan Z, Chen G. Distributed optimal consensus control of constrained multi-agent systems: A non-separable optimization perspective. IEEE Transactions on Automatic Control, DOI: 10.1109/TAC.2024.3390849
    [15] Meng H, Pang D, Cao J, Guo Y, Niazi A. Optimal bipartite consensus control for heterogeneous unknown multi-agent systems via reinforcement learning. Applied Mathematics and Computation, 2024, 476: Article No. 128785 doi: 10.1016/j.amc.2024.128785
    [16] Jin N, Xu J, Zhang H. Distributed optimal consensus control of multi-agent systems involving state and control dependent multiplicative noise. IEEE Transactions on Automatic Control, 2023, 68(12): 7787−7794 doi: 10.1109/TAC.2023.3246422
    [17] 朱永薪, 李永福, 朱浩, 于树友. 通信延时环境下基于观测器的智能网联车辆队列分层协同纵向控制. 自动化学报, 2023, 49(8): 1785−1798

    Zhu Yong-Xin, Li Yong-Fu, Zhu Hao, Yu Shu-You. Observer-based longitudinal control for connected and automated vehicles platoon subject to communication delay. Acta Automatica Sinica, 2023, 49(8): 1785−1798
    [18] Fu X, Pan J, Wang H, Gao X. A formation maintenance and reconstruction method of UAV swarm based on distributed control. Aerospace Science and Technology, 2020, 104: Article No. 105981 doi: 10.1016/j.ast.2020.105981
    [19] Tran Q V, Ahn H S. Distributed formation control of mobile agents via global orientation estimation. IEEE Transactions on Control of Network Systems, 2020, 7(4): 1654−1664 doi: 10.1109/TCNS.2020.2993253
    [20] Wang B, Chen W, Wang J, Zhang B, Zhang Z, Qiu X. Cooperative tracking control of multiagent systems: A heterogeneous coupling network and intermittent communication framework. IEEE Transactions on Cybernetics, 2018, 49(12): 4308−4320
    [21] Cui B, Zhao C, Ma T, Feng C. Leader-following consensus of nonlinear multi-agent systems with switching topologies and unreliable communications. Neural Computing and Applications, 2016, 27: 909−915 doi: 10.1007/s00521-015-1905-0
    [22] Deng C, Yang G H. Distributed adaptive fault-tolerant control approach to cooperative output regulation for linear multi-agent systems. Automatica, 2019, 103: 62−68 doi: 10.1016/j.automatica.2019.01.013
    [23] Parsons S, Wooldridge M. Game theory and decision theory in multi-agent systems. Autonomous Agents and Multi-Agent Systems, 2002, 5: 243−254
    [24] Başar T, Olsder G J, Dynamic Noncooperative Game Theory. Pennsylvania: Society for Industrial and Applied Mathematics, 1998. 71–83
    [25] He W, Chen X, Fu H. Dual ML-ADHDP method for heterogeneous discrete-time nonlinear multi-agent systems with unknown dynamics and time delay. Journal of the Franklin Institute, 2022, 359(11): 5634−5657 doi: 10.1016/j.jfranklin.2022.04.040
    [26] Vamvoudakis K G, Lewis F L. Multi-player non-zero-sum games: Online adaptive learning solution of coupled Hamilton-Jacobi equations. Automatica, 2011, 47(8): 1556−1569 doi: 10.1016/j.automatica.2011.03.005
    [27] Werbos P. Approximate Dynamic Programming for Real-time Control and Neural Modeling. New York: Handbook of Intelligent Control, 1992. 12–23
    [28] Wei Q, Liu D. Data-driven neuro-optimal temperature control of water-gas shift reaction using stable iterative adaptive dynamic programming. IEEE Transactions on Industrial Electronics, 2014, 61(11): 6399−6408 doi: 10.1109/TIE.2014.2301770
    [29] Vamvoudakis K G, Lewis F L, Hudas G R. Multi-agent differential graphical games: Online adaptive learning solution for synchronization with optimality. Automatica, 2012, 48(8): 1598−1611 doi: 10.1016/j.automatica.2012.05.074
    [30] Zhang H, Feng T, Yang G H, Liang H. Distributed cooperative optimal control for multiagent systems on directed graphs: An inverse optimal approach. IEEE Transactions on Cybernetics, 2014, 45(7): 1315−1326
    [31] Abouheaf M I, Lewis F L. Multi-agent differential graphical games: Nash online adaptive learning solutions. In: Proceedings of the 52nd IEEE Conference on Decision and Control. Firenze, Italy: IEEE, 2013. 5803–5809
    [32] Zhang H, Zhang J, Yang G H, Luo Y. Leader-based optimal coordination control for the consensus problem of multiagent differential games via fuzzy adaptive dynamic programming. IEEE Transactions on Fuzzy Systems, 2014, 23(1): 152−163
    [33] Wei Q, Liu D, Lewis F L. Optimal distributed synchronization control for continuous-time heterogeneous multi-agent differential graphical games. Information Sciences, 2015, 317: 96−113 doi: 10.1016/j.ins.2015.04.044
    [34] Abouheaf M I, Lewis F L, Vamvoudakis K G, Haesaert S, Babuska R. Multi-agent discrete-time graphical games and reinforcement learning solutions. Automatica, 2014, 50(12): 3038−3053 doi: 10.1016/j.automatica.2014.10.047
    [35] Abouheaf M, Lewis F, Haesaert S, Babuska R, Vamvoudakis K. Multi-agent discrete-time graphical games: Interactive Nash equilibrium and value iteration solution. In: Proceedings of 2013 American Control Conference. Washington DC, USA: IEEE, 2013. 4189–4195
    [36] Wang D, Liu D, Li H, Ma H. Neural-network-based robust optimal control design for a class of uncertain nonlinear systems via adaptive dynamic programming. Information Sciences, 2014, 282: 167−179 doi: 10.1016/j.ins.2014.05.050
    [37] Zhang H, Jiang H, Luo Y, Xiao G. Data-driven optimal consensus control for discrete-time multi-agent systems with unknown dynamics using reinforcement learning method. IEEE Transactions on Industrial Electronics, 2016, 64(5): 4091−4100
    [38] Cai Y, Zhang H, Zhang K, Liu C. Fuzzy adaptive dynamic programming-based optimal leader-following consensus for heterogeneous nonlinear multi-agent systems. Neural Computing and Applications, 2020, 32(13): 8763−8781 doi: 10.1007/s00521-019-04263-0
    [39] Wang W, Chen X, Chen L, Wu M. Model-free optimal consensus control for multi-agent systems using kernel-based ADP method. In: Proceedings of 2017 IEEE International Conference on Systems, Man, and Cybernetics. Banff AB, Canada: IEEE, 2017. 2471–2476
    [40] Liu D, Wang D, Yang X. An iterative adaptive dynamic programming algorithm for optimal control of unknown discrete-time nonlinear systems with constrained inputs. Information Sciences, 2013, 220: 331−342 doi: 10.1016/j.ins.2012.07.006
    [41] Wang X S, Cheng Y H, Yi J Q. A fuzzy actor-critic reinforcement learning network. Information Sciences, 2007, 177(18): 3764−3781 doi: 10.1016/j.ins.2007.03.012
    [42] Khater A A, El-Nagar A M, El-Bardini M, El-Rabaie N. Online learning based on adaptive learning rate for a class of recurrent fuzzy neural network. Neural Computing and Applications, 2020, 32: 8691−8710 doi: 10.1007/s00521-019-04372-w
    [43] Khater A A, El-Nagar A M, El-Bardini M, El-Rabaie N. A novel structure of actor-critic learning based on an interval type-2 TSK fuzzy neural network. IEEE Transactions on Fuzzy Systems, 2019, 28(11): 3047−3061
    [44] Wang W, Chen X, Fu H, Wu M. Model-free distributed consensus control based on actor-critic framework for discrete-time nonlinear multiagent systems. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2018, 50(11): 4123−4134
    [45] Vrabie D, Lewis F. Neural network approach to continuous-time direct adaptive optimal control for partially unknown nonlinear systems. Neural Networks, 2009, 22(3): 237−246 doi: 10.1016/j.neunet.2009.03.008
    [46] 伍世虔, 徐军. 动态模糊神经网络: 设计与应用. 北京: 清华大学出版社, 2008. 27–28

    Wu Shi-Qian, Xv Jun. Dynamic Fuzzy Neural Network: Design and Application. Beijing: Tsinghua University Press, 2008. 27–28
    [47] Hartmanis J, Stearns R E. On the computational complexity of algorithms. Transactions of the American Mathematical Society, 1965, 117: 285−306 doi: 10.1090/S0002-9947-1965-0170805-7
    [48] Han S, Wang L, Wang Y T. A potential field-based trajectory planning and tracking approach for automatic berthing and COLREGs-compliant collision avoidance. Ocean Engineering, 2022, 266(3): Article No. 112877
    [49] Dong Z P, Zhang Z Q, Qi S J, Zhang H S, Li J K, Liu Y C. Autonomous cooperative formation control of underactuated USVs based on improved MPC in complex ocean environment. Ocean Engineering, 2023, 270: Article No. 113633 doi: 10.1016/j.oceaneng.2023.113633
    [50] Wang L, Chu X M, Liu C G. Different drive models of USV under the wind and waves disturbances MPC trajectory tracking simulation research. In: Proceedings of 2015 International Conference on Transportation Information and Safety. Wuhan, China: IEEE, 2015. 563–568
  • 加载中
图(10)
计量
  • 文章访问数:  226
  • HTML全文浏览量:  2259
  • PDF下载量:  108
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-06-30
  • 录用日期:  2025-01-17
  • 网络出版日期:  2025-02-18
  • 刊出日期:  2025-03-18

目录

/

返回文章
返回