Event-triggered Adaptive Critic Fault-tolerant Control for a Class of Discrete-time MIMO Systems
-
摘要: 本文针对具有执行器故障的一类离散非线性多输入多输出(Multi-input multi-output, MIMO)系统, 提出了一种基于事件触发的自适应评判容错控制方案. 该控制方案包括评价和执行网络. 在评价网络里, 为了缓解现有的非光滑二值效用函数可能引起的执行网络跳变问题, 利用高斯函数构建了一个光滑的效用函数, 并采用评价网络近似最优性能指标函数. 在执行网络里, 通过变量替换将系统状态的将来信息转化成关于系统当前状态的函数, 并结合事件触发机制设计了最优跟踪控制器. 该控制器引入了动态补偿项, 不仅能够抑制执行器故障对系统性能的影响, 而且能够改善系统的控制性能. 稳定性分析表明所有信号最终一致有界且跟踪误差收敛于原点的有界小邻域内. 数值系统和实际系统的仿真结果验证了该方案的有效性.Abstract: In this paper, an event-triggered adaptive critic fault-tolerant control scheme is proposed for a class of discretetime multi-input multi-output (MIMO) nonlinear systems with actuator fault. The proposed control scheme includes the critic and action neural networks (NNs). In the critic NN, a smooth utility function is constructed based on the Gaussian function, which avoids the possible chattering problem caused by the existing non-smooth utility function. Subsequently, the critic NN is used to approximate the optimal strategic utility function. In the action NN, the future system state is expressed by the functions of present system states by using the variable substitution method. By the combination of event-triggered mechanism, this paper designs the optimal tracking controller. An dynamic auxiliary signal is introduced in the developed controller, thereby eliminating the effect of the actuator fault and improving the control performance. Stability analysis indicates that all signals in the control-loop are ultimately uniformly bounded, and the tracking error converges to a small neighborhood of the origin. Finally, simulations of a numerical system and a practical system are performed to demonstrate the effectiveness of the proposed scheme.
-
随着现代工业的快速发展, 无线通信技术被广泛用于各类控制系统中, 以解决工业过程的远程控制问题, 同时提高设备安装和配置的灵活性. 例如, 地面站对高空无人机的控制, 以及控制台对作业车间中工业机器人的远程控制等都是借助无线通信技术来实现的[1-2]. 然而, 在网络资源受限的情况下, 传统的周期性数据传输和执行的控制方式很容易引发网络拥塞. 针对该问题, 文献[3]提出了事件触发的控制策略. 该策略通过仅在满足触发机制要求时进行数据传输, 从而有效地减少了控制系统中网络资源的占用. 结合事件触发策略, 自适应控制和万能逼近器等技术, 大量针对不确定非线性系统的事件触发控制方案相继被提出[4-6]. 需要指出的是, 上述方案极少考虑系统存在非匹配的不确定非线性动态情况, 即不确定非线性动态出现在非控制输入通道. 事实上, 非匹配的非线性动态普遍存在于各种实际系统, 如无人车, 机械臂和飞行器等[7-12]. 针对嵌入了“控制器−执行器网络”的非匹配非线性系统, 国内外学者们提出了大量具有相对或绝对事件触发条件的控制方案[13-15]. 由于事件触发条件设计与系统稳定性的强耦合特性, 导致上述方案很难拓展到嵌入“传感器−控制器网络”的不确定非匹配非线性系统. 为了解决该难题, 文献[16]结合脉冲动力系统和死区算子等技术, 提出了具有自适应事件触发条件的控制方案. 需要说明的是, 上述方案仅适合于连续系统.
相比于连续系统, 离散系统更适用于描述数字化系统的控制过程. 然而, 离散系统事件触发控制方面的研究成果寥寥无几. 造成这一现象的主要原因是直接利用反步法对离散非匹配系统进行控制器设计时, 通常会产生非因果问题[17], 故而难以将连续系统的研究成果直接推广到对应的离散系统上. 为了克服该问题, 文献[18]先将原系统转化成一个n步向前预测模型, 并在该模型上进行反步控制设计. 在假设网络资源充足的前提下, 大量基于n步预测器的离散非匹配非线性系统的控制方案相继被提出[19-22]. 考虑到远程控制中网络资源受限问题, 文献[23]尝试提出了基于n步预测模型的事件触发自适应神经网络控制方案. 然而, 文献[23]设计的控制器存在n步滞后现象, 且触发条件复杂不便于实施. 在此基础上,文献[24-25]探讨了随机噪声情况下离散非匹配非线性系统的事件触发控制问题. 值得注意的是, 上述的方案都没有考虑事件触发下系统的最优控制问题和可能出现的执行器故障现象.
众所周知, 在资源受限的情况下考虑如何利用有限的资源来优化系统性能以及减少资源浪费是非常有必要的. 动态规划是常用的解决最优化问题的有效方法之一, 但是控制动态规划后向寻优的求解过程的矛盾以及系统维数较高时所导致的“维数灾”问题, 使得动态规划难以在系统的最优化控制中得到大规模的应用[26]. 为了解决此问题, 文献[27]通过采用“执行−评价”结构, 提出了自适应评判设计方法. 该方法使得执行网络能够根据评价结果适时调整控制策略, 从而达到实时寻优的目的. 目前, 自适应评判设计被广泛应用于解决离散和连续系统的最优控制问题[21-22, 28-30]. 如何将该方法推广到具有网络资源受限的离散非匹配非线性系统控制中是亟待解决的问题. 此外, 执行器故障广泛存在于工业生产过程中. 执行器故障会导致系统性能下降, 甚至导致系统不稳定[31-34]. 因此, 在执行器故障下, 研究离散非匹配非线性系统的事件触发自适应评判容错控制具有重要意义.
基于上述分析, 本文着重研究具有非匹配结构的离散多输入多输出(Multi-input multi-output, MIMO)非线性系统的事件触发自适应评判容错控制问题. 与现有的结果相比, 本文的贡献可归纳如下: 1)构造光滑的效用函数来构建系统的长期性能指标函数, 从而避免了现有的非光滑二值效用函数切换过程中可能引起的评价网络和执行网络跳变现象; 2)采用变量替换法将系统的将来信息表示成关于系统当前状态的函数, 从而避免了控制设计过程中的非因果问题和控制信号的n步时延问题; 3)通过在控制器中引入动态补偿项, 并结合自适应评判设计方法, 从而改善了系统控制性能和进一步降低了事件触发次数.
1. 问题描述及预备知识
本文所考虑的网络控制系统模型如下
$$ \left\{ \begin{aligned} &x_{j,i_j}(k+1) = f_{j,i_j}\left(\bar{{\boldsymbol{x}}}_{j,i_j}(k)\right)+\\ &\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;g_{j, i_j}\left(\bar{{\boldsymbol{x}}}_{j,i_j}(k)\right) x_{j, i_j+1}(k) \\ &x_{j,n_j}(k+1) = f_{j, n_{j}}({\boldsymbol{X}}(k))+\\ &\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;g_{j, n_j}({\boldsymbol{X}}(k)) u_{j}(k)+d_j(k) \\ &y_j(k) = x_{j, 1}(k) \end{aligned} \right. $$ (1) 其中,
$j = 1,2,\cdots,N,$ $i_j = 1,2,\cdots,n_j-1$ ,$\bar{{\boldsymbol{x}}}_{j,i_j}(k) = $ $ [x_{j,1}(k),x_{j,2}(k),\cdots,x_{j,i_j}(k)]^{\rm T}\in \mathbf{R}^{i_j} .$ ${\boldsymbol{x}}_j(k) = \bar{{\boldsymbol{x}}}_{j,n_j}(k)\in $ $ \mathbf{R}^{n_j}$ ,$ u_j(k)\in \bf{R} $ 和$ y_j(k)\in \bf{R} $ 分别表示第j个子系统的状态, 控制输入和系统输出.$ f_{j,i_j}(\cdot)\in \mathbf{R} $ 及$g_{j,i_j}(\cdot)\in $ $ \mathbf{R}$ 是未知的非线性函数($j = 1,2,\cdots,N;i_j = 1,2,\cdots, $ $ n_j$ ).$ {\boldsymbol{X}}(k) = [{\boldsymbol{x}}_1^{\rm T}(k),{\boldsymbol{x}}_2^{\rm T}(k),\cdots,{\boldsymbol{x}}_N^{\rm T}(k)]^{\rm T} $ 是整个系统的状态,$ \bar{{\boldsymbol{u}}}_{j-1}(k) = [u_1(k),\cdots,u_{j-1}(k)]^{\rm T}\in \mathbf{R}^{j-1} $ .$ d_j(k)\in \bf{R} $ 为外部扰动, 满足$ |d_j(k)|\leq \bar{d}_j $ ,$ \bar{d}_j>0 $ . 本文假设系统(1)是全状态可测的.本文考虑执行器故障模型如下
$$ u_j(k) = \delta_j\omega_j(k)+\theta_j(k),j = 1,2,\cdots,N $$ (2) 其中,
$ \omega_j(k) $ 为控制器输入,$ \delta_j $ 为执行器效率因子, 满足$ 0<\underline{\delta}_j\leq\delta_j\leq 1 $ .$ \theta_j(k) $ 为未知的执行器偏置故障, 满足$ |\theta_j(k)|\leq \overline{\theta}_j $ ,$ \overline{\theta}_j>0 $ . 当$ \delta_j = 1 $ ,$ \theta_j(k) = 0 $ 时, 表示执行器正常工作; 当$ 0<\delta_j<1 $ ,$ \theta_j(k) = 0 $ 时, 表示执行器部分功能损失; 当$ 0<\delta_j\leq 1 $ ,$\theta_j(k)\neq $ $ 0$ 时, 表示执行器偏置故障.控制目标: 本文的控制目标是基于事件触发机制设计系统(1)的最优容错控制律, 使得在网络资源受限和执行器故障的情况下, 1)闭环系统的所有信号都是最终一致有界的; 2)系统的输出
$ y_j(k) $ 能够跟踪给定的参考信号$ y^*_j(k) $ ; 3)同时减少传感器到控制器之间的网络数据传输.假设 1. 对于系统(1)中的未知函数
$ g_{j,i_j}(\cdot) $ ($i_j = $ $ 1,2,\cdots,n_j$ ;$j = 1,2,\cdots,N$ ) , 存在常数$0 < \underline{g}_{j,i_j}\leq $ $ \overline{g}_{j,i_j}$ , 使得$ \underline{g}_{j,i_j}\leq|g_{j,i_j}(\cdot)|\leq \overline{g}_{j,i_j} $ . 不失一般性, 本文假设非线性函数$ g_{j,i_j}(\cdot) $ 是正定的.1.1 高阶神经网络
本文采用高阶神经网络(High-order neural network, HONN)来逼近未知的非线性动态, HONN的结构能够用如下方程来描述:
$$ f_{nn}({\boldsymbol{Z}}(k)) = {\boldsymbol{W}}^{\rm T} {\boldsymbol S}({\boldsymbol{Z}}(k)) $$ (3) 其中,
$ {\boldsymbol{Z}}(k) = [z_1(k),z_2(k),\cdots,z_n(k)]^{\rm T}\in {\bf R}^n $ 为神经网络的输入向量,$ {\boldsymbol W}\in {\bf R}^l $ 为网络权值,${\boldsymbol S}({\boldsymbol Z}(k)) = $ $ [s_1({\boldsymbol Z}(k)),s_2({\boldsymbol Z}(k)),\cdots,s_l({\boldsymbol Z}(k))]^{\rm T}\in {\bf R}^l$ 为激活函数向量.$ s_i({\boldsymbol{Z}}(k)) = \prod_{j\in I_i}s(z_j(k))^{m_j^i} $ ,$s(z_j(k)) = \tanh $ $ (z_j(k))$ .$ m_j^i $ 是非负整数,$ I_i $ 是一个集合, 满足$\{I_1, $ $ I_2,\cdots,I_l\}\subseteq\{1,2,\cdots,n\}$ . HONN的激活函数$ s(\cdot) $ 满足全局Lipschitz条件, 即对任意$ z_1(k) $ ,$z_2(k) \in $ $ \bf{R}$ , 存在正常数$ L_s $ 使得不等式$|s(z_1(k))-s(z_2(k))|\leq $ $ L_s |z_1(k)-z_2(k)|$ 成立.对于任意光滑的函数
$ f({\boldsymbol Z}(k)): {\bf R}^n\to {\bf R} $ , 存在一组理想的权值$ {\boldsymbol{W}}^*\in {\bf R}^l $ 使得当$ l $ 足够大时, HONN对$ f({\boldsymbol{Z}}(k)) $ 的逼近误差$ \epsilon(k) $ 能够任意小:$$ f({\boldsymbol{Z}}(k)) = {\boldsymbol{W}}^{\rm *T} {\boldsymbol S}({\boldsymbol{Z}}(k))+\epsilon({\boldsymbol{Z}}(k)) $$ (4) 本文假设存在大于零的常数
$ \overline{W} $ 和$ \bar{\epsilon} $ 使得,$\|{\boldsymbol W}^*\|\leq $ $ \overline{W}$ ,$ |\epsilon({\boldsymbol{Z}}(k))|\leq \bar{\epsilon} $ .引理 1 [18, 20]. 对于式(3)表示的HONN的激活函数向量
${\boldsymbol S}({\boldsymbol{Z}}(k))$ , 恒有如下的不等式成立$$ {\boldsymbol S}^{\rm T}({\boldsymbol{Z}}(k)){\boldsymbol S}({\boldsymbol{Z}}(k))< l $$ (5) 1.2 事件触发机制
如图1所示, 本文主要考虑系统的传感器和控制器通讯时采用事件触发机制进行数据传输. 当触发条件满足时, 传感器将采集到的系统状态数据通过网络传输给控制器. 为了便于事件触发条件的设计, 本文定义如下的传输误差
$${\boldsymbol{E}_t}(k) = \left\{ {\begin{array}{*{20}{l}} {{\bf{0}},}&{k = {k_t}}\\ {\boldsymbol{X}(k) - \boldsymbol{X}({k_t}),}&{{k_t} < k < {k_{t + 1}}} \end{array}} \right.$$ (6) 其中,
$ k_t $ 表示上一个事件触发时刻,$ {\boldsymbol{X}}(k) $ 为系统(1)的当前状态,$ {\boldsymbol{X}}(k_t) $ 为上一次传输的系统状态.2. 基于事件触发的自适应评判容错控制设计
在这一节中, 针对所考虑的系统(1), 本文提出了一种基于事件触发的自适应评判容错控制方案.
为了便于控制器设计, 定义如下的误差变量
$$ z_{j,i_j}(k) = x_{j,i_j}(k)-\alpha_{j,i_j-1}(k) $$ (7) 其中,
$ j = 1,2,\cdots,N $ ,$ i_j = 1,2,\cdots,n_j $ ,$\alpha_{j,0}(k) = $ $ y_j^*(k)$ ,$ \alpha_{j,i_j-1}(k) $ 是待设计的虚拟控制律. 此外, 定义了如下的中间函数$$ \begin{split} &\phi_{j,i_j}(\bar{{\boldsymbol{x}}}_{j, i_j+1}(k)) = g_{j,i_j}(\bar{{\boldsymbol{x}}}_{j,i_j}(k)) x_{j, i_j+1}(k)+\\ &\qquad\qquad\qquad\qquad f_{j,i_j}\left(\bar{{\boldsymbol{x}}}_{j,i_j}(k)\right)\\ &\qquad j = 1,2,\cdots,N;\; i_j = 1,2,\cdots,n_j-1 \end{split} $$ (8) 基于以上定义的误差变量(7)和中间函数(8), 评价网络和执行网络的具体设计过程给出如下.
2.1 评价网络设计
首先, 定义效用函数
$$ q_j(k) = 1 - {\rm e}^{-z_{j, 1}^{2}(k)/\eta_j} $$ (9) 其中,
$ \eta_j>0 $ 是一个可调参数. 根据式(9)可知, 当跟踪误差$ z_{j,1}(k) = 0 $ 时,$ q_j(k) = 0 $ ; 当跟踪误差$ z_{j,1}(k)\to \pm \infty $ 时,$ q_j(k)\to 1 $ . 因此,$ q_j(k) $ 可视作系统当前性能的评价. 基于效用函数$ q_j(k) $ , 定义系统长期性能指标函数$$ Q_j(k) = \sum\limits^{\infty}_{m = 1}\zeta^{m-1}_j q_j(k+m) $$ (10) 其中,
$ 0<\zeta_j<1 $ . 根据定义(10)可得$$ Q_j(k-1) = \zeta_j Q_j(k)+q_j(k)$$ (11) 式(11)也被称为Bellman等式. 采用评价网络对
$ Q_j(k) $ 进行逼近, 则有$$ Q_j(k) = {\boldsymbol{\Theta}}_j^{\rm *T}{{\boldsymbol{\psi}}_j}\left({{\boldsymbol{\chi}}_j(k)}\right)+\varepsilon_j(k) $$ (12) 其中,
$ {\boldsymbol{\Theta}}_j^* $ 是评价网络的理想权值,$ \varepsilon_j(k) $ 为网络的逼近误差,${{\boldsymbol{\chi}}_j}(k) = {\boldsymbol{v}}_j^{\rm T}z_{j,1}(k)$ ,${\boldsymbol{v}}_j$ 是一个常数向量. 由于$ {\boldsymbol{\Theta}}_j^* $ 未知, 故而令$ \hat{Q}_j(k) $ 为$ Q_j(k) $ 的估计, 其表达式为:$$ \hat{Q}_j(k) = \hat{{\boldsymbol{\Theta}}}_j^{\rm T}(k){{\boldsymbol{\psi}}_j}({\boldsymbol{\chi}}_j(k_t)) $$ (13) 其中,
$ \hat{{\boldsymbol \Theta}}_j(k) $ 为理想权值$ {\boldsymbol \Theta}_j^* $ 的估计,${\boldsymbol{\chi}}_j(k_t) = $ $ {\boldsymbol{v}}_j^{\rm T} z_{j,1}(k_t)$ . 令${\boldsymbol{\psi}}_j(k_t) = {\boldsymbol{\psi}}_j({\boldsymbol{\chi}}_j(k_t))$ , 并定义如下的目标函数$ E_{cj}(k) $ $$ E_{cj}(k) = \frac{1}{2} e_{c j}^{2}(k) $$ (14) 其中,
$ e_{cj}(k) = \zeta_j\hat{Q}_j(k)-\hat{Q}_j(k-1)+q_j(k) $ . 当目标函数$ E_{cj}(k) $ 的值最小时,$ \hat{Q}_j(k) $ 最接近理想的策略函数$ Q_j(k) $ , 系统性能最接近于最优性能. 为最小化能量函数$ E_{cj}(k) $ , 令$\Delta \hat{{\boldsymbol{\Theta}}}_j(k) = -\tau_j(k)\gamma_{cj} \partial E_{cj}(k)/ $ $ \partial \hat{{\boldsymbol{\Theta}}}_j(k)$ , 从而评价网络权值更新律为:$$ \begin{split} \hat{{\boldsymbol{\Theta}}}_j(k+1) =\;& \hat{{\boldsymbol{\Theta}}}_j(k)-\tau_j(k) \gamma_{cj}\zeta_j {\boldsymbol{\psi}}_j(k_t)\big[\zeta_j\hat{Q}_j(k)- \\ &\hat{Q}_j (k-1)+q_j(k)\big] \\[-10pt]\end{split} $$ (15) 其中,
$ \tau_j(k) $ 为第$ j $ 个子系统的事件触发状态指示函数, 定义如下$$ \tau_j(k) = \left\{ \begin{array}{l} 1, \; \; k = k_t \\ 0, \; \; k_t<k<k_{t+1} \end{array} \right. $$ (16) 令
$ \tilde{{\boldsymbol{\Theta}}}_j(k) = \hat{{\boldsymbol{\Theta}}}_j(k)-{\boldsymbol{\Theta}}^*_j $ , 从式(15)两端减去$ {\boldsymbol{\Theta}}^*_j $ 可得评价网络权值的估计误差动态$$ \begin{split} \tilde{{\boldsymbol{\Theta}}}_j(k+1) =\;& \tilde{{\boldsymbol{\Theta}}}_j(k)-\tau_j(k) \gamma_{cj}\zeta_j {\boldsymbol{\psi}}_j(k_t)\big[\zeta_j\hat{Q}_j(k)- \\ &\hat{Q}_j (k-1)+q_j(k)\big] \\[-10pt]\end{split} $$ (17) 注 1. 在评价网络的设计中, 文献[22, 31]都采用二值效用函数来构建长期的性能函数. 由于评价网络与执行网络相关联, 二值效用函数值的突变会对执行网络造成冲击, 从而加速执行部件的老化和磨损. 为了避免该问题, 本文利用指数函数和跟踪误差
$ z_{j,1}(k) $ 定义了一个光滑的效用函数(9). 从式(9)可知,$ q_j(k) $ 的值在$ [0,1) $ 之间连续变化, 从而能够避免由于效用函数值的突变造成执行网络的冲击.2.2 执行网络设计
这部分主要进行执行网络的设计. 首先, 利用反步法设计出理想的控制律, 并用执行网络来对其进行逼近. 具体设计过程如下.
第1步. 已知跟踪误差
$ z_{j, 1}(k) = x_{j, 1}(k)-y_j^*(k) $ ,$ z_{j, 2}(k) = x_{j, 2}(k)-\alpha_{j,1}(k) $ , 根据系统(1)可得$$ \begin{split} z_{j, 1}(k+1) =\;& g_{j, 1}\left(x_{j, 1}(k)\right)\bigg[z_{j, 2}(k)+\alpha_{j, 1}(k) +\\ &\frac{f_{j, 1}\left(x_{j, 1}(k)\right)-y_j^*(k+1)}{g_{j,1}\left(x_{j, 1}(k)\right)}\bigg] \\[-10pt]\end{split} $$ (18) 根据式(18), 虚拟控制律
$ \alpha_{j,1}(k) $ 可设计为$$ \begin{split} \alpha_{j, 1}(k) =\;& -\frac{f_{j, 1}\left(x_{j, 1}(k)\right)-y_j^*(k+1)}{g_{j,1}\left(x_{j,1}(k)\right)} := \\ &\Phi_{j, 1}\left(x_{j, 1}(k), y_j^*(k+1)\right) \end{split}$$ (19) 将式(19)代入式(18)可得
$$ z_{j, 1}(k+1) = g_{j, 1}\left(x_{j, 1}(k)\right) z_{j,2}(k) $$ (20) 第2步. 已知
$ z_{j,2}(k) = x_{j,2}(k)-\alpha_{j,1}(k) $ , 由系统模型(1) 可得$ z_{j,2}(k) $ 的动态为:$$ \begin{split} z_{j, 2}(k+1) =\;& g_{j, 2}\left({\boldsymbol{\bar{x}}}_{j,2}(k)\right)\bigg[z_{j, 3}(k)+\alpha_{j, 2}(k) +\\ &\frac{f_{j,2}\left(\bar{{\boldsymbol{x}}}_{j, 2}(k)\right)-\alpha_{j,1}(k+1)}{g_{j,2}\left(\bar{{\boldsymbol{x}}}_{j,2}(k)\right)}\bigg]\\[-15pt] \end{split} $$ (21) 根据式(19), 式(21) 中的
$ \alpha_{j,1}(k+1) $ 中包含系统的将来信息$ x_1(k+1) $ . 若不加以处理, 接下来设计出的虚拟控制律和实际控制律中都将包含系统的将来信息, 导致所得出的控制律不可实现. 为了解决该问题, 本文利用变量替换的方法将$ \alpha_{j,1}(k+1) $ 表示成关于系统当前状态的函数:$$ \alpha_{j, 1}(k+1) = \Phi_{j, 1}\left(\phi_{j, 1}\left(\bar{{\boldsymbol{x}}}_{j, 2}(k)\right), y^*_j(k+2)\right) $$ (22) 从而, 选择虚拟控制
$ \alpha_{j,2}(k) $ 为$$ \begin{split} \alpha_{j,2}(k) =\;& -\frac{f_{j,2}(\bar{{\boldsymbol{x}}}_{j,2}(k))}{g_{j,2}(\bar{{\boldsymbol{x}}}_{j,2}(k))}+\\ &\frac{\Phi_{j,1}\left(\phi_{j, 1}\left(\bar{{\boldsymbol{x}}}_{j,2}(k)\right), y^*_j(k+2)\right)}{g_{j,2}(\bar{{\boldsymbol{x}}}_{j,2}(k))} \end{split} $$ (23) 将式(23)代入式(21), 可得
$$ z_{j, 2}(k+1) = g_{j, 2}\left(\bar{{\boldsymbol{x}}}_{j, 2}(k)\right) z_{j, 3}(k) $$ (24) 第
$ i_j $ 步 ($ 3\leq i_j \leq n_j-1 $ ). 结合定义(7)和系统模型(1), 可得变量$ z_{j,i_j}(k) $ 的动态为$$ \begin{split} z_{j,i_j}(k+1) =\;& g_{j,i_j}\left(\bar{{\boldsymbol{x}}}_{i, 2}(k)\right)\bigg[z_{j, i_j+1}(k)+\alpha_{j,i_j}(k)+\\ &\frac{f_{j,i_j}\left(\bar{{\boldsymbol{x}}}_{j,i_j}(k)\right)-\alpha_{j,i_j-1}(k+1)}{g_{j,i_j}\left(\bar{{\boldsymbol{x}}}_{j,i_j}(k)\right)}\bigg] \end{split} $$ (25) 根据式(19)、(23)和中间函数(8), 可推知
$$ \begin{split} &\alpha_{j, i_j-1}(k+1) =\\ &\qquad \Phi_{j, i_j-1}(\bar{{\boldsymbol{\phi}}}_{j, i_j-1}\left(\bar{{\boldsymbol{x}}}_{j,i_j}(k)\right), y_j^*(k+i_j)) \end{split} $$ (26) 因此, 虚拟控制
$ \alpha_{j,i_j}(k) $ 的递推公式为$$ \begin{split} \alpha_{j,i_j}(k) =\;& -\frac{f_{j,i_j}(\bar{{\boldsymbol{x}}}_{j,i_j}(k))}{g_{j,i_j}\left(\bar{{\boldsymbol{x}}}_{j,i_j}(k)\right)}+ \\ &\frac{\Phi_{j, i_j-1}(\bar{{\boldsymbol{\phi}}}_{j,i_j-1}(\bar{{\boldsymbol{x}}}_{j,i_j}(k)),y_j^*(k+i_j))}{g_{j,i_j}\left(\bar{{\boldsymbol{x}}}_{j,i_j}(k)\right)} := \\ &\Phi_{j,i_j}\left(\bar{{\boldsymbol{x}}}_{j,i_j}(k), y_j^*(k+i_j)\right)\\[-10pt] \end{split} $$ (27) 将式(27)代入式(25)可得
$$ z_{j,i_j}(k+1) = g_{j,i_j}\left(\bar{{\boldsymbol{x}}}_{j,i_j}(k)\right) z_{j,i_j+1}(k) $$ (28) 第
$ n_j $ 步. 在这一步中将设计出第$ j $ 个子系统的控制律$ \omega_j(k) $ . 根据系统模型(1), 定义(7)以及执行器故障模型(2)可得$ z_{j,n_j}(k) $ 的动态为$$ \begin{split} &z_{j,n_{j}}(k+1) = \delta_j g_{j, n_j}({\boldsymbol{X}}(k))\bigg[\omega_j(k)+\frac{\theta_j(k)}{\delta_j}+ \\ &\frac{f_{j, n_j}({\boldsymbol{X}}(k))-\alpha_{j, n_j-1}(k+1)}{\delta_j g_{j, n_j}({\boldsymbol{X}}(k))}+\frac{d_j(k)}{\delta_j g_{j, n_j}({\boldsymbol{X}}(k))}\bigg]\end{split} $$ (29) 根据递推式(26),
$ \alpha_{j,n_j-1}(k+1) $ 可以表示成$$ \begin{split} &\alpha_{j,n_j-1}(k+1) =\\ &\qquad \Phi_{j,n_j-1}(\bar{{\boldsymbol{\phi}}}_{j,n_j-1}(\bar{{\boldsymbol{x}}}_{j,n_j}(k)),y^*_j(k+n_j)) \end{split} $$ (30) 定义非线性函数
$$ \begin{split} &\Phi_{j, n_j}\left({\boldsymbol{X}}(k), y_j^{*}\left(k+n_{j}\right)\right) = -\frac{f_{j, n_j}({\boldsymbol{X}}(k))}{\delta_j g_{j, n_j}({\boldsymbol{X}}(k))}+ \\ &\qquad \frac{\Phi_{j,n_j-1}(\bar{{\boldsymbol{\phi}}}_{j,n_j-1}(\bar{{\boldsymbol{x}}}_{j,n_j}(k)),y^*_j(k+n_j))}{\delta_j g_{j, n_j}({\boldsymbol{X}}(k))} \end{split} $$ (31) 由式(19)、(23)、(27)以及假设1可知, 非线性函数
$ \Phi_{j,n_j}({\boldsymbol{X}}(k),y_j^*(k+n_j)) $ 是非奇异的. 因而, 采用HONN来近似函数$ \Phi_{j, n_j}\left({\boldsymbol{X}}(k), y_j^{*}\left(k+n_j\right)\right) $ , 可得$$ \Phi_{j, n_j}\left({\boldsymbol{Z}}_j(k)\right) = {\boldsymbol{W}}_j^{*{\rm T}}(k) {\boldsymbol{\varphi}}_j\left({\boldsymbol{Z}}_j(k)\right)+\epsilon_j(k) $$ (32) 其中,
${\boldsymbol{Z}}_j(k) = [{\boldsymbol{X}}^{\rm T}(k),y^*_j(k+n_j)]^{\rm T}$ ,$ {\boldsymbol{W}}^*_j $ 为理想权值,$ \epsilon_j(k) $ 为逼近误差.为了节省网络带宽, 本文设计如下的事件触发的自适应神经网络控制律:
$$ \omega_j(k) = \hat{{\boldsymbol{W}}}^{\rm T}_j(k){\boldsymbol{\varphi}}_j({\boldsymbol{Z}}_j(k_t))+\hat{\mu}_j(k) $$ (33) 其中,
${\boldsymbol{Z}}_j(k_t) = [{\boldsymbol{X}}^{\rm T}(k_t),y^*_j(k+n_j)]^{\rm T}$ ,$ \hat{{\boldsymbol{W}}}_j(k) $ 为$ {\boldsymbol{W}}^*_j $ 的估计,$ k_t $ 表示事件触发时刻.$ \hat{\mu}_j(k) $ 为由执行器故障(2)导致的未知常数$ \mu_j = \bar{\theta}_j/\underline{\delta}_j $ 的估计, 令$ \tilde{\mu}_j(k) = $ $ \hat{\mu}_j(k)-\mu_j $ .将式(31)~(33) 代入式(29), 可得
$$ \begin{split} z_{j,n_j}(k+1) =\;& \delta_j g_{j,n_j}({\boldsymbol{X}}(k))\big[\tilde{{\boldsymbol{W}}}^{\rm T}_j(k){\boldsymbol{\varphi}}_j({\boldsymbol{Z}}_j(k))+ \\ &\hat{{\boldsymbol{W}}}^{\rm T}_j(k)\tilde{{\boldsymbol{\varphi}}}_j(k)+\tilde{\mu}_j(k)+D_j(k)\big] \end{split} $$ (34) 其中,
$\tilde{{\boldsymbol{W}}}_j(k) = \hat{{\boldsymbol{W}}}_j(k)-{\boldsymbol{W}}_j^*$ ,$\tilde{{\boldsymbol{\varphi}}}_j(k) = {\boldsymbol{\varphi}}_j({\boldsymbol{Z}}_j(k_t))- $ $ {\boldsymbol{\varphi}}_j\,({\boldsymbol{Z}}_j\,(k))$ ,$D_j(k)= \mu_j+\theta_j(k)/\delta_j+d_j(k)/ \delta_j g_{j,n_j} $ $ ({\boldsymbol{X}}(k))+ \epsilon_j(k)$ 是一个有界项, 满足$D_j(k)\leq 2\mu_j+ $ $ \bar{d}_j/\underline{\delta}_j\underline{g}_{j,n_j}+\bar{\epsilon}_j = \bar{D}_j$ .令
$\Psi_j(k) = \tilde{{\boldsymbol{W}}}^{\rm T}_j(k){\boldsymbol{\varphi}}_j({\boldsymbol{Z}}_j(k))$ ,$g_{j, n_j}(k) = g_{j, n_j} ({\boldsymbol{X}}(k))$ , 并定义如下的目标函数:$$ E_{aj}(k) = \frac{1}{2}e_{aj}^2(k) $$ (35) 其中,
$e_{aj}(k) = g^{0.5}_{j, n_j}(k) \Psi_j(k)+g^{-0.5}_{j, n_j}(k)\hat{Q}_j(k)$ . 根据梯度下降法, 设计执行网络的权值更新律为$\Delta \hat{{\boldsymbol{W}}}_j(k) = $ $ -\tau_j(k)\gamma_{aj}\partial E_{aj}(k)/\partial \hat{{\boldsymbol{W}}}_j(k)$ , 目标函数$ E_{aj}(k) $ 将随着$ \hat{{\boldsymbol{W}}}_j(k) $ 的演化而收敛到其最小值. 目标函数$ E_{aj}(k) $ 的梯度为,$$ \frac{\partial E_{aj}(k)}{\partial \hat{{\boldsymbol{W}}}_j(k)} = {\boldsymbol{\varphi}}_j({\boldsymbol{Z}}_j(k))\big[g_{j,n_j}(k)\Psi_j(k)+\hat{Q}_j(k)\big] $$ (36) 已知在事件触发时刻式(34)中的
$ \tilde{\varphi}_j(k) = 0 $ , 从而可得$g_{j,n_j}(k)\Psi_j(k) = z_{j,n_j}(k+1)/\delta_j-g_{j,n_j} (k) $ $ D_j(k)$ . 但是, 由于$ D_j(k) $ 是一个扰动项, 而$ z_{j,n_j}(k+1) $ 又无法获得. 因而, 设计如下基于事件触发机制的执行网络权值更新律$$ \begin{split} \hat{{\boldsymbol{W}}}_j(k+1) =\;& -\tau_j(k)\gamma_{aj} {\boldsymbol{\varphi}}_j({\boldsymbol{Z}}_j(k))\big[\hat{Q}_{j}(k)+\\ &\hat{{\boldsymbol{W}}}^{\rm T}_j(k){\boldsymbol{\varphi}}_j({\boldsymbol{Z}}_j(k))\big]+\hat{{\boldsymbol{W}}}_j(k) \end{split}$$ (37) 定义执行网络权值的估计误差为
$\tilde{{\boldsymbol{W}}}_j(k) = \hat{{\boldsymbol{W}}}_j(k)- $ $ {\boldsymbol{W}}^*_j$ , 从式(37)等号两端分别减去$ {\boldsymbol{W}}^*_j $ , 可得执行网络权值估计误差动态为$$ \begin{split} \tilde{{\boldsymbol{W}}}_j(k+1) =\;& -\tau_j(k)\gamma_{aj} {\boldsymbol{\varphi}}_j({\boldsymbol{Z}}_j(k))\big[\hat{Q}_{j}(k)+\\ &\hat{{\boldsymbol{W}}}^{\rm T}_j(k){\boldsymbol{\varphi}}_j({\boldsymbol{Z}}_j(k)) \big]+\tilde{{\boldsymbol{W}}}_j(k) \end{split}$$ (38) 从式(33)可知,
$ \hat{\mu}_j(k) $ 是执行器故障的补偿项. 为了达到补偿效果, 接下来我们需要设计$ \hat{\mu}_j(k) $ 的更新律.定义目标函数
$$ e_{\mu j}(k) = \hat{\mu}_j(k)+z_{j,1}(k) $$ (39) 采用梯度下降法设计
$ \hat{\mu}_j(k) $ 的更新律, 使得最小化目标函数$ E_{\mu j}(k) = 0.5e^2_{\mu j}(k) $ , 则$ \hat{\mu}_j(k) $ 的更新律设计为$$ \hat{\mu}_j(k+1) = \hat{\mu}_j(k)-\beta_j\tau_j(k)\left[\hat{\mu}_j(k)+z_{j,1}(k)\right] $$ (40) 从而
$ \tilde{\mu}_j(k) $ 的动态为$$ \tilde{\mu}_j(k+1) = \tilde{\mu}_j(k)-\beta_j\tau_j(k)\left[\hat{\mu}_j(k)+z_{j,1}(k)\right] $$ (41) 注 2. 在控制器的设计中, 不同于文献[18−22] 所采用的
$ n $ 步向前预测模型方法, 本文利用以当前时刻系统状态为变量的函数来刻画虚拟控制律的将来信息(26), 从而成功避免了在离散系统控制设计过程中可能出现的非因果问题以及基于$ n $ 步预测模型所导致的控制信号滞后$ n $ 步的问题.注 3. 从式(26) 可知, 虚拟控制律的将来信息
$ \alpha_{j, i_j-1}(k+1) $ 已经被表示为系统状态当前信息和参考信号将来信息$ y_j^*(k+i_j) $ 的函数. 类似于现有文献[18−22], 本文假定参考信号是人为给定的, 能够事先获得将来信息. 此外, 如果实际系统中参考信号的将来信息无法预先获得, 那么可以构造$ i_j $ 步参考信号预测器, 从而可以解决该问题.注 4. 注意到本文所考虑的系统(1) 是全状态可测的. 然而, 通过构造状态观测器[35]和引入控制增益函数
$ g_{j,i_j}(\cdot) $ ($ j = 1,2,\cdots,N $ )是已知的约束, 本文所提出的状态反馈控制方案很容易推广到系统状态不完全可测的情况. 需要指出的是, 在状态不完全可测的情况下, 对于未知函数增益$ g_{j,i_j}(\cdot) $ 的处理目前仍是一个开放性和具有挑战性的问题.3. 主要结果
注意到事件触发机制设计的主要目的在于节省网络资源, 该机制决定了是否将传感器采集到的当前时刻的系统数据发送给控制器. 为了能够在节省网络带宽情况下仍然保证系统的控制性能, 本文首先设计了如下的静态事件触发条件:
$$ k_{t+1} = \{k\in {\bf {N}}|ET_1\vee ET_2\vee\cdots\vee ET_N\} $$ (42) 其中,
$ ET_j $ 设计为$$ \|{\boldsymbol{E}}_t(k)\|^2\geq A_j|z_{j,1}(k)|^2/(C_j+B_j\|\hat{{\boldsymbol{W}}}_j(k)\|^2) \nonumber $$ 其中,
$ A_j>0 $ ,$ B_j = 4r_{j,n_j}L^2_s\bar{g}^2_{j,n_j}>0 $ 和$ C_j>0 $ 为待定的触发条件参数,$ j = 1,2,\cdots,N $ .定理 1. 考虑离散多输入多输出系统(1), 控制器(33), (40), 评价网络和执行网络的权值更新律(15)和(37), 以及事件触发条件(42), 若存在正常数
$ l_{aj} $ ,$ l_{cj} $ ,$ \sigma_{aj} $ ,$ \sigma_{cj} $ ,$ \varrho_j $ ,$ r_{j,i_j} $ ($ i_j = 1,2,\cdots,n_j $ ),$ 0<\zeta_j<1 $ ,$ 0<\beta_j<1 $ ,$ 0<\gamma_{aj}<1/l_{aj} $ ,$ 0<\gamma_{cj}< $ $ 1/l_{cj} $ 使得对所有$ j = 1,2,\cdots,N $ 满足如下的条件:$$ \left\{ \begin{aligned} &r_{j,1}>\max\{A_j,2\sigma_{aj}+2\varrho_j\} \\ &r_{j,i_j}-r_{j,i_j-1}\bar{g}^2_{j,i_j-1}>0,i_j = 2,\cdots,n_j\\ &\sigma_{aj}-2r_{j,n_j}\bar{g}^2_{j,n_j}>0\\ &\varrho_j-3r_{j,n_j}\bar{g}^2_{j,n_j}>0 \end{aligned} \right.$$ (43) 那么闭环系统中的所有信号都是最终一致有界的.
证明. 令
$\Xi_j(k) = \tilde{{\boldsymbol{\Theta}}}^{\rm T}_j(k){\boldsymbol{\psi}}_j({\boldsymbol{\chi}}_j(k_t))$ ,$\Psi_j(k) = $ $ \tilde{{\boldsymbol{W}}}_j^{\rm T}{\boldsymbol{\varphi}}_j ({\boldsymbol{Z}}_j(k))$ , 并选择如下的Lyapunov函数:$$ V_j(k) = \sum\limits^5_{m = 1}V_{j,m}(k) $$ (44) 其中,
$V_{j,1}(k) = \displaystyle\sum\nolimits^{n_j}_{i_j = 1} r_{j,i_j}z_{j,i_j}^{2}(k)$ ,$V_{j,2}(k) = \dfrac{\sigma_{cj}}{\gamma_{cj}} $ $ \tilde{{\boldsymbol{\Theta}}}_j^{\rm T}(k) \tilde{{\boldsymbol{\Theta}}}_j(k)$ ,$V_{j,3}(k) = \dfrac{\sigma_{aj}}{\gamma_{aj}} \tilde{{\boldsymbol{W}}}_j^{\rm T}(k) \tilde{{\boldsymbol{W}}}_j(k)$ ,$V_{j,4}(k) = $ $ 2\sigma_{cj} \Xi_j^2(k-1)$ ,$V_{j,5}(k) = \dfrac{\varrho_j}{\beta_j}\tilde{\mu}^2_j(k)$ .令
${\boldsymbol{\psi}}_j(k) = {\boldsymbol{\psi}}_j({\boldsymbol{\chi}}_j(k))$ ,${\boldsymbol{\varphi}}_j(k) = {\boldsymbol{\varphi}}_j({\boldsymbol{Z}}_j(k))$ . 根据事件触发的特性, 本文从以下两种情况分析了闭环系统的稳定性.情况1(
$ k = k_t $ ). 在事件触发时刻,${\boldsymbol{X}}(k_t) = $ $ {\boldsymbol{X}}(k)$ , 根据式(20)、(24)、(28)和(34), 可得$ V_{j,1}(k) $ 的差分为$$ \begin{split}\Delta V_{j,1}(k) =\;& \sum\limits^{n_j}_{i_j = 1} r_{j,i_j}z_{j,i_j}^{2}(k+1)-\sum\limits^{n_j}_{i_j = 1} r_{j,i_j}z_{j,i_j}^{2}(k) \leq \\ &-\sum\limits^{n_j}_{i_j = 1}(r_{j,i_j}-r_{j,i_j-1}\bar{g}^2_{j,i_j})z^2_{j,i_j}(k)+ \\ &3r_{i,n_j}\bar{g}^2_{j,n_j}|\Psi_j(k)|^2 + \\ &3r_{i,n_j}\bar{g}^2_{j,n_j}\tilde{\mu}^2_j(k)+ 3r_{i,n_j}\bar{g}^2_{j,n_j}\bar{D}^2_j\\[-13pt]\end{split} $$ (45) 其中,
$ r_{j,0} = 0 $ . 根据式(17),$ V_{j,2}(k) $ 的差分为$$\begin{split} \Delta V_{j,2}(k) =\;& V_{j,2}(k+1)-V_{j,2}(k) \leq\\ &-\sigma_{cj}(1-\gamma_{cj}\zeta^2_j l_{cj})\big[\zeta_j\hat{Q}_j(k)+q_j(k)- \\ &\hat{Q}_j(k-1)\big]^2-\sigma_{cj}\zeta^2_j\Xi^2_j(k)+ \\ &2\sigma_{cj}\Xi_j^2(k-1)+\Lambda_j(k)\\[-15pt]\end{split}$$ (46) 其中,
$\Lambda_{j}(k) = 2\sigma_{cj}[\zeta_j{\boldsymbol{\Theta}}^*_j({\boldsymbol{\psi}}_j(k_t)-{\boldsymbol{\psi}}_j(k_t-1))+q_j(k)]^2$ 是一个有界量, 满足$\Lambda_j(k)\leq 2\sigma_{cj}((1+\zeta_j){\boldsymbol{\|\Theta}}^*_j\| $ $ \sqrt{l_{cj}}+1)^2 : = \bar{\Lambda}_j$ .根据式(38),
$ V_{j,3}(k) $ 的差分计算如下:$$ \begin{split} \Delta V_{j,3}(k) = \;&V_{j,3}(k+1)-V_{j,3}(k) \leq \\ &-\sigma_{aj}\left(1-\gamma_{aj} l_{aj}\right)\big[\hat{Q}_j(k)+ \\ &\hat{{\boldsymbol{W}}}^{\rm T}_j(k){\boldsymbol{\varphi}}_j({\boldsymbol{Z}}_j(k))\big]^2-\sigma_{aj}\Psi^2_j(k)+ \\ &3\sigma_{aj}\Xi^2_j(k)+3\sigma_{aj}l_{aj}\|{\boldsymbol{W}}_j^*\|^2+\\ &3\sigma_{aj}l_{cj}\|{\boldsymbol{\Theta}}^*_j\|^2\end{split} $$ (47) 其中,
$ l_{aj} $ 表示第$ j $ 个子系统的执行网络所包含的神经元个数. 根据式(41),$ V_{j,4}(k) $ 和$ V_{j,5}(k) $ 的差分为$$ \Delta V_{j,4}(k) = 2\sigma_{cj} \Xi^2_j(k)-2\sigma_{cj}\Xi^2_j(k-1) $$ (48) $$ \begin{split} \Delta V_{j,5}(k) =\;& \frac{\varrho_j}{\beta_j}\tilde{\mu}_j(k+1)-\frac{\varrho_j}{\beta_j}\tilde{\mu}_j(k) \leq \\ &-\varrho_j(1-\beta_j)\left[\hat{\mu}_j(k)+z_{j,1}(k)\right]^2 - \\ &\varrho_j\tilde{\mu}^2_j(k)+2\varrho_j\mu_j+2\varrho_j z^2_{j,1}(k) \end{split} $$ (49) 已知
$ V_j(k) = \sum\nolimits^5_{j,m}V_{j,m}(k) $ , 从而Lyapunov函数$ V_j(k) $ 的差分为$$ \begin{split} \Delta V_j(k)\leq\;&-(r_{j,1}-2\sigma_{aj}-2\varrho_j)z^2_{j,1}(k)- \\ &\sum\limits^{n_j}_{i_j = 1}(r_{j,i_j}-r_{j,i_j-1}\bar{g}^2_{j,i_j})z^2_{j,i_j}(k)-\\ &(\sigma_{aj}-2r_{j,n_j}\bar{g}^2_{j,n_j})\Psi^2_j(k)- \\ &(\varrho_j-3r_{j,n_j}\bar{g}^2_{j,n_j})\tilde{\mu}^2_j(k) - \\ &\varrho_j(1-\beta_j)\left[\hat{\mu}_j(k)+z_{j,1}(k)\right]^2- \\ &\sigma_{cj}(1-\gamma_{cj}\zeta^2_j l_{cj})\big[\zeta_j\hat{Q}_j(k)- \\ &\hat{Q}_j(k-1)+q_j(k)\big]^2- \\ &\sigma_{aj}(1-\gamma_{aj} l_{aj})\big[\hat{{\boldsymbol{W}}}^{\rm T}_j(k){\boldsymbol{\varphi}}_j({\boldsymbol{Z}}_j(k))+\\ &\hat{Q}_j(k)\big]^2-(\sigma_{cj}\zeta^2_j-3\sigma_{aj}-2\sigma_{cj})\Xi^2_j(k)+\Gamma_j \end{split} $$ (50) 其中,
$\Gamma_j = 4\sigma_{cj}+2r^2_{j,n_j}\bar{g}^2_{j,n_j}+2\sigma_{aj} l_{aj}\|{\boldsymbol{W}}^*\|^2+ (8\sigma_{cj}+ $ $ 3\sigma_{aj})l_{cj}\|{\boldsymbol{\Theta}}^*_j\|^2+2\varrho_j\mu_j$ 是一个常量.若选择满足条件(43)的设计参数, 那么基于不等式(50)可得
$$ \Delta V_j(k)\leq -\ell_j V_j(k)+\Gamma_j $$ (51) 其中,
$\ell_j = \min\{(r_{j,1}-2\sigma_{aj}-2\varrho_j)/r_{j,1},(r_{j,i_j}- r_{j,i_j-1}\bar{g}_{j,i_j})/ $ $ r_{j,i_j},i_j = 2,\cdots,n_j$ ,$(\sigma_{cj}\zeta^2_j-3\sigma_{aj}-2\sigma_{cj})/2\sigma_{cj}, \beta_j(\varrho_j- $ $ 3r_{j,n_j}\bar{g}^2_{j,n_j})/\varrho_j\}$ . 已知$ \Gamma_j $ 是一个有界常数, 因此在设计参数满足条件(43)的情况下,$ \Delta V_j(k)\leq 0 $ 对所有$ k = k_t $ 成立, 从而闭环系统中的所有信号都是终极一致有界的. 此外, 根据不等式(51) 可得$$ z^2_{j,1}(k)\leq \frac{(1-\ell_j)^k}{r_{j,1}}V_j(0)+\frac{\Gamma_j}{\rho_j\ell_j} $$ (52) 其中,
$ \rho_j = r_{j,1}/(1-(1-\ell_j)^k) $ .$ V_j(0) $ 取决于系统状态的初值$ x_j(0) $ , 执行网络权值的初值$ \hat{W}_j(0) $ , 和评价网络权值的初值$ \hat{{\boldsymbol{\Theta}}}_j(0) $ . 根据(52), 当$ k\to +\infty $ 时可得$$ z^2_{j,1}(k)\leq \Gamma_j/(r_{j,1} \ell_j) $$ (53) 根据式(53)可知, 跟踪误差
$ z_{j,1}(k) $ 最终会收敛到一个紧集$ \Omega_j = \{z_{j,1}(k)|z^2_{j,1}(k)\leq \Gamma_j/(r_{j,1} \ell_j)\} $ , 紧集的大小可以通过设计参数进行调节.情况2 (
$ k_t<k<k_{t+1} $ ). 在事件触发间隔内, 没有数据进行传输, 因此控制器中的相关数据保持不变.$\hat{{\boldsymbol{\Theta}}}_j(k) = \hat{{\boldsymbol{\Theta}}}_j(k_t)$ ,$\hat{{\boldsymbol{W}}}_j(k) = \hat{{\boldsymbol{W}}}_j(k_t)$ ,$\hat{\mu}_j(k) = \hat{\mu}_j(k_t)$ . 此时, 可得$ V_j(k) $ 的差分满足$$ \begin{split} \Delta V_j(k)\leq\;& -\sum\limits^{n_j}_{i_j = 1}\left(r_{j,i_j}-r_{j,i_j-1}\bar{g}^2_{j,i_j}\right)z^2_{j,i_j}(k)+ \\ &4r_{j,n_j}\bar{g}^2_{j,n_j}L^2_s\|\hat{{\boldsymbol{W}}}_j(k)\|^2\|{\boldsymbol{E}}_t(k)\|^2+ \\ &4r_{j,n_j}\bar{g}^2_{j,n_j}l_{aj}\|\tilde{{\boldsymbol{W}}}_j(k)\|^2 + \\ &4r_{j,n_j}\bar{g}^2_{j,n_j}\tilde{\mu}^2_j(k)+ 4r_{j,n_j}\bar{g}^2_{j,n_j}\bar{D}_j^2\\[-10pt]\end{split}$$ (54) 根据式(42), 当
$k_t < k<k_{t+1}$ 时, 不等式$\|{\boldsymbol{E}}_t(k)\|^2\leq$ $A_j|z_{j,1}(k)|^2/(C_j+4r_{j,n_j}L^2_s\bar{g}^2_{j,n_j}\|\hat{{\boldsymbol{W}}}_j(k)\|^2)\leq A_j|z_{j,1}(k)|^2/$ $ 4r_{j,n_j}L^2_s\bar{g}^2_{j,n_j}\|\hat{{\boldsymbol{W}}}_j(k)\|^2 $ 成立. 将该不等式代入式(54)可得$$ \begin{split} \Delta V_j(k)\leq\;& -\sum\limits^{n_j}_{i_j = 2}(r_{j,i_j}-r_{j,i_j-1}\bar{g}^2_{j,i_j})z^2_{j,i_j}(k)-\\ &\left(r_{j,1}-A_j\right)z^2_{j,1}(k)+ \Upsilon_j \end{split}$$ (55) 其中,
$\Upsilon_j = 4r_{j,n_j}\bar{g}^2_{j,n_j}l_{aj}\|\tilde{{\boldsymbol{W}}}_j(k)\|^2+4r_{j,n_j}\bar{g}^2_{j,n_j}\bar{D}_j^2+ $ $ 4r_{j,n_j}\bar{g}^2_{j,n_j}\tilde{\mu}^2_j(k)$ . 在情况1中已经证明, 闭环系统中的所有信号都是稳定的. 此外, 在事件触发间隔内($ k_t<k<_{t+1} $ ),$ \tilde{{\boldsymbol{W}}}_j(k) $ 和$ \tilde{\mu}_j(k) $ 都保持不变,$ \Upsilon_j $ 可以视为一个有界的常数. 因此, 当$ k_t<k<_{t+1} $ 时, 闭环系统中的所有信号都是有界的.由式(53)和(55) 可得
$$ z^2_{j,1}(k)\leq \frac{(1-\ell_j)^{k-k_t}}{r_{j,1}}z^2_{j,1}(k_t)+\frac{\Upsilon_j}{b_j\ell_j} $$ (56) 其中,
$ b_j = r_{j,1}/(1-(1-\ell_j)^{k-k_t}) $ 是一个大于零的常数. 当触发时刻$ k_t $ 趋于无穷时,$z^2_{j,1}(k)\leq \Gamma_j/(a_j\ell_j)+ $ $ \Upsilon_j/(r_{j,1}\ell_j)$ , 说明跟踪误差在事件触发间隔内$ k_t< $ $ k<k_{t+1} $ 是有界稳定的.综合上述两种情况, 闭环系统中的所有信号都是最终一致有界的. □
基于定理1的研究结果, 本文借鉴动态事件触发机制设计思想[36-37], 进一步对定理1的研究结果进行了推广.
定理 2. 考虑离散多输入多输出系统(1), 控制器(33)、(40), 评价网络和执行网络的权值更新律(15) 和(37), 以及设计如下的动态事件触发条件:
$$ k_{t+1} = \{k\in {\bf {N}}|ET_1\vee ET_2\vee\cdots\vee ET_N\} $$ (57) 其中,
$ ET_j $ 设计为:$$ \begin{split} &\frac{1}{p_{j2}}h_j(k)+ A_jz^2_{j,1}(k)-B_j\|\hat{{\boldsymbol{W}}}_j(k)\|^2\|{\boldsymbol{E}}_t(k)\|^2 < 0, \\ &\qquad h_j(k+1) = p_{j1} h_j(k)+A_jz^2_{j,1}(k)-\\ &\quad\qquad B_j\|\hat{{\boldsymbol{W}}}_j(k)\|^2\|{\boldsymbol{E}}_t(k)\|^2,\; \; h_j(0)>0, \end{split}$$ 若设计参数
$ l_{aj} $ ,$ l_{cj} $ ,$ \sigma_{aj} $ ,$ \sigma_{cj} $ ,$ \varrho_j $ ,$ r_{j,i_j} $ ($i_j = 1, $ $ 2,\cdots,n_j$ ),$ 0<\zeta_j<1 $ ,$ 0<\beta_j<1 $ ,$ 0<\gamma_{aj}<1/l_{aj} $ ,$ 0<\gamma_{cj}<1/l_{cj} $ 满足条件(43), 且$ 0<p_{j1}<1 $ ,$p_{j2} > $ $ 1/p_{j1}$ , 那么闭环系统中的所有信号都是最终一致有界的.定理2的证明与定理1类似, 读者可自行证明.
注 5. 定理2通过在定理1的静态事件触发条件(42)中引入额外的动态变量
$ h_j(k) $ , 构造出了典型的动态事件触发条件(57). 随后, 可以通过修改Lyapunov函数为$V_j(k) = \displaystyle\sum\nolimits^5_{j,m}V_{j,m}(k)+h_j(k)$ , 并采用类似定理1的证明过程, 很容易证明在动态事件触发条件(57)下闭环系统的所有信号也是最终一致有界的. 此外, 通过简单地分析可以得出, 相比于静态事件触发条件(42), 动态事件触发条件(57)能够进一步降低事件触发的次数. 但需要指出的是, 额外动态变量$ h_j(k) $ 的引入, 将导致动态事件触发条件(57) 的计算量有所增加. 因此, 在实际应用中, 用户可以结合自身的网络带宽和处理器的情况选择适当的事件触发条件.4. 仿真验证
本章分别选取了数值算例和双连杆机械臂系统的仿真实例, 来验证本文所提出的方案的有效性.
4.1 数值仿真
首先, 考虑参考文献[19]中的数值模型:
$$ \left\{ \begin{aligned} &x_{1,1}(k+1) = f_{1,1}(x_{1,1}(k))+g_{1,1}(x_{1,1}(k))x_{1,2}(k)\\ &x_{1,2}(k+1) = f_{1,2}({\boldsymbol{X}}(k))+g_{1,2}({\boldsymbol{X}}(k))u_1(k)+d_1(k) \\ &x_{2,1}(k+1) = f_{1,1}(x_{2,1}(k))+g_{2,1}(x_{2,1}(k))x_{2,2}(k)\\ &x_{2,2}(k+1) = f_{2,2}({\boldsymbol{X}}(k))+g_{2,2}({\boldsymbol{X}}(k))u_2(k)+d_2(k) \end{aligned} \right. $$ 其中, 非线性函数
$f_{1,1}(x_{1,1}(k)) = x_{1,1}(k)/(1+ x^2_{1,1} (k))$ ,$g_{1,1}(k) = 0.3$ ,$f_{1,2}\,(X\,(k)) \,=\, x^2_{1,1}\,(k)/\,(1+x^2_{1,2}\,(k)+ $ $ x^2_{2,1}\,(k)+ x^2_{2,2}\,(k))$ ,$g_{1,2}\,(X\,(k)) = 1$ ,$f_{2,1}(x_{2,1}(k)) = $ $ x^2_{2,1}(k)/(1+x^2_{2,1}(k))$ ,$g_{2,1}(x_{2,1}(k)) = 0.2$ ,$f_{2,2}(X(k)) = $ $ x^2_{1,1}(k)/(1\;+\;x^2_{1,2}(k)\;+\;x^2_{2,1}(k)+x^2_{2,2}(k)),$ $g_{2,2}\times $ $ (X(k)) = 1.$ 在仿真中, 选择扰动信号, 参考信号, 故障参数和控制器设计参数如下: 扰动信号为
$d_1(k) = 0.1 $ $ \cos(0.5k)\cos(x_{1,1}(k))$ ,$d_2(k) = 0.1\cos(0.05k)\cos(x_{2,1} $ $ (k))$ ; 参考信号$y_1^*(k) = 0.5+0.25\cos(kT\pi/4)+ 0.25 $ $ \cos (kT\pi/2)$ ,$y_2^*(k) = 0.5+0.25\sin(kT\pi/4)+0.25\sin $ $ (kT\pi/2)$ ; 执行器故障参数$ \delta_1 = 0.5 $ ,$ \theta_1(k) = 0 $ ,$\delta_2 = $ $ 0.8$ ,$ \theta_2(k) = 1.3+0.1\cos(kT\pi/4) $ . 采用本文定理1中所提出的控制方案, 并选择设计参数$ \gamma_{c1} = 0.25 $ ,$ \gamma_{c2} = 0.25 $ ,$ \gamma_{a1} = 0.25 $ ,$ \gamma_{a2} = 0.4 $ ,$ \beta_j $ = 0.4,$\zeta_j = $ $ 0.7$ ,$ l_{c1} = 6 $ ,$ l_{c2} = 6 $ ,$ l_{a1} = 6 $ ,$ l_{a2} = 8 $ ,$ A_1 = 0.1 $ ,$ A_2 = 0.1 $ ,$ B_1 = 1 $ ,$ B_2 = 1 $ ,$ C_1 = 1 $ ,$ C_2 $ = 1. 初始化系统状态${\boldsymbol {x}}_1(0) = [0.2,0.2]^{\rm T}$ ,${\boldsymbol {x}}_2(0) = [0.2,0.2]^{\rm T}$ , 及网络权值$\hat{{\boldsymbol {\Theta}}}_j(0) = {\boldsymbol {0}}$ ,${\boldsymbol {v}} = {\boldsymbol {1}}$ ,$\hat{{\boldsymbol{W}}}_j(0) = {\boldsymbol {0.001}}$ ,$\hat{\mu}_j(0) = $ $ 0$ ,$ j = 1,2 $ .仿真步长
$T = 0.01$ s, 仿真步数$N = 2\ 000$ . 仿真结果如图2~图7所示. 图2和图3表明了系统的输出能够很好地跟踪上给定的参考信号. 图4指示了事件触发间隔. 从图5可以看出, 评价网络的输出始终在零附近, 进一步说明系统取得了令人满意的控制性能. 图6和图7表明了执行网络和评价网络的权值的有界性. 在2 000步仿真中, 总的数据传输次数为843次, 较时间触发的控制方案减少了约60% 的网络资源占用.此外, 本文进行了两组对比仿真实验, 并采用平均绝对误差(Mean absolute error, MAE) 和平均带宽占用(Average bandwidth occupation, ABO)来对系统的性能进行定量刻画:
$$ {\rm MAE} = \frac{1}{N}\sum\limits_{k = 1}^{N}|z_{j,1}(k)| $$ (58) $$ {\rm ABO} = \frac{n_e\times p_L\times b_L}{T\times N} $$ (59) 其中,
$ n_e $ 表示总的数据传输次数,$ p_L $ 表示一次发送的数据包长度,$ b_L $ 表示数据类型的比特长度,$ T\times N $ 表示时间长度. 在仿真中, 传输的向量${\boldsymbol{X}}(k)$ 中包含4个元素, 数据类型为float. 由此可计算$ p_L = 4 $ ,$ b_L = 32 $ bit.第1组对比实验的结果见表1. 通过对比表格1中的数据, 可以看出执行器故障补偿机制和光滑的效用函数在改善系统性能方面的有效性. 第2组对比实验的结果见表2. 为了便于表示, 表2中 “SETC” (Static event-triggered condition)代表静态事件触发条件; “DETC” (Dynamical event-triggered condition) 代表动态事件触发条件, “CPU” (Central processing unit)代表电脑中央处理器. 对比表2中的数据可知, DETC (57) (
$ p_{j1} = 0.01 $ ,$ p_{j2} = 101 $ ) 相比于SETC (42)而言, 能够进一步减少事件触发次数, 同时也因为动态变量$ h_j(k) $ 的引入导致了算法计算量的增加.表 1 仿真实验对比1Table 1 Comparison of simulation results触发次数 MAE ABO (bit/s) 无执行器补偿,非光滑效用函数 921 $ z_{1,1} $ 0.0201 5894.4 $ z_{2,1} $ 0.0335 有执行器补偿,非光滑效用函数 907 $ z_{1,1} $ 0.0185 5804.8 $ z_{2,1} $ 0.0229 有执行器补偿,光滑效用函数 843 $ z_{1,1} $ 0.0130 5395.2 $ z_{2,1} $ 0.0147 注: “无执行器补偿” 表示$\omega_j(k) = \hat{ {\boldsymbol{W} } }^{\rm T}_j(k){\boldsymbol{\varphi}}_j({\boldsymbol{Z} }_j(k_t))$; “有执行器补偿” 表示$\omega_j(k) = \hat{ {\boldsymbol{W} } }^{\rm T}_j(k){\boldsymbol{\varphi}}_j({\boldsymbol{Z} }_j(k_t))+\hat{\mu}_j(k)$; “非光滑效用函数” 表示若$ |z_{j,1}(k)| $大于一个给定的正常数, 则$ q_j(k) = 1 $. 否则, $ q_j(k) = 0 $; “光滑效用函数” 表示$q_j(k) = 1 - {\rm{e}}^{-z_{j, 1}^{2}(k)/\eta_j}$. 表 2 仿真实验对比2Table 2 Comparison of simulation results触发条件 触发次数 MAE ABO (bit/s) CPU耗时(s) SETC 843 $ z_{1,1} $ 0.0130 5395.2 0.6875 $ z_{2,1} $ 0.0147 DETC 801 $ z_{1,1} $ 0.0129 5126.4 0.8125 $ z_{2,1} $ 0.0144 4.2 实例仿真
为了进一步说明本文方案的有效性, 本文对双连杆机械臂模型进行了仿真实验. 已知双连杆机械臂的欧拉−拉格朗日动力学模型[29]为:
$$ M({\boldsymbol {q}})\ddot{{\boldsymbol {q}}}+C({\boldsymbol {q}},\dot{{\boldsymbol {q}}})\dot{{\boldsymbol {q}}} + {\boldsymbol {G}}({\boldsymbol {q}}) = {\boldsymbol {\tau}} + {\boldsymbol {\tau}}_d $$ (60) 其中,
${\boldsymbol {q}} = [q_1,q_2]^{\rm T}$ 和$\dot{{\boldsymbol {q}}} = [\dot{q}_1,\dot{q}_2]^{\rm T}$ 分别表示机械臂关节的角位置和角速度,$M({\boldsymbol {q}})$ 和$C({\boldsymbol {q}},\dot{{\boldsymbol {q}}})$ 分别表示转动惯量矩阵和科氏力矩阵,${\boldsymbol {G}}({\boldsymbol {q}})\in \mathbf{R}^2$ 代表重力加速度向量,${\boldsymbol {\tau}}$ 为输入力矩, 和${\boldsymbol {\tau}}_d$ 为外部扰动.$$\begin{split} &M({\boldsymbol {q}}) = \left[ {\begin{array}{*{20}{c}} {{a_1} + {a_2}\cos ({q_2})}&{{a_3} + {a_2}/2\cos ({q_2})}\\ {{a_3} + {a_2}/2\cos ({q_2})}&{{a_3}} \end{array}} \right]\\ &C({\boldsymbol {q}},\dot {\boldsymbol {q}})\dot {\boldsymbol {q}} = \left[ {\begin{array}{*{20}{c}} { - {a_2}\sin ({q_2})}\\ {0.5{a_2}\sin ({q_2})\dot q_1^2} \end{array}} \right] \end{split}$$ $$\begin{split} {\boldsymbol {G}}({\boldsymbol {q}}) = \left[ {\begin{array}{*{20}{c}} { - {a_4}\cos ({q_1}) + {a_5}\cos ({q_2})}\\ {{a_5}\cos ({q_1} + {q_2})} \end{array}} \right] \end{split}$$ 其中,
$ a_1 = m_2l_2^2+l_1^2(m_1+m2) $ ,$ a_2 = 2l_1 l_2 $ ,$a_3 = $ $ l_2^2 m_2$ ,$ a_4 = (m_1+m_2)l_1g $ ,$ a_5 = m_2l_2g $ .$ m_1 $ ,$ m_2 $ 表示连杆的质量,$ l_1 $ 和$ l_2 $ 表示连杆的长度, 和$ g $ 表示重力加速度.令
${\boldsymbol {x}}_1 = {\boldsymbol {q}}$ ,${\boldsymbol {x}}_2 = \dot{{\boldsymbol {q}}}$ ,${\boldsymbol {x}} = [{\boldsymbol {x}}_1,{\boldsymbol {x}}_2]^{\rm T}$ , 采样时间为$ T $ , 采用欧拉法将机械臂的动力学模型(60)离散化可得$$ \left\{ \begin{array}{l}{\boldsymbol {x}}_1(k+1) = {\boldsymbol {x}}_1(k)+T{\boldsymbol {x}}_2(k)\\ {\boldsymbol {x}}_2(k+1) = f({\boldsymbol {x}}(k))+g({\boldsymbol {x}}_1(k)){\boldsymbol {u}}(k)+d(k) \end{array} \right. $$ 其中,
$g({\boldsymbol {x}}_1(k))= TM^{-1}({\boldsymbol {x}}_1(k))$ ,${\boldsymbol {u}}(k) = {\boldsymbol {\tau}}(k)$ ,$f({\boldsymbol {x}}(k)) =-$ $TM^{-1}\,({\boldsymbol {x}}_1\,(k))[C\,({\boldsymbol {x}}_1\,(k),{\boldsymbol {x}}_2\,(k)){\boldsymbol {x}}_2\,(k)+{\boldsymbol {G}}\,({\boldsymbol {x}}_1(k))+ $ $ {\boldsymbol {F}}({\boldsymbol {x}}_2(k))]$ ,${\boldsymbol {d}}(k) = g({\boldsymbol {x}}_1(k)){\boldsymbol {\tau}}_d(k)$ . 可以看出, 离散化后的机械臂模型完全符合本文所考虑的系统(1) 的形式.采用本文定理1中所提出的控制方案, 并设置系统参数为
$ m_1 = 1 $ 千克,$ m_2 = 1 $ 千克,$ l_1 = 1 $ 米,$ l_2 = 1 $ 米,$ g = 9.81 $ 米/秒. 系统输出的参考信号选为$ y^*_1(k) = 0.5\sin(\pi kT/25) $ ,$ y^*_2(k) = 0.5\cos(\pi k T/25) $ . 外部扰动设置为${\boldsymbol {d}}(k) = [0.1\sin(x_{1,1}(k)), \; 0.1\cos $ $ (x_{2,1}(k))]^{\rm T}$ . 执行器故障参数为$ \delta_1 = 0.8 $ ,$ \theta_1(k) = 0 $ ,$ \delta_2 = 0.6 $ ,$ \theta_2(k) = 0.1\cos(kT) $ . 设置控制器参数为$ \gamma_{aj} = 0.3 $ ,$ \gamma_{cj} = 0.3 $ ,$ \beta_j = 0.1 $ ,$ \zeta_j = 0.6 $ ,$ l_{aj} = 6 $ ,$ l_{cj} = 8 $ ,$ j = 1,2 $ . 初始条件设置为${\boldsymbol {x}}(0) = {{0}}$ ,$\hat{{\boldsymbol {W}}}_j(0) = $ $ {{0.01}}$ ,$\hat{{\boldsymbol {\Theta}}}_j(0) = {{0}}$ ,$ {\boldsymbol{v}} = 1 $ ,$ \hat{\mu}_j(k) = 0 $ ,$ j = 1,2 $ . 事件触发条件参数设置为$ A_1 = 0.1 $ ,$ B_1 = 1 $ ,$ C_1 = 1 $ ,$ A_2 = 0.2 $ ,$ B_2 = 1 $ ,$ C_2 = 1 $ . 采样时间$ T = 0.1 $ s, 仿真步数$N = 2\ 000$ . 仿真实验结果如图8~图13. 从图8~图13可知, 本文所提出的基于事件触发的自适应评判容错控制方案既能抑制执行器故障对系统性能的影响, 又能在降低触发次数情况下实现高性能的跟踪控制.5. 总结与展望
本文针对存在执行器故障的离散MIMO严格反馈非线性系统的最优跟踪控制问题, 提出了一种基于事件触发的自适应评判控制设计方案. 相比于现有的基于n步预测模型的控制方案, 本文所提出的基于变量替换控制方案避免了控制信号的n步时延问题. 此外, 通过设计执行器故障补偿机制, 事件触发机制与自适应评判机制, 本文所提出的控制方案不仅节省了网络资源占用, 而且改善了系统的控制性能. 最后仿真结果验证了本文所提出的方案的有效性. 注意到在离散系统的网络控制方面仍然有诸多待解决的问题, 例如数据丢包[38], 网络攻击[39], 执行器故障估计[40-41]等, 这些问题将是我们未来的工作方向.
-
表 1 仿真实验对比1
Table 1 Comparison of simulation results
触发次数 MAE ABO (bit/s) 无执行器补偿,非光滑效用函数 921 $ z_{1,1} $ 0.0201 5894.4 $ z_{2,1} $ 0.0335 有执行器补偿,非光滑效用函数 907 $ z_{1,1} $ 0.0185 5804.8 $ z_{2,1} $ 0.0229 有执行器补偿,光滑效用函数 843 $ z_{1,1} $ 0.0130 5395.2 $ z_{2,1} $ 0.0147 注: “无执行器补偿” 表示$\omega_j(k) = \hat{ {\boldsymbol{W} } }^{\rm T}_j(k){\boldsymbol{\varphi}}_j({\boldsymbol{Z} }_j(k_t))$; “有执行器补偿” 表示$\omega_j(k) = \hat{ {\boldsymbol{W} } }^{\rm T}_j(k){\boldsymbol{\varphi}}_j({\boldsymbol{Z} }_j(k_t))+\hat{\mu}_j(k)$; “非光滑效用函数” 表示若$ |z_{j,1}(k)| $大于一个给定的正常数, 则$ q_j(k) = 1 $. 否则, $ q_j(k) = 0 $; “光滑效用函数” 表示$q_j(k) = 1 - {\rm{e}}^{-z_{j, 1}^{2}(k)/\eta_j}$. 表 2 仿真实验对比2
Table 2 Comparison of simulation results
触发条件 触发次数 MAE ABO (bit/s) CPU耗时(s) SETC 843 $ z_{1,1} $ 0.0130 5395.2 0.6875 $ z_{2,1} $ 0.0147 DETC 801 $ z_{1,1} $ 0.0129 5126.4 0.8125 $ z_{2,1} $ 0.0144 -
[1] Zhang G C, Wu Q Q, Cui M, Zhang R. Securing UAV communications via joint trajectory and power control. IEEE Transactions on Wireless Communications, 2019, 18(2): 1376-1389 doi: 10.1109/TWC.2019.2892461 [2] Bullo F, Cort\’{e}s J, Mart\’{i}nez S. Distributed Control of Robotic Networks: A Mathematical Approach to Motion Coordination Algorithms. Princeton: Princeton University Press, 2009. 57-134 [3] Tabuada P. Event-triggered real-time scheduling of stabilizing control tasks. IEEE Transactions on Automatic Control, 2007, 52(9): 1680-1685 doi: 10.1109/TAC.2007.904277 [4] 董滔, 李小丽, 赵大端. 基于事件触发的三阶离散多智能体系统一致性分析. 自动化学报, 2019, 45(7): 1366-1372Dong Tao, Li Xiao-Li, Zhao Da-Duan. Event-triggered consensus of third-order discrete-time multi-agent systems. Acta Automatica Sinica, 2019, 45(7): 1366-1372 [5] Sahoo A, Xu H, Jagannathan S. Neural network-based event-triggered state feedback control of nonlinear continuous-time systems. IEEE Transactions on Neural Networks and Learning Systems, 2016, 27(3): 497-509 doi: 10.1109/TNNLS.2015.2416259 [6] Wu L G, Gao Y B, Liu J X, Li H Y. Event-triggered sliding mode control of stochastic systems via output feedback. Automatica, 2017, 82: 79-92 doi: 10.1016/j.automatica.2017.04.032 [7] Dai S L, He S D, Lin H, Wang C. Platoon formation control with prescribed performance guarantees for USVs. IEEE Transactions on Industrial Electronics, 2018, 65(5): 4237-4246 doi: 10.1109/TIE.2017.2758743 [8] Dai S L, He S D, Wang M, Yuan C Z. Adaptive neural control of underactuated surface vessels with prescribed performance guarantees. IEEE Transactions on Neural Networks and Learning Systems, 2019, 30(12): 3686-3698 doi: 10.1109/TNNLS.2018.2876685 [9] He W, Dong Y T. Adaptive fuzzy neural network control for a constrained robot using impedance learning. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(4): 1174-1186 doi: 10.1109/TNNLS.2017.2665581 [10] Wang M, Yang A L. Dynamic learning from adaptive neural control of robot manipulators with prescribed performance. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2017, 47(8): 2244-2255 doi: 10.1109/TSMC.2016.2645942 [11] Chen M, Ren B B, Wu Q X, Jiang C S. Anti-disturbance control of hypersonic flight vehicles with input saturation using disturbance observer. Science China Information Sciences, 2015, 58(7): 1-12 [12] Xu B, Sun F C, Yang C G, Gao D X, Ren J X. Adaptive discrete-time controller design with neural network for hypersonic flight vehicle via back-stepping. International Journal of Control, 2011, 84(9): 1543-1552 doi: 10.1080/00207179.2011.615866 [13] 李会, 刘允刚, 黄亚欣. 不确定非线性系统自适应动态事件触发输出反馈镇定. 控制理论与应用, 2019, 36(11): 1871-1878 doi: 10.7641/CTA.2019.90475Li Hui, Liu Yun-Gang, Huang Ya-Xin. Adaptive stabilization via dynamic event-triggered output feedback for uncertain nonlinear systems. Control Theory & Applications, 2019, 36(11): 1871-1878 doi: 10.7641/CTA.2019.90475 [14] Zhang Y H, Sun J, Liang H J, Li H Y. Event-triggered adaptive tracking control for multiagent systems with unknown disturbances. IEEE Transactions on Cybernetics, 2020, 50(3): 890-901 doi: 10.1109/TCYB.2018.2869084 [15] 杨彬, 周琪, 曹亮, 鲁仁全. 具有指定性能和全状态约束的多智能体系统事件触发控制. 自动化学报, 2019, 45(8): 1527-1535Yang Bin, Zhou Qi, Cao Liang, Lu Ren-Quan. Event-triggered control for multi-agent systems with prescribed performance and full state constraints. Acta Automatica Sinica, 2019, 45(8): 1527-1535 [16] Li Y X, Yang G H. Model-based adaptive event-triggered control of strict-feedback nonlinear systems. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(4): 1033-1045 doi: 10.1109/TNNLS.2017.2650238 [17] Chen F C, Khalil H K. Adaptive control of a class of nonlinear discrete-time systems using neural networks. IEEE Transactions on Automatic Control, 1995, 40(5): 791-801 doi: 10.1109/9.384214 [18] Ge S S, Li G Y, Lee T H. Adaptive NN control for a class of strict-feedback discrete-time nonlinear systems. Automatica, 2003, 39(5): 807-819 doi: 10.1016/S0005-1098(03)00032-3 [19] Ge S S, Zhang J, Lee T H. Adaptive neural network control for a class of MIMO nonlinear systems with disturbances in discrete-time. IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), 2004, 34(4): 1630-1645 doi: 10.1109/TSMCB.2004.826827 [20] Yang C G, Ge S Z, Xiang C, Chai T Y, Lee T H. Output feedback NN control for two classes of discrete-time systems with unknown control directions in a unified approach. IEEE Transactions on Neural Networks, 2008, 19(11): 1873-1886 doi: 10.1109/TNN.2008.2003290 [21] Liu Y J, Tong S C. Optimal control-based adaptive NN design for a class of nonlinear discrete-time block-triangular systems. IEEE Transactions on Cybernetics, 2016, 46(11): 2670-$2680 doi: 10.1109/TCYB.2015.2494007 [22] Tang L, Liu Y J, Chen C L P. Adaptive critic design for pure-feedback discrete-time MIMO systems preceded by unknown backlashlike hysteresis. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(11): 5681-5690 doi: 10.1109/TNNLS.2018.2805689 [23] Li Y X, Yang G H. Event-based adaptive NN tracking control of nonlinear discrete-time systems. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(9): 4359-4369 doi: 10.1109/TNNLS.2017.2765683 [24] Wang M, Wang Z D, Chen Y, Sheng W G. Adaptive neural event-triggered control for discrete-time strict-feedback nonlinear systems. IEEE Transactions on Cybernetics, 2020, 50(7): 2946-2958 doi: 10.1109/TCYB.2019.2921733 [25] Wang M, Wang Z D, Chen Y, Sheng W G. Event-based adaptive neural tracking control for discrete-time stochastic nonlinear systems: A triggering threshold compensation strategy. IEEE Transactions on Neural Networks and Learning Systems, 2020, 31(6): 1968-1981 doi: 10.1109/TNNLS.2019.2927595 [26] 王鼎. 基于学习的鲁棒自适应评判控制研究进展. 自动化学报, 2019, 45(6): 1031-1043Wang Ding. Research progress on learning-based robust adaptive critic control. Acta Automatica Sinica, 2019, 45(6): 1031-1043 [27] Werbos P J. Approximate dynamic programming for real-time control and neural modeling. Handbook of Intelligent Control: Neural, Fuzzy, and Adaptive Approaches. New York: Van Nostrand Reinhold, 1992. [28] He P G, Jagannathan S. Reinforcement learning neural-network-based controller for nonlinear discrete-time systems with input constraints. IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), 2007, 37(2): 425-436 doi: 10.1109/TSMCB.2006.883869 [29] Yang R X, Yang C G, Chen M, Annamalai A S K. Discrete-time optimal adaptive RBFNN control for robot manipulators with uncertain dynamics. Neurocomputing, 2017, 234: 107-115 doi: 10.1016/j.neucom.2016.12.048 [30] Dong L, Zhong X G, Sun C Y, He H B. Adaptive event-triggered control based on heuristic dynamic programming for nonlinear discrete-time systems. IEEE Transactions on Neural Networks and Learning Systems, 2017, 28(7): 1594-1605 doi: 10.1109/TNNLS.2016.2541020 [31] Wang Z S, Liu L, Wu Y M, Zhang H G. Optimal fault-tolerant control for discrete-time nonlinear strict-feedback systems based on adaptive critic design. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(6): 2179-2191 doi: 10.1109/TNNLS.2018.2810138 [32] 杨浩, 姜斌, 周东华. 互联系统容错控制的研究回顾与展望. 自动化学报, 2017, 43(1): 9-19Yang Hao, Jiang Bin, Zhou Dong-Hua. Review and perspectives on fault tolerant control for interconnected systems. Acta Automatica Sinica, 2017, 43(1): 9-19 [33] 何潇, 郭亚琦, 张召, 贾繁林, 周东华. 动态系统的主动故障诊断技术. 自动化学报, 2020, 46(8): 1557-1570He Xiao, Guo Ya-Qi, Zhang Zhao, Jia Fan-Lin, Zhou Dong-Hua. Active fault diagnosis for dynamic systems. Acta Automatica Sinica, 2020, 46(8): 1557-1570 [34] Laghrouche S, Liu J X, Ahmed F S, Harmouche M, Wack M. Adaptive second-order sliding mode observer-based fault reconstruction for PEM fuel cell air-feed system. IEEE Transactions on Control Systems Technology, 2015, 23(3): 1098-1109 doi: 10.1109/TCST.2014.2361869 [35] Wang M, Wang Z D, Chen Y, Sheng W G. Observer-based fuzzy output-feedback control for discrete-time strict-feedback nonlinear systems with stochastic noises. IEEE Transactions on Cybernetics, 2020, 50(8): 3766-3777 doi: 10.1109/TCYB.2019.2902520 [36] Girard A. Dynamic triggering mechanisms for event-triggered control. IEEE Transactions on Automatic Control, 2015, 60(7): 1992-1997 doi: 10.1109/TAC.2014.2366855 [37] Liu D, Yang G H. Dynamic event-triggered control for linear time-invariant systems with L_2-gain performance. International Journal of Robust and Nonlinear Control, 2019, 29(2): 507-518 doi: 10.1002/rnc.4403 [38] Xiong S X, Chen M, Wu Q X. Predictive control for networked switch flight system with packet dropout. Applied Mathematics and Computation, 2019, 354: 444-459 doi: 10.1016/j.amc.2019.01.005 [39] Deng C, Wen C Y. Distributed resilient observer-based fault-tolerant control for heterogeneous multiagent systems under actuator faults and DoS attacks. IEEE Transactions on Control of Network Systems, 2020, 7(3): 1308-1318 doi: 10.1109/TCNS.2020.2972601 [40] Xing L T, Wen C Y, Liu Z T, Su H Y, Cai J P. Adaptive compensation for actuator failures with event-triggered input. Automatica, 2017, 85: 129-136 doi: 10.1016/j.automatica.2017.07.061 [41] Zhang C H, Yang G H. Event-triggered adaptive output feedback control for a class of uncertain nonlinear systems with actuator failures. IEEE Transactions on Cybernetics, 2020, 50(1): 201-210 doi: 10.1109/TCYB.2018.2868169 期刊类型引用(6)
1. 肖金桐,田亮,王艳君. 小时间尺度网络数据传输故障识别数学建模. 计算机仿真. 2024(06): 507-511 . 百度学术
2. 游星星,杨道文,郭斌,刘凯,佃松宜,朱雨琪. 基于观测器和指定性能的非线性系统事件触发跟踪控制. 自动化学报. 2024(09): 1747-1760 . 本站查看
3. 王敏,林梓欣,王聪,杨辰光. 基于外环速度补偿的封闭机器人确定学习控制. 自动化学报. 2023(09): 1904-1914 . 本站查看
4. 郑帅,杨雪纯,海丹凤. 基于改进密度峰值聚类算法的低占用率云调度容错控制模型研究. 桂林航天工业学院学报. 2023(03): 400-405 . 百度学术
5. 付兴建,吕永霞,严航. 随机不确定时延Markov系统鲁棒容错控制及应用. 北京信息科技大学学报(自然科学版). 2022(05): 15-21 . 百度学术
6. 盖文东,李珊珊,张桂林,张婧. 动态事件触发的无人机非线性系统故障检测. 控制理论与应用. 2022(08): 1569-1578 . 百度学术
其他类型引用(13)
-