Disturbance Observer Based Consensus of Linear Multi-agent Systems Under a Directed Graph
-
摘要: 在有向图中,针对多智能体系统中智能体动力学存在扰动的情形,研究了系统的一致性问题.每个智能体的动力学模型为存在未知外部扰动的一般线性系统.在有向图是强连通的条件下,通过设计一种基于扰动观测器的分布式算法,实现了存在未知扰动的线性多智能体系统的一致性.最后通过仿真验证所提算法的有效性.Abstract: In this paper, we study the consensus problem of multi-agent systems in the existence of unknown disturbances under a general directed graph. The dynamics of each agent is a general linear system with matched disturbances. Given that the directed graph is strongly connected, we design a distributed disturbance observer to solve the consensus problem for general linear multi-agent systems with unknown external disturbances. At the end, simulation results are presented to demonstrate the effectiveness of the proposed algorithm.
-
Key words:
- Multi-agent systems /
- disturbance observer /
- consensus /
- directed graph
-
自从多智能体系统这一概念被提出以来, 关于其协调控制[1]的研究发展出:一致性[2-3]、编队[4-5]和聚集[6-7]等一系列问题.其中, 一致性问题因其在许多领域拥有广泛的潜在应用而受到关注.一致性的目标就是智能体利用其局部邻居的信息不断更新自身状态, 最终所有智能体状态趋于同一值.在一致性问题的研究中, 智能体的动力学模型至关重要, 已有的结果大多集中在一阶和二阶积分器[8-12].而将一阶和二阶积分器作为特殊形式的一般线性多智能体系统的一致性问题也逐渐成为研究的热点[13-19].其中, 对于可测和稳定的线性离散系统, Tuna[13]提出一个针对任意固定拓扑的线性输出反馈律, 使得耦合系统能够渐近一致.针对一般线性时不变系统和固定拓扑结构, Ma等[16]给出了一般线性系统的可一致性条件. Li等[17]提出, 在有向图中包含有向生成树时, 采用观测器形式的控制律可以使一般线性多智能体系统达到一致性.在Zhang等[18]提出的分布式观测器形式的控制律中, 每个智能体采用相同的控制增益.同样当系统的拓扑结构是有向图并且强连通时, Mei等[19]提出一种每个智能体的控制增益均不相同的分布式控制算法, 实现了线性系统的一致性.
在多智能体系统中, 当每个智能体存在扰动时, 现有的一致性算法无法使每个智能体的状态轨线收敛到同一值, 因此需要一种分布式的扰动抑制手段.在不同的应用层面上, 扰动抑制包含了抗干扰、输出调节、扰动观测器等多种抑制手段[20-21].当外源信号被视为跟踪信号时, 一般采用输出调节的方法, 因为从形式上, 输出调节包含了扰动抑制和输出跟踪. Xiang等[22]解决了只有领导者能够接收到外源信号状态, 跟随者根据领导者的状态调节自身输出与外源信号一致的输出调节问题. Su等[23]进一步将多智能体系统分为两组, 一组能够接收到外源信号而另一组不能, 解决了分组输出调节问题.当外源信号被视为扰动时, 根据扰动形式, 当扰动是常数时, Andreasson等[24]在多智能体系统中引入了分布式比例-积分控制器, 通过使用积分环节, 补偿了网络中的静态扰动, 并且使多个智能体在扰动存在的情况下, 以任意初始速度达到初始位置的平均值点.更进一步, Lombana等[25]提出了多重比例-积分控制器, 解决了异构节点动力学中存在常数扰动时的一致性问题.当扰动是时变未知或不可测量的, 一个常用的手段是设计一种扰动观测器, 使用状态量或者输出量来估计扰动, 并用估计值来消除扰动带来的影响. Yang等[26]在存在外源扰动的二阶多智能体系统中采用扰动观测器, 使得系统在固定和切换拓扑结构中均达到一致性. Ding[27]解决了无向图中一般线性多智能体系统存在外部未知扰动的一致性问题.
每个智能体间的信息交换情况一般由拓扑图来描述, 拓扑图通常可以分为无向图和有向图两种.本文研究的有向图与无向图相比有如下两个方面的优点:一方面, 因为无向图是对称的, 所以要求每个智能体的传感设备, 通信能力都是相同的.而对于非对称的有向图, 则允许每个智能体不必使用相同的传感设备和拥有相同的通信能力.另一方面, 使用多智能体系统的目的之一就是用多个功能单一设计简单的智能体代替单个复杂的智能体.因此从降低系统复杂度, 减少成本, 节约能源的角度考虑, 有向图的单向信息交流方式较无向图对通信网络的计算交换能力要求更低.同时, 在通信受限的情况下, 有向图更具优势.因此, 有向图的拓扑形式在简化智能体结构, 降低系统复杂度, 减少成本, 节约能源等方面有着出色的实际应用价值.
本文将重点讨论在有向图中存在外部未知扰动的线性多智能体系统的一致性问题.将相对误差信息作为观测器的输入信息, 并且每个智能体将采用互异的控制增益.本文之后各节的主要内容如下:第1节介绍图论的相关知识和被研究的线性多智能体动力学模型; 第2节介绍分布式扰动观测器及系统的稳定性分析; 第3节是仿真分析; 第4节则是本文结论.
1. 数学背景与问题描述
1.1 图论知识
首先对本文涉及的图论相关知识进行简单介绍, 详细内容可以参考文献[28].对于一个由$n$个智能体所组成的系统来说, 其网络拓扑形式可以抽象为一个有向图, 记为$\mathcal {G}=(\mathcal {V}, \mathcal {E})$, 其中点集$\mathcal {V}=\{v_1, \cdots , v_n\}$代表$n$个智能体, 边集$\mathcal{E}\subseteq\mathcal{V}\times\mathcal{V}$代表智能体之间的有向连接.一条有向边$(i, j)\in\mathcal{E}$代表智能体$j$能够接收到智能体$i$的信息, 信息流通方向不可逆.这种关系中, 节点$i$称为父节点, 节点$j$称为子节点, 等价地, 节点$i$称为节点$j$的邻居.一条从节点$i$到$j$的有向路径可以表示为:在有向图中一组形式为$(i, i_2), (i_2, i_3), \cdots, (i_k, j)$的有向边序列.在一个有向图中, 如果每一个节点到其他所有节点均存在有向路径, 那么则称这个有向图是强连通的.有向树是指除了一个称为根节点之外, 其他每一个节点有且仅有一个父节点, 根节点到任何节点均存在一条有向路径.一个有向图包含一个有向生成树, 当且仅当至少存在一个节点, 这个节点到其他任何节点之间均存在一条有向路径.一般地, 用矩阵$\mathcal{A}=[a_{ij}]\in{\bf R}^{n\times n}$来表示一个图的邻接矩阵, 当$(j, i)\in\mathcal {E}$时, 有$a_{ij}>0$; 否则, $a_{ij}=0$.一般假设节点自身没有连通性, 即$a_{ii}=0$.对无向图而言, $(j, \, i)\in\mathcal {E}\leftrightarrow (i, \, j)\in\mathcal {E}$.即当$(j, \, i)\in\mathcal {E}$时, $a_{ij}=a_{ji}>0$, 否则$a_{ij}=0$.由上述定义可知, 无向图是有向图的一种特殊情况, 因此, 有向图更具一般化.有向图$\mathcal{G}$的拉普拉斯矩阵定义为
$ \begin{align} \mathcal{L}_{A}=\mathcal{D}-\mathcal{A} \end{align} $
(1) 其中, $\mathcal{D}=\mathit{\rm diag}\{d_1, \cdots, d_n\}$, $d_i=\sum_{j=1}^{n}a_{ij}$.一般来说, 有向图的拉普拉斯矩阵$\mathcal{L}_A$是非对称的.对有向图来说, 有如下结论:
引理1[29].如果$\mathcal{G}$是一个强连通的$n$阶有向图, $\mathcal{L}_{A}\in{\bf R}^{n\times{n}}$是其对应的拉普拉斯矩阵, 则存在一个向量$\xi:=[\xi_{1}, \cdots, \xi_{n}]^{\rm T}\in{\bf R}^n$, 其中, $\sum_{i=1}^{n}\xi_i=1$, $\xi_i>0$, $\forall i=1, \cdots, n$, 使得$\xi^{\rm T} \mathcal{L}_A=0$成立.
与无向图不同, 有向图的拉普拉斯矩阵是非对称的, 因此, 介绍如下引理:
引理2[9].假设$\mathcal{G}$是一个$n$阶有向图, 并且是强连通的.定义矩阵$\widehat{L}:=\Xi\mathcal{L}_A+\mathcal{L}_{A}^{\rm T}\Xi$, 其中$\Xi:=\mathit{\rm diag}\{\xi_1, \cdots, \xi_n\}$, $\xi_i$定义如引理1所示.那么矩阵$\widehat{L}$是一个无向图所对应的对称拉普拉斯矩阵.此外, 对$\varsigma\in{\bf R}^n$为任意正向量, 有下式成立:
$ \begin{align} a(\mathcal{L}_A):=\min\limits_{\stackrel{\vartheta^{\rm T}\varsigma=0}{\vartheta^{\rm T}\vartheta=1}}\vartheta^{\rm T}\widehat L \vartheta>0 \end{align} $
(2) 由Kronecker积的性质, 我们有如下结果:
引理3[19].假设${U}=[u_{ij}]\in{\bf R}^{n\times n}$, ${V}={V^{\rm T}}\in{\bf R}^{p\times p}$.令${S}\in{\bf R}^{p\times p}$为酉矩阵, 且$SVS^{\rm T}:=\, {\rm diag}\{\lambda_1(V), \cdots, \lambda_p(V)\}$, 令${x_i}=[{x_{i1}, {x_{i2}}, \cdots, {x_{ip}}}]^{\rm T}\in{\bf R}^p, i=1, \cdots, n$.则有如下等式成立:
$ \begin{align} {x^{\rm T}(U\otimes V)x}=\sum\limits_{k=1}^p \lambda_k(V)v^{\rm T}_{k}Uv_k \notag \end{align} $
其中, $x=\mathit{col}(x_1, \cdots, x_n)\in{\bf R}^{np}$和$v_{k}=[v_{k1}, \cdots, v_{kn}]^{\rm T}\in{\bf R}^{n}$是所有$Sx_{i}$, $i=1, \cdots, n$第$k$个元素的堆栈向量.
1.2 智能体动力学模型
在本文中, 每个智能体的动力学模型可描述为
$ \begin{align} \dot x_{i}=Ax_{i}+Bu_{i}+Dw_{i} \end{align} $
(3) $i=1, \cdots, N$, 其中$x_i\in{\bf R}^p$是智能体$i$的状态向量, $A\in{\bf R}^{p\times p}$, $B\in{\bf R}^{p\times m}$, $D\in{\bf R}^{p\times s}$均是常数矩阵, 代表系统参数, 且$(A, B)$可控. $u_i\in{\bf R}^m$是第$i$个智能体的控制输入, $w_i\in{\bf R}^s$是一个外源系统的状态量, 表示每个智能体中存在的扰动.定义外源系统的动态方程为
$ \begin{align} \dot w_{i}=Sw_i \end{align} $
(4) 常数矩阵$S\in{\bf R}^{s\times s}$是这个外源系统的系统参数.
注1. 外源系统(4)的表示形式被广泛地应用于输出调节问题($w$作为跟踪信号)(如文献[30-31])和扰动抑制问题($w$作为外部扰动)中(如文献[32-33]).而许多工程应用上的扰动信号也可用式(4)表示, 例如, 文献[34]中的未知常数扰动和未知相位和幅值的谐波扰动, 文献[34-35]中的有界外部扰动等.因此, 式(4)是一个一般化的扰动表述形式.
多智能体系统的扰动抑制一致性问题可以解释为:在每个智能体存在不同扰动时, 仅使用相对状态信息来设计控制输入使每一个智能体的状态都收敛到同一轨线上.当传感器无法精确测量系统外部扰动时, 使用扰动观测器对扰动进行实时估计, 并将估计值反馈回系统之中, 可以使多智能体系统达到一致性.对智能体的动力学模型和系统网络拓扑形式作出如下假设:
假设1. 描述智能体间拓扑结构的有向图$\mathcal{G}$是强连通的.
假设2. 每个智能体的动力学模型的控制输入系数和扰动项系数是匹配的, 即, 存在一个矩阵$F\in{\bf R}^{s\times s}$, 满足$D=BF$.
假设3. 外源系统的系数矩阵$S$的特征值无重根, 并且都分布在虚轴上. $(S, D)$是能观的.
注2. 假设2要求智能体扰动项与输入项系数是匹配的.系数的匹配保证了扰动的估计值和实际值的系数是相同的, 即控制输入可以通过相同信道作用于扰动.关于$S$特征值部分的要求普遍存在于扰动抑制和输出调节问题中.扰动是有界的, 如果矩阵$S$的特征值严格位于右半平面或在虚轴上有重根, 则扰动发散的; 如果矩阵$S$的特征值严格位于左半平面, 则扰动是稳定的, 对线性系统稳定性没有影响. $(S, D)$是可观测的, 因为不可观测部分不影响系统状态变化.综上, 假设3是合理的.当$S$的特征值位于虚轴上时, 系统(4)是中性稳定的, 因此式(4)产生的是一个有界周期扰动.
2. 有向图中扰动抑制一致性
本节介绍的扰动观测器的结构与算法有两方面特点:一致性算法中所使用的信息是每个智能体与其邻居的相对状态量; 每个智能体的控制增益是异质的.
2.1 扰动观测器设计
当扰动存在时, 已知的一致性算法并不能使多智能体的状态轨线收敛到同一值.对于常规的已知扰动$w$, 可以在原有的一致性算法上加入$-Fw$来消除扰动.在扰动是未知的情况下, 我们将设计一种扰动抑制算法来消除因扰动未知带来的不确定性影响.其中, 扰动$w$应该是可观的, 即$w_i$可以用每个子智能体的状态$x_i$表示.因此, 我们有如下引理:
引理4[25].如果$(S, D)$是能观的, 则$(A_{C}, H)$是能观的.其中, $A_{C}={bmatrix} A&D\\0&S{bmatrix}$, $H={bmatrix} \mathit{I}&0{bmatrix}$.因为$(A_{C}, H)$是可观的, 所以存在一个正定矩阵$Q$, 使得:
$ \begin{align} QA_C+A^{\rm T}_{C}Q-2H^{\rm T}H=-I \end{align} $
(5) 成立.
扰动观测器的基本框架正如图 1所示, 这个复合控制器由两部分组成: 1)由反馈控制所组成的外环, 其作用是跟踪和镇定被控对象; 2)由扰动观测器和前馈控制所组成的内环, 系统中的扰动和不确定性由扰动观测器估计出来, 然后再通过前馈控制进行补偿.根据分离原理, 内环和外环可以分开设计.即通过分别调整反馈控制和前馈控制可以实现输出跟踪和扰动抑制这两种控制目标.
在分布式控制中, 每个智能体的相对状态信息是指其自身的状态量与其邻居的状态量之差.用公式描述为
$ \begin{align} \zeta_i=\sum\limits_{j=1}^{N}a_{ij}(x_i-x_j) \end{align} $
(6) 根据拉普拉斯矩阵的定义, 将上式写成:
$ \begin{align} \zeta_i=\sum\limits_{j=1}^{N}l_{ij}x_j \end{align} $
(7) 基于扰动观测器的控制律可以写成:
$ \begin{align} u_i=-K\chi_{i}-F\hat{w}_i \end{align} $
(8) 其中, $\chi_{i}\in{\bf R}^n$, $\hat{w}_i\in{\bf R}^s$分别是系统状态的观测值和扰动的观测值:
$ \dot{\chi}_i=(A-BK)\chi_i+\alpha_iG_x\left(\zeta_i-\sum\limits_{j=1}^{N}l_{ij}\chi_j\right) $
(9) $ \dot{\hat{w}}_i=S\hat{w}_i+\alpha_iG_w\left(\zeta_i-\sum\limits_{j=1}^{N}l_{ij}\chi_j\right) $
(10) 其中, $\alpha_i$是一个正实数, 代表第$i$个智能体的控制增益. $K$是使得$(A-BK)$为Hurwitz的常数增益矩阵, $[G_{x}^{\rm T}, G_{w}^{\rm T}]^{\rm T}=G=Q^{-1}H^{\rm T}$.
在扰动和智能体状态的观测值和真实值方面, 做出如下定义:
$ \begin{align} \widetilde{x}_i=x_i-\chi_i \notag \\ \widetilde{w}_i=w_i-\hat{w}_i \notag \end{align} $
将式(8)代入式(3)可得:
$ \begin{align} \dot{x}_i=Ax_i-BK\chi_i+D\widetilde{w}_i \end{align} $
(11) 由式(4), (9), (10)和式(11)可得:
$ \dot{\widetilde{x}}_i=A\widetilde{x}_i+D\widetilde{w}_i-\alpha_iG_x\sum\limits_{j=1}^{N}l_{ij}\widetilde{x}_j $
(12) $ \dot{\widetilde{w}}_i=S\widetilde{w}_i-\alpha_iG_w\sum\limits_{j=1}^{N}l_{ij}\widetilde{x}_j $
(13) 定义.
$ \begin{align} e_i={\begin{bmatrix}{\widetilde{x}_i}^{\rm T} , {\widetilde{w}_i}^{\rm T}\end{bmatrix}}^{\rm T} \notag \end{align} $
记$e:=[e_1^{\rm T}, \cdots, e_N^{\rm T}]^{\rm T}$, 那么由式(12)和(13)可得:
$ \begin{align} \dot{e}=(I_N\otimes A_C-\Lambda\mathcal{L}_A\otimes GH)e \end{align} $
(14) 其中, $A_C$和$H$如引理4中定义所示.对于每个智能体来说, 有:
$ \begin{align} \dot{x}_i&=Ax_i-BK\chi_i+BF(w_i-\hat{w}_i) =\notag \\ &(A-BK)x_i+B[K, F]e_i \end{align} $
(15) 2.2 一致性分析
由于每个智能体的控制增益$\alpha_i$是异质的, 因此引入如下李雅普诺夫函数:
$ \begin{align} V&=\sum\limits_{i=1}^N\alpha_i\xi_i\left[\sum\limits_{j=1}^Na_{ij}(e_i-e_j)\right]^{\rm T}Q\cdot\notag \\& \sum\limits_{j=1}^Na_{ij}(e_i-e_j) =[(\mathcal{L}_A\otimes I_p)e]^{\rm T}\cdot\notag \\ &(\Xi\Lambda\otimes Q)(\mathcal{L}_A\otimes I_p)e \end{align} $
(16) 其中$\Xi={\rm diag}\{\xi_1, \cdots, \xi_N\}$, $\Lambda={\rm diag}\{\alpha_1, \cdots$, $\alpha_N\}$.正定矩阵$Q$如式(5)定义所示.因为$\xi_i$和$\alpha_i$都是正实数且$Q$是正定的, 可以得出, $V(t)\geq0$, $V(t)=0$当且仅当$\sum_{j=1}^Na_{ij}(e_i-e_j)=0$.
注3. 在无向图中, 可以利用无向图的拉普拉斯矩阵$\mathcal{L}_A$是对称的这一性质来设计李雅普诺夫函数.因此无向图中的李雅普诺夫函数可以选择经典二次型形式, 如: $V=e^{\rm T}(\mathcal{L}_A^2\otimes Q)e$.而在有向图中, 由于拉普拉斯矩阵不再是对称的, 李雅普诺夫函数无法再采用简单的二次型形式.因此, 由式(16)可知, 有向图的李雅普诺夫函数不仅引入了异质增益$\alpha_i$与拉普拉斯矩阵的左零特征向量$\xi_i$, 而且与一般无向图的李雅普诺夫经典正定二次型函数相比, 形式更复杂.
对$V(t)$沿式(14)求导可得:
$ \begin{align} \dot{V}(t)=\, &2[(\mathcal{L}_A\otimes I_p)e]^{\rm T}(\Xi\Lambda\mathcal{L}_A\otimes Q)\dot{e}= \notag \\ &2[(\mathcal{L}_A\otimes I_p)e]^{\rm T}(\Xi\Lambda\mathcal{L}_A\otimes QA_C-\Xi\Lambda\mathcal{L}_A\Lambda \notag \\ &\mathcal{L}_A \otimes QGH)e= \notag \\ &2\gamma^{\rm T}(\Xi\Lambda^{-1}\otimes QA_C-\Xi\mathcal{L}_A\otimes QGH)\gamma \end{align} $
(17) 其中, $\gamma:=(\Lambda\mathcal{L}_A\otimes I_p)e$.因为$\Xi$和$\Lambda$均为对角阵, 由$G=Q^{-1}H^{\rm T}$和式(5), 可得:
$ \begin{align} \dot{V}(t)=\, &\gamma^{\rm T}[\Xi\Lambda^{-1}\otimes (2H^{\rm T}H-I)-\widehat{L}\otimes H^{\rm T}H]\gamma =\notag \\ &\gamma^{\rm T}(\Xi\Lambda^{-1}\otimes 2H^{\rm T}H)\gamma-\gamma^{\rm T}(\widehat{L}\otimes H^{\rm T}H)\gamma -\notag \\ &\gamma^{\rm T}(\Xi\Lambda^{-1}\otimes I)\gamma \end{align} $
(18) 式中, $\widehat{L}$如引理2定义所示.
由于$H^{\rm T}H$是正定的.那么存在酉矩阵$S\in{\bf R}^{p\times p}$使得$SH^{\rm T}HS^{\rm T}:=\mathit{\rm diag}\{\lambda_1(H^{\rm T}H)$, $\lambda_2(H^{\rm T}H\}$, $\cdots$, $\lambda_p(H^{\rm T}H))$成立.
把$\gamma_i$写成$\gamma=[\gamma_1^{\rm T}, \cdots, \gamma_N^{\rm T}]^{\rm T}\in{\bf R}^{Np}$, 其中$\gamma_i\in{\bf R}^p$.设$v_k=[v_{k1}, \cdots, v_{kN}]^{\rm T}\in{\bf R}^N$是所有$S\gamma_i$第$k$个元素的堆栈向量, 根据引理3, 可得:
$ \begin{align} \gamma^{\rm T}(\widehat{L}\otimes H^{\rm T}H)\gamma=\sum\limits_{k=1}^{p}\lambda_k(H^{\rm T}H)v_k^{\rm T}\widehat{L}v_k \end{align} $
(19) 记$S\gamma_i=\alpha_iS\sum_{j=1}^Na_{ij}(e_i-e_j)$, 向量$Se_i$的第$k$个元素我们记为$(Se_i)_k$, 那么则有:
$ \begin{align} v_{ki}=\alpha_i\sum\limits_{j=1}^{N}[(Se_i)_k-(Se_j)_k] \end{align} $
(20) 定义$\theta_k:=[(Se_1)_k, \cdots, (Se_N)_k]^{\rm T}\in{\bf R}^N$.那么式(20)可以写成$v_k=\Lambda\mathcal{L}_A\theta_k$.因此, 对于$\xi_i>0$, $\alpha_i>0$, $\forall i=1, \cdots, N$, 正向量$\Lambda^{-1}\xi$使得:
$ \begin{align} v_k^{\rm T}\Lambda^{-1}\xi=\theta_k^{\rm T}{\mathcal{L}_A}^{\rm T}\xi=0 \notag \end{align} $
则由引理2可知:
$ \begin{align} v_k^{\rm T}\widehat{L}v_k&\geq\min\limits_{v_k^{\rm T}\varsigma=0}v_k^{\rm T}\widehat{L}v_k= \notag \\ &a(\mathcal{L}_A)v_{k}^{\rm T}v_k \end{align} $
(21) 综上所述, 可以得出:
$ \begin{align} \gamma^{\rm T}(\widehat{L}\otimes H^{\rm T}H)\gamma&=\sum\limits_{k=1}^{p} \lambda_k(H^{\rm T}H)v_k^{\rm T}\widehat{L}v_k \geq\notag \\ & \sum\limits_{k=1}^{p}\lambda_k(H^{\rm T}H)\min\limits_{v_k^{\rm T}\varsigma=0} v_k^{\rm T}\widehat{L}v_k =\notag\\ & a(\mathcal{L}_A)\sum\limits_{k=1}^{p} \lambda_k(H^{\rm T}H)v_k^{\rm T}v_k =\notag \\ &a(\mathcal{L}_A)\gamma^{\rm T}(I_p\otimes H^{\rm T}H)\gamma \end{align} $
(22) 将式(22)代回式(18)中, 可得:
$ \begin{align} \dot{V}\leq\, & -\sum\limits_{i=1}^N\left[a(\mathcal{L}_A)-\frac{2\xi_i}{\alpha_i}\right]\gamma_i^{\rm T}H^{\rm T}H\gamma_i-\notag \\ &\sum\limits_{i=1}^N\frac{\xi_i}{\alpha_i}\gamma_i^{\rm T}\gamma_i \end{align} $
(23) 由此得到本文的主要结论:
定理1. 在假设1, 2和3成立的条件下, 将观测器(9), (10)及控制输入(8)作用于系统(3), 选取适当的异质增益$\alpha_i$, 系统将达到状态一致性, 即: $\lim_{t\rightarrow\infty}x_1(t)=\lim_{t\rightarrow\infty}x_2(t)=\cdots=\lim_{t\rightarrow\infty}x_N(t)$.
证明. 从式(23)可知, 当控制增益满足条件:
$ \begin{align} \alpha_i>\frac{2\max_k\xi_k}{a(\mathcal{L}_A)} \end{align} $
(24) $k=1, \cdots, N$时, 可知$\dot{V}$是半负定的, 则系统中的所有变量是有界的, 并且$\gamma\in L_2\bigcap L_\infty$, 因此, 有$\sum_{j=1}^Na_{ij}(e_i-e_j)\in L_2\bigcap L_\infty$.从式(14)可知, $\dot{e}\in L_\infty$, 那么根据Barbalat引理可知, $\sum_{j=1}^Na_{ij}(e_i-e_j)\rightarrow 0$, 即$\lim_{t\rightarrow\infty}e_1(t)=\lim_{t\rightarrow\infty}e_2(t)=\cdots=\lim_{t\rightarrow\infty}e_N(t)$则由式(15)可知, 对任意$i$, $j$:
$ \begin{align} \dot{x}_i-\dot{x}_j=(A-BK)(x_i-x_j)+B[K, F](e_i-e_j) \end{align} $
(25) 注意到$(A-BK)$是Hurwitz的, 那么将$B[K, F](e_i-e_j)$看作输入, $(x_i-x_j)$看作状态, 系统(25)是输入到状态稳定的.由于$\lim_{t\rightarrow\infty}(e_i-e_j)=0$, 那么$\lim_{t\rightarrow\infty}(x_i-x_j)=0$, 即系统达到一致性.
注4. 在分布式的背景下, 与传统的每个智能体采用相同的控制增益方法相比, 异质增益更符合算法分布式的要求.另外, 注意到$\xi_i$和$a(\mathcal{L}_A)$的信息并不能通过分布式方法得到, 另一方面, 由式(24)可知, 可以通过选取足够大的$\alpha_i$使系统达到一致性.基于Lyapunov方法的分析是一个充分条件, $\alpha_i$并不需要严格满足(24), 在实际中可以从较小的$\alpha_i$开始, 如果系统不能满足要求, 则可以通过不断增加$\alpha_i$来完成系统的一致性.
3. 仿真分析
在本节中, 我们将在无人机(Unmanned aerial vehicle, UAV)的飞行控制上使用上节所得结论, 在一组无人机的编队飞行时, 由于受到空气流动等因素影响, 每个机身上不可避免的会存在机身震动, 我们把机身震动当成一种外源扰动.因此, 我们使用扰动观测器来抑制这种扰动, 并使得一组无人机的各状态能够达到一致性.本节将使用文献[36]中的YF-22研究型无人机为例, 介绍本文所得结论在实际中的潜在应用.在文献[36]中, 该款研究型无人机的参数由机身上的多种传感器测量所得.我们引用其中一种线性纵向方向数学模型:
$ \begin{align} \begin{bmatrix} \dot{V} \\ \dot{\beta}\\ \dot{q}\\ \dot{\theta} \end{bmatrix}=\, &\begin{bmatrix} -0.284&-23.096&2.420&9.913 \\ 0 &-4.117 &0.843&0.272 \\ 0 &-33.884&-8.263&-19.543 \\ 0 &0 &1 &0 \end{bmatrix}\times\notag \\ & \begin{bmatrix} V \\ \beta \\ q \\ \theta \end{bmatrix} +\begin{bmatrix} 20.168 \\ 0.544 \\ -39.085 \\ 0 \end{bmatrix} i_{H} \end{align} $
(26) 式中, 参数$V$代表由GPS接收器测量得到的飞行器的速度, $\beta$代表由飞行器前端的鼻探针测量所得的攻角, $q$是由惯性测量单元所测得的俯仰率, $\theta$是由垂直陀螺仪所测的俯仰角.利用该模型, 再引入飞机机身震动所产生的扰动$\dot{w}_{i}={bmatrix} 0&\omega \\ -\omega&0 {bmatrix}w_i$, 其中$\omega$代表机身震动的频率.由此, 解决由机身震动带来的一组飞行器的状态不一致问题变为扰动抑制一致性问题.此外, $D=B[1 \ 0]$ 那么为了满足假设 1 和 2 我们选取 $F=[1\ 0] $, 通过$A_C={bmatrix} A&D \\ 0&S {bmatrix}$, $H={bmatrix} I&0 {bmatrix}$以及$QA_C+A^{\rm T}_CQ-2H^{\rm T}H=-I$, 我们可以求出:
$ \begin{align} G=\begin{bmatrix} 0.0058 & 0.0393 & 0.0033 & -0.0412 \\ 0.0393 & 17.0846 & 2.9318 & 6.3884 \\ 0.0033 & 2.9318 & 1.6088 & 2.3888 \\ -0.0412 & 6.3884 & 2.3888 & 6.69543 \\ 0 & 0.0004 & 0.0033 & 0.0028 \\ 0 & -0.3486 & -0.2041 & -0.3025 \end{bmatrix} \notag \end{align} $
那么观测器的增益$G_x$和$G_w$遵循第$2.1$节中$[G^{\rm T}_x \ G^{\rm T}_w]^{\rm T}$即可.此外, 无人机的网络通信拓扑是有向图, 且$\mathcal{L}_A$是强连通图的拉普拉斯矩阵, 选择:
$ \begin{align} \mathcal{L}_A =\begin{bmatrix} 1&0&0&0&0&-1 \\ -1 &1 &0&0&0&0 \\ 0 &-1& 2&0&-1& 0 \\ 0&0&-1& 1&0&0 \\ 0&0&0&-1&1&0 \\ 0&0&-1& 0&0&1 \end{bmatrix} \notag \end{align} $
对异质增益$\alpha_i$的选取应满足式(24), 由引理1可知, 对于强连通图$\mathcal{G}$的拉普拉斯矩阵$\mathcal{L}_A$, 存在向量$\xi$, 使得$\xi^{\rm T} \mathcal{L}_A=0$, 且$\sum_{k=1}^{N}\xi_k=1$, $\xi_k>0$.为此取$\max_k\xi_k=0.4082$.由引理2可知, $a(\mathcal{L}_A)={\lambda_2(\widehat{\mathcal{L}})}/{N}$, 其中$\lambda_2(\widehat{\mathcal{L}})$为$\widehat{\mathcal{L}}$第二小特征值.因此取$a(\mathcal{L}_A)=0.0520$.综上可得: $\alpha_i>15.71$.取: $\alpha_1=16$, $\alpha_2=18$, $\alpha_3=17$, $\alpha_1=16$, $\alpha_1=19$, $\alpha_1=20$.
由于该线性纵向系统的系数矩阵$A$是Hurwitz的, 因此选择反馈控制系数$K=0$.由图 1~5中可知, 无人机的4个状态最终收敛到同一轨线.
由图 6可以看出, 每个无人机受到的扰动均不相同, 充分地模拟了每个无人机上的机身扰动.
由图 6可以看出, 每个无人机受到的扰动均不相同, 充分地模拟了每个无人机上的机身扰动.
从仿真图可知, 在每个无人机受到各不相同的扰动, 并且网络通信拓扑为有向图时, 使用本文中有向图中的扰动观测器可以使得每个无人机的状态最终收敛到同一值.从整体状态上来说, 由于设计只使用了相对状态量, 因此仅保证了每个无人机在编队中的相对一致性, 即并不是完全抑制了输入端的扰动.
4. 结论
在本文中, 我们研究了在网络拓扑结构是有向图时, 一般线性多智能体系统的扰动抑制一致性问题.在每个智能体受到不同的扰动的情况下, 提出了基于扰动观测器的分布式控制算法, 每个智能体均有不同增益, 并根据李雅普诺夫稳定性理论证明了系统的一致性.最终, 通过仿真证明了本文所提算法的有效性.
-
[1] 闵海波, 刘源, 王仕成, 孙富春.多个体协调控制问题综述.自动化学报, 2012, 38(10):1557-1570 http://www.aas.net.cn/CN/abstract/abstract17765.shtmlMin Hai-Bo, Liu Yuan, Wang Shi-Cheng, Sun Fu-Chun. An overview on coordination control problem of multi-agent system. Acta Automatica Sinica, 2012, 38(10):1557-1570 http://www.aas.net.cn/CN/abstract/abstract17765.shtml [2] Olfati-Saber R, Fax J A, Murray R M. Consensus and cooperation in networked multi-agent systems. Proceedings of the IEEE, 2007, 95(1):215-233 doi: 10.1109/JPROC.2006.887293 [3] Ren W, Beard R W, Atkins E M. Information consensus in multivehicle cooperative control. IEEE Control Systems Magazine, 2007, 27(2):71-82 doi: 10.1109/MCS.2007.338264 [4] Oh K K, Park M C, Ahn H S. A survey of multi-agent formation control. Automatica, 2015, 53:424-440 doi: 10.1016/j.automatica.2014.10.022 [5] Fax J A, Murray R M. Information flow and cooperative control of vehicle formations. IEEE Transactions on Automatic Control, 2004, 49(9):1465-1476 doi: 10.1109/TAC.2004.834433 [6] Olfati-Saber R. Flocking for multi-agent dynamic systems:algorithms and theory. IEEE Transactions on Automatic Control, 2006, 51(3):401-420 doi: 10.1109/TAC.2005.864190 [7] Su H S, Wang X F, Lin Z L. Flocking of multi-agents with a virtual leader. IEEE Transactions on Automatic Control, 2009, 54(2):293-307 doi: 10.1109/TAC.2008.2010897 [8] Yu W W, Chen G R, Gao M, Kurths J. Second-order consensus for multiagent systems with directed topologies and nonlinear dynamics. IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), 2010, 40(3):881-891 doi: 10.1109/TSMCB.2009.2031624 [9] Mei J, Ren W, Chen J. Distributed consensus of second-order multi-agent systems with heterogeneous unknown inertias and control gains under a directed graph. IEEE Transactions on Automatic Control, 2016, 61(8):2019-2034 doi: 10.1109/TAC.2015.2480336 [10] Wang C R, Wang X H, Ji H B. Leader-following consensus for an integrator-type nonlinear multi-agent systems using distributed adaptive protocol. In: Proceedings of the 10th IEEE International Conference on Control and Automation (ICCA). Hangzhou, China: IEEE, 2013. 1166-1171 http://ieeexplore.ieee.org/document/6564881/ [11] Yu W W, Chen G R, Cao M. Some necessary and sufficient conditions for second-order consensus in multi-agent dynamical systems. Automatica, 2010, 46(6):1089-1095 doi: 10.1016/j.automatica.2010.03.006 [12] 梅杰, 张海博, 马广富.有向图中网络Euler-Lagrange系统的自适应协调跟踪.自动化学报, 2011, 37(5):596-603 http://www.aas.net.cn/CN/abstract/abstract17395.shtmlMei Jie, Zhang Hai-Bo, Ma Guang-Fu. Adaptive coordinated tracking for networked Euler-Lagrange systems under a directed graph. Acta Automatica Sinica, 2011, 37(5):596-603 http://www.aas.net.cn/CN/abstract/abstract17395.shtml [13] Tuna S E. Synchronizing linear systems via partial-state coupling. Automatica, 2008, 44(8):2179-2184 doi: 10.1016/j.automatica.2008.01.004 [14] Scardovi L, Sepulchre R. Synchronization in networks of identical linear systems. Automatica, 2009, 45(11):2557-2562 doi: 10.1016/j.automatica.2009.07.006 [15] Li Z K, Duan Z S, Chen G R, Huang L. Consensus of multiagent systems and synchronization of complex networks:a unified viewpoint. IEEE Transactions on Circuits and Systems I:Regular Papers, 2010, 57(1):213-224 doi: 10.1109/TCSI.2009.2023937 [16] Ma C Q, Zhang J F. Necessary and sufficient conditions for consensusability of linear multi-agent systems. IEEE Transactions on Automatic Control, 2010, 55(5):1263-1268 doi: 10.1109/TAC.2010.2042764 [17] Li Z, Duan Z, Chen G. Dynamic consensus of linear multi-agent systems. IET Control Theory & Applications, 2011, 5(1):19-28 https://www.researchgate.net/publication/224216882_Dynamic_consensus_of_linear_multi-agent_systems [18] Zhang H W, Lewis F L, Das A. Optimal design for synchronization of cooperative systems:state feedback, observer and output feedback. IEEE Transactions on Automatic Control, 2011, 56(8):1948-1952 doi: 10.1109/TAC.2011.2139510 [19] Mei J, Ren W, Chen J, Anderson B D O. Consensus of linear multi-agent systems with fully distributed control gains under a general directed graph. In: Proceedings of the 53rd Annual Conference on Decision and Control (CDC). Los Angeles, CA, USA: IEEE, 2014. 2993-2998 http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=7039849 [20] Francis B A. The linear multivariable regulator problem. SIAM Journal on Control and Optimization, 1977, 15(3):486-505 doi: 10.1137/0315033 [21] Ding Z T. Asymptotic rejection of general periodic disturbances in output-feedback nonlinear systems. IEEE Transactions on Automatic Control, 2006, 51(2):303-308 doi: 10.1109/TAC.2005.863523 [22] Xiang J, Wei W, Li Y J. Synchronized output regulation of linear networked systems. IEEE Transactions on Automatic Control, 2009, 54(6):1336-1341 doi: 10.1109/TAC.2009.2015546 [23] Su Y F, Huang J. Cooperative output regulation with application to multi-agent consensus under switching network. IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), 2012, 42(3):864-875 doi: 10.1109/TSMCB.2011.2179981 [24] Andreasson M, Dimarogonas D V, Sandberg H, Johansson K H. Distributed control of networked dynamical systems:static feedback, integral action and consensus. IEEE Transactions on Automatic Control, 2014, 59(7):1750-1764 doi: 10.1109/TAC.2014.2309281 [25] Lombana D A B, di Bernardo M. Multiplex PI control for consensus in networks of heterogeneous linear agents. Automatica, 2016, 67:310-320 doi: 10.1016/j.automatica.2016.01.039 [26] Yang H Y, Zhang Z X, Zhang S Y. Consensus of second-order multi-agent systems with exogenous disturbances. International Journal of Robust and Nonlinear Control, 2011, 21(9):945-956 doi: 10.1002/rnc.v21.9 [27] Ding Z T. Consensus disturbance rejection with disturbance observers. IEEE Transactions on Industrial Electronics, 2015, 62(9):5829-5837 doi: 10.1109/TIE.2015.2442218 [28] Godsil C, Royle G F. Algebraic Graph Theory. New York: Springer, 2001 [29] Ren W and Cao Y C. Distributed Coordination of Multi-Agent Networks: Emergent Problems, Models, and Issues. London, UK: Springer-Verlag, 2011. [30] Ding Z T. Adaptive consensus output regulation of a class of nonlinear systems with unknown high-frequency gain. Automatica, 2015, 51:348-345 doi: 10.1016/j.automatica.2014.10.079 [31] Liu L. Adaptive cooperative output regulation for a class of nonlinear multi-agent systems. IEEE Transactions on Automatic Control, 2015, 60(6):1677-1682 doi: 10.1109/TAC.2014.2360023 [32] Guo L, Chen W H. Disturbance attenuation and rejection for systems with nonlinearity via DOBC approach. International Journal of Robust and Nonlinear Control, 2005, 15(3):109-125 doi: 10.1002/(ISSN)1099-1239 [33] Wang C Y, Zuo Z Y, Sun J Y, Yang J, Ding Z T. Consensus disturbance rejection for Lipschitz nonlinear multi-agent systems with input delay:a DOBC approach. Journal of the Franklin Institute, 2017, 354(1):298-315 doi: 10.1016/j.jfranklin.2016.09.019 [34] Isidori A. Nonlinear Control Systems. Berlin Heidelberg: Springer-Verlag, 1995. [35] Zheng Y F, Zhang C S, Evans R J. A differential vector space approach to nonlinear system regulation. IEEE Transactions on Automatic Control, 2000, 45(11):1997-2010. doi: 10.1109/9.887623 [36] Gu Y, Seanor B, Campa G, Napolitano M R, Rowe L, Gururajan S, et al. Design and flight testing evaluation of formation control laws. IEEE Transactions on Control Systems Technology, 2006, 14(6):1105-1112 doi: 10.1109/TCST.2006.880203 期刊类型引用(5)
1. 王君,杨荣连. 基于干扰观测器的异构多智能体自适应滑模容错一致性控制. 系统科学与数学. 2023(02): 281-294 . 百度学术
2. 代学武,贾志安,崔东亮,柴天佑. 基于扩展PI抗扰补偿器的高精度时间同步控制. 自动化学报. 2023(12): 2520-2531 . 本站查看
3. 周涛,吴雄林. 基于参考模型的扰动观测器控制系统. 控制理论与应用. 2021(06): 823-832 . 百度学术
4. 刘伟,李大卫,戴洪德,李飞. 具有避障的机器人集群系统分布式编队控制. 机械与电子. 2021(07): 44-48 . 百度学术
5. 王卓,秦博东,徐雍,鲁仁全,魏庆来. 复杂无向网络连通性的一种高效判定算法. 自动化学报. 2020(10): 2129-2136 . 本站查看
其他类型引用(26)
-