-
摘要: 图像描述(Image captioning)是一个融合了计算机视觉和自然语言处理这两个领域的研究方向, 本文为图像描述设计了一种新颖的显著性特征提取机制(Salient feature extraction mechanism, SFEM), 能够在语言模型预测每一个单词之前快速地向语言模型提供最有价值的视觉特征来指导单词预测, 有效解决了现有方法对视觉特征选择不准确以及时间性能不理想的问题. SFEM包含全局显著性特征提取器和即时显著性特征提取器这两个部分: 全局显著性特征提取器能够从多个局部视觉向量中提取出显著性视觉特征, 并整合这些特征到全局显著性视觉向量中; 即时显著性特征提取器能够根据语言模型的需要, 从全局显著性视觉向量中提取出预测每一个单词所需的显著性视觉特征. 本文在MS COCO (Microsoft common objects in context)数据集上对SFEM进行了评估, 实验结果表明SFEM能够显著提升基准模型 (baseline)生成图像描述的准确性, 并且SFEM在生成图像描述的准确性方面明显优于广泛使用的空间注意力模型, 在时间性能上也大幅领先空间注意力模型.Abstract: Image captioning is a research direction that combines computer vision and natural language processing. In this paper, a novel saliency feature extraction mechanism (SFEM) is designed to solve several key problems existing in current methods. It can quickly provide the most valuable visual features to the language model before which predict word. And it effectively solves the problems that the existing methods are inaccurate in selecting visual features and time-consuming. SFEM consists of global salient feature extractor and instant salient feature extractor: global salient Feature extractor extracts salient visual features from multiple local visual vectors and integrate these features into a global salient visual vector; the instant salient feature extractor can extract the saliency visual features required at each moment from the global saliency visual vector according to the needs of the language model. We evaluated SFEM on the MS COCO (Microsoft common objects in context) dataset. Experiments show that our SFEM can significantly improve the accuracy of baseline in caption generating. And SFEM is significantly better than the widely used spatial attention model in both the accuracy of generating caption and time performance.
-
Key words:
- Image captioning /
- salient feature extract /
- language model /
- encoder /
- decoder
-
近年来, 随着计算机技术、网络通信、控制工程等新兴产业的相互融合与促进, 信息物理系统(Cyber-physical system, CPS)随之出现, 并朝着大规模、复杂化、智能化的方向发展.多智能体系统分布式协调控制问题作为CPS系统的典型问题, 引起了众多研究者的广泛关注.分布式协同控制因效率高、鲁棒性强等优点, 被广泛应用于无人机编队控制[1]、多机器人协同控制[2]、多飞行器系统群集控制[3-4]等领域.
一致性问题是多智能体协同控制领域的基本问题, 也是协调控制中的研究热点之一[5-13].多智能体系统通过各智能体之间互相协调合作进行信息传递, 按照控制协议改变自身的状态, 从而使各个智能体达到状态一致.近年来诸多学者已经分别针对一阶、二阶、混合阶以及高阶多智能体系统展开了深入的研究[5-7].考虑到许多自然现象的动力学特性不能用整数阶方程描述, 分数阶(非整数阶)动力学的智能个体合作行为也引起了许多研究者的关注[8-9].此外, 在解决多智能体系统一致性问题时, 常常会遇到存在领导者的情况, 这被称为Leader-follower (领导跟随型)问题[10].在多个领导者情况下, 多智能体系统的跟踪问题就变成包容控制问题[11-14].这是领导跟随型一致性问题在多个领导者情况下的扩展, 跟随者在通信协议的作用下最终收敛到由多个领导者围成的某一目标区域内.文献[13]分别研究了通信拓扑为动态联合联通且存在通信时延情况下二阶网络化系统的包容控制问题.文献[14]研究了具有时延的分数阶多智能体系统的包容控制问题, 利用Laplace变换和频域定理, 提出了无向网络分数阶多智能体系统包容控制协议.
上述研究成果均是假设多智能体系统中各个智能体的状态渐近达到稳定, 即当时间趋于无穷大时, 各个智能体的状态可以达到某一共同值.然而在实际应用中, 特别是某些控制精度比较高的系统, 往往要求系统在很短的时间内能够达成一致.与渐近收敛相比, 有限时间一致性控制法不仅可以保证系统的收敛速度更快, 在系统存在外部干扰时也表现出更好的鲁棒性[15].因此研究多智能体系统的有限时间一致性是很有实际意义的.目前关于多智能体系统的有限时间一致性问题已取得比较丰富的研究成果[16-18], 文献[16]研究了二阶多智能体系统有限时间快速收敛问题.文献[17]研究了带有外部干扰的二阶多智能体系统分布式有限时间包容控制, 提出了分布式有限时间包容控制算法使得跟随者的状态在有限时间内收敛到由领导者组成的动态区域内.文献[18]针对联合连通拓扑下具有多领导者的二阶多智能体系统群集运动问题, 提出了一种有限时间收敛的包容控制算法.
由于复杂多变的工作环境, 多智能体系统通常会受到各种干扰的影响.为了处理系统干扰, 研究者提出了许多先进的控制方法, 包括自适应控制[19]、鲁棒控制[20], 滑模控制[21-22]等.然而大多数方法仅考虑匹配干扰, 即干扰与控制输入在同一通道中.在多智能体系统中, 常常存在异于控制输入通道进入系统的干扰, 即不匹配干扰.不匹配干扰广泛存在于实际工程系统中, 例如多导弹系统[23]和工业磁悬浮列车控制系统[24].由于不匹配干扰无法直接利用反馈控制器消除, 因此对带有不匹配干扰系统的协同控制的研究意义重大.文献[24]以工业磁悬浮列车控制系统为例, 详细介绍了不匹配干扰的成因和影响, 基于干扰观测器方法, 介绍了状态通道和输出通道不匹配不确定系统干扰主动控制方法.文献[25]提出基于控制的干扰观测器(Disturbance observer based control, DOBC)方法, 利用干扰前馈补偿和输出反馈复合控制来消除干扰.文献[26]研究了带有不匹配干扰的高阶多智能体系统分布式主动抗干扰控制方法, 结合滑模控制理论和DOBC方法, 实现系统的输出一致性.但文中各智能体的状态最终渐近收敛, 没有考虑有限时间收敛的情况.文献[27]研究了不匹配二阶多智能体受扰系统的输出一致性问题, 文献[28]研究了带有不匹配干扰的多智能体系统有限时间包容控制问题.这两篇文献对系统模型作了处理, 将不匹配干扰转变成匹配干扰, 从而可以利用常规的处理方式消除干扰.然而在实际应用中存在很多情况不能如此处理, 因此该方法有一定的局限性.文献[29]研究了基于扰动观测器的复合积分滑模制导律设计, 给出一种基于积分滑模控制理论和非线性扰动观测理论的复合制导律方法, 但是该方法没有考虑到系统中存在不匹配干扰的情况.
本文以文献[24]介绍的不匹配干扰为研究对象, 研究带有不匹配干扰的二阶多智能体系统的有限时间包容控制问题.相对于文献[27-28], 本文的创新点在于设计了主动有限时间干扰观测器直接估算智能体的不匹配干扰, 并在控制协议中做出干扰补偿, 提出了较为新颖的复合分布式积分滑模控制律.应用滑模控制和现代控制等相关理论, 研究了具有不匹配干扰二阶多智能体系统的有限时间包容控制问题.
1. 预备知识
1.1 代数图论
假设$n$个节点的权重连接图用$G=(V, E, A)$来表示, 其中为$n$个节点的集合, 节点的下标集合$N=\{1, 2, \cdots , n\}$, $E\subseteq V\times V$为边的集合, 为图$G$的权重邻接矩阵, 其中矩阵元素${{a}_{ij}}$表示节点${{v}_{i}}$与节点${{v}_{j}}$的连接权重.定义为节点${{v}_{i}}$的邻居集合.当${{v}_{j}}\in {{N}_{i}}$时, ${{a}_{ij}}>0$, 否则${{a}_{ij}}=0$.若对$\forall i \in N$, ${{a}_{ij}}={{a}_{ji}}$, , 则图$G$为无向拓扑图, 且邻接矩阵$A$为对称矩阵.若对, ${{a}_{ij}}\ne$ ${{a}_{ji}}$, , 则图$G$为有向拓扑图, 且邻接矩阵$A$为非对称矩阵.假设图$G$中任一节点无自环, 即对于$\forall i\in N$, ${{a}_{ii}}=0$.定义$D$为图$G$的度对角矩阵$D$ , 其中节点${{v}_{i}}$的度${{d}_{i}}=$ $\sum\nolimits_{j=1}^{n}{{{a}_{ij}}}$.图$G$的Laplacian矩阵定义为$L=D$ $-$ $A$.无向联通拓扑图的Laplacian矩阵为对称矩阵.
1.2 相关引理和定义
引理1 (Input-to-state stability theorem, ISS)[30].考虑非线性系统$\dot{x}=f(x, u, t)$, 如果系统$\dot{x}=f(x, 0, t)$是全局均一化指数型稳定, 当 $=$ $0$时, 系统的$\dot{x}=f(x, u, t)$状态渐近收敛到0, 即${\lim_{t\to \infty } }x(t)=0$.
引理2[15].考虑系统$\dot{x}=f(x)$, $f(0)=0$, $x$ $\in$ ${{\bf R}^{n}}$, 假设存在一个正定连续函数$V(x):U\to {\bf R}$, 且实数$c>0$, $\alpha \in (0, 1)$, 在${{U}_{0}}\subset U$的邻域上满足, , 则$V(x)$在有限时间内收敛到0.此外有限时间$T$满足$T$ $\le$ $\frac{{{V}^{1-\alpha }}(x(0))}{c(1-\alpha )}$.
定义1[12-13].假设集合$X$是向量空间的子集, 集合$X$的凸包定义为 ${{a}_{i}}$ $\ge 0$, $\sum\nolimits_{i=1}^{k}{{{a}_{i}}=1} \}$.
定义2[15, 18].考虑连续非线性系统: $\dot{\pmb x}=f({\pmb x})$, , 其中连续向量流$f({\pmb x})=[ {{f}_{1}}({\pmb x})$, 与带有扩张, ${ {r}_{i}}>0$的度$\kappa \in \bf R$是齐次的, 如果对于任意的$\varepsilon$ $>$ $0$, ${\pmb x}\in {{\bf R}^{n}}$都有 , $i=1, 2, \cdots , n$.
引理3[15, 18].若系统与带有扩张, ${{ r}_{i}}>0$的度$\kappa$ $\in$ $\bf R$是齐次的, 函数$f({\pmb x})$是连续的, 且${\pmb x}=0$是其一个渐近稳定平衡点.如果齐次度$\kappa <0$, 则该系统是有限时间稳定的.
定义3.如果网络化系统中的一个自主体至少存在一个邻接成员, 则称之为跟随者, 否则称为领导者.
2. 二阶多智能体系统的有限时间包容控制
假设一个具有$n$个跟随者和$m$个领导者的多智能体系统, 其中每个智能体可理解为加权无向图$G$中的一个顶点, 各智能体之间的信息传递可理解为图$G$的边.考虑二阶多智能体系统未受到干扰时的动力学模型为
$ \begin{align}\label{1} \begin{cases} {{{\dot{x}}}_{i}}(t)={{v}_{i}}(t) \\ {{{\dot{v}}}_{i}}(t)={{u}_{i}}(t) \end{cases} \end{align} $
(1) 其中, $i= \{ 1, 2, \cdots , n, n+1, \cdots , n+m \}$, $n$表示跟随者的个数, $m$表示领导者的个数, 跟随者和领导者集合分别表示为$F= \{ 1, 2, \cdots , n \}$和$L=\{ n+1$, $n+2$, $\cdots , n+m \}$. ${{x}_{i}}(t)$和${{v}_{i}}(t)$分别表示系统第$i$个智能体在$t$时刻的位置和速度, ${{u}_{i}}(t)$是控制输入.假设领导者为作匀速运动的动态领导者, 对于$\forall i$ $\in$ $L$, 其动力学模型为
$ \begin{align}\label{2} \begin{cases} {{{\dot{x}}}_{i}}(t)={{v}_{i}}(t) \\ {{{\dot{v}}}_{i}}(t)=0 \end{cases} \end{align} $
(2) 多Leader-follower型多智能体系统(1)和(2)的通信拓扑图可描述成${{G}_{n+m}}=( {{V}_{n+m}}, {{E}_{n+m}}$, , 其中$m$表示领导者的个数, $n$表示跟随者的个数.图${{G}_{n+m}}$的邻接矩阵为 $\in$ ${{\bf R}^{ ( n+m )\times ( n+m )}}$, Laplacian矩阵为${{L}_{n+m}}=[ {{l}_{ij}} ]\in$ , 可描述成, ${{L}_{f}}$ $\in {{\bf R}^{n\times n}}$, ${{L}_{d}}\in {{\bf R}^{n\times m}}$.
假设1.领导者相互间不通信, 领导者与跟随者之间单向通信, 跟随者之间为双向通信, 且每个智能体都可接收到它邻居发送的状态信息和干扰估计信息.
假设2.多Leader-follower型多智能体系统的通信拓扑${{G}_{n+m}}$包含至少一条有向生成树.
引理4[12].如果假设2成立, 多Leader-follower型多智能体系统的${{L}_{f}}$是正定的, 此外$-L_{f}^{-1}{{L}_{d}}$为非负的且行和为1.
引理5[12].令, ${{\pmb x}_{L}}=$ , 若有, 则网络化系统可以实现包容控制.
为了简化, 令, ${{\pmb v}_{F}}=[{{v}_{1}}$, , , ${{\pmb v}_{L}}=$ , . , , ${{v}_{c2}}$, .由定义1、引理3和引理5可知, ${{\pmb x}_{F}}\to {{\pmb x}_{c}}$ $({{x}_{i}}\to {{x}_{ci}}$, $i\in F)$意味着${{x}_{i}}$, 收敛到凸包$Co \{ {{x}_{j}}, j\in L \}$内, 即实现包容控制.
基于上述描述, 本节首先考虑不存在干扰的情况, 设计分布式控制协议, 使得各个跟随者的状态在有限时间内实现包容控制, 即.
首先令跟踪误差为
$ \begin{align}\label{3} \begin{cases} \omega _{i}^{x}= & \sum\limits_{j=1}^{n}{{{a}_{ij}}\left( {{x}_{i}}-{{x}_{j}} \right)+\sum\limits_{j=n+1}^{n+m}{{{a}_{ij}}\left( {{x}_{i}}-{{x}_{j}} \right)}} \\[2mm] \omega _{i}^{v}= & \sum\limits_{j=1}^{n}{{{a}_{ij}}\left( {{v}_{i}}-{{v}_{j}} \right)+\sum\limits_{j=n+1}^{n+m}{{{a}_{ij}}\left( {{v}_{i}}-{{v}_{j}} \right)}} \end{cases} \end{align} $
(3) 基于跟踪误差(3), 设计控制器如下:
$ \begin{align}\label{4} {{u}_{i}}= -{{k}_{1}}{{\rm sig}^{{{\alpha }_{1}}}}\left( \omega _{i}^{x} \right)- {{k}_{2}}{{\rm sig}^{{{\alpha }_{2}}}}\left( \omega _{i}^{v} \right) \end{align} $
(4) 其中, 控制增益${{k}_{1}}$, ${{k}_{2}}>0$, $0<{{\alpha }_{1}} <1$, ${{\alpha }_{2}}=$ ${2{{\alpha }_{1}}}/({{\alpha }_{1}}+1)$. , 表示符号函数.假设 , .
定理1. 考虑由$n$个跟随者和$m$个领导者组成的二阶动态多智能体系统(1)和(2), 其通信拓扑图可描述成, 如果假设1和假设2成立, 则多智能体系统基于分布式控制协议(4)可实现全局有限时间包容控制.
证明.由引理4可知, 多智能体系统(1)和(2)的${{L}_{f}}$是正定的.令, ${{\bar{\pmb v}}_{F}}={{\pmb v}_{F}}$ $+$ $L_{f}^{-1}{{L}_{d}}{{\pmb v}_{L}}$, 则跟踪误差(3)转变成矩阵形式为
$ \begin{align}\label{5} \begin{cases} {{\pmb {\omega }}_{x}}={{L}_{f}}{{\pmb x}_{F}}+{{L}_{d}}{{\pmb x}_{L}}={{L}_{f}}{{{\bar{\pmb x}}}_{F}} \\ {{\pmb {\omega }}_{v}}={{L}_{f}}{{\pmb v}_{F}}+{{L}_{d}}{{\pmb v}_{L}}={{L}_{f}}{{{\bar{\pmb v}}}_{F}} \end{cases} \end{align} $
(5) 其中, , $\omega _{n}^{v}]^{\rm T}$, 且${{\dot{\pmb \omega }}_{x}}={{\pmb \omega }_{v}}$.因此速度跟踪误差${{\bar{\pmb v}}_{F}}$的微分方程为
$ \begin{align}\label{6} {{\dot{\bar{\pmb v}}}_{F}}=-{{k}_{1}}{{\rm sig}^{{{\alpha }_{1}}}}\left( {{\pmb \omega }_{x}} \right)-{{k}_{2}}{{\rm sig}^{{{\alpha }_{2}}}}\left( {{\pmb \omega }_{v}} \right) \end{align} $
(6) 构造Lyapunov函数
$ \begin{align}\label{7} {{V}_{1}}=\frac{1}{2}\bar{\pmb v}_{F}^{\texttt{T}}{{L}_{f}}{{\bar{\pmb v}}_{F}}+\frac{{{k}_{1}}{{\left| {{\pmb \omega }_{x}} \right|}^{{{\alpha }_{1}}+1}}}{{{\alpha }_{1}}+1} \end{align} $
(7) 对${{V}_{1}}$函数沿着式(6)求一次导, 得
$ \begin{align} {{{\dot{V}}}_{1}}= &\ \bar{\pmb v}_{F}^{\rm{T}}{{L}_{f}}{{{\dot{\bar{\pmb v}}}}_{F}} +{{k}_{1}}{{\left| {{\pmb \omega }_{x}} \right|}^{{{\alpha }_{1}}}} {\pmb \omega _{v}}^{\rm{T}}{\rm sgn}\left( {{\pmb \omega }_{x}} \right) = \nonumber\\ &\ {\pmb \omega _{v}}^{\rm{T}}\left( -{{k}_{1}}{{\rm sig}^{{{\alpha }_{1}}}}\left( {{\pmb \omega }_{x}} \right)-{{k}_{2}}{{\rm sig}^{{{\alpha }_{2}}}}\left( {{\pmb \omega }_{v}} \right) \right)+ \nonumber\\ &\ {{k}_{1}}{\pmb \omega _{v}}^{\rm{T}}{{\rm sig} ^{{{\alpha }_{1}}}}\left( {{\pmb \omega }_{x}} \right) = -{{k}_{2}}{{\left| {{\pmb \omega }_{v}} \right|}^{{{\alpha }_{2}}+1}} \le 0 \nonumber \end{align} $
注意到, 当${{\dot{V}}_{1}}=0$时, ${{\pmb \omega }_{v}}=0$, 由于${{\pmb \omega }_{v}}={{L}_{f}}{{\bar{\pmb v}}_{F}}$, 且${{L}_{f}}$是正定的, 所以${{\bar{\pmb v}}_{F}}=0$.由式(6)可知 $0$.因此只有在平衡点${{\pmb \omega }_{x}}=0$, 处才有${{\dot{V}}_{1}}$ $=$ $0$.根据Lyapunov第二稳定性定理可知, 该系统在平衡点处渐近稳定.进一步由式(5)可得${{\pmb x}_{F}}$ $\to$ , ${{\pmb v}_{F}}\to -L_{f}^{-1}{{L}_{d}}{{\pmb v}_{L}}$, 由引理5可知系统可以实现渐近包容控制.
下面分析系统的齐次性.假设原动力学系统为
$ \begin{align}\label{8} \begin{cases} {{f}_{1}}\left( {{x}_{i}}, {{v}_{i}} \right)= & {{v}_{i}}\left( t \right) \\ {{f}_{2}}\left( {{x}_{i}}, {{v}_{i}} \right)= & {{u}_{i}}\left( t \right) \end{cases} \end{align} $
(8) 取${{r}_{1}}=2$, ${{r}_{2}}=1+{{\alpha }_{1}}$, , 则有
$ \begin{align} &{{f}_{1}}\left( {{\varepsilon }^{{{r}_{1}}}}{{x}_{i}}, {{\varepsilon }^{{{r}_{2}}}}{{v}_{i}} \right)={{\varepsilon }^{{{r}_{2}}}} {{v}_{i}}\left( t \right)={{\varepsilon }^{{{r}_{1}}+\kappa }} {{f}_{1}}\left( {{x}_{i}}, {{v}_{i}} \right)\notag\\ &{{f}_{2}}\left( {{\varepsilon }^{{{r}_{1}}}}{{x}_{i}}, {{\varepsilon }^{{{r}_{2}}}}{{v}_{i}} \right) =\notag\\ &\qquad -{{k}_{1}}{{\rm sig}^{{{\alpha }_{1}}}}\bigg( \sum\limits_{j=1}^{n+m}{{{a}_{ij}}\left( {{\varepsilon }^{{{r}_{1}}}}{{x}_{i}}-{{\varepsilon }^{{{r}_{1}}}}{{x}_{j}} \right)} \bigg)- \notag\\ &\qquad {{k}_{2}}{{\rm sig}^{{{\alpha }_{2}}}}\bigg( \sum\limits_{j=1}^{n+m}{{{a}_{ij}}\left( {{\varepsilon }^{{{r}_{2}}}}{{v}_{i}}-{{\varepsilon }^{{{r}_{2}}}}{{v}_{j}} \right)} \bigg) = \notag\\ &\qquad -{{k}_{1}}{{\varepsilon }^{{{r}_{1}}{{\alpha }_{1}}}}{{\rm sig}^{{{\alpha }_{1}}}}\bigg( \sum\limits_{j=1}^{n+m}{{{a}_{ij}}\left( {{x}_{i}}-{{x}_{j}} \right)} \bigg)- \notag\\ &\qquad {{k}_{2}}{{\varepsilon }^{{{r}_{2}}{{\alpha }_{2}}}}{{\rm sig}^{{{\alpha }_{2}}}}\bigg( \sum\limits_{j=1}^{n+m}{{{a}_{ij}}\left( {{v}_{i}}-{{v}_{j}} \right)} \bigg) = \notag\\ &\qquad {{\varepsilon }^{2{{\alpha }_{1}}}}\bigg( -{{k}_{1}}{{\rm sig}^{{{\alpha }_{1}}}}\bigg( \sum\limits_{j=1}^{n+m} {{{a}_{ij}}\left( {{x}_{i}}-{{x}_{j}} \right)} \bigg)- \notag\\ &\qquad {{k}_{2}}{{\rm sig}^{{{\alpha }_{2}}}}\bigg( \sum\limits_{j=1}^{n+m} {{{a}_{ij}}\left( {{v}_{i}}-{{v}_{j}} \right)} \bigg) \bigg) =\notag \\ &\qquad {{\varepsilon }^{{{r}_{2}}+\kappa }}{{f}_{2}}\left( {{x}_{i}}, {{v}_{i}} \right) \nonumber \end{align} $
由定义2可知, 多智能体系统(1)和(2)与带有扩张的度是齐次的, 且由引理3可知, 系统(8)可在有限时间内收敛.
综上可知, 多智能体系统(1)和(2)可实现有限时间包容控制.
3. 带有不匹配干扰的多智能体系统的有限时间包容控制
本节考虑二阶多智能体系统中存在的不匹配干扰和匹配干扰等多源干扰的情况, 假设二阶受扰多智能体系统的动力学模型为
$ \begin{align}\label{9} \begin{cases} {{{\dot{x}}}_{i}}(t)= {{v}_{i}}(t)+{{d}_{i1}}(t) \\ {{{\dot{v}}}_{i}}(t)= {{u}_{i}}(t)+{{d}_{i2}}(t) \end{cases} \end{align} $
(9) 其中, $i\in F= \{ 1, 2, \cdots , n \}$, $n$表示跟随者的个数, ${{x}_{i}}(t)$和${{v}_{i}}(t)$分别是智能体的位置和速度, ${{u}_{i}}(t)$是控制输入, ${{d}_{i1}}(t)$和${{d}_{i2}}(t)$分别表示不匹配干扰和匹配干扰.
领导者的动力学模型为
$ \begin{align}\label{10} \begin{cases} {{{\dot{x}}}_{j}}(t)={{v}_{j}}(t) \\ {{{\dot{v}}}_{j}}(t)=0 \end{cases} \end{align} $
(10) 其中, $j\in L= \{ n+1, n+2, \cdots , n+m \}$, $m$表示领导者的个数, ${{x}_{j}}(t)$和${{v}_{j}}(t)$分别是领导者位置和速度.
为了解决系统(9)中的不匹配干扰并保持系统的标称性能, 本节将结合积分滑模控制和非线性干扰观测器给出复合分布式控制协议.首先, 通过设计非线性干扰观测器, 在有限时间内估算出系统的状态和干扰信息.然后, 基于干扰估计值, 设计出带有前馈补偿项的复合分布式积分滑模控制协议.
3.1 非线性干扰观测器设计
假设3.干扰${{d}_{ik}}(t)$和, $k$ $= 1, 2$, 都是有界的.
注1. 假设3在DOBC领域是很常见的假设.一方面, 如果干扰具有很快时变, 那么干扰观测器很难进行估算; 另一方面, 在实际应用上, 有很多种干扰满足这种假设, 例如:常值干扰, 谐波干扰等[27-29].
引理6[31].对于一般系统
$ \begin{align}\label{11} \dot{x}=f+gu+d \end{align} $
(11) 其中, $x$为状态量, $u$为控制量, $d$为系统干扰, $f, g$已知.设计的非线性干扰观测器如下:
$ \begin{align}\label{12} \begin{cases} \dot{\hat{x}}= f+gu+z \\ z= -{{\lambda }_{1}}{{\rm sig}^{\frac{2}{3}}}(\hat{x}-x)+\hat{d} \\ \dot{\hat{d}}= -{{\lambda }_{2}}{{\rm sig}^{\frac{1}{2}}}(\hat{d}-z) \end{cases} \end{align} $
(12) 其中, 增益${{\lambda }_{1}}$, ${{\lambda }_{2}}>0$, $\hat{x}$和$\hat{d}$分别是状态$x$和干扰$d$的估计值, 则该观测器是有限时间收敛的.
根据引理6, 设计干扰观测器如下:
$ \begin{align}\label{13} \begin{cases} {{{\dot{\hat{x}}}}_{i}}= {{v}_{i}}+{{z}_{i1}} \\ {{z}_{i1}}= -{{\lambda }_{i1}}{{\rm sig}^{\frac{2}{3}}}({{{\hat{x}}}_{i}}-{{x}_{i}})+{{{\hat{d}}}_{i1}} \\ {{{\dot{\hat{d}}}}_{i1}}= -{{\lambda }_{i2}}{{\rm sig}^{\frac{1}{2}}}({{{\hat{d}}}_{i1}}-{{z}_{i1}}) \\ {{{\dot{\hat{v}}}}_{i}}= {{u}_{i}}+{{z}_{i2}} \\ {{z}_{i2}}= -{{\lambda }_{i3}}{{\rm sig}^{\frac{2}{3}}}({{{\hat{v}}}_{i}}-{{v}_{i}})+{{{\hat{d}}}_{i2}} \\ {{{\dot{\hat{d}}}}_{i2}}= -{{\lambda }_{i4}}{{\rm sig}^{\frac{1}{2}}}({{{\hat{d}}}_{i2}}-{{z}_{i2}}) \end{cases} \end{align} $
(13) 其中, $i\in F$, ${{\hat{x}}_{i}}$和${{\hat{v}}_{i}}$分别是系统中跟随者的位置状态和速度的估计值, ${{\hat{d}}_{i1}}$和${{\hat{d}}_{i2}}$分别是干扰的估计量, ${{z}_{i1}}$和${{z}_{i2}}$为中间量, 为观测增益.
设${{e}_{{{x}_{i}}}}={{x}_{i}}-{{\hat{x}}_{i}}$, ${{e}_{{{d}_{i1}}}}={{d}_{i1}}-{{\hat{d}}_{i1}}$, ${{e}_{{{v}_{i}}}}={{v}_{i}}-{{\hat{v}}_{i}}$, ${{e}_{{{d}_{i2}}}}$ $={{d}_{i2}}-{{\hat{d}}_{i2}}$, 则
$ \begin{align}\label{14} \begin{cases} {{{\dot{e}}}_{{{x}_{i}}}}= -{{\lambda }_{i1}}{{\rm sig}^{\frac{2}{3}}}({{e}_{{{x}_{i}}}})+{{e}_{{{d}_{i1}}}} \\ {{{\dot{e}}}_{{{d}_{i1}}}}= -{{\lambda }_{i2}}{{\rm sig}^{\frac{1}{2}}}({{e}_{{{d}_{i1}}}}-{{{\dot{e}}}_{{{x}_{i}}}})+{{{\dot{d}}}_{i1}} \\ {{{\dot{e}}}_{{{v}_{i}}}}= -{{\lambda }_{i3}}{{\rm sig}^{\frac{2}{3}}}({{e}_{{{v}_{i}}}})+{{e}_{{{d}_{i2}}}} \\ {{{\dot{e}}}_{{{d}_{i2}}}}= -{{\lambda }_{i4}}{{\rm sig}^{\frac{1}{2}}}({{e}_{{{d}_{i2}}}}-{{{\dot{e}}}_{{{v}_{i}}}})+{{{\dot{d}}}_{i2}} \end{cases} \end{align} $
(14) 其中, .由引理6可知, 存在大于零的增益, 使得观测器是有限时间收敛, 即存在一个时刻${{ T}^{*}}$, 当$t\in [0, {{ T}^{*}}]$时, ${{e}_{{{x}_{i}}}}$, ${{e}_{{{d}_{i1}}}}$, ${{e}_{{{v}_{i}}}}$, ${{e}_{{{d}_{i2}}}}$均有界; 当$t>{{ T}^{*}}$时, ${{e}_{{{x}_{i}}}}=0$, ${{e}_{{{d}_{i1}}}}$ $=$ $0$, ${{e}_{{{v}_{i}}}}=0$, ${{e}_{{{d}_{i2}}}}=0$.
3.2 复合式分布式控制律设计
下面基于上述设计的有限时间干扰观测器, 结合滑模控制理论, 设计复合分布式控制协议消除干扰, 并使得系统(9)和系统(10)实现有限时间包容控制.
首先令跟踪误差为
$ \begin{align}\label{15} \begin{cases} \omega _{i}^{x}= \sum\limits_{j=1}^{n}{{{a}_{ij}}\left( {{x}_{i}}-{{x}_{j}} \right)+\sum\limits_{j=n+1}^{n+m}{{{a}_{ij}}\left( {{x}_{i}}-{{x}_{j}} \right)}} \\[2mm] \omega _{i}^{v}= \sum\limits_{j=1}^{n}{{{a}_{ij}}\left( ( {{{\hat{v}}}_{i}}+{{{\hat{d}}}_{i1}} )-( {{{\hat{v}}}_{j}}+{{{\hat{d}}}_{j1}} ) \right)}\, +\\ \qquad \sum\limits_{j=n+1}^{n+m}{{{a}_{ij}}\left( ( {{{\hat{v}}}_{i}}+{{{\hat{d}}}_{i1}} )-{{v}_{j}} \right)} \end{cases} \end{align} $
(15) 基于跟踪误差(15), 设计复合分布式控制协议如下:
$ \begin{align}\label{16} {{u}_{i}}= & -{{k}_{0}}{\rm sgn}\left( \sum\limits_{j=1}^{n}{{{a}_{ij}} \left( {{s}_{i}}-{{s}_{j}} \right)}+\sum\limits_{j=n+1}^{n+m}{{{a}_{ij}} {{s}_{i}}} \right)- \nonumber\\ &\ {{k}_{1}}{{\rm sig}^{{{\alpha }_{1}}}}\left( \omega _{i}^{x} \right)- {{k}_{2}}{{\rm sig}^{{{\alpha }_{2}}}}\left( \omega _{i}^{v} \right)-{{{\hat{d}}}_{i2}} \end{align} $
(16) 其中, ${{k}_{0}}, {{k}_{1}}, {{k}_{2}}>0$, 分别是干扰观测器(13)对系统速度和干扰的估计值, $i\in F$, 非线性动态积分滑模面为
$ \begin{align}\label{17} {{s}_{i}}= &\ {{{\hat{v}}}_{i}}+{{{\hat{d}}}_{i1}}-\left( {{{\hat{v}}}_{i}} (0)+{{{\hat{d}}}_{i1}}(0) \right)+ \nonumber\\ &\ \int_{0}^{t}\left({ {{k}_{1}}{{\rm sig}^{{{\alpha }_{1}}}}( \omega _{i}^{x} ) +{{k}_{2}}{{\rm sig}^{{{\alpha }_{2}}}}( \omega _{i}^{v} ) }\right){\rm d}\tau \end{align} $
(17) 其中, $0<{{\alpha }_{1}}<1$, .当$t=0$时, ${{s}_{i}}(0)$ $=0$, 表示各智能体的状态从初始时刻就位于非线性滑模面(17)上.
定理2.考虑由$n$个跟随者和$m$个领导者组成的二阶受扰多智能体系统(9)和(10), 其通信拓扑图可描述成, 如果假设1~3成立, 当切换增益满足${{k}_{0}}>\delta $时, 基于有限时间干扰观测器(13)和非线性积分滑模面(17)的复合分布式非线性积分滑模控制协议(16)可使得系统实现全局有限时间包容控制.其中, , $e_{{{v}_{i}}}^{*}$ $=$ , , $k=1, 2, 3$, .
证明.首先对滑模面(17)求一次导, 得
$ \begin{align*} {{{\dot{s}}}_{i}} =&\ {{{\dot{\hat{v}}}}_{i}}+{{{\dot{\hat{d}}}}_{i1}}+{{k}_{1}} {{\rm sig}^{{{\alpha }_{1}}}}\left( \omega _{i}^{x} \right)+{{k}_{2}}{{\rm sig}^ {{{\alpha }_{2}}}}\left( \omega _{i}^{v} \right)= \\ & \ {{u}_{i}}-{{\lambda }_{i3}}{{\rm sig}^{\frac{2}{3}}}({{{\hat{v}}}_{i}}-{{v}_{i}})+ {{{\hat{d}}}_{i2}}+{{{\dot{\hat{d}}}}_{i1}}\, + \\ & \ {{k}_{1}}{{\rm sig}^{{{\alpha }_{1}}}}\left( \omega _{i}^{x} \right)+{{k}_{2}}{{\rm sig}^ {{{\alpha }_{2}}}}\left( \omega _{i}^{v} \right)=\\ & -{{k}_{0}}{\rm sgn}\left( \sum\limits_{j=1}^{n}{{{a}_{ij}}\left( {{s}_{i}}-{{s}_{j}} \right)}+\sum\limits_{j=n+1}^{n+m}{{{a}_{ij}}{{s}_{i}}} \right)- \\ &\ {{\lambda }_{i3}}{{\rm sig}^{\frac{2}{3}}}\left( {{{\hat{v}}}_{i}}-{{v}_{i}} \right)+{{{\dot{\hat{d}}}}_{i1}}= \\ & -{{k}_{0}}{\rm sgn}\left( \sum\limits_{j=1}^{n}{{{a}_{ij}}\left( {{s}_{i}}-{{s}_{j}} \right)}+\sum\limits_{j=n+1}^{n+m}{{{a}_{ij}}{{s}_{i}}} \right)+ \\ &\ {{\lambda }_{i3}}{{\rm sig}^{\frac{2}{3}}}\left( {{e}_{{{v}_{i}}}} \right)+{{\lambda }_{i2}}{{\rm sig}^{\frac{1}{2}}}\left( {{\lambda }_{i1}}{{\rm sig}^{\frac{2}{3}}}\left( {{e}_{{{x}_{i}}}} \right) \right) \nonumber \end{align*} $
令${\pmb S}={[{{s}_{1}}, {{s}_{2}}, \cdots , {{s}_{n}}]}^{{\rm T}}$, 将上式转换成矩阵形式
$ \begin{align}\label{18} \dot{\pmb S}= & -{{k}_{0}}{\rm sgn}\left( {{L}_{f}}{\pmb S} \right)+{{\lambda }_{3}} {{\rm sig}^{\frac{2}{3}}}\left( {{\pmb e}_{v}} \right)+ \notag\\ &\ {{\lambda }_{2}} {{\rm sig}^{\frac{1}{2}}}\left( {{\lambda }_{1}}{{\rm sig}^{\frac{2}{3}}}\left( {{\pmb e}_{x}} \right) \right) \end{align} $
(18) 其中, ${{L}_{f}}$为系统的Laplacian矩阵, , ${{\lambda }_{21}}$, , , ${\rm diag} \{ {{\lambda }_{13}}$, , , , ${{\pmb e}_{v}}$ .
构造函数, 对$V_2$求一次导, 得
$ \begin{align*} {{{\dot{V}}}_{2}} =&\ {{\pmb S}^{\rm{T}}}{{L}_{f}}\dot{\pmb S} = {{\pmb S}^{\rm{T}}}{{L}_{f}}\left( -{{k}_{0}}{\rm sgn}\left( {{L}_{f}}{\pmb S} \right) \right)+ \\ &\ {{\pmb S}^{\rm{T}}}{{L}_{f}}\left( {{\lambda }_{3}}{{\rm sig}^{\frac{2}{3}}} \left( {{\pmb e}_{v}} \right)+{{\lambda }_{2}}{{\rm sig}^{\frac{1}{2}}}\left( {{\lambda }_{1}}{{\rm sig}^{\frac{2}{3}}} \left( {{\pmb e}_{x}} \right) \right) \right) = \\ & -{{k}_{0}}\sum\limits_{i=1}^{n}{\left| {{\left[ {{L}_{f}}{\pmb S} \right]}_{i}} \right|}+ \sum\limits_{i=1}^{n}\bigg( {{\lambda }_{i3}}{{\rm sig}^{\frac{2}{3}}} \left( {{e}_{{{v}_{i}}}} \right)+\\ &\ {{\lambda }_{i2}}{{\rm sig}^{\frac{1}{2}}}\left( {{\lambda }_{i1}} {{\rm sig}^{\frac{2}{3}}} \left( {{e}_{{{x}_{i}}}} \right) \right) \bigg)\left| {{\left[ {{L}_{f}}{\pmb S} \right]}_{i}} \right| \le \\ & -\left( {{k}_{0}}-\delta \right){{\left\| {{L}_{f}}{\pmb S} \right\|}_{1}} \le -\left( {{k}_{0}}-\delta \right){{\left\| {{L}_{f}}{\pmb S} \right\|}_{2}} \nonumber \end{align*} $
其中, , , , , $k=1, 2, 3$, .由有限时间观测器(13)可知, 在$[0, {{ T}^{*}}]$内, ${{e}_{{{x}_{i}}}}$, ${{e}_{{{v}_{i}}}}$是有界的, 因此$\delta $一定存在.由于${{L}_{f}}$是正定的, .因此
$ \begin{align}\label{19} \dot{V}\le -\sqrt{2}\left( {{k}_{0}}-\delta \right)\lambda _{\min }^{\frac{1}{2}}\left( {{L}_{f}} \right)V_{2}^{\frac{1}{2}} \end{align} $
(19) 因此, 当${{k}_{0}}>\delta $时, 由引理2可知各智能体状态可在有限时间内到达非线性滑模面(17)上.假设各智能体状态可在${{t}_{1}}$时刻到达滑模面上, 由引理2可得
$ \begin{align}\label{20} {{t}_{1}}\le &\ \frac{\sqrt{2}V_{2}^{\frac{1}{2}}(0)}{\left( {{k}_{0}} -\delta \right)\lambda _{\min }^{\frac{1}{2}}\left( {{L}_{f}} \right)} \le\notag\\[2mm] &\ \frac{{{\left( {{\pmb S}^{\rm{T}}}(0)L_{f}^{2}{\pmb S}(0) \right)}^{\frac{1}{2}}}} {\left( {{k}_{0}}-\delta \right){{\lambda }_{\min }}\left( {{L}_{f}} \right)}=0 \end{align} $
(20) 式(20)表明各智能体状态从初始时刻开始就一直发生在非线性滑模面上.
下面证明系统有限时间包容控制.首先假设跟随者的状态跟踪误差为, , , ${{\bar{v}}_{n}}]^{\rm{T}}$.
由有限时间观测器(13)可知, 存在一个时刻${{T}^{*}}$, 当$t>{{ T}^{*}}$时, ${{e}_{{{x}_{i}}}}={{e}_{{{d}_{i1}}}}={{e}_{{{v}_{i}}}}={{e}_{{{d}_{i2}}}}=0$.因此, 闭合系统(9), (10), (16)的有限时间稳定性可分两步证明, 即上状态跟踪误差${{\bar{x}}_{i}}$, ${{\bar{v}}_{i}}$有界, 及$t$ $>$ ${{T}^{*}}$时, 全局有限时间收敛.
1) 注意到系统的状态一直发生在非线性积分滑模面上, 因此
$ \begin{align}\label{21} {{\dot{s}}_{i}}=\, &{\dot{\hat{v}}_{i}}+{\dot{\hat{d}}}_{i1}+ {{k}_{1}}{{\rm sig}^{{{\alpha }_{1}}}}\left( \omega _{i}^{x} \right)+ {{k}_{2}}{{\rm sig}^{{{\alpha }_{2}}}}\left( \omega _{i}^{v} \right)=0 \end{align} $
(21) 令${{\tilde{v}}_{i}}={{\hat{v}}_{i}}+{{\hat{d}}_{i1}}$, 则, 因此
$ \begin{align}\label{22} \begin{cases} {{{\dot{x}}}_{i}}= {{{\tilde{v}}}_{i}}+{{e}_{{{v}_{i}}}}+{{e}_{{{d}_{i1}}}} \\ {{{\dot{\tilde{v}}}}_{i}}= -{{k}_{1}}{{\rm sig}^{{{\alpha }_{1}}}} \Big( \sum\limits_{j=1}^{n}{{a}_{ij}}\left( {{x}_{i}}-{{x}_{j}} \right)+\\ \qquad\, \sum\limits_{j=n+1}^{n+m}{{{a}_{ij}}\left( {{x}_{i}}-{{x}_{j}} \right)} \Big)- {{k}_{2}}\, \times\\ \qquad\, {{\rm sig}^{{{\alpha }_{2}}}}\Big( \sum\limits_{j=1}^{n}{{{a}_{ij}} \left( {{{\tilde{v}}}_{i}}-{{{\tilde{v}}}_{j}} \right)+ \sum\limits_{j=n+1}^{n+m}{{{a}_{ij}}\left( {{{\tilde{v}}}_{i}}-{{v}_{j}} \right)}} \Big) \end{cases} \end{align} $
(22) 应用ISS稳定性引理, 假设${{e}_{{{v}_{i}}}}$, ${{e}_{{{d}_{i1}}}}=0$, 则系统(22)转变为
$ \begin{align}\label{23} \begin{cases} {{{\dot{x}}}_{i}}= {{{\tilde{v}}}_{i}} \\ {{{\dot{\tilde{v}}}}_{i}}= -{{k}_{1}}{{\rm sig}^{{{\alpha }_{1}}}} \Big( \sum\limits_{j=1}^{n}{{a}_{ij}}\left( {{x}_{i}}-{{x}_{j}} \right)+\\ \qquad\, \sum\limits_{j=n+1}^{n+m}{{{a}_{ij}}\left( {{x}_{i}}-{{x}_{j}} \right)} \Big)-{{k}_{2}}\, \times \\ \qquad\, {{\rm sig}^{{{\alpha }_{2}}}}\Big( \sum\limits_{j=1}^{n}{{{a}_{ij}} \left( {{{\tilde{v}}}_{i}}-{{{\tilde{v}}}_{j}} \right)+ \sum\limits_{j=n+1}^{n+m}{{{a}_{ij}}\left( {{{\tilde{v}}}_{i}}-{{v}_{j}} \right)}} \Big) \end{cases} \end{align} $
(23) 由定理1可知, 系统(23)是有限时间包容控制的, 结合引理1, 系统(22)是ISS稳定的.由观测器可知, 在$[0, {{ T}^{*}}]$内${{e}_{{{v}_{i}}}}$和${{e}_{{{d}_{i1}}}}$有界, 因此系统(22)状态跟踪误差${{\bar{x}}_{i}}$和${{\bar{\tilde{v}}}_{i}}$有界.而假设1中说明${{d}_{i1}}$是有界的, 因此${{\hat{d}}_{i1}}$也是有界的, 所以速度跟踪误差${{\bar{v}}_{i}}$是有界的.
2) (全局有限时间包容控制)当$t>{{ T}^{*}}$时, ${{e}_{{{x}_{i}}}}$ $=$ ${{e}_{{{d}_{i1}}}}={{e}_{{{v}_{i}}}}= {{e}_{{{d}_{i2}}}}=0$.令${{\tilde{v}}_{i}}={{\hat{v}}_{i}}+{{\hat{d}}_{i1}}= {{v}_{i}}+$ ${{d}_{i1}}$, 则
$ \begin{align}\label{24} \begin{cases} {{{\dot{x}}}_{i}}= {{{\tilde{v}}}_{i}} \\ {{{\dot{\tilde{v}}}}_{i}}= -{{k}_{1}}{{\rm sig}^{{{\alpha }_{1}}}} \Big( \sum\limits_{j=1}^{n}{{a}_{ij}}\left( {{x}_{i}}-{{x}_{j}} \right)+\\ \qquad\, \sum\limits_{j=n+1}^{n+m}{{{a}_{ij}}\left( {{x}_{i}}-{{x}_{j}} \right)} \Big)- {{k}_{2}}\, \times\\ \qquad\, {{\rm sig}^{{{\alpha }_{2}}}}\Big( \sum\limits_{j=1}^{n}{{{a}_{ij}} \left( {{{\tilde{v}}}_{i}}-{{{\tilde{v}}}_{j}} \right)+ \sum\limits_{j=n+1}^{n+m}{{{a}_{ij}}\left( {{{\tilde{v}}}_{i}}-{{v}_{j}} \right)}} \Big) \end{cases} \end{align} $
(24) 由定理1可知, 系统可实现全局有限时间包容控制, 即在有限时间内, $\to$ $-L_{f}^{-1}{{L}_{d}}{{\pmb v}_{L}}$.
注2.文献[26]研究了带有不匹配干扰的高阶多智能体系统分布式主动抗干扰控制方法, 同时采用了滑模控制理论和DOBC方法, 然而文献[26]设计的是常规的线性滑模面, 会出现抖振现象, 而本文设计的非线性积分滑模面不仅能有效消除抖振, 而且能增强系统的鲁棒性能.文献[27-28]在研究带有不匹配干扰的多智能体系统时对系统模型进行了处理, 假设不匹配干扰二阶可微, 则可将不匹配干扰转变成匹配干扰, 然后利用常规的处理方式消除干扰.但在实际应用中存在很多情况不能如此处理, 因此这种方法有一定的局限性.本文则直接对干扰进行观测, 并在控制器中添加干扰补偿项, 可有效抵消干扰的影响, 而不影响系统的性能.
4. 数值仿真
考虑4个跟随者和3个领导者组成的网络, 如图 1所示.
图 1中节点1~ 4是无向连通的跟随者, 节点5~7是单向发送信息的领导者.假设拓扑图所有边的权重都是1, 则系统的Laplacian矩阵为
$ \begin{align*}L=\begin{bmatrix} 3 & -1 & 0 & -1 & 0 & 0 & -1 \\ -1 & 2 & -1 & 0 & 0 & 0 & 0 \\ 0 & -1 & 2 & 0 & -1 & 0 & 0 \\ -1 & 0 & 0 & 2 & 0 & -1 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ \end{bmatrix}\end{align*} $
其中,
$ $${{L}_{f}}=\!\begin{bmatrix} 3 & -1 & 0 & -1 \\ -1 & 2 & -1 & 0 \\ 0 & -1 & 2 & 0 \\ -1 & 0 & 0 & 2 \\ \end{bmatrix}, ~~ {{L}_{d}}=\!\begin{bmatrix} 0 & 0 & -1 \\ 0 & 0 & 0 \\ -1 & 0 & 0 \\ 0 & -1 & 0 \\ \end{bmatrix}$$ $
假设4个智能体都受到干扰影响:智能体1: ${{d}_{1, 1}}$ $=2\tanh (2t)$, ${{d}_{1, 2}}=2$; 智能体2: ${{d}_{2, 1}}=4\tanh (t)$, ${{d}_{2, 2}}=1$; 智能体3: ${{d}_{3, 1}}={\rm sigmoid}(t)$, ${{d}_{3, 2}}$ ; 智能体4: ${{d}_{4, 1}}=3{\rm sigmoid}(t)$, ${{d}_{4, 2}}$ $=-\tanh (t)$, $t>0$.其中${{d}_{i1}}$, ${{d}_{i2}}$ ($i=1, 2, 3, 4$)分别表示不匹配干扰和匹配干扰.
控制器的参数设置为${{k}_{0}}=10$, ${{k}_{1}}=20$, ${{k}_{2}}=$ $30$, ${{\alpha }_{1}}=0.8$.干扰观测器的参数设置为${{\lambda }_{i, 1}}=10$, ${{\lambda}_{i, 2}}$ $=20$, ${{\lambda}_{i, 3}}=15$, ${{\lambda}_{i, 4}}=32$, $i=1, 2, 3, 4$; 假设4个跟随者的初始位置分别为${{x}_{1}}=(2, 0)$, ${{x}_{2}}=$ $(4, 0)$, ${{x}_{3}}=(0, 2)$, ${{x}_{4}}=(0, 4)$, 领导者的初始坐标分别为${{x}_{5}}=(6, 8)$, ${{x}_{6}}=(8, 8)$, ${{x}_{7}}= (8, 6)$.领导者为动态领导者, 其初始速度为${{v}_{5}}=(1, 1)$, ${{v}_{6}}=(1.2, 1.2)$, ${{v}_{7}}$ $=(1, 1)$.仿真结果如图 2~4所示.
图 2是干扰观测器(13)对受扰系统(9)中各智能体的不匹配干扰和匹配干扰的观测量和估计误差, 从图 2(a) 和图 2(c)可以看出观测器可以快速估计出智能体所受的干扰, 在图 2(b)和图 2(d)中各智能体所受干扰的观测误差很快的趋于0, 说明观测器可准确地估算出系统中的干扰, 表现出较好的观测性能.图 3是智能体的位置和速度状态观测误差.从图 3可知, 在不到1 s的时间误差曲线趋于0, 直观地说明观测器可快速准确地估算出跟随者的状态信息, 从而确保控制器的有效作用.
图 4是多智能体系统的位置状态轨迹图, 其中星号表示跟随者, 圆圈表示动态领导者, 可以看出3个动态领导者以一定的速度沿着某一方向移动, 而4个跟随者通过相互作用最终收敛到有领导者组成的几何体中.特别地, 当时, 跟随者还没有完全进入凸包内, 而当$t=10 \, \rm s$时, 各跟随者均进入凸包内, 且跟随着领导者同步运动.因此, 在控制律(16)下各智能体能够快速地跟踪到领导者, 并进入由领导者组成的几何体中, 实现了包容控制.
文献[26]研究的是带有不匹配干扰的多智能体系统滑模控制.为了进一步说明本文方法的优越性, 本文将文献[26]所提方法拓展到多领导者情况.利用上述数值参数, 得到图 5所示的仿真图.由图 5可知, 当$t=10\, \rm s$时跟随者没有完全进入凸包内, 当$t$ $=$ $20\, \rm s$时, 系统才实现包容控制.与文献[26]的实验结果比较, 说明本文方法可以更加快速地达到一致, 取得较好的结果.
综上, 带干扰的多智能体系统(9)和(10)通过有限时间干扰观测器(13)快速地估算干扰, 在复合分布式控制协议(16)下快速消除干扰, 使得各跟随者的状态收敛到由动态领导者组成的动态凸包内, 即, 实现了包容控制.
5. 结论
本文研究带有不匹配干扰的二阶多智能体系统协同控制问题.设计了非线性有限时间干扰观测器, 使得智能体的干扰可被观测和补偿.利用滑模控制理论和基于控制的干扰观测器方法, 提出了复合分布式非线性积分滑模控制协议.通过使用Lyapunov稳定性理论、代数图论、齐次性理论等方法, 研究了带有不匹配干扰的多智能体系统有限时间包容控制.最后数值仿真表明了所提控制算法的有效性.
由于复杂多变的工作环境, 多智能体系统通常会受到各种干扰的影响.在实际工程应用中, 不匹配干扰是十分常见的干扰, 因此本文所提方法具有一定的发展前景, 而且更具有普适性.未来的研究方向将针对更为复杂的环境, 设计新型的干扰观测器, 研究多智能体系统的协同控制问题.
-
表 1
$\bar{D_{t}}$ 值最高的20个单词Table 1 The top-20 words with
$\bar{D_{t}}$ value单词 $\overline{D}_{t}$ 单词 $\overline{D}_{t}$ 单词 $\overline{D}_{t}$ hood 0.0592 ducks 0.0565 doughnut 0.0546 cats 0.0589 pug 0.0564 baby 0.0546 teddy 0.0576 rug 0.0561 bird 0.0545 little 0.0573 hummingbird 0.0556 pen 0.0543 duck 0.0571 pasta 0.0549 motorcycle 0.0543 bananas 0.0569 horse 0.0547 colorful 0.0542 seagull 0.0565 panda 0.0546 — — 表 2 Encoder-Decoder + SFEM在MS COCO数据集上的表现(%)
Table 2 The performance of Encoder-Decoder + SFEM on MS COCO dataset (%)
表 3 Up-Down + SFEM在MS COCO数据集上的表现(%)
Table 3 The performance of Up-Down + SFEM on MS COCO dataset (%)
表 4 本模型和空间注意力模型的时间性能对比(帧/s)
Table 4 Time performance comparison between our model and the spatial attention model (frame/s)
表 5 各个模块单次执行平均花费时间(s)
Table 5 The average time spent by each module in a single execution (s)
表 6 本文模型在MS COCO数据集上的表现(%)
Table 6 The performance of our model on MS COCO dataset (%)
表 7 组合模型在MS COCO数据集上的表现(%)
Table 7 Performance of the combined model on MS COCO dataset (%)
-
[1] Kulkarni G, Premraj V, Ordonez V, Dhar S, Li S M, Choi Y, et al. BabyTalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(12): 2891-2903 doi: 10.1109/TPAMI.2012.162 [2] Mao J H, Xu W, Yang Y, Wang J, Yuille A L. Deep captioning with multimodal recurrent neural networks (m-RNN). In: Proceedings of the 3rd International Conference on Learning Representations. San Diego, USA: ICLR, 2015. [3] 汤鹏杰, 王瀚漓, 许恺晟. LSTM逐层多目标优化及多层概率融合的图像描述. 自动化学报, 2018, 44(7): 1237-1249Tang Peng-Jie, Wang Han-Li, Xu Kai-Sheng. Multi-objective layer-wise optimization and multi-level probability fusion for image description generation using LSTM. Acta Automatica Sinica, 2018, 44(7): 1237-1249 [4] Cho K, Van Merriënboer B, Gulcehre C, Bahdanau D, Bougares F, Schwenk H, et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation [Online], available: https://arxiv.org/pdf/1406.1078v3.pdf, September 3, 2014 [5] Bahdanau D, Cho K, Bengio Y. Neural machine translation by jointly learning to align and translate. In: Proceedings of the 3rd International Conference on Learning Representations. San Diego, USA: ICLR, 2015. [6] Sutskever I, Vinyals O, Le Q V. Sequence to sequence learning with neural networks. In: Proceedings of the 27th International Conference on Neural Information Processing Systems. Montreal, Canada: NIPS, 2014. [7] Vinyals O, Toshev A, Bengio S, Erhan D. Show and tell: A neural image caption generator. In: Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Boston, USA: IEEE, 2015. 3156−3164 [8] 张雪松, 庄严, 闫飞, 王伟. 基于迁移学习的类别级物体识别与检测研究与进展. 自动化学报, 2019, 45(7): 1224-1243Zhang Xue-Song, Zhuang Yan, Yan Fei, Wang Wei. Status and development of transfer learning based category-level object recognition and detection. Acta Automatica Sinica, 2019, 45(7): 1224-1243 [9] You Q Z, Jin H L, Wang Z W, Fang C, Luo J B. Image captioning with semantic attention. In: Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas, USA: IEEE, 2016. 4651−4659 [10] Hochreiter S, Schmidhuber J. Long short-term memory. Neural Computation, 1997, 9(8): 1735-1780 doi: 10.1162/neco.1997.9.8.1735 [11] Jia X, Gavves E, Fernando B, Tuytelaars T. Guiding the long-short term memory model for image caption generation. In: Proceedings of the 2015 IEEE International Conference on Computer Vision (ICCV). Santiago, Chile: IEEE, 2015. 2407−2415 [12] Wu Q, Shen C H, Liu L Q, Dick A, Van Den Hengel A. What value do explicit high level concepts have in vision to language problems? In: Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas, USA: IEEE, 2016. 203−212 [13] Yang Z L, Yuan Y, Wu Y X, Cohen W W, Salakhutdinov R R. Review networks for caption generation. In: Proceedings of the 30th International Conference on Neural Information Processing Systems. Barcelona, Spain: NIPS, 2016. [14] 奚雪峰, 周国栋. 面向自然语言处理的深度学习研究. 自动化学报, 2016, 42(10): 1445-1465Xi Xue-Feng, Zhou Guo-Dong. A survey on deep learning for natural language processing. Acta Automatica Sinica, 2016, 42(10): 1445-1465 [15] 侯丽微, 胡珀, 曹雯琳. 主题关键词信息融合的中文生成式自动摘要研究. 自动化学报, 2019, 45(3): 530-539Hou Li-Wei, Hu Po, Cao Wen-Lin. Automatic Chinese abstractive summarization with topical keywords fusion. Acta Automatica Sinica, 2019, 45(3): 530-539 [16] Xu K, Ba J, Kiros R, Cho K, Courville A, Salakhudinov R, et al. Show, attend and tell: Neural image caption generation with visual attention. In: Proceedings of the 32nd International Conference on Machine Learning. Lille, France: JMLR.org, 2015. 2048−2057 [17] Lu J S, Xiong C M, Parikh D, Socher R. Knowing when to look: Adaptive attention via a visual sentinel for image captioning. In: Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, USA: IEEE, 2017. 3242−3250 [18] Chen L, Zhang H W, Xiao J, Nie L Q, Shao J, Liu W, et al. SCA-CNN: Spatial and channel-wise attention in convolutional networks for image captioning. In: Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, USA: IEEE, 2017. 6298−6306 [19] Chen X P, Ma L, Jiang W H, Yao J, Liu W. Regularizing RNNs for caption generation by reconstructing the past with the present. In: Proceedings of the 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, USA: IEEE, 2018. 7995−8003 [20] Anderson P, He X D, Buehler C, Teney D, Johnson M, Gould S, et al. Bottom-up and top-down attention for image captioning and visual question answering. In: Proceedings of the 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, USA: IEEE, 2018. 6077−6086 [21] Lu J S, Yang J W, Batra D, Parikh D. Neural baby talk. In: Proceedings of the 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, USA: IEEE, 2018. 7219−7228 [22] Lin T Y, Maire M, Belongie S, Hays J, Perona P, Ramanan D, et al. Microsoft COCO: Common objects in context. In: Proceedings of the 13th European Conference on Computer Vision. Zurich, Switzerland: Springer, 2014. 740−755 [23] Karpathy A, L F F. Deep visual-semantic alignments for generating image descriptions. In: Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Boston, USA: IEEE, 2015. 3128−3137 [24] Papineni K, Roukos S, Ward T, Zhu W J. BLEU: A method for automatic evaluation of machine translation. In: Proceedings of the 40th Annual Meeting on Association for Computational Linguistics. Philadelphia, USA: ACL, 2002. 311−318 [25] Banerjee S, Lavie A. METEOR: An automatic metric for MT evaluation with improved correlation with human judgments. In: Proceedings of the ACL Workshop on Intrinsic and Extrinsic Evaluation Measures for Machine Translation and/or Summarization. Ann Arbor, USA: ACL, 2005. 65−72 [26] Vedantam R, Zitnick C L, Parikh D. CIDEr: Consensus-based image description evaluation. In: Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Boston, USA: IEEE, 2015. 4566−4575 [27] Lin C Y. ROUGE: A package for automatic evaluation of summaries. In: Proceedings of the Workshop on Text Summarization Branches Out, Post-Conference Workshop of ACL 2004. Barcelona, Spain: Association for Computational Linguistics, 2004. [28] Anderson P, Fernando B, Johnson M, Gould S. SPICE: Semantic propositional image caption evaluation. In: Proceedings of the 14th European Conference on Computer Vision. Amsterdam, the Netherlands: Springer, 2016. [29] Ren S Q, He K M, Girshick R, Sun J. Faster R-CNN: Towards real-time object detection with region proposal networks. In: Proceedings of the 28th International Conference on Neural Information Processing Systems. Montreal, Canada: NIPS, 2015. 91−99 [30] Krishna R, Zhu Y K, Groth O, Johnson J, Hata K, Kravitz J, et al. Visual genome: Connecting language and vision using crowdsourced dense image annotations. International Journal of Computer Vision, 2017, 123(1): 32-73 doi: 10.1007/s11263-016-0981-7 [31] Rennie S J, Marcheret E, Mroueh Y, Ross J, Goel V. Self-critical sequence training for image captioning. In: Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, USA: IEEE, 2017. 1179−1195 期刊类型引用(31)
1. Zhiguang Feng,Sibo Yao. Dynamic Event-Triggered Active Disturbance Rejection Formation Control for Constrained Underactuated AUVs. IEEE/CAA Journal of Automatica Sinica. 2025(02): 460-462 . 必应学术
2. 吴锦娃,刘勇华,苏春翌,鲁仁全. 具有不确定控制增益严格反馈系统的自适应命令滤波控制. 自动化学报. 2024(05): 1015-1023 . 本站查看
3. 游星星,杨道文,郭斌,刘凯,佃松宜,朱雨琪. 基于观测器和指定性能的非线性系统事件触发跟踪控制. 自动化学报. 2024(09): 1747-1760 . 本站查看
4. 邱俊豪,程志键,林国怀,任鸿儒,鲁仁全. 具有执行器故障的非线性系统指定性能控制. 广东工业大学学报. 2023(02): 55-63 . 百度学术
5. 周淑燕,程玉虎,王雪松. 具有新型状态约束的非线性系统神经网络自适应控制. 系统科学与数学. 2023(08): 1952-1968 . 百度学术
6. 郭徽,王健安. 基于事件触发的多机器人固定时间编队控制. 太原科技大学学报. 2023(06): 515-521 . 百度学术
7. 罗傲,肖文彬,周琪,鲁仁全. 基于强化学习的一类具有输入约束非线性系统最优控制. 控制理论与应用. 2022(01): 154-164 . 百度学术
8. 范利蓉,王芳,周超,王坤. 状态时延和全状态约束下的多智能体系统自适应事件触发控制. 控制与决策. 2022(04): 892-902 . 百度学术
9. 张瑀航,姜玉莲,崔立朝,王海伟. 间歇通信的非线性多智能体系统协调跟踪控制. 计算机技术与发展. 2022(03): 180-185 . 百度学术
10. 蒲志强,易建强,刘振,丘腾海,孙金林,李非墨. 知识和数据协同驱动的群体智能决策方法研究综述. 自动化学报. 2022(03): 627-643 . 本站查看
11. YANG Bin,CAO Liang,XIAO Wenbin,YAO Deyin,LU Renquan. Event-Triggered Adaptive Neural Control for Multiagent Systems with Deferred State Constraints. Journal of Systems Science & Complexity. 2022(03): 973-992 . 必应学术
12. 王敏,黄龙旺,杨辰光. 基于事件触发的离散MIMO系统自适应评判容错控制. 自动化学报. 2022(05): 1234-1245 . 本站查看
13. 韩松,李晓孟,陈广登,孟伟. 重放攻击下不确定CPS的安全滤波. 控制工程. 2022(06): 1004-1010 . 百度学术
14. 吴宜,梅珂琪,丁世宏,葛群辉,王巍植. 基于扩张状态观测器的永磁同步电机转速环连续螺旋控制. 广东工业大学学报. 2022(05): 112-119 . 百度学术
15. 杨翊卓,代伟. 事件触发机制下的工业过程多速率模型预测控制方法. 广东工业大学学报. 2022(05): 68-74 . 百度学术
16. 李争,刘磊,刘艳军. 具有时变全状态约束的非线性随机切换系统的自适应神经网络控制. 广东工业大学学报. 2022(05): 127-136 . 百度学术
17. 周林娜,金南南,王海,杨春雨. 双永磁同步电机滑模协调控制及实验研究. 广东工业大学学报. 2022(05): 83-92 . 百度学术
18. 范利蓉,王芳,周超,王坤. 执行器故障和非对称误差约束下的时延多智能体系统自适应事件触发控制. 中国科学:信息科学. 2022(07): 1287-1301 . 百度学术
19. 王洪斌,高静,苏博,王跃灵. 基于事件触发的AUVs固定时间编队控制. 自动化学报. 2022(09): 2277-2287 . 本站查看
20. 杨盼,毕文豪,张安. 基于事件驱动的多智能体有限时间分群一致控制. 控制与决策. 2022(11): 2925-2933 . 百度学术
21. 贾新春,吕腾,王悦,白文杰. 基于多率采样的MASs在FDI攻击下的安全一致性. 山西大学学报(自然科学版). 2022(05): 1186-1194 . 百度学术
22. 李文杰,张正强. 非线性时滞系统基于降阶观测器的反步镇定控制. 控制理论与应用. 2022(08): 1433-1441 . 百度学术
23. 李枝强,刘洋,周琪,鲁仁全. 精确估计下的多智能体系统漏斗复合控制. 控制理论与应用. 2022(08): 1417-1425 . 百度学术
24. 杨祎桀,刘冬,曲袁超. 基于指定性能的非线性系统数据驱动滑模控制. 沈阳师范大学学报(自然科学版). 2022(06): 502-508 . 百度学术
25. 范睿超,孔宪仁,胡文坤,钟智雄. 基于扩张观测器的航天器无速度旋量信息姿轨一体化控制. 南京信息工程大学学报(自然科学版). 2021(01): 1-9 . 百度学术
26. Liang CAO,Hongru REN,Wei MENG,Hongyi LI,Renquan LU. Distributed event triggering control for six-rotor UAV systems with asymmetric time-varying output constraints. Science China(Information Sciences). 2021(07): 193-208 . 必应学术
27. 韩俊先,乔静兵,任宁,袁瑞,赵思. 基于事件触发的时滞网络系统稳定性研究. 信息与电脑(理论版). 2021(06): 192-195 . 百度学术
28. 时侠圣,杨涛,林志赟,王雪松. 基于连续时间的二阶多智能体分布式资源分配算法. 自动化学报. 2021(08): 2050-2060 . 本站查看
29. 赵光同,曹亮,周琪,李鸿一. 具有未建模动态的互联大系统事件触发自适应模糊控制. 自动化学报. 2021(08): 1932-1942 . 本站查看
30. 张毅,方国伟,杨秀霞,严瑄. 基于事件触发的多机编队目标跟踪控制. 北京航空航天大学学报. 2021(11): 2215-2225 . 百度学术
31. 徐光辉,余蒙,付波,赵熙临,陈洁. 事件触发机制下二阶多智能体系统量化追踪控制. 华侨大学学报(自然科学版). 2020(05): 667-673 . 百度学术
其他类型引用(50)
-