-
摘要: 在线人体动作识别是人体动作识别的最终目标,但由于如何分割动作序列是一个待解决的难点问题,因此目前大多数人体动作识别方法仅关注在分割好的动作序列中进行动作识别,未关注在线人体动作识别问题.本文针对这一问题,提出了一种可以完成在线人体动作识别的时序深度置信网络(Temporal deep belief network, TDBN)模型.该模型充分利用动作序列前后帧提供的上下文信息,解决了目前深度置信网络模型仅能识别静态图像的问题,不仅大大提高了动作识别的准确率,而且由于该模型不需要人为对动作序列进行分割,可以从动作进行中的任意时刻开始识别,实现了真正意义上的在线动作识别,为实际应用打下了较好的理论基础.Abstract: Online human action recognition is the ultimate goal of human action recognition. However, how to segment the action sequence is a difficult problem to be solved. So far, most human action recognition algorithms are only concerned with the action recognition within a segmented action sequences. In order to solve this problem, a deep belief network (DBN) model is proposed which can handle sequential time series data. This model makes full use of the action sequences and frames to provide contextual information so that it can handle video data. Moreover, this model not only greatly improves the action recognition accuracy, but also realizes online action recognition. So it lays a good theoretical foundation for practical applications.
-
过去的十几年里,多运载体编队控制引起了众多研究者的兴趣.其研究的动机在于这种以群体方式工作的系统在完成诸如搜寻、救援以及测绘等任务时具有内在的优势及鲁棒性. 例如,为了适应海洋采样,可利用一组水下潜航器共同工作[1]. 从网络控制的观点来看,多运载体编队控制是一个网络化系统的协同控制,其结点为在给定通讯拓扑下互联的运载体.网络化系统的动力学不但取决于结点的动力学同时又与通讯拓扑有关.相关的探索首先源于对多个积分器的研究,该研究主要是提出一种理念以揭示借助于通讯互联的个体行为与群组作为整体行为的逻辑关系[2].对于包含多个积分器的模型,一些学者[3-10]关注个体之间的通讯拓扑以及群组的协调行为,并设计了各种基于一致性的算法以便协调诸如群集、 编队、领航者-跟随者的协同等群组的行为. 积分器网络的研究结果相当丰硕,相关的理论也较为成熟,其内容已超出本文的范围,有兴趣的读者可参阅文献[11-12]及该文献所附参考文献.尽管这些工作都试图将积分器在运载体动力学的意义下进行解释,但积分器充其量只能表示质点动力学.当运载体考虑成刚体时用质点模型来描述运载体则难以实现.因为质点模型无法描述运载体的姿态,而这种必须要考虑运载体姿态的编队控制在实际中有着广泛的应用.在航天领域,小卫星编队的对地观测及目标定位、深空探测,不仅对小卫星之间的相对位置,更对编队中小卫星之间的姿态协同有严格的要求; 两航天器的在轨交会对接,只有满足特定的对接姿态才能实现; 在航空领域,战斗机的空中加油,必须保证加油机和受油机的姿态协同来实现运动中的刚性队形,多个无人机以编队的形式进行战场侦察、战术欺骗也必须通过姿态的协同来实现行进中的固定队形;在航海领域,水面舰只的补给,要求补给舰与被补给舰在之间取得刚性编队,并在行进中通过姿态协同来保持队形,多个水下无人潜航器对水下目标的搜寻、定位也需要通过编队的形式来提高搜寻精度和工作效率,而其中潜航器姿态的机动和协同都是必不可少的.
文献[13-16]将结点动力学考虑成线性系统,研究了多线性系统的一致性及编队问题,并取得了一系列原创性成果.与积分器相比,线性系统有更为丰富的动力学行为,并可局部地表示运载体作为刚体动力学在某平衡点附近的线性化. 然而,对于大范围的运动协同问题,特别是群组的初始状态远离协调状态时,动力学的非线性特性将起作用,线性系统描述可能是失真的,不能捕捉到运载体的真实动力学特性.一些学者进一步考虑了受控欧拉-拉格朗日(Euler-Lagrange(EL))系统作为网络结点的动力学,并在研究一致性以及协同跟踪方面取得重要进展 [17-20]. 然而,将运载体考虑为刚体时,其位形空间是欧氏群SE(3) (Special Euclidian),它是一个非线性流形. 因而从理论上讲,EL系统充其量只是运载体动力学局部化后的欧氏空间上的表示.当姿态协调中大的姿态角机动不可避免时,很难说EL方程在多大程度上有效.
文献[21-22]的作者在李群框架下考虑了运载体的编队问题,通过Frenet-Serret 运动方程来刻画运载体的运动学,取单位移动速度并将角速度作为控制输入,导出了运载体集群的控制律.该文从协同控制的观点将运载体位形空间全局地考虑成欧氏群而非局部地同胚于欧氏空间的某个开集,是基于李群方法研究运载体协同方面较早的工作.为了保持运载体在空间运动时的队形,一些学者[23]研究了李群上的协调运动,由于李代数是一个线性空间,通过将协调问题转化为李代数上的一致性问题,进而提出了协调控制律. 与运载体动力学在欧氏空间上演化的研究工作相比,当编队控制考虑运载体姿态时,文献[21-23]的研究工作在刻画运载体动力学时更切合实际.但是在他们的研究工作中没有涉及如何达到任意指定的队形控制问题,而这一点对于某些实际应用是非常重要的. 最近,文献[19-24]在欧氏群框架下研究了多运载体达到任意指定队形的控制问题,针对以广义速度作为控制输入的运动学模型[24],以及以广义力/力矩作为控制输入的动力学模型[25-26]分别提出了基于镇定的渐近收敛的编队控制律.文献[27]基于运载体的运动学模型从最优控制的角度,在欧氏群的框架下考虑了多运载体有限时间最优编队控制问题,其中编队时间以及队形的几何结构可由编队任务任意指定,对此给出了以机体坐标系下的速度作为控制输入的最优编队控制律.文献[28]在欧氏群的框架下研究运动学模型下的有限时间最优编队跟踪问题,同样给出了控制律的解析表示.文献[29]还借助于反步法的思想将运动学模型下的最优编队控制律推广到动力学模型,然而该方法得到的动力学编队控制律不能克服起始和终止时刻速度的非连续变化带来的影响,需要对原运动学意义下的速度表示的控制律进行必要的修正.利用最优控制来研究有限时间编队控制,是将编队问题转化为有限时域上的最优控制问题. 其特点是,系统的初始状态是任意的,编队的时间是由编队任务任意指定的,而编队队形可通过构造最优控制问题的边值条件由任务指定,这为在指定的有限时间完成编队,队形解构、重构等机动控制任务的实现提供了可能.这种方法的困难在于控制律的求解,能否获得问题的解析解,依赖于问题本身.该方法在多个二阶积分器编队中的应用见文献[30-31],在多个线性系统编队方面的应用见文献[32].
本文基于庞特里亚金极小值原理,研究欧氏群上动力学模型表示的多运载体有限时间编队控制问题.它不同于渐近达到编队队形的无限时域的结果 [24-26],可以看成是文献[27]的深入和继续,但不同于文献[27]的是采用了动力学模型,这时广义速度成为系统的部分状态而控制输入可从物理上解释为广义力/力矩.这与文献[27]研究的将广义速度作为控制输入的运动学模型完全不同.从而使得控制输入更接近实际,且避免了运动学模型将速度作为控制输入时对速度非连续变化所带来物理实现上的困难.在本文提出的方法中,编队时间和队形的几何结构同样可由编队任务任意指定.假设运载体为全驱动的,运载体间的通讯为全联通的[7, 33],因为运载体之间相距足够近以至于在编队时需要考虑姿态时,这一假定通常是合理的. 对于该编队控制问题,本文给出了最优(或近似最优)控制律,在该控制律作用下可在指定的有限时间达到期望的编队.
为了获得动力学模型最优控制律显式的反馈形式,所要克服的最大的技术性挑战是速度的积分,而在初始速度不为零时这是不可能的,因为此时的广义速度显式地包含位形变量,而该变量正是需要通过积分所求的. 正是基于这个原因,本文将一般问题分解为两个特殊构造的问题的复合.一是所有运载体具有零初始速度的编队控制问题;另一个是所有的运载体的初始位形均为SE(3) 上单位元时的速度一致性控制问题.然后通过寻求一般问题的控制律与分解问题控制律的关系,进而建立动力学模型控制律的显式反馈形式.
本文所给出结果的优势在于: 1)从最优控制的角度,针对欧氏群上演化的运载体动力学模型显式地给出了有限时间最优(或近似最优)编队控制律的解析表示,从而使得最优(或近似最优)编队控制实时实现在线自主性成为可能;2)编队时间和队形的几何结构可由编队任务任意指定. 该结果是全新的.
本文安排如下: 第1节介绍本文所用的一些符号及概念;第2节重点关注问题的描述;第3节针对运载体具有任意初始位形及零初始速度情况下的控制律展开研究,并给出取得静态编队队形的开环以及闭环控制律;第4节提出了动力学模型的分解方法,基于该方法将编队控制律推广到任意初始位形及任意初始速度的情况,从而取得速度保持协调的运动编队队形; 第5节总结全文主要结果,并指出值得进一步研究的问题.
1. 预备知识
本节介绍文中所用到的一些符号和概念. 考虑一个$N(N = 2,3) $维物理空间运动的刚体.为了在给定的空间坐标系下刻画它的位形(质心位置和姿态),本文采用特殊欧氏群(Special Euclidian (SE) group)
$$\begin{array}{c}\mbox{SE}(N)\!=\!\left\{\left[\begin{array}{cc} R & {\pmb p} \\{\pmb 0}_{1× N}&1\\\end{array}\right]\! : R\in\mbox{SO}(N),{\pmb p}\in{\bf R}^N\right\},\\\hfill N=2,3\\\end{array}$$
来表示刚体的位形流形. 其中SO($N$)是一个$N× N$的特殊正交矩阵群(Special orthogonal (SO) matrix group),其元素$R\in$ SO($N$)为满足 $\det(R) = 1$的正交矩阵.$R$的每一列是固定于刚体上坐标系的基向量,因而$R$可用于表示刚体的姿态,而${\pmb p}\in{\bf R}^N$是刚体坐标系原点(质心)的位置向量.
设$T$SE($N$)表示SE($N$)的切丛,而$T_g$SE($N$)表示SE($N$)在$g\in\mbox{SE}(N)$点的切空间.对于$g$取单位元$I\in$ SE($N$)时的特殊情况,将切空间记为$\mathfrak{se}(N)$,它具有如下结构:
$$\mathfrak{se}(N)=\left\{\left[\begin{array}{cc}\hat{\omega}& {\pmb v}\\{\pmb 0}_{1× N}& 0\\\end{array}\right] : \hat{\omega}\in\mathfrak{so}(N),{\pmb v}\in{\bf R}^N\right\}$$
其中,$\mathfrak{so}(N)\subset{\bf R}^{N× N}$是一个反对称矩阵的集合,其元素表示刚体的旋转速度,而${\pmb v}\in{\bf R}^N$是一个实向量表示刚体的平移速度. $\mathfrak{so}(3) $同构于${\bf R}^3$,且${\bf R}^3$上定义的外积,如${\pmb\omega}_1× {\pmb\omega}_2$,可以表示为$\hat{\omega}_1{\pmb\omega}_2$,${\pmb\omega}_1,{\pmb\omega}_2\in{\bf R}^3$,其中$\hat{\omega}_1\in\mathfrak{so}(3) $是${\pmb\omega}_1\in{\bf R}^3$的同构像. 作为线性空间的$\mathfrak{se}(3) $同构于${\bf R}^6$.对此定义同构映射$\wedge : {\bf R}^6 \rightarrow \mathfrak{se}(3) $,使得:
$$\wedge :{\pmb\eta}=\left[\begin{array}{c}{\pmb\omega}\\{\pmb v}\end{array}\right]\rightarrow\left[\begin{array}{cc}\hat{\omega} & {\pmb v}\\{\pmb 0}_{1× 3}&0\end{array}\right]=\hat{\eta},,{\pmb\omega},{\pmb v}\in{\bf R}^3$$
并记为$\wedge({\pmb\eta})=\hat{\eta}$. 映射$\wedge$的逆记为$\vee :\mathfrak{se}(3) \rightarrow {\bf R}^6$. 对于$\mathfrak{se}(2) $,它同构于${\bf R}^3$,可类似地定义同构映射及逆映射,这里不再重复细节. 用于$\mathfrak{so}(3) $,$\mathfrak{se}(3) $以及$\mathfrak{se}(2) $中向量的记号"$,\hat{,},$"可从上下文中加以区别.
在$\mathfrak{se}(3) $上一旦定义了如下李括号,$ [\hat{x},\hat{y}]:=\hat{x}\hat{y}-\hat{y}\hat{x},,\hat{x},\hat{y}\in\mathfrak{se}(N),$ 则$\mathfrak{se}(N)$是一个对应SE($N$)的李代数. 对于给定的$\hat{x}\in\mathfrak{se}(N)$,定义了一个线性变换$\mbox{ad}_{\hat{x}} :\mathfrak{se}(N)\rightarrow \mathfrak{se}(N)$,使得$\mbox{ad}_{\hat{x}}(\hat{y}) = [\hat{x},\hat{y}],\hat{y}\in\mathfrak{se}(N)$. 以下只对$N = 3$的情况进行讨论,其结果对$N = 2$时也将成立.
分别记$T$SE(3) ,$T_g$SE(3) 及$\mathfrak{se}(3) $的对偶空间为$T^*$SE(3) ,$T_g^*$SE(3) ,及$\mathfrak{se}^*(3) $.
每一个$\hat{x}\in\mathfrak{se}(3) $,定义了一个左(右)不变向量场$\hat{x}_L :\mbox{SE}(3) \rightarrow T\mbox{SE}(3) $ ($\hat{x}_R :\mbox{SE}(3) \rightarrow T\mbox{SE}(3) ),$ 使得对$q\in$ SE(3) ,$\hat{x}_L(q)=q\hat{x} \in T_q\mbox{SE}(3) $ $( \hat{x}_R(q)=\hat{x}q \in T_q\mbox{SE}(3) $).由左(右)不变向量场的定义,对任意给定的$q\in$ SE(3) ,定义了左(右)作用映射记为 : $T_IL_q : \mathfrak{se}(3) \rightarrow T_q\mbox{SE}(3) $ $( T_IR_q : \mathfrak{se}(3) \rightarrow T_q\mbox{SE}(3) ),$ 使得$T_IL_q(\hat{x})= q\hat{x}$ $(T_IR_q(\hat{x})= \hat{x}q ).$ 因而,给定一个切向量$\hat{x}_q\in T_q$SE(3) ,可确定$\mathfrak{se}(3) $中两个不同的元素$\hat{x}^b :=q^{-1}\hat{x}_q$和$\hat{x}^s := \hat{x}_q q^{-1}$,使得$\hat{x}^b_L(q)=\hat{x}^s_R(q)= \hat{x}_q$.本文将对$\mathfrak{se}(3) $中定义左向量场及右向量场的元素加以区分,并分别记为$\hat{x}^b$和$\hat{x}^s$.因而对于$\hat{x}^b_L(q)=\hat{x}^s_R(q)$,将其简记为$\hat{x}_q =q\hat{x}^b=\hat{x}^sq$. 对线性空间$T_q$SE(3) 和$\mathfrak{se}(3) $,在其上定义内积
\begin{align}\label{eq on inner product}G_q(\hat{x}_q,\hat{y}_q):= G_I(\hat{x}^s,\hat{y}^s):= {\pmb x}^{\rm T}{\pmb y}\end{align}
(1) 其中,${\pmb x}= \vee(\hat{x}^s)$及${\pmb y}= \vee(\hat{y}^s)$,则$T_q$SE(3) 和$\mathfrak{se}(3) $为内积空间,进而SE(3) 为一个黎曼流形,其黎曼度量是由该内积诱导的.
定义 1[34]. 设$V$是一个线性空间,$V^*$是其对偶空间,$B: V× V \rightarrow {\bf R}$是一个双线性映射. 称线性映射$B^\flat : V \rightarrow V^*$为映射$B$的一个flat映射,系指满足:
$$(B^\flat({\pmb u}))({\pmb v})=B({\pmb v},{\pmb u}),\qquad\forall{\pmb v}\in V$$
并将flat映射的像$B^\flat({\pmb u})$记为${\pmb u}^*\in V^*$.若flat映射$B^\flat$是可逆的,则其逆记为$B^\sharp : V^*\rightarrow V$,并称其为$B$的sharp映射,使得:
$$B({\pmb v},B^\sharp ({\pmb u}^*))={\pmb u}^*({\pmb v}),\qquad\forall {\pmb v}\in V$$
根据该定义以及上述符号,记$\hat{x}^*_q =G_q^\flat(\hat{x}_q)$以及$\hat{x}^*= G_I^\flat(\hat{x})$,且易证明:
\begin{align}\label{eq on dual vector}\hat{x}^*_q =(q^{-1})^*(\hat{x}^b)^* = (\hat{x}^s)^*(q^{-1})^* ,~~~\hat{x}^*=\vee^*({\pmb x})\end{align}
(2) \begin{align}\label{eq on lineaer functional}\hat{x}^*_q (\hat{y}_q)=(\hat{x}^s)^*(\hat{y}^s)={\pmb x}^{\rm T}{\pmb y}\end{align}
(3) 利用矩阵内积的定义,有:
${{\hat{x}}^{*}}(\hat{y})={{\left\langle {{\left[ {{{\hat{x}}}^{*}} \right]}^{\text{T}}},\hat{y} \right\rangle }_{{{\mathbf{R}}^{4\times 4}}}}=\text{tr}({{\hat{x}}^{*}}\hat{y})$
(4) $\hat{x}_{q}^{*}(\widehat{{{y}_{q}}})={{\left\langle {{\left[ \hat{x}_{q}^{*} \right]}^{\text{T}}},{{{\hat{y}}}_{q}} \right\rangle }_{{{\mathbf{R}}^{4\times 4}}}}=\text{tr}(\hat{x}_{q}^{*}{{{\hat{y}}}_{q}})$
(5) 其中,$\hat{x}^*=\mbox{diag}\left\{\frac{1}{2}I_3,1\right\}\hat{x}^{\rm T} $,$\hat{x}_q^*=\mbox{diag}\left\{\frac{1}{2}I_3,1\right\}\cdot(\hat{x}^b)^{\rm T}q^{-1} $ $ =q^{-1}\mbox{diag}\left\{\frac{1}{2}I_3,1\right\}(\hat{x}^s)^{\rm T} $.
设$\{ {\pmb e}_i \}$,$\{\hat{e}_i\}$,$\{\hat{e}_{i,q}\}$分别表示${\bf R}^6$,$\mathfrak{se}(3) $,$T_q$SE(3) 的正交基,满足 $\hat{e}_{i,q}=(\hat{e}^s_{i})q=(\wedge({\pmb e}_i))q,i=1,\cdots,6,$ 其中${\pmb e}_i\in {\bf R}^6$是一个第$i$分量为1其他分量为0的列向量. $({\bf R}^6) ^*$,$\mathfrak{se}^*(3) $和$T_q^*$SE(3) 的对偶基为,$ {\pmb e}_i^{\rm T}=G^{\flat}_{{\bf R}^6}({\pmb e}_i),,\hat{e}_i^*=G^{\flat}_I(\hat{e}_i),,\hat{e}_{i,q}^*=G^{\flat}_q(\hat{e}_{i,q}). $
对于给定的$q\in$ SE(3) ,定义伴随映射$\mbox{Ad}_q :$$\mathfrak{se}(3) \rightarrow \mathfrak{se}(3) $为 $\mbox{Ad}_q(\hat{x}):= q\hat{x}q^{-1}$,$\hat{x}\in \mathfrak{se}(3) $.因而对于$\hat{x}^s \in \mathfrak{se}(3) $,将$\mbox{Ad}_{q^{-1}}(\hat{x}^s)$记为$\hat{x}^b$.尽管$\hat{x}^s$和$\hat{x}^b$都是$\mathfrak{se}(3) $的元素,本文仍将像空间$\mbox{Ad}_{q^{-1}}(\mathfrak{se}(3) )$与原像空间$\mathfrak{se}(3) $加以区分.用类似的方法可定义$\mbox{Ad}_{q^{-1}}\left(\mathfrak{se}(3) \right)$上的内积,$G_{\mbox{\small{Ad}}_{q^{-1}}}(\hat{x}^b,\hat{y}^b):=G_I(\hat{x}^s,\hat{y}^s)= {\pmb x}^{\rm T}{\pmb y},\hat{x}^b,\hat{y}^b\in\mbox{Ad}_{q^{-1}}\left(\mathfrak{se}(3) \right)$,并记$\hat{x}^b$在映射$G_{\mbox{\small{Ad}}_{q^{-1}}}^\flat$下的像为$(\hat{x}^b)^*= G_{\mbox{\small{Ad}}_{q^{-1}}}^\flat(\hat{x}^b)$,使得$(\hat{x}^b)^*(\hat{y}^b) =G_{\mbox{\small{Ad}}_{q^{-1}}}\left(\hat{x}^b,\hat{y}^b\right),\forall\hat{y}^b\in\mbox{Ad}_{q^{-1}}\left(\mathfrak{se}(3) \right)$.由于$(\hat{x}^b)^*(\hat{y}^b)=(\hat{x}^s)^*(\hat{y}^s)=(\hat{x}^s)^*(\mbox{Ad}_{q}\left((\hat{y}^b)\right)=\mbox{Ad}_{q}^*(\hat{x}^s)^*(\hat{y}^b)$对所有的$\hat{y}^b\in\mbox{Ad}_{q^{-1}}(\mathfrak{se}(3) )$成立,从而有:
\begin{align}\label{eq on dual of adjoint}G_{\mbox{\small{Ad}}_{q^{-1}}}^\flat(\mbox{Ad}_{q^{-1}}\hat{x}^s)=(\hat{x}^b)^*=\mbox{Ad}_{q}^*(\hat{x}^s)^*\end{align}
(6) 且易证
\begin{align}\label{eq on adjoint map of dual twist}\mbox{Ad}_{q}^*(\hat{x}^s)^*=q^{-1}(\hat{x}^s)^*q\end{align}
(7) 2. 问题描述
考虑由下列运动学及动力学方程描述的$n$个运载体
\begin{align}\label{eq on dynamics in body cor.}\Sigma: ,\left\{\begin{array}{ll}\dot{g_i}=g_i\hat{\xi}^b_i,& g_i(t_0) =g^0_i\\\dot{\hat{\xi}}^b_i = \hat{u}^b_i,&\hat{\xi}^b_i(t_0) =\hat{\xi}^{b,0}_i \\\end{array}\right.,,i=1,\cdots,n\end{align}
(8) 其中,$g_i\in$ SE(3) 为第$i$个运载体的位形,$\hat{\xi}^b_i\in\mathfrak{se}(3) $是在固定于第$i$个运载体上的刚体坐标系下的第$i$个刚体的速度,$\hat{u}^b_i\in \mathfrak{se}(3) $是第$i$个运载体的控制输入.运动学方程$\dot{g_i}=g_i\hat{\xi}^b_i$也可以写成$\dot{g_i}=\hat{\xi}^s_i g_i$,其中$\hat{\xi}^s_i=\mbox{Ad}_g\hat{\xi}^b_i$是第$i$个刚体在空间坐标系下的速度. 若定义$\hat{u}^s_i= \mbox{Ad}_g \hat{u}^b_i$,则易验证$\dot{\hat{\xi}}^s_i =\hat{u}^s_i $.
需要说明的是,刚体动力学可由Euler-Poincar\'{e}方程,$ {\dot{\hat{\xi}}^{b}}={{I}^{\mathsf{\sharp }}} (\operatorname{ad}_{{{{\hat{\xi }}}^{b}}}^{*}{{I}^{\mathsf{\flat }}}{{\hat{\xi }}^{b}}+F) $来描述,其中${{I}^{\mathsf{\sharp}}}$和${{I}^{\mathsf{\flat}}}$分别是惯性张量${I}$的sharp映射和flat映射,$\mbox{ad}^*_{{\hat{\xi}}^b}$是$\mbox{ad}_{{\hat{\xi}}^b}$的对偶映射,$F\in \mathfrak{se}^{*}(3) $为控制力/力矩. 由于假定系统是全驱动的,可令${{\hat{u}}^{b}}={{I}^{\mathsf{\sharp}}}(\operatorname{ad}_{{{{\hat{\xi}}}^{b}}}^{*}{{I}^{\mathsf{\flat }}}{{\hat{\xi}}^{b}}+F)$. 而由${\hat{u}}^b$很易求出刚体实际的控制力/力矩,$F={I}^{\mathsf{\flat }}{{\hat{u}}^{b}}-\operatorname{ad}_{{{{\hat{\xi}}}^{b}}}^{*}{{I}^{\mathsf{\flat }}}{{\hat{\xi }}^{b}}$.从而刚体动力学采用了式(8) 中的$\mathfrak{se}(3) $上的积分器形式.
本文所要研究的问题为,对由编队任务指定的相对位形$\bar{g}_{ij}:=\bar{g}_i^{-1}\bar{g}_j,i,j =1,\cdots,n$,期望达到编队的时间$t_f > t_0$,以及确定的初始状态$(g_i^0,\hat{\xi}^{b,0}_i),i=1,\cdots,n$,设计控制输入$\hat{u}^b_i : [t_0,t_f] \rightarrow \mathfrak{se}(3) ,i=1,\cdots,n$,使得:
\begin{align}\label{eq on boudary condition}\begin{array}{c}g_i^{-1}(t_f)g_j(t_f)=\bar{g}_{ij},,\hat{\xi}^b_j(t_f)-\mbox{Ad}_{\bar{g}_{ji}}\hat{\xi}^b_i(t_f)=0,\\\hfill i,j=1,\cdots,n\end{array}\end{align}
(9) 且下列目标函数最小,
\begin{align}\label{eq on cost function} J(\hat{u}^s_1,\cdots,\hat{u}^s_n)=\int_{t_0}^{t_f}\frac{1}{2}\sum_{k=1}^n G_I(\hat{u}^s_k,\hat{u}^s_k){\rm d}t\end{align}
(10) 注 1.在目标函数中采用$\hat{u}^s_k$而没有用$\hat{u}^b_k$是因为希望在同一空间坐标系下来度量来自不同运载体控制作用对目标函数的贡献.
称上述问题为有限时间最优编队控制. 当$\hat{\xi}^b_i(t_f) =0,i=1,\cdots,n$时,对应的问题称为静态编队;否则,速度$\hat{\xi}^b_i$与$\hat{\xi}^b_j$必须满足协调关系使得相对速度$\hat{\xi}^b_j(t_f)-\mbox{Ad}_{\bar{g}_{ji}}\hat{\xi}^b_i(t_f)=0$,称对应的问题为协调编队. 若$\bar{g}_{ij}= I,i,j=1,\cdots,n$,则伴随映射$\mbox{Ad}_{\bar{g}_{ji}}$将退化为恒等映射,这意味着$\hat{\xi}^b_j(t_f)=\hat{\xi}^b_i(t_f),i,j=1,\cdots,n$,从而对应的问题称为有限时间最优一致性控制问题.对于编队问题和一致性问题之间的关系,有如下引理.
引理 1. 设$\tilde{g}_i= g_i\bar{g}_{i1}$,$\tilde{\xi}^b_i=\mbox{Ad}_{\bar{g}_{1i}}\hat{\xi}^b_i$以及$\tilde{u}^b_i=\mbox{Ad}_{\bar{g}_{1i}}\hat{u}^b_i$,$ i=1,\cdots,n$,则系统(8) 在控制$\hat{u}^b_i,i=1,\cdots,n$下取得编队,当且仅当下列系统:
\begin{align}\label{eq on trans. dynamics in body cor.}\left\{\begin{array}{ll}\dot{\tilde{g}}_i=\tilde{g}_i\tilde{\xi}^b_i,& \tilde{g}_i(t_0) =\tilde{g}^0_i\\\dot{\tilde{\xi}}^b_i = \tilde{u}^b_i,&\tilde{\xi}^b_i(t_0) =\tilde{\xi}^{b,0}_i \\\end{array}\right.,,i=1,\cdots,n \end{align}
(11) 在控制$\tilde{u}^b_i,i=1,\cdots,n$下取得一致性.
证明. 注意到,$\dot{\tilde{g}}_i=\dot{g}_i\bar{g}_{i1}=g_i\hat{\xi}^b_i\bar{g}_{i1}=g_i\bar{g}_{i1}\bar{g}^{-1}_{i1}\hat{\xi}^b_i\bar{g}_{i1}=\tilde{g}_i\mbox{Ad}_{\bar{g}_{1i}}\hat{\xi}^b_i.$由此得到$\dot{\tilde{g}}_i=\tilde{g}_i\tilde{\xi}^b_i$以及$\dot{\tilde{\xi}}^b_i=\mbox{Ad}_{\bar{g}_{1i}}\hat{u}^b_i=\tilde{u}^b_i$.此外,通过利用$\bar{g}_{ij}= \bar{g}_{i1}\bar{g}_{1j}$,$g^{-1}_i(t_f)g_j(t_f)=\bar{g}_{ij}=\bar{g}_{i1}\bar{g}_{1j}$ 以及$\tilde{\xi}^b_j-\tilde{\xi}^b_i=\mbox{Ad}_{\bar{g}_{1j}}\hat{\xi}^b_j-\mbox{Ad}_{\bar{g}_{1i}}\hat{\xi}^b_i=\mbox{Ad}_{\bar{g}_{1j}}(\hat{\xi}^b_j-\mbox{Ad}_{\bar{g}_{ji}}\hat{\xi}^b_i)$ 很容易得到,一致性条件,$%\begin{array}{c}\tilde{g}^{-1}_i(t_f)\tilde{g}_j(t_f)=I,\tilde{\xi}^b_j(t_f)-\tilde{\xi}^b_i(t_f)=0,i,j=1,\cdots,n%\end{array}$. 等价于编队条件(9) .
借助于该引理,将编队控制问题转化为等价的一致性控制问题.出于技术上的原因,本文将首先考虑运载体初始速度为零时的编队控制问题,在无外界扰动的情况下,这将导致静态编队.所以也称运载体初始速度为零的编队问题为静态编队问题. 其次,考虑一般的运载体初始速度不为零的编队控制问题,这将导致协调编队,所以也称运载体初始速度非零时的编队问题为协调编队问题.
3. 静态编队的控制
上一节已经将有限时间编队控制问题转化为最优控制问题,本节将对最优控制进行求解.首先给出求取解析开环最优控制律的一个充分条件,依据该条件,本节将问题限制于静态编队(运载体初始速度为零)的情况,并给出解析表示的开环控制律. 其意义在于:1)在此基础上利用反馈进一步给出解析闭环最优控制律,从而实现运载体静态编队最优控制的在线自主性;2)为下一节更一般的协调编队(运载体初始速度非零)提供推广的基础.
3.1 最优轨迹的协状态
求取控制律$\hat{u}^b_i$的问题是一个最优控制问题.为了利用庞特里亚金极小值原理(Pontryagin$'$s minimum principle(PMP))[35],建立该问题的哈密顿函数如下:
\begin{align}H_{\Sigma}=&-\frac{1}{2}\sum_{i=1}^n G_I(\hat{u}^s_i,\hat{u}^s_i)+\sum_{i=1}^n\hat{p}^*_{g_i}(g_i\hat{\xi}^b_i)+\nonumber\\&\sum_{i=1}^n\hat{p}^*_{\xi^s_i}(\hat{u}^s_i)\end{align}
(12) 其中,$\hat{p}^*_{g_i}\in T^*_{g_i}\mbox{SE}(3) $及$\hat{p}^*_{\xi^s_i}\in\mathfrak{se}^*(3) $为协状态(拉格朗日乘子). 利用附录A的引理10和注9,并注意到$g_i\hat{\xi}^b_i =\hat{\xi}^s_ig_i$,则对应的哈密顿系统为
\begin{align}\label{eq on Hamiltonian sys}\begin{array}{ll}\dot{g_i}=\displaystyle\frac{\partial H_\Sigma}{\partial\hat{p}_{g_i}}=g_i\hat{\xi}^b_i,&\dot{\hat{\xi}}^s_i=\displaystyle\frac{\partial H_\Sigma}{\partial\hat{p}_{\xi^s_i}}=\hat{u}^s_i \\\\\dot{\hat{p}}^*_{g_i}=-\displaystyle\frac{\partial H_\Sigma}{\partial g^{\rm T}_i}=-\hat{\xi}^b_i\hat{p}^*_{g_i},&\dot{\hat{p}}^*_{\xi^s_i}=- \displaystyle\frac{\partial H_\Sigma}{\partial(\hat{\xi}^s_i)^*}=-g_i\hat{p}^*_{g_i} \\\end{array}\end{align}
(13) 设$\hat{p}_{\xi^s_i}=G_I^\sharp(\hat{p}^*_{\xi^s_i})$及$\hat{p}^s_i=G_I^\sharp(g_i\hat{p}^*_{g_i})$,则有如下引理.
引理 2. $\hat{p}^s_i,i=1,\cdots,n$为常向量.
证明. 记$\hat{\xi}^b_i=g_i^{-1}\dot{g}_i$并将其代入(13) 的方程$\dot{\hat{p}}^*_{g_i}=-\hat{\xi}^b_i\hat{p}^*_{g_i}$,可得:
$$\frac{{\rm d} (g_i\hat{p}^*_{g_i})}{{\rm d}t}=g_i\dot{\hat{p}}^*_{g_i}+\dot{g}_i\hat{p}^*_{g_i}=0$$
该式表明$g_i\hat{p}^*_{g_i}$不随时间变化,因而为常向量并记为$(\hat{p}^s_i)^*=g_i\hat{p}^*_{g_i}$.经过sharp映射变换后可得结论.
式(13) 的最后一个方程可写为$\dot{\hat{p}}^*_{\xi^s_i}=-(\hat{p}^s_i)^*$,引理2已证明它是一个常向量.因而协状态$\hat{p}_{\xi^s_i}(t),i= 1,\cdots,n $,可以写成
\begin{align}\label{eq on op costate p_xi^s}\hat{p}_{\xi^s_i}(t) =\hat{p}_{\xi^s_i}(t_0) -\hat{p}^s_i(t-t_0) ,\qquad i=1,\cdots,n\end{align}
(14) 其中,$\hat{p}_{\xi^s_i}(t_0) $为协状态$\hat{p}_{\xi^s_i}$的初值.
3.2 最优控制问题的解
本节将研究上述最优控制问题的解. 根据PMP,并注意到$\hat{u}^s_i=\mbox{Ad}_{g_i}\hat{u}^b_i$,取而代之,首先研究$\hat{u}^s_i$. 最优控制必须满足下列必要条件:
$$\frac{\partial H_\Sigma}{\partial\hat{u}^s_i}=-\hat{u}^s_i +\hat{p}_{\xi^s_i}=0,\qquad i=1,\cdots,n$$
由于这些方程有唯一解,所以上述条件也是充分的. 从而,根据式(14) 最优控制可以写成
\begin{align}\label{eq on op cont.}\hat{u}^{s,op}_i(t) =\hat{p}_{\xi^s_i}(t_0) - \hat{p}^s_i(t-t_0) \end{align}
(15) 该控制律中的常量$\hat{p}_{\xi^s_i}(t_0) $及$\hat{p}^s_i$需要通过边值条件(9) 来确定.
首先,在一致性意义下给出与由边值条件(9) 确定的横截条件以及与横截条件相关的一些结果.
引理3.若$\hat{\xi}^s_\alpha(t_f)=\hat{\xi}^s_\beta(t_f),\alpha,\beta =1,\cdots,n$,则终端协状态$\hat{p}_{\xi^s_k}(t_f)$满足 $\sum_{k=1}^n\hat{p}_{\xi^s_k}(t_f) =0. $
证明. 由边值条件(9) ,设 $%\begin{array}{c}h_{\alpha\beta}(\hat{\xi}^s_1(t_f),\cdots,$ $\hat{\xi}^s_n(t_f))$$=\hat{\xi}^s_\alpha(t_f)- \hat{\xi}^s_\beta(t_f),\alpha,\beta=1,\cdots,n%\end{array}$,并记$h_{\alpha\beta}$的($i ,j$)分量为$h_{\alpha\beta}^{ij}$.则由PMP,当固定$\beta$时对应$h_{\alpha\beta}=0$的横截条件可写为
$$\begin{array}{c}\begin{array}{rl}[\hat{p}^*_{\xi^s_k}(t_f)]^{pq}=&\displaystyle\sum_\alpha\sum_{i,j}\Gamma_{\alpha\beta}^{ij}\frac{\partial h_{\alpha\beta}^{ij}}{\partial[\hat{\xi}^s_k]^{pq}}(t_f)=\\ &\displaystyle\sum_\alpha\mbox{tr}\displaystyle\left(\Gamma^{\rm T}_{\alpha\beta}\frac{\partial(\hat{\xi}^s_\alpha-\hat{\xi}^s_\beta)}{\partial[\hat{\xi}^s_k]^{pq}}\right)(t_f),\end{array}\\\hfill k=1,\cdots,n,\quad p,q = 1,2,3,4\end{array}$$
其中,"tr"表示矩阵的迹,上标"$pq$"表示对应矩阵的($p ,q$)分量,而$\Gamma_{\alpha\beta}=[\Gamma^{ij}_{\alpha\beta}]$为待确定的参数矩阵.
对于$k\neq\beta$的情况,上述等式可写为
$$\begin{array}{rl}[\hat{p}^*_{\xi^s_k}(t_f)]^{pq}=&\displaystyle\mbox{tr}\displaystyle\left(\Gamma^{\rm T}_{k\beta}\frac{\partial(\hat{\xi}^s_k-\hat{\xi}^s_\beta)}{\partial[\hat{\xi}^s_k]^{pq}}\right)(t_f)=\\ &\mbox{tr}\displaystyle\left(\Gamma^{\rm T}_{k\beta}E_{pq}\right)=\Gamma^{pq}_{k\beta}\end{array}$$
由此给出$ \hat{p}^*_{\xi^s_k}(t_f)=\Gamma_{k\beta},,k\neq\beta$. 而对于$k=\beta$的情况,有:
$$\begin{array}{rl}[\hat{p}^*_{\xi^s_\beta}(t_f)]^{pq}=&\displaystyle\sum_{\alpha\neq\beta}\mbox{tr}\displaystyle\left(\Gamma^{\rm T}_{\alpha\beta}\frac{\partial(\hat{\xi}^s_\alpha-\hat{\xi}^s_\beta)}{\partial[\hat{\xi}^s_\beta]^{pq}}\right)(t_f)=\\ &-\displaystyle\sum_{\alpha\neq\beta}\mbox{tr}\displaystyle\left(\Gamma^{\rm T}_{\alpha\beta} E_{pq}\right)(t_f)=-\displaystyle\sum_{\alpha\neq\beta}\Gamma^{pq}_{\alpha\beta}\end{array}$$
这将导致$\hat{p}^*_{\xi^s_\beta}(t_f)=-\sum_{\alpha\neq\beta}\Gamma_{\alpha\beta}$. 将上述两种情况结合起来可得,$\sum_{k=1}^n\hat{p}^*_{\xi^s_k}(t_f) =0. $取其sharp变换的像便得所需结果.
引理 4. 若$g_i(t_f)=g_j(t_f),i,j =1,\cdots,n$,则终端协状态$\hat{p}_{g_k}(t_f)$满足$\sum_{k=1}^n\hat{p}_{g_k}(t_f) =0$.
证明. 考虑由$n$个SE(3) 的笛卡尔积构成的流形,即$\mbox{SE}(3) ^n:= \mbox{SE}(3) ×\cdots× \mbox{SE}(3) $,并记在 $(g_1,\cdots,g_n)$ $\in \mbox{SE}(3) ^n$点的切空间为$T_{(g_1,\cdots,g_n)}\mbox{SE}(3) ^n =$$T_{g_1}\mbox{SE}(3) ×\cdots× T_{g_n}\mbox{SE}(3) $.现定义子流形
$$\begin{array}{ll}\mbox{SE}(3) ^n_C=\!\!\!\!&\{(g_1,\cdots,g_n)\in \mbox{SE}(3) ^n :\\&,,g_i=g_j,,i,j=1,2,\cdots,n\}\\\end{array}$$
为一致性子流形. 从而引理的条件等价于
\begin{align}\label{eq on consensus in configuration}(g_1,\cdots,g_n)(t_f)\in \mbox{SE}(3) ^n_C\end{align}
(16) 如果将切向量$\hat{v}_{g_i}\in T_{g_i}\mbox{SE}(3) $写成基向量$\mathcal{E}_{g_i}=\{\hat{e}_{1,g_i},\cdots,\hat{e}_{6,g_i} \}$的线性组合 $ \hat{v}_{g_i}=\sum_{k=1}^6v_i^k\hat{e}_{k,g_i}=\{\hat{e}_{1,g_i},\cdots,\hat{e}_{6,g_i}\}{\pmb v}_i=\mathcal{E}_{g_i}{\pmb v}_i $,其中${\pmb v}_i=(v^1_i,\cdots,v^6_i)^{\rm T}\in {\bf R}^6$. 则切向量$\hat{\nu} \in T_{(g,\cdots,g)}\mbox{SE}(3) ^n_C$可写成如下形式
$$\hat{\nu}=\left[\begin{array}c\mathcal{E}_g\\\vdots\\\mathcal{E}_g\end{array}\right]{\pmb v},\qquad{\pmb v}\in {\bf R}^6$$
则$T_{(g,\cdots,g)}\mbox{SE}(3) ^n_C$的正交补$(T_{(g,\cdots,g)}\mbox{SE}(3) ^n_C)^\bot$中的任意向量$\hat{\alpha}$具有如下形式:
$$\hat{\alpha}=\left[\begin{array}{cccc}-\mathcal{E}_g&0&\cdots&0\\\mathcal{E}_g&-\mathcal{E}_g&\cdots&\vdots\\0&\mathcal{E}_g&\cdots&0\\\vdots&\vdots&\ddots&-\mathcal{E}_g\\0&\cdots&0&\mathcal{E}_g\\\end{array}\right]{\pmb a},,{\pmb a}\in{\bf R}^{6(n-1) }$$
设${{\mathbb{1}}_{n}}=\textbf{1}_{n}\bigotimes I_4$,其中$\textbf{1}_{n}$是每一个分量为1的$n$维列向量,"$\bigotimes$''表示矩阵的右克朗耐克积,从而对任意的$\hat{\alpha}\in(T_{(g,\cdots,g)}\mbox{SE}(3) ^n_C)^\bot$,易验证,$1_{n}^{\text{T}}\hat{\alpha }=0$.将协状态$\hat{p}_{g_i}=G_{g_i}^\sharp(\hat{p}^*_{g_i}),i=1,\cdots,n$,记为
$$\hat{p}_{(g_1,\cdots,g_n)}=\left[\begin{array}{c}\hat{p}_{g_1}\\ \vdots\\ \hat{p}_{g_n}\end{array}\right]\in T_{(g_1,\cdots,g_n)}\mbox{SE}(3) ^n$$
则根据PMP,终端时刻$t_f$的一致性条件(16) 对应的横截条件将写为 $\hat{p}_{(g_1,\cdots,g_n)}(t_f)\bot T_{(g_1,\cdots,g_n)(t_f)}\mbox{SE}(3) ^n_C $,这意味着,$1_{n}^{\text{T}}{{\hat{p}}_{({{g}_{1}},\cdots ,{{g}_{n}})}}({{t}_{f}})=\sum\limits_{k=1}^{n}{{{{\hat{p}}}_{{{g}_{k}}}}}({{t}_{f}})=0$.
推论 1.
1) $ \sum_{k=1}^n\hat{p}^s_k =0; $
2) $ \sum_{k=1}^n\hat{p}_{\xi^s_k}(t_0) =0.$
证明. 注意到$g_i(t_f)=g_j(t_f),i,j =1,\cdots,n$及$\hat{p}_{g_k}(t_f)=\hat{p}^s_kg_k(t_f)$,则1) 可由引理4得到.由式(14) ,通过取$t = t_f$,则 $\hat{p}_{\xi^s_k}(t_f)=\hat{p}_{\xi^s_k}(t_0) -\hat{p}^s_k(t_f-t_0) $,将其对指标$k$求和,并利用引理3及1) 即可得2) .
最优控制(15) 表明,确定最优控制归结为确定初始协状态$\hat{p}_{\xi^s_i}(t_0) $及参数$\hat{p}^s_i$.对于求取初始协状态,本文给出如下引理.
引理 5.
\begin{align}\label{eq on initial co-states}\hat{p}_{\xi^s_i}(t_0) =\frac{1}{t_f-t_0}(\hat{\xi}^{s,0}-\hat{\xi}^{s,0}_i)+\frac{1}{2}(t_f-t_0) \hat{p}^s_i\end{align}
(17) 其中,$\hat{\xi}^{s,0}=\frac{1}{n}\sum_i\hat{\xi}^{s,0}_i$是初始速度的算数均值.
证明. 通过将最优控制(15) 代入到动力学方程$\dot{\hat{\xi}}^s_k=\hat{u}^s_k$,并对其进行积分可得:
\begin{align}\label{eq on opt velocity with 2 para.}\hat{\xi}^s_k(t)=\hat{\xi}^{s,0}_k+\hat{p}_{\xi^s_k}(t_0) (t-t_0) -\frac{1}{2}\hat{p}^s_k(t-t_0) ^2\end{align}
(18) 对式(18) 关于指标$k$求和得:
$$\hat{\xi}^{s}(t)=\hat{\xi}^{s,0}+\frac{1}{n}\sum_{k=1}^n\hat{p}_{\xi^s_k}(t_0) (t-t_0) -\frac{1}{2n}\sum_{k=1}^n\hat{p}^s_k(t-t_0) ^2$$
其中,$\hat{\xi}^s(t)=\frac{1}{n}\sum_k\hat{\xi}^s_k(t)$.由推论1易得,$\hat{\xi}^{s}(t)=\hat{\xi}^{s,0},\forall t\geq t_0.$ 这意味着对于最优控制而言速度的算数均值不随时间变化.从而$\hat{\xi}^{s,f}:= \hat{\xi}^s(t_f)=\hat{\xi}^{s,0}$,且一致性条件意味着$\hat{\xi}^s_k(t_f)=\hat{\xi}^{s,f}$.通过在式(18) 中取$t=t_f$,并用$\hat{\xi}^{s,0}$来取代$\hat{\xi}^s_k(t_f)$,则可求得$\hat{p}_{\xi^s_i}(t_0) $.
推论 2.将$\hat{p}_{\hat{\xi}^s_i}(t_0) $的表达式代入$\hat{\xi}^s_i(t)$后,可得到在最优控制下的速度有如下形式:
\begin{align}\hat{\xi}^s_i(t)= &\hat{\xi}^{s,0}_i+\frac{t-t_0}{t_f-t_0}(\hat{\xi}^{s,0}-\hat{\xi}^{s,0}_i)+\nonumber\\&\frac{1}{2}(t_f-t)(t-t_0) \hat{p}^s_i\end{align}
(19) 引理 6. 假设$[\hat{p}^s_i,\hat{\xi}^{s,0}]=0$和$[\hat{p}^s_i,\hat{\xi}^{s,0}_i] =0,i=1,\cdots,n$,成立,则最优控制下的位形为
\begin{align}\label{eq on opt. config. written in spacial coordinate} g_i(t)=\exp (\hat{x}^s_i(t))g^0_i,\qquad t_0\leq t\leq t_f\end{align}
(20) 其中
\begin{align}\hat{x}^s_i(t)=&\displaystyle\int_{t_0}^t\hat{\xi}^s_i(\tau){\rm d}\tau=\nonumber\\ &(t-t_0) \hat{\xi}^{s,0}_i+\displaystyle\frac{1}{2n}\frac{(t-t_0) ^2}{(t_f-t_0) }\sum_{j=1}^n\hat{\xi}^{s,0}_{ij}+\nonumber\\& \displaystyle\frac{(3t_f-2t-t_0) (t-t_0) ^2}{12}\hat{p}^s_i\end{align}
(21) $\hat{\xi}^{s,0}_{ij}=\hat{\xi}^{s,0}_j-\hat{\xi}^{s,0}_i$是运载体$j$相对于运载体$i$在空间坐标系下的相对速度.
证明. 设$\hat{x}^s_i(t)=\log(g_i(t)g_i^{-1}(t_0) ),,i=1,\cdots,n$,则由附录A的引理13,有:
\begin{align}\label{eq on ode of ith exp}\dot{\hat{x}}^s_i=\hat{\xi}^s_i +\displaystyle\sum_{k=1}^{\infty}\frac{B_k}{k!}\mbox{ad}^k_{\hat{x}^s_i}(\hat{\xi}^s_i),\qquad\hat{x}^s_i(t_0) =0\end{align}
(22) 若证明$\hat{x}^s_i(t)=\int_{t_0}^t\hat{\xi}^s_i(\tau){\rm d}\tau$是该方程的解,则结果自然成立. 由式(19) ,这个$\hat{x}^s_i(t)$应该有如下形式$\hat{x}^s_i(t)=a(t)\hat{\xi}^{s,0}+ b(t)\hat{\xi}^{s,0}_i + c(t)\hat{p}^s_i$,其中$a$,$b$和$c$是时间的标量函数,因而由附录A的引理9,$%\begin{array}{rl}\mbox{ad}_{\hat{x}^s_i}(\hat{\xi}^s_i)=[\hat{x}^s_i,\hat{\xi}^s_i]=a(t)[\hat{\xi}^{s,0},\hat{\xi}^s_i]+b(t)[\hat{\xi}^{s,0}_i,\hat{\xi}^s_i]+c(t)[\hat{p}^s_i,\hat{\xi}^s_i] =0%\end{array}.$. 这意味着对于$k\geq 1$,$\mbox{ad}^k_{\hat{x}^s_i}(\hat{\xi}^s_i) = 0$,并且方程(22) 变为$\dot{\hat{x}}^s_i=\hat{\xi}^s_i$.积分该方程即可得结果.
设$(\hat{p}^b_i)^*= \hat{p}^*_{g_i}g_i$,则$(\hat{p}^b_i)^*=\mbox{Ad}^*_{g_i}(\hat{p}^s_i)^*$,或$\hat{p}^b_i=\mbox{Ad}_{g^{-1}_i}\hat{p}^s_i$,对此,有如下推论.
推论 3. 在引理6的假设下,若对某个$\hat{λ}^s\in\mathfrak{se}(3) $ 有$[\hat{x}^s_i(t),\hat{λ}^s] = 0$,则 $\mbox{Ad}_{g^{-1}_i}\hat{λ}^s=\mbox{Ad}_{(g^0_i)^{-1}}\hat{λ}^s,,i=1,\cdots,n$.
证明. 容易看出$[\hat{x}^s_i(t),\hat{λ}^s]=0$意味着$\hat{x}^s_i(t)$与$\hat{λ}^s$可交换,即$\hat{x}^s_i(t)\hat{λ}^s=\hat{λ}^s\hat{x}^s_i(t)$,这进一步意味着$\exp(\hat{x}^s_i(t))\hat{λ}^s=\hat{λ}^s\exp(\hat{x}^s_i(t))$.若引理6 的条件成立,则$g_i(t)=\exp (\hat{x}^s_i(t))g^0_i$,
$$\begin{array}{rl}\hat{λ}^b&\!\!\!\!:=\mbox{Ad}_{g^{-1}_i}\hat{λ}^s=g^{-1}_i(t)\hat{λ}^s g_i(t)=\\& (g^0_i)^{-1}\exp(-\hat{x}^s_i(t))\hat{λ}^s \exp(\hat{x}^s_i(t))g^0_i=\\& (g^0_i)^{-1}\hat{λ}^s g^0_i=\mbox{Ad}_{(g^0_i)^{-1}}\hat{λ}^s\\\end{array}$$
注 2. 在引理6的假设下,易验证$[\hat{x}^s_i(t),\hat{\xi}^{s,0}]=0$,$[\hat{x}^s_i(t),\hat{\xi}^{s,0}_i]=0$及$[\hat{x}^s_i(t),\hat{p}^s_i]=0$.据此并结合引理5的式(17) ,还成立$[\hat{x}^s_i(t),\hat{p}_{\hat{\xi}^s_i}]=0$,从而对任意的$t\in [t_0,t_f]$有
$\begin{array}{*{35}{l}} {{{\hat{\xi }}}^{b,0}}:=\text{A}{{\text{d}}_{{{(g_{i}^{0})}^{-1}}}}{{{\hat{\xi }}}^{s,0}}=\text{A}{{\text{d}}_{g_{i}^{-1}(t)}}{{{\hat{\xi }}}^{s,0}} \\ \hat{\xi }_{i}^{b,0}:=\text{A}{{\text{d}}_{{{(g_{i}^{0})}^{-1}}}}\hat{\xi }_{i}^{s,0}=\text{A}{{\text{d}}_{g_{i}^{-1}(t)}}\hat{\xi }_{i}^{s,0} \\ \hat{p}_{i}^{b}:=\text{A}{{\text{d}}_{g_{i}^{-1}(t)}}\hat{p}_{i}^{s}=\text{A}{{\text{d}}_{{{(g_{i}^{0})}^{-1}}}}\hat{p}_{i}^{s} \\ {{{\hat{p}}}_{\hat{\xi }_{i}^{b}}}({{t}_{0}}):=\text{A}{{\text{d}}_{{{(g_{i}^{0})}^{-1}}}}{{{\hat{p}}}_{\hat{\xi }_{i}^{s}}}({{t}_{0}})=\text{A}{{\text{d}}_{g_{i}^{-1}(t)}}{{{\hat{p}}}_{\hat{\xi }_{i}^{s}}}({{t}_{0}}) \\ \end{array}$
(23) 推论 4. 在引理6的假设下可得:
1) $ \sum_{k=1}^n\hat{p}^b_k =0; $
2) $ \sum_{k=1}^n\hat{p}_{\xi^b_k}(t_0) =0.$
证明. 在式(23) 的后两式中取$t = t_f$,并对它们从1到$n$对指标$i$求和,然后利用在$t_f$时刻的一致性条件$g_i(t_f)=g_j(t_f),i,j =1,\cdots,n$,以及推论1 的结果则可得本推论的结果.
进一步,通过定义
\begin{align}\label{eq on twists in body coordinate}\begin{array}{l}\hat{u}^{b,op}_i(t):=\mbox{Ad}_{g^{-1}_i(t)}\hat{u}^{s,op}_i(t) \\\hat{\xi}^b_i(t):=\mbox{Ad}_{g^{-1}_i(t)}\hat{\xi}^s_i(t) \\\hat{x}^b_i(t):=\mbox{Ad}_{g^{-1}_i(t)}\hat{x}^s_i(t) \\\end{array}\end{align}
(24) 并根据注2,可得如下推论.
推论 5. 在引理6的假定下,平行地可获得刚体坐标系下对应式(15) 的最优控制律,对应式(19) 的速度以及对应式(20) 的位形,
$\hat{u}_{i}^{b,op}(t)=~{{\hat{p}}_{\hat{\xi }_{i}^{b}}}({{t}_{0}})-\hat{p}_{i}^{b}(t-{{t}_{0}})$
(25) $\begin{align} & \hat{\xi }_{i}^{b}(t)=~\hat{\xi }_{i}^{b,0}+\frac{t-{{t}_{0}}}{{{t}_{f}}-{{t}_{0}}}({{{\hat{\xi }}}^{b,0}}-\hat{\xi }_{i}^{b,0})+ \\ & \frac{1}{2}({{t}_{f}}-t)(t-{{t}_{0}})\hat{p}_{i}^{b} \\ \end{align}$
(26) ${{g}_{i}}(t)=~g_{i}^{0}\exp (\hat{x}_{i}^{b}(t)),,{{t}_{0}}\le t\le {{t}_{f}}$
(27) 其中
\begin{align}\hat{x}^b_i(t)=&(t-t_0) \hat{\xi}^{b,0}_i+\displaystyle\frac{1}{2n}\frac{(t-t_0) ^2}{(t_f-t_0) }\sum_{j=1}^n\hat{\xi}^{b,0}_{ij}+\nonumber\\& \displaystyle\frac{(3t_f-2t-t_0) (t-t_0) ^2}{12}\hat{p}^b_i\end{align}
(28) 注 3. 借助于伴随映射$\mbox{Ad}_{g^{-1}_i}$,引理6的条件将等价于$[\hat{p}^b,\hat{\xi}^{b,0}]=0$和$[\hat{p}^b,\hat{\xi}^{b,0}_i]=0$. 这一条件限制了所能处理问题的范围.但是对于初始速度为零的情况,该条件自然满足.
本节余下的部分将作如下假设.
假设 1. 每一运载体的初始速度满足: $\hat{\xi}^{b,0}_i=0,,i=1,\cdots,n $.
现在确定最优控制式(25) (或式(15) )的问题进一步简化为确定参数$\hat{p}^b_i$ (或$\hat{p}^s_i$),而这并非显然. 首先对 $n = 2$的情况确定.
引理 7. 对于$n = 2$,且$\hat{\xi}^{b,0}_i=0,i=1,2$,则
\begin{align}\label{eq on p1 and p2}\hat{p}^b_1=\frac{6}{(t_f-t_0) ^3}\hat{x}^0_{12},\qquad\hat{p}^b_2=\frac{6}{(t_f-t_0) ^3}\hat{x}^0_{21}\end{align}
(29) 其中,$\hat{x}^0_{ij}=\log(g^0_{ij})=\log(g^{-1}_i(t_0) g_j(t_0) ),i,j =1,2$.
证明. 由式(24) ,结合附录A的引理12易知$\hat{x}^b_i(t)=g^{-1}_i(t_0) \hat{x}^s_ig_i(t_0) =\log(g^{-1}_i(t_0) g_i(t))$. 在一致性$g_1(t_f)=g_2(t_f)$的意义下,回顾式(27) 易得,$ \exp(\hat{x}^b_1(t_f))\cdot\exp(-\hat{x}^b_2(t_f)) = g^0_{12} $.借助于附录A的Baker-Campbell-Hausdorff(BCH)式(A2) 以及$\hat{x}^b_i$在$t_f$ 的值(在式(28) 中取$t=t_f$),有:
$$\begin{array}{rl}\hat{x}^0_{12} \!\!&=\hat{x}^b_1(t_f)-\hat{x}^b_2(t_f)-\displaystyle\frac{1}{2}[\hat{x}^b_1(t_f),\hat{x}^b_2(t_f)]+ \cdots=\\& \displaystyle\frac{(t_f-t_0) ^3}{12}\hat{p}^b_1-\displaystyle\frac{(t_f-t_0) ^3}{12}\hat{p}^b_2-\\& \displaystyle\frac{1}{2}[\displaystyle\frac{(t_f-t_0) ^3}{12}\hat{p}^b_1,\displaystyle\frac{(t_f-t_0) ^3}{12}\hat{p}^b_2]+\cdots\end{array}$$
由推论4知$\hat{p}^b_1+\hat{p}^b_2 =0 $,这意味着所有的李括号将消失,且 $\hat{x}^0_{12}=\frac{(t_f-t_0) ^3}{12}\hat{p}^b_1-\frac{(t_f-t_0) ^3}{12}\hat{p}^b_2=\frac{(t_f-t_0) ^3}{6}\hat{p}^b_1 $. 因而,$\hat{p}^b_1=\frac{6}{(t_f-t_0) ^3}\hat{x}^0_{12} $,注意到$\hat{p}^b_1=-\hat{p}^b_2$,$\hat{x}^0_{21}=-\hat{x}^0_{12}$,$\hat{p}^b_2=\frac{6}{(t_f-t_0) ^3}\hat{x}^0_{21} $.
现在,针对$n=2$的情况给出最优控制律.
定理 1. 对于$n=2$及$\hat{\xi}^{b,0}_i=0,i=1,2$,最优一致性控制律为
\begin{align}\label{eq on open control n=2}\hat{u}^{b,op}_i=\frac{3(t_f+t_0-2t)}{(t_f-t_0) ^3}\hat{x}^0_{ij},\qquad i\neq j,,i,j =1,2\end{align}
(30) 证明. 只要将由式(23) ,(17) 及式(29) 给出的$\hat{p}_{\xi^b_i}(t_0) $ 和 $\hat{p}^b_i$ 代入控制律(25) ,即得所证结果.
对于$n > 2$的情况,不能像$n =2$的情况那样得到精确的显式最优控制律,此时只能得到近似的显式最优控制律. 结果由如下定理给出.
定理 2. 对于$n > 2$,以及$\hat{\xi}^{b,0}_i=0,i=1,\cdots,n$,近似最优一致性控制律为
\begin{align}\label{eq on open cont. n>2}\hat{u}^{b,op}_i\thickapprox\frac{6(t_f+t_0-2t)}{n(t_f-t_0) ^3}\sum_{\stackrel{j=1}{j\neq i}}^n\hat{x}^0_{ij},\qquad i,j=1,\cdots,n\end{align}
(31) 其中,$\hat{x}^0_{ij}=\log(g^0_{ij})=\log(g^{-1}_i(t_0) g_j(t_0) )$.
证明. 设$\hat{x}^b_i(t)=\log(g^{-1}_i(t_0) g_i(t))$.由于$\hat{\xi}^{b,0}_i=0,i=1,\cdots,n$,由式(28) 可知 $\hat{x}^b_i(t_f)= {(t_f-t_0) ^3\hat{p}^b_i}/{12},,i=1,\cdots,n $.在一致性$g_i(t_f)=g_j(t_f)$的意义下易得,$\exp(\hat{x}^b_i(t_f))\cdot\exp(-\hat{x}^b_j(t_f))=g^0_{ij} $.借助于附录A的BCH式(A2) ,有:
$\begin{align} & \hat{x}_{ij}^{0}=\hat{x}_{i}^{b}({{t}_{f}})-\hat{x}_{j}^{b}({{t}_{f}})-\frac{1}{2}[\hat{x}_{i}^{b}({{t}_{f}}),\hat{x}_{j}^{b}({{t}_{f}})]- \\ & \frac{1}{12}[\hat{x}_{i}^{b}({{t}_{f}}),[\hat{x}_{i}^{b}({{t}_{f}}),\hat{x}_{j}^{b}({{t}_{f}})]]+ \\ & \frac{1}{12}[\hat{x}_{j}^{b}({{t}_{f}}),[\hat{x}_{j}^{b}({{t}_{f}}),\hat{x}_{i}^{b}({{t}_{f}})]]+\cdots \\ \end{align}$
将其对指标$j$求和并注意到$\sum_j \hat{x}^b_j(t_f)=0$,可得:
\begin{align*}\displaystyle\sum_{j=1}^n\hat{x}^0_{ij}&=n\hat{x}^b_i(t_f)+\\&\frac{1}{12}\sum\limits_{j=1}^n[\hat{x}^b_j(t_f),[\hat{x}^b_j(t_f),\hat{x}^b_i(t_f)]]+\cdots,\\ &\hfill i=1,\cdots,n\end{align*}
这是一组关于参数$\hat{p}^b_i,i=1,\cdots,n$的方程,该方程一般不可能显式地求解. 对于该问题,当运载体的位形趋近一致性时高阶李括号的影响将快速衰减,从而可以略去.因而,得到如下一组近似方程:
$$\displaystyle\sum_{j=1}^n \hat{x}^0_{ij}\thickapprox n\hat{x}^b_i(t_f)=\frac{n(t_f-t_0) ^3}{12}\hat{p}^b_i$$
由此近似解得,$ \hat{p}^b_i\thickapprox\frac{12}{n(t_f-t_0) ^3}\sum_{j=1}^n \hat{x}^0_{ij} $.回忆式(17) 及(23) ,有$\hat{p}_{\xi^b_i}(t_0) = {(t_f-t_0) \hat{p}^b_i}/2$,通过将$\hat{p}_{\xi^b_i}(t_0) $及$\hat{p}^b_i$代入式(25) ,则可得结果.
注 4. 通过将$\hat{p}^b_i,i=1,\cdots,n,$代入式(26) ,最终的位形$g_i,i=1,\cdots,n,$为
\begin{align}\label{eq on final conf.}g_i(t_f)=g^0_i\exp\left(\frac{1}{n}\sum_{k=1}^n\hat{x}^0_{ik}\right),\qquad i=1,\cdots,n\end{align}
(32) 对于$n=2$的情况,有$g_1(t_f)=g_2(t_f)$.
注 5. 控制律(31) 是由初始条件确定的开环控制律. 该控制律对于初始条件的摄动以及对控制输入的扰动敏感,这可能导致当存在初始摄动及外界扰动时,系统不能取得预期的一致性.此外,对于$n > 2$的情况,开环控制律是近似的,与所需取得一致性的轨迹的偏离程度取决于初始位形与期望一致性位形的偏离程度,这种偏离也可认为是初始位形摄动所致.
为了克服这一缺陷,建议采用闭环最优控制,即在构造最优控制律时取当前时刻和当前状态为初始时刻和初始状态[36].此时控制律(30) 和(31) 不能用,因为该控制律是在假设初始速度为零时得到的,但是将当前的速度作为初始速度时如式(26) 所示是不能为零的,$\hat{\xi}^b_i(t)=-\frac{1}{2}(t-t_0) (t-t_f)\hat{p}^b_i $.若取初始时刻为0,当前时刻为$t_0$,则当前速度为 $\hat{\xi}^b_i(t_0) =-\frac{1}{2}(t_0) (t_0-t_f)\hat{p}^b_i. $ 显然,这种形式的速度表示具有性质$[\hat{p}^b_i,\hat{\xi}^b_i(t_0)]=0$,以及$\sum_i\hat{\xi}^b_i(t_0) =0$,满足引理6的条件,见注3.
定理 3. 假设$[\hat{p}^b_i,\hat{\xi}^b_i(t_0)]=0,i=1,\cdots,n$,及$\sum_i\hat{\xi}^b_i(t_0) =0$,则最优控制为
\begin{align}\label{eq on opt cont. n>2 with no zero v0}\begin{array}{c}\begin{array}{lr}\hat{u}^{b,op}_i\!\!\!&\thickapprox\displaystyle\sum_{\stackrel{j=1}{j\neq i}}^n\left(\frac{6(t_f+t_0-2t)}{n(t_f-t_0) ^3}\hat{x}_{ij}(t_0) \right.+\\& \left.\displaystyle\frac{2(2t_f+t_0-3t)}{n(t_f-t_0) ^2}\hat{\xi}^b_{ij}(t_0) \right)\\\end{array}\\\hfill i = 1,\cdots,n\end{array}\end{align}
(33) 证明. 注意到,此时还有$\sum_i\hat{x}^b_i(t_f)=0$,利用与定理2几乎相同的论证方法可得结论.
定理 4. 假定初始速度满足$\hat{\xi}^{b,0}_i=0,$ $i=1,\cdots,n$. 对于由相对位形$\bar{g}_{ij},i,j =1,\cdots,n,$指定的期望队形,最优反馈编队控制律为
\begin{align}\label{eq on feedback opt. formation cont.} \begin{array}{c}\hat{u}^{b,opf}_i\thickapprox\displaystyle\sum_{\stackrel{j=1}{i\neq j}}^n\left(\frac{6}{n(t_f-t)^2}\hat{x}_{ij}(t)+\frac{4}{n(t_f-t)}\hat{\xi}^b_{ij}(t)\right),\\\hfill i=1,\cdots,n\end{array}\end{align}
(34) 其中,$\hat{x}_{ij}(t)=\log(g_{ij}(t)\bar{g}_{ji})$,$\hat{\xi}^b_{ij}(t) = {\rm Ad}_{\bar{g}_{ij}}\hat{\xi}^b_j(t)-\hat{\xi}^b_i(t)$.
证明. 回顾引理1,取当前的时刻$t$为初始时刻$t_0$,并分别用 $\tilde{u}^{b,opf}_i$,$\tilde{x}_{ij}=\log{\tilde{g}^{-1}_i\tilde{g}_j}$,和$\tilde{\xi}^b_{ij}={\rm Ad}_{\bar{g}_{1j}}\hat{\xi}^b_j-{\rm Ad}_{\bar{g}_{1i}}\hat{\xi}^b_i$取代式(33) 中的$\hat{u}^{b,op}_i$,$\hat{x}_{ij}$,和$\hat{\xi}^b_{ij}$,将得到:
$$ \begin{array}{c}\tilde{u}^{b,opf}_i\thickapprox\displaystyle\sum_{\stackrel{j=1}{i\neq j}}^n\left(\frac{6}{n(t_f-t)^2}\tilde{x}_{ij}(t)+\frac{4}{n(t_f-t)}\tilde{\xi}^b_{ij}(t)\right),\\\hfill i=1,\cdots,n\end{array}$$
由引理1,最优反馈编队控制为 $ \hat{u}^{b,opf}_i={\rm Ad}_{\bar{g}_{i1}}\tilde{u}^{b,opf}_i $.进一步借助于附录A中的引理12,有 $%\begin{array}{rl}{\rm Ad}_{\bar{g}_{i1}}\tilde{x}_{ij}=\displaystyle\bar{g}_{i1}\left(\log\left(\tilde{g}^{-1}_i\tilde{g}_j\right)\right)\bar{g}^{-1}_{i1}=\displaystyle\log\left(\bar{g}_{i1}\tilde{g}^{-1}_i\tilde{g}_j\bar{g}^{-1}_{i1}\right)=\displaystyle\log\left(g^{-1}_ig_j\bar{g}_{ji}\right)=\hat{x}_{ij}(t)%&\end{array},$,以及 $%\begin{array}{rl}{\rm Ad}_{\bar{g}_{i1}}\tilde{\xi}^b_{ij} = {\rm Ad}_{\bar{g}_{i1}}\left({\rm Ad}_{\bar{g}_{1j}}\hat{\xi}^b_j- {\rm Ad}_{\bar{g}_{1i}}\hat{\xi}^b_i\right) ={\rm Ad}_{\bar{g}_{ij}}\hat{\xi}^b_j-\hat{\xi}^b_i=\hat{\xi}^b_{ij}(t)%\end{array}.$. 这就证明了定理4.
注 6. 在定理4中
1) 当$n = 2$时,最优反馈控制律是精确的,此时没有近似假设;
2) 当$\bar{g}_{ij}=I,i,j=1,\cdots,n$时 ,编队控制律(34) 将退化为一致性控制律.
3.3 静态一致性及编队的数值仿真
3.3.1 两平面运载体在外部扰动下的开环及闭环一致性最优控制
为了说明闭环最优控制律与开环最优控制律的区别,考虑两个平面运载体的一致性问题,初始质心位置$(x(0) ,y(0) )$和初始姿态$\theta(0) $如表 1所示. 如无特别说明,本算例及后续仿真算例中的角度、相对角度单位均采用"弧度";位置、相对位置坐标的长度单位均采用"无量纲化的长度单位"(即与实际的长度单位成比例); 时间单位采用"秒".从而角速度的单位为"弧度/秒";移动速度单位为"无量纲化长度单位/秒".标称化的控制力矩((转动惯量)$^{-1}$$\cdot$力矩)单位为"弧度/(秒)$^2$";标称化的控制力((质量)$^{-1}$$\cdot$力)单位为"无量纲化长度单位/(秒)$^2$''.
表 1 运载体的初始位形Table 1 Initial configurations of agents序号 1 2 $x(0) $ 80 $-80$ $y(0) $ 100 $-100$ $\theta(0) $ $\dfrac{\pi}{2}$ $-\dfrac{\pi}{2}$ 初始位形是由空间坐标系下的质心位置坐标$(x,y)$ 和姿态角$\theta$给出. 对应的欧氏群SE(2) 上表示的初始位形为
$$%\begin{array}{l}g^0_1(0) =\left[\begin{array}{ccc} \cos(\frac{\pi}{2})& -\sin(\frac{\pi}{2})& 80\\\sin(\frac{\pi}{2})& \cos(\frac{\pi}{2})& 100\\0 & 0& 1\end{array}\right]$$$$g^0_2(0) =\left[\begin{array}{ccc} \cos(-\frac{\pi}{2})& -\sin(-\frac{\pi}{2})& -80\\\sin(-\frac{\pi}{2})& \cos(-\frac{\pi}{2})& -100\\0 & 0& 1\end{array}\right]%\end{array}$$
(21) 取初始时刻$t_0 =0$,控制律的终端时刻为$t_f = 10$,整个仿真时间为15s.假设第1运载体带有外界扰动$[0,sin(t),-0.1\sin(t)]^{\rm T}$,表示受有横向力及旋转力矩扰动.首先利用开环最优控制(30) 给出如下受到扰动的控制律:
$$\begin{array}{c}\begin{array}{l}{\pmb u}^b_1= {\pmb u}^{b,op}_1(t) +[0,sin(t),-0.1\sin(t)]^{\rm T}\\{\pmb u}^b_2= {\pmb u}^{b,op}_2(t)\\\end{array},\\ \hfill 0\leq t\leq t_f\\\end{array}$$
$t >t_f$后,取${\pmb u}^b_i =0,i= 1,2$. $t_f = 10$时的位形为
$\begin{align} & {{g}_{1}}({{t}_{f}})=\left[ \begin{matrix} -0.4937 & 0.8696 & 16.1605 \\ -0.8696 & 0.4937 & -39.6656 \\ 0 & 0 & 1 \\ \end{matrix} \right] \\ & {{g}_{2}}({{t}_{f}})=\left[ \begin{matrix} 1 & 0 & 100 \\ 0 & 1 & -80 \\ 0 & 0 & 1 \\ \end{matrix} \right] \\ \end{align}$
由于扰动的存在,系统在时刻$t_f = 10$时$g_1(t_f) \neq g_2(t_f)$,第一运载体的质心位置为$(16.2,-39.7) $,姿态角为$-56.5^\circ$,第二运载体的质心位置为$(100,-80) $,姿态角为$0^\circ$.没有取得一致性,且在$t > t_f$后,受扰运载体的速度不为零. 见图 1和图 2.
图 2 取得一致性过程中两运载体的时间行为(从上到下: 空间坐标系下的位形(质心位置与姿态角);相对于第一个运载体刚体坐标系下的相对位形; 刚体坐标系下的速度;刚体坐标系下的控制. 从左到右: 相应变量的 $x$-轴坐标;$y$-轴坐标; 姿态角$\theta$轴坐标.Fig. 2 The time behaviors of the two vehicles during the process of achieving consensus (From top to down: configuration(position and attitude angle) in the space frame; relative configuration with respect to the body frame of first vehicle;velocity in the body frame; control in the body frame. From left to right: the coordinates of the corresponding quantity in $x$-axis,$y$-axis,and attitude angle $\theta$.现在,在同样的扰动下,将系统的控制律取为带有扰动的反馈最优控制律(34) ,加上扰动后的控制律如下:
$$\begin{array}{c}\begin{array}{l}{\pmb u}^b_1= {\pmb u}^{b,opf}_1(t) +[0,sin(t),-0.1\sin(t)]^{\rm T}\\{\pmb u}^b_2= {\pmb u}^{b,opf}_2(t)\\\end{array} ,\\\hfill 0\leq t\leq t_f\\\end{array}$$
$t >t_f$后,取${\pmb u}^b_i =0,i= 1,2$. $t_f=10$时的位形为
$$g_1(t_f)=g_2(t_f)=\left[\begin{array}{ccc}0.8642& 0.5031&88.38\\-0.5031&0.8642& -72.50\\0&0&1\\\end{array}\right]$$
系统在时刻$t_f=10$确实取得了一致性.易求得此时两运载体的质心位置为$(88.4,-72.5) $,姿态角为$-32.0^\circ$. 由于外界受到扰动,在$ t >10$后尽管两运载体速度不为零,但由于此时外部输入为零,系统保持一致性. 见图 3和图 4.
图 4 取得一致性过程中两运载体的时间行为(从上到下:空间坐标系下的位形(质心位置与姿态角);相对于第一个运载体刚体坐标系下的相对位形;刚体坐标系下的速度; 刚体坐标系下的控制. 从左到右: 相应变量的$x$-轴坐标; $y$-轴坐标; 姿态角$\theta$轴坐标Fig. 4 The time behaviors of the two vehicles during the process of achieving consensus (From the top down: configuration(position and attitude angle) in the space frame; relative configuration with respect to the body frame of first vehicle;velocity in the body frame; control in the body frame. From left to right: the coordinates of the corresponding quantity in $x$-axis,$y$-axis,and attitude angle $\theta$.3.3.2 反馈最优控制律下的四平面运载体编队控制
为了验证多个$(n > 2) $运载体情况下次优闭环编队控制律的有效性,考虑如下给定的4个平面运载体,其初始位形如表 2所示.
表 2 运载体的初始位形Table 2 Initial configurations of agents序号 1 2 3 4 $x(0) $ 100 -100 -100 100 $y(0) $ 100 -100 100 -100 $\theta(0) $ 0 $-\pi$ ${\pi}/{2}$ $-{\pi}/{2}$ 初始位形是由空间坐标系下的质心位置坐标$(x,y)$ 和姿态角$\theta$给出. 现在考虑其编队问题,期望的队形由表 3给出的相对第一运载体的相对位形指定.
表 3 终端时刻相对位形Table 3 Relative configurations at final time相对指标$(1i)$ (11) (12) (13) (14) $x_{1i}(t_f)$ 0 -40 -40 -80 $y_{1i}(t_f)$ 0 -40 40 0 $\theta_{1i}(t_f)$ 0 0 0 0 队形由相对于第一运载体刚体坐标系的相对质心位置坐标$(x_{1i},y_{1i})$和相对姿态角$\theta_{1i}$给出. 取初始时刻$t_0 = 0$,控制律的终端时刻为$t_f = 10$,整个仿真时间为15s. 控制律采用最优反馈控制律(34) ,且第1、第4运载体受到外部扰动,系统受扰控制律如下:
$\begin{matrix} \left\{ \begin{array}{*{35}{l}} u_{1}^{b}(t)=u_{1}^{b,opf}(t)+{{[2\sin t,\sin (t),0.1\sin (t)]}^{\text{T}}}, \\ u_{2}^{b}(t)=u_{2}^{b,opf}(t), \\ u_{3}^{b}(t)=u_{3}^{b,opf}(t), \\ u_{4}^{b}(t)=u_{4}^{b,opf}(t)+[5U(t),5U(t),0.5U(t)], \\ \end{array} \right.&{} \\ 0\le t<{{t}_{f}}\quad &{} \\ \end{matrix}$
其中,$U(t)$为采样时间为0.1,取值为[-1,1]内均匀分布的随机数. $t> t_f$时,取 ${\pmb u}_{i}^{b}(t)=0,\ \i=1,2,3,4$. 仿真的动力学时间演化过程如图 5和图 6所示.
图 6 取得一致性过程中两运载体的时间行为(从上到下:空间坐标系下的位形(质心位置与姿态角);相对于第一个运载体刚体坐标系下的相对位形;刚体坐标系下的速度; 刚体坐标系下的控制. 从左到右: 相应变量的$x$-轴坐标; $y$-轴坐标; 姿态角$\theta$轴坐标.Fig. 6 The time behaviors of the two vehicles during the process of achieving consensus (From top to down: configuration(position and attitude angle) in the space frame; relative configuration with respect to the body frame of first vehicle;velocity in the body frame; control in the body frame. From left to right: the coordinates of the corresponding quantity in $x$-axis,$y$-axis,and attitude angle $\theta$.在时刻$t_f = 10$,相对位形的欧氏群SE(2) 上表示为
$\begin{matrix} {{g}_{12}}=\left[ \begin{matrix} 1.0000 & 0 & -40.0010 \\ 0 & 1.0000 & -40.0003 \\ 0 & 0 & 1.0000 \\ \end{matrix} \right] \\ {{g}_{13}}=\left[ \begin{matrix} 1.0000 & 0 & -40.0003 \\ 0 & 1.0000 & 40.0010 \\ 0 & 0 & 1.0000 \\ \end{matrix} \right] \\ {{g}_{14}}=\left[ \begin{matrix} 1.0000 & 0 & -80.0012 \\ 0 & 1.0000 & 0.0007 \\ 0 & 0 & 1.0000 \\ \end{matrix} \right] \\ \end{matrix}$
仿真结果表明系统在时刻$t_f = 10$,第2、3、4运载体相对于第1运载体的姿态角为0,相对于第一运载体的质心位置分别为$(-40,-40) $,$(-40,40) $和$(-80,0) $,达到了期望的编队,并在$t > t_f$后保持队形.
4. 协调编队控制
上一节在假定初始速度为零的情况下研究了编队控制问题.本节将考虑非零初始速度情况下的编队控制问题,即每一个运载体作为动态刚体在$t_0$时刻可以有任意的初始位形和任意的初始速度.本节将给出欧氏群上的系统分解原理,利用该原理可将非零初始速度编队的一般问题分解为如下两个子问题的合成:1) 上一节研究过的零初始速度的静态最优控制编队问题;2) 所有的运载体的初始位形均为SE(3) 上单位元时的速度一致性最优控制问题.并利用庞特里亚金最小值原理,结合反馈机制给出后者的闭环解析最优控制律. 其意义在于:1) 通过两个子问题的闭环解析最优控制律并利用分解原理可进一步合成一般问题的闭环解析编队控制律;2) 实现了运载体协调编队最优控制的在线自主性.
由边值条件(9) ,只要注意到$\mbox{Ad}_{\bar{g}_{ji}} =\mbox{Ad}_{g_{j}(t_f)}^{-1}\mbox{Ad}_{g_{i}(t_f)}$,则条件$\hat{\xi}^b_j(t_f)-\mbox{Ad}_{\bar{g}_{ji}}\hat{\xi}^b_i(t_f)=0$,$i,j = 1,\cdots,n$,意味着在时刻$t_f$每一个运载体有相同的空间速度,即$\hat{\xi}^s_j(t_f)-\hat{\xi}^s_i(t_f)= 0$,$i,j = 1,\cdots,n$. 称此时的速度达到了协调[23],同时运载体的位形取得了由任务指定的编队.所以对于非零初始速度的多运载体编队控制,在时刻$t_f$要取得两个目标:一个是位形的编队,另一个是速度的协调.
4.1 系统的分解
为了利用上一节在零初始速度情况下得到的结果,本文给出下列分解引理.
引理 8. 假设
${{\Sigma }_{1}}:,\left\{ \begin{array}{*{35}{l}} {{{\dot{q}}}_{k}}={{q}_{k}}\hat{\zeta }_{k}^{b}, & {{q}_{k}}({{t}_{0}})=g_{k}^{0} \\ \dot{\hat{\zeta }}_{k}^{b}=\hat{v}_{k}^{b}, & \hat{\zeta }_{k}^{b}({{t}_{0}})=0 \\ \end{array}, \right.,k=1,\cdots ,n$
(35) ${{\Sigma }_{2}}:,\left\{ \begin{array}{*{35}{l}} {{{\dot{h}}}_{k}}={{h}_{k}}\hat{\eta }_{k}^{b}, & {{h}_{k}}({{t}_{0}})=I \\ \dot{\hat{\eta }}_{k}^{b}=\hat{w}_{k}^{b}, & \hat{\eta }_{k}^{b}({{t}_{0}})=\hat{\xi }_{k}^{b,0} \\ \end{array}, \right.,k=1,\cdots ,n$
(36) 是李群SE(3) 上的两组系统,使得$g_k(t)=q_k(t)h_k(t),k=1,\cdots,n$,并且在时刻$t_f$,带有零初始速度的系统$\Sigma_1$在控制$\hat{v}^b_k,k=1,\cdots,n$下取得编队,即
\begin{align}\label{eq on formation with 0 velocity}\begin{array}{l}q_{ij}(t_f)=\bar{q}_{ij}\\\hat{\zeta}^b_k(t_f)=0\\\end{array},\quad i,j,k=1,\cdots,n\end{align}
(37) 其中,$q_{ij}(t_f)$ $:= $ $q_i^{-1}(t_f)q_j(t_f)$及$ \bar{q}_{ij}$$:= $ $h_i(t_f)\bar{g}_{ij}h^{-1}_j(t_f) $.且系统$\Sigma_2$在控制$\hat{w}^b_k,k=1,\cdots,n,$下取得速度协调,即
\begin{align}\label{eq on consensus of velocity}\hat{\eta}^b_{ij}(t_f):=\mbox{Ad}_{\bar{g}_{ij}}\hat{\eta}_j^b(t_f)-\hat{\eta}_i^b(t_f)=0,,i,j= 1,\cdots,n\end{align}
(38) 则在时刻$t_f$,系统$\Sigma$(见式(8) )在控制
\begin{align}\label{eq on control decom.}\hat{u}^b_k=\hat{w}^b_k+\mbox{Ad}_{h_k^{-1}}\hat{v}^b_k+[\mbox{Ad}_{h_k^{-1}}\hat{\zeta}^b_k,\hat{\eta}^b_k],,k=1,\cdots,n\end{align}
(39) 作用下取得协调编队.
证明. 设$ g_k=q_kh_k,q_k,h_k\in \mbox{SE}(3) ,k= 1,\cdots,n$,则首先要证明系统$\Sigma$的控制$\hat{u}^b_k$具有式(39) 的形式.由的$g_k$分解形式容易看出,$ \dot{g}_k=q_kh_k\hat{\eta}^b_i+q_k\hat{\zeta}^b_kh_k=g_k(\hat{\eta}^b_k+\mbox{Ad}_{h_k^{-1}}\hat{\zeta}^b_k)$. 这表明有如下速度分解式:
\begin{align}\label{eq on velocity decom.}\hat{\xi}^b_k=\hat{\eta}^b_k+\mbox{Ad}_{h_k^{-1}}\hat{\zeta}^b_k,\qquad k=1,\cdots,n\end{align}
(40) 利用$\hat{u}^b_k=\dot{\hat{\xi}}^b_k$,则控制律可以写成如式(39) 给出的分解子系统的动力学形式. 其次,需要证明系统$\Sigma$取得协调编队. 由式(37) 可得,$%\begin{array}{c}%\begin{array}{ll}g^{-1}_i(t_f)g_j(t_f)=h^{-1}_i(t_f)q^{-1}_i(t_f)q_j(t_f)h_j(t_f)=\bar{g}_{ij}(t_f),%\end{array}\\i,j =1,\cdots,n%\end{array}$. 进一步,由式(37) 和式(40) 可知,$\hat{\xi}^b_k(t_f)=\hat{\eta}^b_k(t_f),i=1,\cdots,n $.因而式(38) 表明系统取得了协调编队.
因而,设计系统$\Sigma$的编队控制律问题转化为设计$\Sigma_1$(见式(35) )及$\Sigma_2$(见式(36) )的控制律$\hat{v}^b_k$和$\hat{w}^b_k$,使得条件(37) 和(38) 得以满足. 为此,构造如下的最优控制问题.
首先,对系统$\Sigma_1$,问题为求控制$\hat{v}^b_k,k=1,\cdots,n$,使得系统取得由编队条件(37) 指定的编队,同时目标函数
$$J_1(\hat{v}^s_1,\cdots,\hat{v}^s_n)=\int_{t_0}^{t_f}\frac{1}{2}\sum_{k=1}^n G_I(\hat{v}^s_k,\hat{v}^s_k){\rm d}t$$
最小. 其中$\hat{v}^s_k=\mbox{Ad}_{q_k}\hat{v}^b_k,k=1,\cdots,n$.
针对系统$\Sigma_1$的控制$\hat{v}^b_k$可取为由定理4给出的反馈形式.由定理4确定的控制律知道,若初始速度$\hat{\zeta}^b_k(t_0) =0$,则$\hat{\zeta}^b_k(t_f) = 0$. 通过在式(34) 中用 $\hat{y}_{ij}:=\log(q_{ij}(t)h_j(t)\bar{g}_{ji}h^{-1}_i(t))$ 和 $\hat{\zeta}^b_{ij}:= \mbox{Ad}_{ h_i(t)\bar{g}_{ij}h^{-1}_j(t)}\hat{\zeta}^b_j(t) -\hat{\zeta}^b_i(t) $替换$\hat{x}_{ij}$和$\hat{\xi}^b_{ij}$,有:
$$\hat{v}^b_k=\sum_{j=1}^n\left(\frac{6}{n(t_f-t)^2}\hat{y}_{kj}+\frac{4}{n(t_f-t)}\hat{\zeta}^b_{kj}\right)$$
进一步定义,$%\begin{array}{l}\hat{x}_{kj}(t)=\log(g_{kj}(t)\bar{g}_{jk}),,\hat{\xi}^b_{kj}(t)=\mbox{Ad}_{\bar{g}_{kj}}\hat{\xi}^b_j(t)-\hat{\xi}^b_k(t),,\hat{\eta}^b_{kj}(t)=\mbox{Ad}_{\bar{g}_{kj}}\hat{\eta}^b_j(t)-\hat{\eta}^b_k(t),%\end{array}$ 则
$$\begin{array}{rl}&\mbox{Ad}_{h^{-1}_k}\hat{v}^b_k=\\ &\qquad\displaystyle\sum_{j=1}^n\left(\frac{6}{n(t_f-t)^2}\hat{x}_{kj}+\frac{4}{n(t_f-t)}(\hat{\xi}^b_{kj}-\hat{\eta}^b_{kj})\right) \\\end{array}$$
这是由于,根据附录A的引理12,$\mbox{Ad}_{h^{-1}_k}\hat{y}_{kj}(t)=\log(g_{kj}(t)\bar{g}_{jk})=\hat{x}_{kj}(t),$ 且
$$\begin{array}{rl}&\mbox{Ad}_{h^{-1}_k}\hat{\zeta}^b_{kj}(t)=\\ &\qquad(\mbox{Ad}_{\bar{g}_{kj}}\mbox{Ad}_{h^{-1}_j}\hat{\zeta}^b_j-\mbox{Ad}_{h^{-1}_k}\hat{\zeta}^b_k)(t)=\\ &\qquad(\mbox{Ad}_{\bar{g}_{kj}}\hat{\xi}^b_j-\hat{\xi}^b_k-\mbox{Ad}_{\bar{g}_{kj}}\hat{\eta}^b_j+\hat{\eta}^b_k)(t)=\\ &\qquad\hat{\xi}^b_{kj}(t)-\hat{\eta}^b_{kj}(t)\end{array}$$
注意到由式(40) 给出的速度分解,易知 $[\mbox{Ad}_{h^{-1}_k}\hat{\zeta}^b_k,\hat{\eta}^b_k]=[\hat{\xi}^b_k,\hat{\eta}^b_k] $.控制律(39) 中待确定的变量为系统$\Sigma_2$的控制,位形与速度$\hat{w}^b_i,\hat{\eta}^b_i,h_i$. 因而,为了确定控制律(39) ,需要构造如下动态控制器,
\begin{align}\label{eq on dynamic cotroller}\begin{array}{l}\begin{array}{ll}\dot{h}_k = h_k\hat{\eta}^b_k,& h_k(t_0) =I\\\dot{\hat{\eta}}^b_k=\hat{w}^b_k,&\hat{\eta}^b_k(t_0) =\hat{\xi}^{b,0}_k\end{array}\hat{u}^b_k=[\hat{\xi}^b_k,\hat{\eta}^b_k] +\mbox{Ad}_{h^{-1}_k}\hat{v}^b_k + \hat{w}^b_k\end{array},\quad k=1,\cdots,n\end{align}
(40) 其中,$\Sigma$的控制$\hat{u}^b_k$可作为子系统$\Sigma_2$的输出.
因而,问题进一步转化为设计系统
\begin{align}\label{eq on dynamic part of sub. sys. 2}\dot{\hat{\eta}}^b_k=\hat{w}^b_k,\qquad k=1,\cdots,n\end{align}
(42) 的控制律$\hat{w}^b_k,k = 1,\cdots,n$,使得系统$\Sigma_2$的速度$\hat{\eta}^b_k,k= 1,\cdots,n$在时刻$t_f$取得协调. 由于 $\mathfrak{se}(3) $同构于${\bf R}^6$,通过令${\pmb\eta}_k=(\mbox{Ad}_{\bar{g}_{1k}}\hat{\eta}^b_k)^{\vee}\in{\bf R}^6$和 ${\pmb w}_k=(\mbox{Ad}_{\bar{g}_{1k}}\hat{w}_k)^{\vee}\in{\bf R}^6$,易验证系统(42) 的协调问题等价于${\bf R}^6$上的积分器 $ \dot{{\pmb\eta}}_k={\pmb w}_k,,k=1,\cdots,n,$ 的一致性问题. 对此,构造下列最优一致性控制问题.
求控制${\pmb w}_k,k=1,\cdots,n$,使得在时刻$ t_f$,上述积分器取得一致性,即${\pmb \eta}_i(t_f)={\pmb \eta}_j(t_f),i,j =1,\cdots,n$,同时使得下列目标函数最小,
\begin{align}\label{eq on cost function for consensus}J_2({\pmb w}_1,\cdots,{\pmb w}_n)=\int_{t_0}^{t_f}\frac{1}{2}\sum_{i=1}^n {\pmb w}_i^{\rm T}{\pmb w}_i {\rm d}t\end{align}
(43) 4.2 多积分器有限时间最优一致性问题的解
设${\pmb\eta}=[{\pmb\eta}_1^{\rm T},\cdots,{\pmb\eta}_n^{\rm T}]^{\rm T}$,${\pmb w} =[{\pmb w}_1^{\rm T},\cdots,{\pmb w}_n^{\rm T}]^{\rm T}$,则上述${\bf R}^6$上的一致性问题是为系统
$$\dot{{\pmb\eta}}={\pmb w},,{\pmb\eta}(t_0) ={\pmb\eta}^0$$
设计控制律${\pmb w}$,使得在给定的$t_f(t_f> t_0) $,一致性条件,${\pmb\eta}_1(t_f)-{\pmb\eta}_i(t_f)=0,,i=1,\cdots,n,$得以满足,且目标函数(43) 最小.
一致性条件可写成如下紧凑的形式,
$[{{\mathbf{1}}_{n-1}}\otimes {{I}_{6}},-{{I}_{n-1}}\otimes {{I}_{6}}]\eta ({{t}_{f}})=0$
(44) 其中,${{\mathbf{1}}_{n-1}}$是每一个分量都为1的$n-1$维列向量,"$\otimes$''表示矩阵的右克朗耐克积. 为了节省符号,将${{\mathbf{1}}_{n-1}}\otimes {{I}_{6}}$和${{I}_{n-1}}\otimes {{I}_{6}}$简记为${{1}_{n-1}}$和${{I}_{n-1}}$.
该最优控制问题的哈密顿函数可构造如下
$$H_{\Sigma_2}=-\frac{1}{2}{\pmb w}^{\rm T}{\pmb w}+{\pmb p}^{\rm T}{\pmb w}$$
其中,${\pmb p}\in {\bf R}^{6n}$是协状态向量(拉格朗日乘子).对应的哈密顿系统可写为
$$\dot{{\pmb\eta}}=\frac{\partial H_{\Sigma_2}}{\partial {\pmb p}}={\pmb w},,\dot{{\pmb p}}=-\frac{\partial H_{\Sigma_2}}{\partial {\pmb\eta}}= 0$$
这意味着${\pmb p}$是常向量. 根据PMP,${\pmb w}$为最优控制的必要条件为
$$\frac{\partial H_{\Sigma_2}}{\partial {\pmb w}}=-{\pmb w}+{\pmb p}=0$$
由于该方程有唯一解,所以该条件也是充分的.从而一致性问题的最优控制为,$ {\pmb w}^{op}={\pmb p} $. 关于${\pmb p}$的确定有如下定理.
定理5.
$${\pmb p}_k=\frac{1}{n(t_f-t_0) }\sum_{i=1}^n({\pmb\eta}_i^0-{\pmb\eta}_k^0) ,\qquad k=1,\cdots,n$$
证明. 由边值条件有,$ {\pmb f}_i({\pmb\eta}(t_f)):={\pmb\eta}_i(t_f)-{\pmb\eta}_{i+1}(t_f)=0,i=1,\cdots,n-1,$则对应${\pmb f}_i=0,i=1,\cdots,n$的横截条件可以写为
$$\begin{array}{l}{\pmb p}_1(t_f)=\displaystyle\sum_{i=1}^n\frac{\partial{\pmb f}_i({\pmb\eta})}{\partial{\pmb\eta}_1}{\pmbλ}_i = {\pmbλ}_1 \\{\pmb p}_2(t_f)=\displaystyle\sum_{i=1}^n\frac{\partial{\pmb f}_i({\pmb\eta})}{\partial{\pmb\eta}_2}{\pmbλ}_i = -{\pmbλ}_1+ {\pmbλ}_2 \\\qquad \qquad\qquad\vdots \\{\pmb p}_{n-1}(t_f)=\displaystyle\sum_{i=1}^n\frac{\partial{\pmb f}_i({\pmb\eta})}{\partial{\pmb\eta}_{n-1}}{\pmbλ}_i = -{\pmbλ}_{n-2}+ {\pmbλ}_{n-1} \\{\pmb p}_n(t_f)=\displaystyle\sum_{i=1}^n\frac{\partial{\pmb f}_i({\pmb\eta})}{\partial{\pmb\eta}_n}{\pmbλ}_i = -{\pmbλ}_{n-1} \\\end{array}$$
其中,${\pmbλ}_i\in {\bf R}^6,i=1,\cdots,n$,为待确定的参数. 由此易看出$\sum_{i=1}^n {\pmb p}_i(t_f)=0$.注意到${\pmb p}$是常量,这个等式还可以写成如下形式:
$1_{n}^{\text{T}}p=0$
(45) 进一步,取${\pmb w} = {\pmb p}$并对$\dot{{\pmb\eta}} = {\pmb p}$积分,有 $ {\pmb\eta}(t_f)={\pmb\eta}(t_0) +(t_f-t_0) {\pmb p} $.结合边值条件(44) ,有
$[{{1}_{n-1}},-{{I}_{n-1}}](\eta ({{t}_{0}})+({{t}_{f}}-{{t}_{0}})p)=0$
(46) 将关于${\pmb p}$的方程(45) 和(46) 结合在一起有:
由该方程可解出,
$p=\frac{Q}{{{t}_{f}}-{{t}_{0}}}\eta ({{t}_{0}})$
其中
可以验证,
经过简单的代数运算可以得到,
$p=\frac{Q\eta ({{t}_{0}})}{{{t}_{f}}-{{t}_{0}}}=\left[ \begin{matrix} \frac{1}{n({{t}_{f}}-{{t}_{0}})}\sum\limits_{i=1}^{n}{({{\eta }_{i}}({{t}_{0}})-{{\eta }_{1}}({{t}_{0}}))} \\ \frac{1}{n({{t}_{f}}-{{t}_{0}})}\sum\limits_{i=1}^{n}{({{\eta }_{i}}({{t}_{0}})-{{\eta }_{2}}({{t}_{0}}))} \\ \vdots \\ \frac{1}{n({{t}_{f}}-{{t}_{0}})}\sum\limits_{i=1}^{n}{({{\eta }_{i}}({{t}_{0}})-{{\eta }_{n}}({{t}_{0}}))} \\ \end{matrix} \right]$
由此定理得证.
4.3 协调编队的控制
根据${\bf R}^6$与$\mathfrak{se}(3) $的同构关系,定理5可以写成如下形式:
\begin{align*}&\mbox{Ad}_{\bar{g}_{1k}}\hat{w}^b_k=\\&\quad\frac{1}{n(t_f-t_0) }\sum_{j=1}^n(\mbox{Ad}_{\bar{g}_{1j}}\hat{\eta}_j^b(t_0) -\mbox{Ad}_{\bar{g}_{1k}}\hat{\eta}_k^b(t_0) )\end{align*}
注意到$(\mbox{Ad}_{\bar{g}_{1k}})^{-1}\mbox{Ad}_{\bar{g}_{1j}} =\mbox{Ad}_{\bar{g}_{k1}}\mbox{Ad}_{\bar{g}_{1j}}=\mbox{Ad}_{\bar{g}_{kj}}$,最终得到系统 (42) 的最优速度协调的控制律,
$$\begin{array}{c}\hat{w}^b_k=\displaystyle\frac{1}{n(t_f-t_0) }\sum_{j=1}^n(\mbox{Ad}_{\bar{g}_{kj}}\hat{\eta}_j^b(t_0) - \hat{\eta}_k^b(t_0) ),\\\hfill k=1,\cdots,n\\\end{array}$$
通过将当前时刻作为初始时刻,当前状态作为初始状态,得到控制律的反馈形式
\begin{align}\label{eq on opt. control law for velocity consensus} \hat{w}^b_k=\frac{1}{n(t_f-t)}\sum_{i=1}^n\hat{\eta}_{ki}^b(t),\qquad k=1,\cdots,n\end{align}
(47) 现在将$\hat{v}^b_k,\hat{w}^b_k$代入动态控制器(41) ,得到系统的闭环有限时间协同编队控制器如下:
\begin{align}&\dot{h}_k=h_k\hat{\eta}^b_k,h_k(t_0) =I \nonumber\\&\dot{\hat{\eta}}^b_k=\displaystyle\frac{1}{n(t_f-t)}\sum_{i=1}^n\hat{\eta}_{ki}^b(t),\hat{\eta}^b_k(t_0) =\hat{\xi}^{b,0}_k\nonumber\\&\hat{u}^{b,opf}_k=\displaystyle\sum_{i=1}^n\left(\frac{6}{n(t_f-t)^2}\hat{x}_{ki}+\frac{4}{n(t_f-t)}\hat{\xi}^b_{ki}\right.-\nonumber\\&\left.,,,displaystyle\frac{3}{n(t_f-t)}\hat{\eta}^b_{ki}\right)+[\hat{\xi}^b_k,\hat{\eta}^b_k]\end{align}
(48) 从而系统的控制律可取为
$$\hat{u}^b_k=\left\{\begin{array}{ll}\hat{u}^{b,opf}_k,& t_0\leq t\leq t_f\\0,& t> t_f\end{array},\right.\quad k=1,\cdots,n$$
注 7. 1) 称控制器(48) 是闭环的是因为它依赖于系统当前的状态 $(g_k,\hat{\xi}^{b}_k),k= 1,\cdots,n$.称其为动态的是因为控制律为一个动力系统的输出.并且称它是最优的或近似最优的($n > 2$时),是指它是通过分解后的系统$\Sigma_1$和$\Sigma_2$的最优或近似最优($n> 2$时)控制得到的.
2) 控制器(48) 并不是一个物理系统,它只是产生控制信号当前取值的一个动态解析算法.
3) 不同于基于镇定的控制律,可以在无穷时域上使得控制器的初始状态对系统的影响随时间而趋于消失.对基于有限时间的控制律而言,控制器的初始状态确实对终端时刻的控制结果有影响,但这并不意味着由式(48) 给出的控制器的初始条件是唯一的,对于一般的初始状态,可以考虑相对于给定初始状态的动力学,但这将引起不必要的复杂性.
4) 该控制律只在时间段 $[t_0,t_f]$ 起作用. 系统在时刻$t_f$以后的行为取决于被切换后的控制律.如果在时刻$t_f$以后无控制且无外部扰动,则每一运载体处于由$\dot{\hat{\xi}}^b_i=0,i= 1,\cdots,n$刻画的稳定的相对平衡态. 此外,所有的相对速度$\hat{\xi}^b_j-\mbox{Ad}_{\bar{g}_{ji}}\hat{\xi}^b_i =0$.这就保证了系统保持队形并以恒定的速度运动. 若有外部扰动,为了保持队形可切换到由文献[25]给出的基于镇定的编队控制律.
4.4 协调编队的数值仿真
4.4.1 四个平面运载体反馈最优控制下的协调编队
为了验证协调编队控制律的有效性,考虑如下给定的4个平面运载体,其初始位形和初始速度如表 4所示. 现在考虑协调编队问题,期望的队形仍由表 3给出. 控制律取闭环最优控制律(48) ,取初始时刻$t_0 =0$,控制律终端时刻$t_f = 10$,总的仿真时间取50.仿真的动力学过程如图 7和图 8所示.
表 4 运载体的初始位形和初始速度Table 4 Initial configurations and initial velocities of vehicles序号 1 2 3 4 $x(0) $ 100 -100 -100 100 $y(0) $ 100 -100 100 -100 $\theta(0) $ 0 $-\pi$ ${\pi}/{2}$ $-{\pi}/{2}$ $v_x(0) $ 15 10 7 5 $v_y(0) $ 0 0 0 0 $v_{\theta}(0) $ 0.05 0.02 0.08 0.05 初始位形由空间坐标系下的质心位置坐标$(x,y)$和姿态角$\theta$给出. 初始速度由刚体坐标系下平移速度$(v_x,v_y)$和角速度$v_{\theta}$ 给出. 图 8 取得一致性过程中两运载体的时间行为(从上到下: 空间坐标系下的位形(质心位置与姿态角);相对于第一个运载体刚体坐标系下的相对位形; 刚体坐标系下的速度;刚体坐标系下的控制. 从左到右: 相应变量的 $x$-轴坐标;$y$-轴坐标; 姿态角$\theta$轴坐标.Fig. 8 The time behaviors of the two vehicles during the process of achieving consensus (From the top down: configuration(position and attitude angle) in the space frame; relative configuration with respect to the body frame of first vehicle;velocity in the body frame; control in the body frame. From left to right: the coordinates of the corresponding quantity in$x$-axis,$y$-axis,and attitude angle $\theta$.)在时刻$t = t_f = 10$ 相对位形的欧氏群SE(2) 表示为
$$\begin{array}{l}g_{12}=\left[\begin{array}{ccc} 1 & -0.0000 & -40\\ 0.0000 & 1 & -40\\ 0 & 0 & 1\end{array}\right] \$0.5cm]g_{13}=\left[\begin{array}{ccc} 1 & 0.0000 & -40\\-0.0000 & 1& 40\\ 0 & 0 & 1\end{array}\right] \$0.5cm]g_{14}=\left[\begin{array}{ccc} 1& -0.0000 & -80\\ 0.0000 & 1 & 0\\ 0 & 0 & 1\end{array}\right] \\\end{array}$$
仿真结果表明系统在时刻$t_f=10$,第2、3、4运载体相对于第1运载体的姿态角为0,相对于第一运载体的质心位置分别为$(-40,-40) $,$(-40,40) $和$(-80,0) $,达到了期望的编队.此后系统在无控制的条件下以协调编队的方式运动,仿真计算误差导致其与期望的队形有较小的偏离,说明系统处于稳定的相对平衡态. 在$t =50$时相对位形的欧氏群SE(2) 表示为
$$g_{12}=\left[\begin{array}{ccc} 1.0000 & -0.0015 & -39.6954\\ 0.0015 & 1.0000 & -39.9235\\ 0 & 0 & 1.0000\end{array}\right]$$$$g_{13}=\left[\begin{array}{ccc} 1.0000 & 0.0011 & -40.1024\\ -0.0011 & 1.0000& 39.8278\\ 0 & 0 & 1.0000\end{array}\right]$$$$g_{14}=\left[\begin{array}{ccc} 1.0001& -0.0004 & -79.8831\\ 0.0004 & 1.0001 & -0.1594\\ 0 & 0 & 1.0000\end{array}\right]$$
表明$t = 50$时,第2、3、4运载体相对于第1运载体的姿态角为0,相对于第一运载体的质心位置分别为$(-39.7,-39.9) $,$(-40.1,39.8) $和$(-79.9,-0.16) $,保持了期望的编队队形.
注 8. 为了验证控制律的有效性,本文对平面上运载体编队进行了更多的仿真验证,结果概括如下:
1) 针对不同的编队终端时刻$t_f$为 5,10,$\cdots$,100的情况在同一仿真模型下进行了仿真验证,结果表明在期望的终端时刻达到了编队,精度至少在 $10^{-3}$.随着期望的编队时间$t_f$的增加,控制作用的幅值变小,非零初始速度和外界扰动的作用变得明显,这使得取得编队的轨迹变得复杂.
2) 针对运载体数量为2,3,4,6,8,10及20的情况,对不同的指定编队时间、初始状态、以及外界扰动进行了仿真验证,结果表明该方法对运载体的数量没有限制.
3) 随着外界扰动幅值的加大,为了克服扰动引起的偏差,控制的幅值也随之增大.
4.4.2 四个空间运载体反馈最优控制下的协调编队
本文还针对3维空间的运载体协调编队情况验证了闭环控制律的有效性.结果简述如下. 运载体数量$n = 4$. 初始位形及初始速度列于表 5.终端时刻的相对位形列于表 6.
表 5 运载体的初始位形和初始速度Table 5 Initial configurations and initial velocities of vehicles序号 1 2 3 4 $\theta_r(0) $ 0 0 0 0 $\theta_p(0) $ 0 0 0 0 $\theta_y(0) $ ${\pi}/{4}$ $-{3\pi}/{4}$ ${\pi}/{2}$ $-{\pi}/{2}$ $x(0) $ 100 -100 -100 100 $y(0) $ 100 -100 100 -100 $z(0) $ 0 0 0 0 $\omega_x(0) $ 0 0 0 0 $\omega_y(0) $ -0.15 0 0 0 $\omega_z(0) $ -0.08 -0.05 0.08 0.05 $v_x(0) $ 15 10 7 5 $v_y(0) $ 0 0 0 0 $v_z(0) $ 0 0 0 0 初始位形是由包括滚转,俯仰,偏航三个欧拉角$(\theta_r,\theta_p,\theta_y)$以及空间坐标系下质心的位置坐标$(x,y,z)$给定的.初始速度是在刚体坐标系下给定的,它们分别是绕$x$-轴,$y$-轴,$z$-轴的旋转速度$(\omega_x,\omega_y,\omega_z)$,以及沿$x$-轴,$y$-轴,$z$-轴的平移速度$(v_x,v_y,v_z)$. 表 6 终端时刻相对位形Table 6 Relative configurations at final time相对指标$(1i)$ (11) (12) (13) (14) $\theta_{r,1i}(t_f)$ 0 0 0 0 $\theta_{p,1i}(t_f)$ 0 0 0 0 $\theta_{y,1i}(t_f)$ 0 0 0 0 $x_{1i}(t_f)$ 0 $-100$ -50 -50 $y_{1i}(t_f)$ 0 0 50 -50 $z_{1i}(t_f)$ 0 0 0 0 相对位形是由相对于第一运载体刚体坐标系下的相对欧拉角$(\theta_{r,1i},\theta_{p,1i},\theta_{y,1i})$及相对位置坐标$(x_{1i},y_{1i},z_{1i})$给出的. 欧拉角 $(\theta_r,\theta_p,\theta_y)\in (-\pi,\pi]×(-{\pi}/{2},{\pi}/{2})×(-\pi,\pi]$与旋转矩阵$R\in\mbox{SO}(3) $的关系可确定如下: $R =e^{\hat{e}_3\theta_y} e^{\hat{e}_2\theta_p}e^{\hat{e}_1\theta_r}$,$\theta_r = \mbox{arctan}(R_{21},R_{11})$,$\theta_p = \mbox{arctan}(-R_{31},\sqrt{R^2_{11}+R^2_{21}})$,$\theta_y = \mbox{arctan}(R_{32},R_{33})$.
控制律采用由式(48) 给出的闭环最优控制律,$t_f$取为30,总的仿真时间为50. 仿真的动态过程如图 9$\sim$12所示,图 12中的纸飞机只用来表示运载体的位置和姿态. $t = t_f $时的相对位形为
$\begin{align} & \begin{array}{*{35}{l}} {{g}_{12}}({{t}_{f}})=\left[ \begin{matrix} 1 & 0.00 & -0.00 & -100 \\ -0.00 & 1 & -0.00 & 0.00 \\ 0.00 & 0.00 & 1 & 0.00 \\ 0 & 0 & 0 & 1 \\ \end{matrix} \right] \\ \end{array} \\ & \begin{array}{*{35}{l}} {{g}_{13}}({{t}_{f}})=\left[ \begin{matrix} 1 & 0.00 & -0.00 & -50 \\ -0.00 & 1 & 0.00 & 50 \\ 0.00 & -0.00 & 1 & 0.00 \\ 0 & 0 & 0 & 1 \\ \end{matrix} \right] \\ \end{array} \\ & {{g}_{14}}({{t}_{f}})=\left[ \begin{matrix} 1 & 0.00 & -0.00 & -50 \\ -0.00 & 1 & -0.00 & -50 \\ 0.00 & 0.00 & 1 & 0.00 \\ 0 & 0 & 0 & 1 \\ \end{matrix} \right] \\ \end{align}$
图 9 系统状态的时间行为 (从上到下:空间坐标系下的欧拉角; 质心位置以及刚体坐标系下的旋转速度和平移速度.从左到右: 相应变量的$x$-轴坐标; $y$-轴坐标;$z$-轴坐标.Fig. 9 Time behaviors of system$'$s states (From the top down: Euler angle; position in the space frame; rotation velocity in the body frame; translation velocity in the body frame. From left to right: the coordinates of the corresponding quantity in$x$-axis,$y$-axis,and $z$-axis.图 10 系统相对于第一个运载体刚体坐标系下的相对状态 (从上到下: 相对欧拉角;相对位置; 相对旋转速度; 相对平移速度. 从左到右:相应变量的$x$-轴坐标; $y$-轴坐标; $z$-轴坐标.Fig. 10 Time behaviors of system$'$s relative states with respect to the body coordinate of the first agent (From top to down: relative Euler angle; relative position; relative rotation velocity; relative translation velocity. From left to right: the coordinates of the corresponding quantity in $x$-axis,$y$-axis,and$z$-axis.)图 11 在刚体坐标系下的控制时间行为 (从上到下:广义力矩; 广义力. 从左到右: 相应变量的$x$-轴坐标;$y$-轴坐标; $z$-轴坐标.)Fig. 11 Time behaviors of system$'$s control in the body coordinate (From top to down: generalized torque; and generalized force. From left to right: the coordinates of the corresponding quantity in $x$-axis,$y$-axis,and $z$-axis.)仿真结果表明,系统在指定的时刻$t_f = 30$,第2、3、4运载体相对于第1运载体的三个相对欧拉角为0,相对于第一运载体的质心位置分别为$(-100,0,0) $,$(-50,50,0) $和$(-50,-50,0) $,达到了预期编队队形,此后以速度协调的方式保持了编队运动.
5. 结论
本文研究了多运载体有限时间最优编队控制问题,运载体通过在欧氏群SE($N$) ($N$ = 2,3) 的切从上演化的刚体动力学加以刻画.编队时间和队形的几何结构是由任务指定的. 在所有运载体为全驱动,运载体之间的通讯为全联通的假定下,导出了有限时间编队控制律,当编队的运载体数量为2时,该控制律是最优的,当编队的运载体数量多于2时,该控制律是近似最优的.
本文作了两个假设. 首先,运载体的动力学假设为全驱动的,该假设对于实际情况可能较强; 其次,通讯拓扑假设为全联通的,这是本文的方法所必需的. 因为假设网络中每一个运载体的地位相同,即每一运载体要根据其所有邻居来确定其控制,由于采用有限时间最优控制,该控制在本质上是依赖于初始状态的开环控制.若一个结点不知道某个其他结点的初始状态,则在其动态过程中的控制将不受那个结点的影响.本文是通过将当前时刻和当前状态作为初始时刻和初始状态来引入的反馈,从而抑制扰动并增加鲁棒性,它不能改变最优控制律依赖于初值的本质.
进一步值得研究的工作首先是同样的编队控制问题,但是对运载体的动力学的要求放松为欠驱动的情况; 其次,在通讯拓扑为较全联通更为一般的模式下,研究运载体在"领航者-跟踪者"的最优跟踪方式下的编队控制问题.
附录 A
该附录给出本文将用到的一些预备性结果.
对于在$\mathfrak{se}(3) $上定义的李括号,有如下引理
引理 9. 设$\hat{\eta},\hat{\xi}_1,\hat{\xi}_2\in\mathfrak{se}(3) $,若$[\hat{\eta},\hat{\xi}_i]=0,i=1,2$,则$[\hat{\xi}_1,\hat{\xi}_2]=0$.
证明. 假设
$$\hat{\eta}=\left[\begin{array}{cc}\hat{\omega}& {\pmb v}\\{\pmb 0}_{1× 3}&0\end{array}\right]\neq 0$$
下面证明: 对某个$\hat{\xi}\in \mathfrak{se}(3) $,$[\hat{\eta},\hat{\xi}]=0$当且仅当$\hat{\xi}$具有如下形式:
$$\hat{\xi}=\left[\begin{array}{cc}\hat{\xi}_{\omega}&{\pmb \xi}_v\\{\pmb 0}_{1× 3}&0\\\end{array}\right]\!=\!\left[\begin{array}{cc}\alpha\hat{\omega}& \alpha {\pmb v} + \beta{\pmb\omega}\\{\pmb 0}_{1× 3}&0\\\end{array}\right],\alpha,\beta\in {\bf R}$$
由于
$$\vee\left([\hat{\eta},\hat{\xi}]\right)= \left[\begin{array}{cc}\hat{\omega}&0\\\hat{v}&\hat{\omega}\end{array}\right]\left[\begin{array}{c}{\pmb\xi}_{\omega}\\{\pmb\xi}_v\end{array}\right]=\left[\begin{array}{c} \hat{\omega}{\pmb\xi}_{\omega}\\\hat{v}{\pmb\xi}_{\omega}+\hat{\omega}{\pmb\xi}_v\end{array}\right]$$
则$\hat{\omega}{\pmb\xi}_{\omega}= {\pmb\omega} ×{\pmb\xi}_{\omega} = 0$当且仅当对某个标量 $\alpha\in{\bf R}$有${\pmb \xi}_{\omega}= \alpha{\pmb\omega}$,且$\hat{v}{\pmb\xi}_{\omega}+ \hat{\omega}{\pmb\xi}_v=(\alpha{\pmb v} -{\pmb \xi}_v)×{\pmb\omega}=0$,当且仅当对某个标量$\beta\in{\bf R}$有$(\alpha {\pmb v} -{\pmb\xi}_v)= -\beta {\pmb\omega}$,因而${\pmb\xi}_v = \alpha {\pmb v}+ \beta {\pmb\omega}$. 现假设
$$\hat{\xi}_i =\left[\begin{array}{cc} \alpha_i\hat{\omega}&\alpha_i{\pmb v} +\beta_i {\pmb\omega} \\{\pmb 0}_{1× 3}&0\end{array}\right],\qquad i=1,2$$
则易验证
$$\begin{array}{rl}&\vee\left([\hat{\xi}_1,\hat{\xi}_2]\right)=\\ &\qquad \left[\begin{array}{cc}\alpha_1\hat{\omega}& 0\\\alpha_1\hat{v} + \beta_1\hat{\omega}&\alpha_1\hat{\omega}\end{array}\right]\left[\begin{array}{c}\alpha_2{\pmb\omega}\\ \alpha_2 {\pmb v} +\beta_2{\pmb\omega} \end{array}\right]=0\\\end{array}$$
这就给出了$[\hat{\xi}_1,\hat{\xi}_2]=0$.
定义 2. 设$V$是一个有限维线性空间,其基向量为$\{{\pmb\varepsilon_i}\}$,$f$是定义在$V$上的连续可微函数,则$f$关于${\pmb x} =\sum_i{\pmb\varepsilon_i} x^i\in V$的导数定义为
$$\frac{\partial f}{\partial {\pmb x}}=\sum_i{\pmb\varepsilon}_i\frac{\partial f}{\partial x^i}\in V$$
注 9. 由该定义有:
$\begin{array}{*{35}{l}} \frac{\partial {{{\hat{x}}}^{*}}(\hat{y})}{\partial \hat{x}}=\frac{\partial {{{\hat{y}}}^{*}}(\hat{x})}{\partial \hat{x}}=\sum\limits_{i}{{{{\hat{e}}}_{i}}}\frac{\partial {{x}^{\text{T}}}y}{\partial {{x}^{i}}}=\hat{y} \\ \frac{\partial {{{\hat{x}}}^{*}}(\hat{y})}{\partial {{{\hat{x}}}^{*}}}=\frac{\partial {{{\hat{y}}}^{*}}(\hat{x})}{\partial {{{\hat{x}}}^{*}}}=\sum\limits_{i}{\hat{e}_{i}^{*}}\frac{\partial {{x}^{\text{T}}}y}{\partial {{x}^{i}}}={{{\hat{y}}}^{*}} \\ \end{array}$
(A1) 引理 10. 设$(q,\hat{x}_q^*)\in T^*\mbox{SE}(3) $及$\hat{y}^b\in \mathfrak{se}(3) $,则对于$\hat{x}_q^*(q\hat{y}^b)$作为$q\in \mbox{SE}(3) $的函数有:
$$\frac{\partial \hat{x}_q^*(q\hat{y}^b)}{\partial q^{\rm T}}=\hat{y}^b\hat{x}_q^*$$
证明. 将SE(3) 嵌入${\bf R}^{4× 4}$并记$q=\sum_{ij}E_{ij}q_{ij}$,其中$E_{ij}$是$(i ,j)$分量为1其他分量为0的基矩阵,则可利用矩阵空间的内积(见式(5) ),并由定义2 有:
$\begin{align} &\frac{\partial \hat{x}_{q}^{*}(q{{{\hat{y}}}^{b}})}{\partial {{q}^{\text{T}}}}= \\ &\sum\limits_{ij}{{{E}_{ji}}}\frac{\partial \hat{x}_{q}^{*}(q{{{\hat{y}}}^{b}})}{\partial {{q}_{ij}}}= \\ &\sum\limits_{ij}{{{E}_{ji}}}{{\left\langle {{[\hat{x}_{q}^{*}]}^{\text{T}}},{{E}_{ij}}{{{\hat{y}}}^{b}} \right\rangle }_{{{\mathbf{R}}_{4\times 4}}}}= \\ &\sum\limits_{ij}{{{E}_{ji}}}{{\left\langle {{E}_{ji}},{{{\hat{y}}}^{b}}\hat{x}_{q}^{*} \right\rangle }_{{{\mathbf{R}}_{4\times 4}}}}={{{\hat{y}}}^{b}}\hat{x}_{q}^{*}. \\ \end{align}$
假设$\exp : \mathfrak{se}(3) \longrightarrow\mbox{SE}(3) $可认为是定义在算子空间$ {\bf C}^{4× 4}$且取值在同一空间的指数映射,对于这样的指数映射,有如下引理.
引理 11 (Baker Campbell Hausdorff[37]).}对于两个不可交换的算子$X$和$Y$,若$Z$定义为$\exp Z = \exp X\cdot\exp Y$,则$Z$可以写成
$\begin{matrix} Z= & X+Y+\frac{1}{2}[X,Y]+\frac{1}{12}[X,[X,Y]]+ \\ {} & \frac{1}{12}[Y,[Y,X]]+\cdots \\ \end{matrix}$
(A2) 其中,$[\cdot,\cdot]$是由算子的换位子定义的李括号.
注 10. 对于Baker Campbell Hausdorff 公式,易看出,若$[X,Y]=0$,则
1) $\exp X \cdot \exp Y=\exp Y \cdot \exp X$;
2) $X \cdot \exp Y=\exp Y \cdot X$.
定义指数映射的逆如下. 若算子$A\in {\bf C}^{n× n}$没有负实半轴${\bf R}_{-}$上的特征值时,则有唯一的$X\in {\bf C}^{n× n}$,其特征值位于带状域$\{z: -\pi<\mbox{Im}(z)<\pi\}$,使得$ A=\exp{X}$. 将其记为$ X=\log (A)$,并将其称为算子$A$的算子对数(见文献$ {[38]). 对于对数映射,有下列引理.
引理 12[24]{\bf.} 设$A\in {\bf C}^{n× n}$在${\bf R}_{-}$上没有特征值. 若$B\in {\bf C}^{n× n}$可逆使得$BAB^{-1}$在${\bf R}_{-}$上没有特征值,则 $B(\log(A))B^{-1}=\log(BAB^{-1}) $.
引理 13[39] (指数微分).设$g(t)$是SE(3) 上的光滑曲线,$\hat{x}(t)=\log(g(t))$是$g(t)$的指数坐标,$\hat{\xi}^b =g^{-1}\dot{g}$ 是刚体坐标系下的速度,$\hat{\xi}^s=\dot{g}g^{-1}$而是空间坐标系下的速度. 则成立
$\dot{\hat{x}}=\sum\limits_{k=0}^{\infty }{\frac{{{B}_{k}}}{k!}}\text{ad}_{-\hat{x}}^{k}({{\hat{\xi }}^{b}})=\sum\limits_{k=0}^{\infty }{\frac{{{B}_{k}}}{k!}}\text{ad}_{{\hat{x}}}^{k}({{\hat{\xi }}^{s}})$
(A3) 其中,$\{B_k\}$为伯努利数.
-
表 1 测试1和测试2中整个序列的识别结果(%)
Table 1 Results of the sequences (%)
表 2 测试3中本文算法与其他算法的比较(%)
Table 2 Comparisons between our method
表 3 前5帧的识别结果(%)
Table 3 Recognition results of the first 5 sequences (%)
ASl1 AS21 AS31 AS12 AS22 AS32 本文 79.84 79.35 82.93 90.78 92.76 94.66 Yang等[3] 67±1 67±1 74±1 77±1 75±1 82±1 表 4 全部实验识别结果(%)
Table 4 All recognition results (%)
1 5 整个动作 ASl1 77.55 79.84 96.67 AS21 78.01 79.35 92.81 AS31 81.60 82.93 96.68 平均 79.05 80.71 95.39 ASl2 89.74 90.78 99.33 AS22 90.78 92.76 97.44 AS32 93.00 94.66 99.87 平均 91.17 92.73 98.88 表 5 不同阶数的识别时间(ms)
Table 5 Recognition time with different orders (ms)
Action n 0 1 2 3 4 5 6 Horizontal arm wave 4.45 9.78 12.56 14.61 17.21 19.45 23.51 Hammer 3.67 9.89 11.89 14.39 17.12 19.78 22.13 Forward punch 3.79 10.03 12.54 14.48 17.49 20.01 22.56 High throw 3.96 9.92 12.48 14.68 17.73 19.21 22.67 Hand clap 4.13 9.99 12.49 14.63 17.62 19.84 22.78 Bend 4.78 9.79 12.34 14.61 17.94 19.47 21.87 Tennis serve 4.56 9.67 12.52 14.65 17.56 19.49 22.46 Pickup and throw 3.71 9.97 12.67 14.51 17.83 19.92 22.81 表 6 不同阶数的识别率(%)
Table 6 Recognition rates with different orders (%)
Action n 0 1 2 3 4 5 6 Horizontal arm wave 81.56 85.39 89.12 90.03 91.45 89.97 87.68 Hammer 82.56 86.48 85.34 87.50 86.84 88.10 87.98 Forward punch 73.67 76.45 78.78 79.19 77.87 78.16 78.45 High throw 72.78 73.46 76.98 79.92 79.23 78.89 76.75 Hand clap 87.65 93.78 98.34 98.65 97.85 96.12 96.23 Bend 80.13 81.35 84.56 86.43 86.72 85.97 83.85 Tennis serve 88.74 91.67 92.89 93.67 93.35 92.89 92.54 Pickup and throw 83.81 86.34 86.94 88.34 87.13 87.67 97.56 Average 81.36 84.37 86.62 87.97 87.56 87.22 87.63 -
[1] (佟丽娜, 侯增广, 彭亮, 王卫群, 陈翼雄, 谭民.基于多路sEMG时序分析的人体运动模式识别方法.自动化学报, 2014, 40(5):810-821) http://www.aas.net.cn/CN/abstract/abstract18349.shtmlTong Li-Na, Hou Zeng-Guang, Peng Liang, Wang Wei-Qun, Chen Yi-Xiong, Tan Min. Multi-channel sEMG time series analysis based human motion recognition method. Acta Automatica Sinica, 2014, 40(5):810-821 http://www.aas.net.cn/CN/abstract/abstract18349.shtml [2] Li W Q, Zhang Z Y, Liu Z C. Action recognition based on a bag of 3D points. In:Proceedings of the 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops. San Francisco, CA:IEEE, 2010. 9-14 http://www.oalib.com/references/17186320 [3] Yang X D, Zhang C Y, Tian Y L. Recognizing actions using depth motion maps-based histograms of oriented gradients. In:Proceedings of the 20th ACM International Conference on Multimedia. Nara, Japan:ACM, 2012. 1057-1060 http://www.oalib.com/paper/4237135 [4] Ofli F, Chaudhry R, Kurillo G, Vidal R, Bajcsy R. Sequence of the most informative joints (SMIJ):a new representation for human skeletal action recognition. Journal of Visual Communication & Image Representation, 2014, 25(1):24-38 http://cn.bing.com/academic/profile?id=2125073690&encoded=0&v=paper_preview&mkt=zh-cn [5] Theodorakopoulos I, Kastaniotis D, Economou G, Fotopoulos S. Pose-based human action recognition via sparse representation in dissimilarity space. Journal of Visual Communication and Image Representation, 2014, 25(1):12-23 doi: 10.1016/j.jvcir.2013.03.008 [6] (王斌, 王媛媛, 肖文华, 王炜, 张茂军.基于判别稀疏编码视频表示的人体动作识别.机器人, 2012, 34(6):745-750) doi: 10.3724/SP.J.1218.2012.00745Wang Bin, Wang Yuan-Yuan, Xiao Wen-Hua, Wang Wei, Zhang Mao-Jun. Human action recognition based on discriminative sparse coding video representation. Robot, 2012, 34(6):745-750 doi: 10.3724/SP.J.1218.2012.00745 [7] (田国会, 尹建芹, 韩旭, 于静.一种基于关节点信息的人体行为识别新方法.机器人, 2014, 34(3):285-292) http://www.cnki.com.cn/Article/CJFDTOTAL-JQRR201403005.htmTian Guo-Hui, Yin Jian-Qin, Han Xu, Yu Jing. A novel human activity recognition method using joint points information. Robot, 2014, 34(3):285-292 http://www.cnki.com.cn/Article/CJFDTOTAL-JQRR201403005.htm [8] (乔俊飞, 潘广源, 韩红桂.一种连续型深度信念网的设计与应用.自动化学报, 2015, 41(12):2138-2146) http://www.aas.net.cn/CN/Y2015/V41/I12/2138Qiao Jun-Fei, Pan Guang-Yuan, Han Hong-Gui. Design and application of continuous deep belief network. Acta Automatica Sinica, 2015, 41(12):2138-2146 http://www.aas.net.cn/CN/Y2015/V41/I12/2138 [9] Zhao S C, Liu Y B, Han Y H, Hong R C. Pooling the convolutional layers in deep convnets for action recognition[Online], available:http://120.52.73.77/arxiv.org/pdf/1511.02126v1.pdf, November 1, 2015. http://cn.bing.com/academic/profile?id=1969767174&encoded=0&v=paper_preview&mkt=zh-cn [10] Liu C, Xu W S, Wu Q D, Yang G L. Learning motion and content-dependent features with convolutions for action recognition. Multimedia Tools and Applications, 2015, http://dx.doi.org/10.1007/s11042-015-2550-4. [11] Baccouche M, Mamalet F, Wolf C, Garcia C, Baskurt A. Sequential deep learning for human action recognition. Human Behavior Understanding. Berlin:Springer, 2011. 29-39 [12] Lefebvre G, Berlemont S, Mamalet F, Garcia C. BLSTM-RNN based 3d gesture classification. Artificial Neural Networks and Machine Learning. Berlin:Springer, 2013. 381-388 [13] Du Y, Wang W, Wang L. Hierarchical recurrent neural network for skeleton based action recognition. In:Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston, USA:IEEE, 2015. 1110-1118 [14] Taylor G W, Hinton G E, Roweis S. Modeling human motion using binary latent variables. In:Proceedings of Advances in Neural Information Processing Systems. Cambridge, MA:MIT Press, 2007. 1345-1352 [15] Hinton G E, Osindero S. A fast learning algorithm for deep belief nets. Neural Computation, 2006, 18:1527-1554 doi: 10.1162/neco.2006.18.7.1527 [16] Bengio Y, Lamblin P, Popovici D, Larochelle H. Personal communications with Will Zou. learning optimization Greedy layerwise training of deep networks. In:Proceedings of Advances in Neural Information Processing Systems. Cambridge, MA:MIT Press, 2007. [17] Rumelhart D E, Hinton G E, Williams R J. Learning representations by back-propagating errors. Nature, 1986, 323(6088):533-536 doi: 10.1038/323533a0 [18] Hsu E, Pulli K, PopovićJ. Style translation for human motion. ACM Transactions on Graphics, 2005, 24(3):1082-1089 doi: 10.1145/1073204 [19] Xia L, Chen C C, Aggarwal J K. View invariant human action recognition using histograms of 3D joints. In:Proceedings of the 2012 IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops. Providence, USA:IEEE, 2012. 20-27 http://www.oalib.com/references/16301407 [20] Ellis C, Masood S Z, Tappen M F, LaViola J J Jr, Sukthankar R. Exploring the trade-off between accuracy and observational latency in action recognition. International Journal of Computer Vision, 2013, 101(3):420-436 doi: 10.1007/s11263-012-0550-7 [21] Chen C, Liu K, Kehtarnavaz N. Real-time human action recognition based on depth motion maps. Journal of Real-Time Image Processing, 2016, 12(1):155-163 doi: 10.1007/s11554-013-0370-1 [22] Gowayyed M A, Torki M, Hussein M E, El-Saban M. Histogram of oriented displacements (HOD):describing trajectories of human joints for action recognition. In:Proceedings of the 2013 International Joint Conference on Artificial Intelligence. Beijing, China, AAAI Press, 2013. 1351-1357 [23] Vemulapalli R, Arrate F, Chellappa R. Human action recognition by representing 3D skeletons as points in a lie group. In:Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, USA:IEEE, 2014. 588-595 期刊类型引用(18)
1. 曹毅 ,吴伟官 ,李平 ,夏宇 ,高清源 . 基于时空特征增强图卷积网络的骨架行为识别. 电子与信息学报. 2023(08): 3022-3031 . 百度学术
2. 王威,孙少明,孙怡宁,陈超,陈竟成,张海涛. 久坐人群无器械训练动作识别与计数算法研究. 电子测量技术. 2021(02): 109-114 . 百度学术
3. 张冰冰,葛疏雨,王旗龙,李培华. 基于多阶信息融合的行为识别方法研究. 自动化学报. 2021(03): 609-619 . 本站查看
4. 曹毅,刘晨,盛永健,黄子龙,邓小龙. 基于三维图卷积与注意力增强的行为识别模型. 电子与信息学报. 2021(07): 2071-2078 . 百度学术
5. 王昊飞,李俊峰. 基于注意力机制的改进残差网络的人体行为识别方法. 软件工程. 2021(11): 51-54+46 . 百度学术
6. 金锋,张德,王亚慧. 基于HOG特征协方差矩阵的动作识别算法. 现代电子技术. 2020(03): 78-81+86 . 百度学术
7. 潘嘉琪,邹俊韬. 一种基于深度RTRBM的动态网络链路预测方法. 计算机技术与发展. 2020(03): 1-6 . 百度学术
8. 张明键,张悦. 基于语谱图和深度置信网络的方言自动辨识与说话人识别. 电子技术与软件工程. 2020(14): 151-154 . 百度学术
9. 周宏宇,严春峰,宋旭,刘国英. 基于加权三视角运动历史图像与时序分割的动作识别算法. 电子测量与仪器学报. 2020(11): 194-203 . 百度学术
10. 曹军梅,秦婧文. 基于AE-CNN的手势识别算法的探讨及实现. 信息技术. 2019(06): 18-21 . 百度学术
11. 付优,任芳. 基于AE-CNN的手势识别算法. 计算机应用与软件. 2019(11): 157-160+167 . 百度学术
12. 蒋留兵,李骢,车俐. 利用二维小波包分解实现超宽带雷达人体动作识别. 电子测量与仪器学报. 2018(08): 69-75 . 百度学术
13. 左静,胡春玲,张远洪,卢筱莉,彭森. 基于MPU6050的人体姿态信号采集装置的设计. 工业控制计算机. 2018(02): 30+33 . 百度学术
14. 王忠民,李卓,范琳. 基于滑动窗特征融合的深信度网络驾驶行为识别. 计算机应用研究. 2018(04): 1096-1100 . 百度学术
15. 占俊,谢全卿. 3D局部特征耦合回归森林的图像动作识别算法. 计算机工程与设计. 2018(07): 1990-1995+2007 . 百度学术
16. 吴志攀,郑中韦. 基于深度学习与运动信息的动作识别算法. 计算机工程与设计. 2018(08): 2668-2674 . 百度学术
17. 高大鹏,朱建刚. 滑动窗口时空深度置信网络行为识别. 计算机工程与设计. 2018(08): 2654-2659 . 百度学术
18. 张绍辉. 集成参数自适应调整及隐含层降噪的深层RBM算法. 自动化学报. 2017(05): 855-865 . 本站查看
其他类型引用(23)
-