A Hierarchical Bio-inspired Neural Network Based Multi-robot Cooperative Area Search Algorithm
-
摘要: 针对多机器人系统在战场、灾难现场等复杂未知环境下的区域搜索问题, 提出一种基于分层仿生神经网络的多机器人协同区域搜索算法. 首先将仿生神经网络(Bio-inspired neural network, BNN) 和不同分辨率下的区域栅格地图结合, 构建分层仿生神经网络信息模型, 其中包括区域搜索神经网络信息模型(Area search neural network information model, AS-BNN)和区域覆盖神经网络信息模型(Area coverage neural network information model, AC-BNN). 机器人在任务区域内实时探测到的环境信息将转换为AS-BNN和AC-BNN中神经元的动态活性值. 其次, 在分层仿生神经网络信息模型基础上引入分布式模型预测控制(Distributed model predictive control, DMPC)框架, 并设计多机器人分层协同决策机制. 当机器人处于正常搜索状态时, 基于AS-BNN进行搜索路径滚动优化决策; 当机器人陷入局部最优状态时, 则启用AC-BNN引导机器人快速找到新的未搜索区域. 最后, 在复杂未知环境下进行多机器人区域搜索仿真实验, 并与该领域内的3种算法进行比较. 仿真结果验证了所提算法能够在复杂未知环境下引导多机器人系统高效地完成区域搜索任务.Abstract: Aiming at the problem of multi-robot system area search in complex and unknown environments, such as battlefields and disaster scenes, a multi-robot cooperative area search algorithm based on a hierarchical bio-inspired neural network is proposed. Firstly, a hierarchical bio-inspired neural network (BNN) information model is constructed by combining the bio-inspired neural network with area grid maps at different resolutions, including the area search neural network information model (AS-BNN) and the area coverage neural network information model (AC-BNN). The real-time environmental information detected by the robots in the task area is converted into the dynamic activity values of neurons in both AS-BNN and AC-BNN. Secondly, a distributed model predictive control (DMPC) framework is introduced based on the hierarchical bio-inspired neural network information model, and a multi-robot hierarchical cooperative decision-making mechanism is designed. When the robot is in a normal search state, a rolling optimization decision for the search path is made based on the AS-BNN. If the robot falls into a local optimum state, the AC-BNN is activated to guide it in quickly finding a new unsearched area. Finally, a multi-robot area search simulation experiment is conducted in a complex and unknown environment, comparing the proposed algorithm with three other algorithms in this field. The simulation results verify that the proposed algorithm can guide the multi-robot system to efficiently complete the area search task in complex and unknown environments.
-
近年来, 无人机集群在各个领域都受到了极大的关注, 获得了较大的发展[1−3]. 其中, 无人机的相变控制在无人机集群控制中已经引起了一定的关注[4]. 目前, 在多智能体研究领域, 相变还没有一个准确的定义, 一般而言, 是指在一个集群系统中, 由于内因、外因、系统内外因相互作用等的改变, 在集群内部的相互作用调节下, 导致群体行为从一种运动模态转变为另一种运动模态的过程. 在无人机集群中引入相变控制, 能够使无人机集群适应日益复杂的任务环境, 提升集群对复杂环境的适应能力[5].
目前, 集群的相变控制已经成为了研究的前沿领域, 学者们对不同的模型中蕴含的相变现象进行了深入的讨论. Vicsek模型是一个经典的能够产生相变的模型. Romero等[6]基于Vicsek模型开展研究, 引入了层级之间的控制衰减因子, 并讨论了衰减因子和噪声的指数临界值, 并据此研究了等级机制对集群聚集带相态的影响. 相关文献则基于自推进粒子模型而非Vicsek模型, 研究了三维空间中自推进粒子集群的运动过程, 并运用数值求解的方法计算了集群从聚集到分散的临界参数[7]. 相比于Vicsek模型而言, 自推进粒子以自然界的鸟群运动模型为基础, 能够容纳更多类型的集群交互形式, 蕴含着更丰富的集群运动相态可能性, 因此被广泛作为多智能体相变的研究对象. Cheng等[8]研究了自推进粒子在不同形式的势能项和邻居交互距离条件下集群的运动相态, 讨论了不同势能作用参数下集群产生的运动相态, 并引入了两种序参量来衡量集群的旋转运动和直线运动相态; 文献[9]研究了集群存在通信时延的情况下集群的运动相态, 通过对集群的中心和个体相对集群中心的向量差分别进行研究, 并借助混沌学科中的分岔理论得到了集群时延状态下的稳定运动相态, 探讨了存在通信延迟情况下自推进粒子集群的运动规律并给出了一些重要参数的解析解. 除了描述不同参数下集群从初始随机状态开始所形成的的运动相态, 相关文献进一步讨论了某些运动相态是如何瓦解并转为另外一个相态的过程. Zhang等[10]通过大量的仿真模拟, 讨论了在存在外界一个捕食者的情况下, 集群因为躲避而产生的涡旋到晶格运行运动状态的单向转变, 分析了速度对齐比例系数和吸引排斥力比例系数对临界危险半径的影响. Edwards等[11]研究了两个具有同样控制规律的群体在产生的从集群平移相态到集群涡旋相态的转变过程, 并研究了两个群体中心距离不同导致最终稳定的集群状态.
自推进粒子的相变理论已经初步应用到了无人集群中. 在考虑通信延迟的集群相变的研究[9]基础上, Edwards等[12]使用虚实混合方法, 在实际的小车上测试相关理论, 验证了自推进小车集群在通信延迟和集群交互强度变化时产生的不同的运动相态. Lei等[13]用小车对相变理论进行实际验证, 研究了小车集群在不同的交互作用强度下不同的集群特性, 在不同的参数下测试了集群的一致性收敛性的和面对外界威胁时集群的反应速度. Xie等[14]研究了环境中的磁场强度, 对微型机器人集群运动形态的形象, 并实现了群体在多种形态之间的快速可逆切换, Hao等[15]则研究了局部交互规则对微型机器人集群的影响, 通过改变振幅和频率, 实现了对集群的聚集和分散行为的控制.
鸟类行为是生物界中最为普遍的群体运动之一, 吸引着大量学者的研究[16−17]. 鸟群相比于其他集群运动有一个比较明显的特征, 即鸟群倾向于和邻居的速度保持一致, 这也是最经典的鸟群运动模型——Vicsek模型[18]的基本原理. 由于鸟群中存在大量个体, 对鸟群的观察和数据记录一直是相关研究的一个难点. 直到近期, 随着GPS技术的进步, 人们可以通过数据比较精确地记录鸟类的位置和速度信息, 并基于相关数据为鸟群建立一系列模型, 研究集群中信息的传递[19]、信息交互机制[20]或者飞行时的轨迹形成机制[21−22].
总之, 目前集群相变问题已经得到了广泛研究, 然而相关研究主要聚焦于集群的参数变化而导致的集群稳态解的不同, 为了得到不同的集群运动相态需要调整所有个体的控制参数, 而较少考虑同一控制方程不同稳定运动相态之间的转换8,23. 考虑同一方程不同相态变化的一些文献中所讨论的运动相态转变也仅局限于从涡旋态到晶格平移相态的单向转变[10], 或是某种运动相态的崩溃[24], 针对两种乃至多种稳定相态之间的相互转换的研究仍然处于起步阶段. 此外, 目前相变控制理论主要针对空间中的自由粒子, 实际物理系统中应用相变理论进行控制的实例仍然较少, 目前引入相变理论的实际系统主要基于的是无人小车[12−13]和各种微型机器人[14,25], 这些实际物理系统受到的硬件限制较少. 而由于无人机较为复杂的动力学特性, 基于无人机集群进行的相变仿真分析尚存在技术空白.
基于上述情况, 本文对全连通交互拓扑下的无人机集群相变控制方法进行研究. 首先, 从鸟群飞行规律中得到启发, 基于自推进粒子模型, 考虑集群系统中的无人机满足无人机的实际飞行条件限制, 设计无人机仿鸟群相变控制律, 使无人机集群形成稳定的集群运动相态. 设计简单的相变控制项, 使无人机能够在两种不同的稳定集群运动相态中进行互相转换. 此外, 基于无人机集群仿鸟群相变控制律, 进一步分析集群的稳定运动相态, 讨论部分重要的集群运动参数, 并通过仿真验证了所设计的集群相变控制律能够使集群实现稳定的集群平移和涡旋运动相态. 通过调节简单的相变控制项, 集群能够在两个运动相态之间进行转换, 完成无人机集群的相变控制. 最后, 在别的社会力模型中引入了相变控制项, 进行了仿真对比测试, 本文提出的相变控制方法更加灵活, 更适合实际无人集群的控制.
1. 问题描述
考虑在三维欧式空间中飞行的由$ N $架无人机组成的无人机集群系统. 假设集群中的每架无人机均配有一阶速度保持自动驾驶仪、一阶航向保持自动驾驶仪以及二阶高度保持自动驾驶仪, 则每架无人机的动力学模型可以表示为[26]:
$$ \begin{split} & {{{\dot{x}}}_{i}}={{V}_{i}}\text{cos}{{\psi }_{i}},\; \\ & {{{\dot{y}}}_{i}}={{V}_{i}}\text{sin}{{\psi }_{i}},\; \\ & {{{\dot{z}}}_{i}}={{h}_{i}},\; \\ & {{{\dot{V}}}_{i}}=\tau _{{{V}_{i}}}^{-1}(V_{i}^{C}-{{V}_{i}}),\; \\ & {{{\dot{\psi }}}_{i}}=\tau _{{{\psi }_{i}}}^{-1}(\psi _{i}^{C}-{{\psi }_{i}}),\; \\ & {{{\dot{h}}}_{i}}=\tau _{{{z}_{i}}}^{-1}(z_{i}^{C}-{{z}_{i}})-\tau _{{{h}_{i}}}^{-1}{{h}_{i}},\; \end{split} $$ (1) 其中, 下标$ i\in \left\{ 1,\;2,\;\cdots ,\;N \right\} $表示不同的无人机, $ {{\mathbf{x}}_{i}}={{\left[ {{x}_{i}},\;{{y}_{i}},\;{{z}_{i}} \right]}^{\text{T}}} $表示无人机$ i $的位置向量, $ {{\mathbf{v}}_{i}}=[ {{{\dot{x}}}_{i}}, {{{\dot{y}}}_{i}},\;{{{\dot{z}}}_{i}} ]^{\text{T}} $为无人机$ i $在惯性坐标系三个坐标轴上的速度分量, $ {{V}_{i}} $, $ {{\psi }_{i}} $和$ {{h}_{i}} $分别为无人机的速度、航向和高度变化率. $ {{\tau }_{{{V}_{i}}}} $, $ {{\tau }_{{{\psi }_{i}}}} $, $ {{\tau }_{{{z}_{i}}}} $, $ {{\tau }_{{{h}_{i}}}} $分别为无人机的速度保持, 航向角保持和高度保持常数, 与自动驾驶仪和无人机本身的性能有关, $ V_{i}^{C} $, $ \psi _{i}^{C} $, $ z_{i}^{C} $为自动驾驶仪的输入指令.
考虑到实际无人机飞行受到无人机的速度、水平过载和爬升速度的限制, 无人机的飞行状态需要满足如下约束条件:
$$ \begin{aligned}[b] & {{V}_{\text{min}}} \le {{V}_{i}} \le {{V}_{\text{max}}},\; \\ & \left| {{{\dot{\psi }}}_{i}} \right| \le V_{i}^{-1}{{n}_{\text{max}}}g,\; \\ & {{h}_{\min }} \le {{h}_{i}} \le {{h}_{\max }},\; \end{aligned} $$ (2) 其中, $ g=9.8\,\;\text{m/s} $为重力加速度, $ {{V}_{\text{min}}} $, $ {{V}_{\text{max}}} $分别为无人机最小和最大飞行速度, $ {{n}_{\text{max}}} $为最大水平过载, $ {{h}_{\min }} $, $ {{h}_{\max }} $为最小和最大的高度变化率.
本文设定集群的交互拓扑为全连通的, 即无人机能够和集群中的所有个体进行交互, 无人机$ i $的交互邻居集合为$ {{N}_{i}}=\left\{ j|j=1,\;2,\;\cdots ,\;N,\;j\ne i \right\} $. 受到Cheng等[8]的启发, 引入集群运动序参量定义. 并定义集群的运动相态如下.
定义 1. (集群平移序参量与平移运动相态) 给定某一时刻无人机集群的位置矢量$ \mathbf{p}=[ {{\mathbf{x}}_{1}},\;{{\mathbf{x}}_{2}}, \;\cdots , {{\mathbf{x}}_{N}} ]^{\text{T}} $和惯性坐标系下的速度矢量$ \mathbf{v}=[\dot{\mathbf{x}}_1,\; \dot{\mathbf{x}}_2,\; \cdots, \dot{\mathbf{x}}_N]^{\mathrm{T}} $, 则可定义无人机集群平移序参量$ {{V}_{m}} $如下[8]:
$$ \begin{aligned} {{V}_{m}}=\frac{1}{N}\left\| \sum\limits_{i=1}^{N}{\frac{{{\mathbf{x}}_{i}}}{\left\| {{\mathbf{x}}_{i}} \right\|}} \right\| \end{aligned} $$ (3) 当无人机集群满足$ {{V}_{m}}=1 $时, 称无人机集群处于平移运动相态.
定义2. (集群涡旋序参量与涡旋运动相态) 给定某一时刻无人机集群的位置矢量$ \mathbf{p} $, 惯性坐标系下的速度矢量$ \mathbf{v} $和集群的邻居集合$ {{N}_{a}}=\{ {{N}_{1}},\;{{N}_{2}}, \cdots ,\;{{N}_{N}} \} $, 则定义无人机集群涡旋序参量$ {{V}_{c}} $如下[8]:
$$ \begin{aligned} {{V}_{c}}=\frac{1}{N}\left\| \sum\limits_{i=1}^{N}{\frac{{{\mathbf{r}}_{i}}\times {{{\dot{\mathbf{x}}}}_{i}}}{\left\| {{\mathbf{r}}_{i}} \right\|\left\| {{{\dot{\mathbf{x}}}}_{i}} \right\|}} \right\| \end{aligned} $$ (4) 其中, $ {{\mathbf{r}}_{i}}=\frac{1}{\left| {{N}_{i}} \right|}\sum\nolimits_{j\in {{N}_{i}}}{{{\mathbf{x}}_{j}}} $为无人机$ i $所有邻居的中心位置坐标, $ \left| {{N}_{i}} \right| $表示无人机$ i $邻居集合中元素的个数, $ \times $表示两个向量的叉乘.
当无人机集群满足$ {{V}_{c}}=1 $时, 称无人机集群处于涡旋运动相态.
注意到, 集群的平移序参量和涡旋序参量不会同时为1, 因此, 在本文的序参量定义下, 无人机集群仅有可能处于三种运动相态: 平移运动相态, 涡旋运动相态和无序运动相态.
2. 仿鸟群无人机相变控制方法设计
2.1 鸟群运动规律启发
鸟群的集群行为是一种常见的集体运动, 学者们已经建立了许多模型来解释鸟群所展现出的复杂行为. 采集鸟类的飞行数据表明, 鸟群的飞行几乎都处于同一个高度, 也因此, 对鸟群运动的讨论主要基于二维平面[27−28].
Vicsek模型[18]作为最经典的仿鸟群运动的模型, 受到了广泛的关注. 对于Vicsek模型的研究进一步揭示了即使简单如Vicsek的模型也同样能够产生相变的现象.
自推进粒子模型作为一个经典的受到鸟群启发的模型, 由Reynolds提出其基本思想[29]. 自推进粒子模型的核心在于设计集群中的个体存在速度自推进项, 以保持自身速度, 并通过粒子之间的集群交互作用调整集群的行为. 在此基础上, Couzin则进一步发展了相关模型. Couzin模型[30]参考鸟群的交互机制, 设计了集群势能作用. 认为集群中的交互存在有三个区域, 排斥区, 对齐区和吸引区, 处于交互范围内的粒子分别会受到排斥力, 速度对齐力和吸引力. 本文受到类似启发, 按照相关讨论的一般做法, 将排斥力和吸引力统一为集群势能梯度作用, 集群中的个体通过势能梯度进行交互. 在没有其余因素的影响下, 两个个体总是倾向于位于互相的势能最低点附近. 通过设计不同的集群交互势函数, 集群的运动行为相比Vicsek模型的三种运动相态有了更多的可能性. 由于自推进粒子模型能够实现多种集群运动相态, 其相变特征目前仍是相关研究的热点.
鸟类归巢行为是一种特殊的鸟群运动行为. 以鸽群归巢行为为例, 鸽群在远离巢穴时, 具有多个个体的集群会选择一条从出发点到终点的较短路径, 群体的运动轨迹近似一条直线[31]; 而在靠近巢穴的位置, 集群的运动发生了变化, 鸟群倾向于在巢穴附近做盘旋运动[32]. 鸽群如何实现两种相态的切换存在着较大的研究空间.
相变能够比较好地在不同模态中进行切换, 灵活适应不同作战场景; 而鸟群归巢行为体现了灵活的的模态转换, 对无人机集群的相变控制有着较大的启发. 通过给出目标位置, 作为无人机集群的归巢目标, 仅将部分无人机设置为信息个体, 引入相变控制项, 即可控制集群到达敌方目标; 在到达敌方目标后, 巢穴吸引力降低, 相变控制项逐渐不发生作用, 无人机集群变为涡旋运动模态, 围绕在敌方目标周围开展任务; 如果遇到敌方威胁时, 集群中的部分个体感受到威胁, 产生逃逸行为, 进而促使集群所有个体远离敌方威胁; 完成任务后, 将巢穴设置为起飞点, 产生相变控制项, 集群就能够通过部分信息个体, 控制集群返回出发点.
综上, 本文借助自推进粒子模型模拟鸟群的基础群体行为, 进一步引入相变控制项来模拟巢穴的吸引对鸟群的调节作用, 设计无人机集群仿鸟群相变控制律, 实现集群运动相态的切换.
2.2 仿鸟群相变控制律设计
从鸟群运动中得到启发, 采用自推进粒子模型作为无人机集群仿鸟群控制律的基础, 可以得到无人机集群的相变控制的速度保持控制项$ \boldsymbol{\Gamma}_i^v $:
$$ \begin{aligned} \boldsymbol{\Gamma}_{i}^{v}=a\left( {{v}_{0}}-\alpha {{\left\| {{{\dot{\mathbf{x}}}}_{i}} \right\|}^{2}} \right){{\dot{\mathbf{x}}}_{i}} \end{aligned} $$ (5) 其中, $ a>0 $为速度保持项的控制增益, $ \alpha >0 $为阻尼比, $ {{v}_{0}} $为速度保持项的基准速度, $ \left\| {{{\dot{\mathbf{x}}}}_{i}} \right\| $为无人机$ i $位置变化率的范数.
基于Couzin模型的基本原理, 采用保守势函数梯度作用作为仿鸟群控制律的集群交互项, 设计得到集群无人机之间交互的集群势能梯度项$ \Gamma _{i}^{U} $:
$$ \begin{aligned} \boldsymbol{\Gamma} _{i}^{U}=b\sum\limits_{j\in {{N}_{i}}}{\nabla {{U}_{ij}}\left( {{\mathbf{x}}_{ij}} \right)} \end{aligned} $$ (6) 其中, $ b>0 $为势能梯度项的控制增益, $ {{N}_{i}} $为无人机$ i $的交互邻居集合. 在本文中, $ {{\mathbf{x}}_{ij}}={{\mathbf{x}}_{i}}-{{\mathbf{x}}_{j}} $为无人机$ i $和$ j $之间的坐标向量差, $ {{U}_{ij}} $为无人机集群交互势函数, 设计势函数满足为:
$$ \begin{aligned} \nabla {{U}_{ij}}\left( {{\mathbf{x}}_{ij}} \right)=\frac{\left( \left\| {{\mathbf{x}}_{ij}} \right\|-d \right){{\mathbf{x}}_{ij}}}{\left\| {{\mathbf{x}}_{ij}} \right\|} \end{aligned} $$ (7) 其中, $ d $为设计的势能梯度项的平衡距离, 为一个定值. 势能梯度在$ {\mathbf{x}}_{ij} = d $时为0, 意味着势能在该点处取得最小值. 势能梯度项同样起到无人机集群内部避障的作用. 当集群中任意两个个体的距离小于平衡距离时, 势能梯度项的作用会让两者互相远离; 而当两个个体距离大于平衡距离时, 势能梯度项的作用会将两者互相靠近, 防止距离过远或发生碰撞. 在仅存在两个个体时, 个体之间的距离将会保持在$ d $.
通过引入速度自推进项和势能梯度项, 就能够实现无人机集群的自组织等行为, 使集群实现一个固定的相态.
为了实现无人机集群的相变控制, 完成无人机集群在两种运动相态的切换, 在上述两项的基础上, 引入仿鸟群相变控制项$ \boldsymbol{\Gamma} _{i}^{p} $来模拟巢穴等对鸟群中部分个体的吸引, $ \boldsymbol{\Gamma} _{i}^{p}=\lambda\left( t \right) {{\mathbf{F}}_{i}} $. 其中, $ \lambda\left( t \right) \in \mathbb{R} $为相变控制项的强度, $ {{\mathbf{F}}_{i}}\left( t \right) $是相变控制力. 实际上, 相变控制力可以沿任意方向. 但是为了探究无人机集群的相变控制并简化讨论, 在本文中, 设计相变控制力为沿某一坐标的方向的单位向量, 以模拟一个固定位置的巢穴的吸引. 其具体表达式为:
$$ \begin{aligned} {{\mathbf{F}}_{i}}={{\left[ 1,\;0,\;0 \right]}^{\text{T}}} \end{aligned} $$ (8) 综上所述, 对于无人机集群, 为了使无人机能够维持自身的速度并保持群体的一致性, 设计如下的仿鸟群无人机集群相变控制律:
$$ \begin{aligned}[b] {{\mathbf{u}}_{i}} =\;&a\left( {{v}_{0}}-\alpha {{\left\| {{{\dot{\mathbf{x}}}}_{i}} \right\|}^{2}} \right){{\dot{\mathbf{x}}}_{i}}+\\ &b\sum\limits_{j\in {{N}_{i}}}{\nabla {{U}_{ij}}\left( {{\mathbf{x}}_{ij}} \right)}+\lambda {{\mathbf{F}}_{i}}\left( t \right) \end{aligned} $$ (9) 其中, $ {{\mathbf{x}}_{ij}}={{\mathbf{x}}_{i}}-{{\mathbf{x}}_{j}} $为两个邻居个体的位置矢量差, $ a,\;b,\;\lambda $分别为粒子自推进项, 集群势能项, 相变控制力的控制增益, $ {{v}_{0}} $为速度保持项的基准速度量, $ \alpha $为粒子运动的阻尼.
将由式(9)计算得到的控制律带入如下控制指令转换器可以得到无人机$ i $的自动驾驶仪控制指令输入为:
$$ \begin{aligned}[b] & V_{i}^{C}={{\tau }_{{{V}_{i}}}}({{\mathbf{u}}_{i,\;1}}\text{cos}{{\psi }_{i}}+{{\mathbf{u}}_{i,\;2}}\text{sin}{{\psi }_{i}})+{{V}_{i}},\; \\ & \psi _{i}^{C}=\frac{{{\tau }_{{{\psi }_{i}}}}}{{{V}_{i}}}({{\mathbf{u}}_{i,\;2}}\text{cos}{{\psi }_{i}}-{{\mathbf{u}}_{i,\;1}}\text{sin}{{\psi }_{i}})+{{\psi }_{i}},\; \\ & z_{i}^{C}=\frac{{{\tau }_{{{z}_{i}}}}}{{{\tau }_{{{h}_{i}}}}}{{h}_{i}}+{{\tau }_{{{z}_{i}}}}{{\mathbf{u}}_{i,\;3}}+{{z}_{i}}. \end{aligned} $$ (10) 3. 集群运动相态分析
本部分将证明, 使用控制律式(9)和控制律转化式(10), 无人机集群能够实现两种稳定运动相态, 并实现两种运动相态的转化.
定理 1. 给定一个无人机集群, 若集群交互拓扑全连通且集群中的无人机均处在同一高度, 无人机在控制律式(9)和控制律转化式(10)的作用下, 在相变控制强度$ \lambda =0 $时, 集群存在两个运动相态, 分别为平移运动相态$ {{V}_{m}}=1 $和涡旋运动相态$ {{V}_{c}}=1 $.
证明: 为了描述方便, 对集群的中心坐标和每个个体相对集群中心的坐标向量差分别进行处理[12]. 引入集群中心坐标$ \mathbf{R} $和每个个体相对集群中心坐标的差$ \delta {{\mathbf{r}}_{i}} $, 有:
$$ \begin{aligned}[b] & \mathbf{R}=\frac{1}{N}\sum\limits_{i=1}^{N}{{{\mathbf{x}}_{i}}} \\ & {{\mathbf{x}}_{i}}=\mathbf{R}+\delta {{\mathbf{r}}_{i}} \end{aligned} $$ (11) 由上述定义式, 显然有:
$$ \begin{aligned} \sum\limits_{i}^{N}{\delta {{\mathbf{r}}_{i}}}=\mathbf{0} \end{aligned} $$ (12) 将上式带入到集群的控制律(9)中, 有:
$$ \begin{aligned} {{{\ddot{\mathbf{x}}}}_{i}}=a\left( {{v}_{0}}-\alpha {{\left\| {{{\dot{\mathbf{x}}}}_{i}} \right\|}^{2}} \right){{\dot{\mathbf{x}}}_{i}}+b\sum\limits_{j\in {{N}_{i}}}{\nabla {{U}_{ij}}\left( {{\mathbf{x}}_{ij}} \right)}+\lambda {{\mathbf{F}}_{i}} \end{aligned} $$ (13) $$ \begin{aligned}[b] {\ddot{\mathbf{R}}}+\delta {{{\ddot{\mathbf{r}}}}_{i}} =\; & a\left( {{v}_{0}}-\alpha {{\left\| \dot{\mathbf{R}}+\delta {{{\dot{\mathbf{r}}}}_{i}} \right\|}^{2}} \right)\left( \dot{\mathbf{R}}+\delta {{{\dot{\mathbf{r}}}}_{i}} \right)+\\ & b\sum\limits_{j\in {{N}_{i}}}{\nabla {{U}_{ij}}\left( {{\mathbf{x}}_{ij}} \right)}+\lambda {{\mathbf{F}}_{i}} \end{aligned} $$ (14) 将式(14)对集群中的所有个体进行求和, 有:
$$ \begin{aligned}[b] N{\ddot{\mathbf{R}}} =\; & \sum\limits_{j=1}^{N}{a\left[ {{v}_{0}}-\alpha {{\left( \dot{\mathbf{R}}+\delta {{{\dot{\mathbf{r}}}}_{j}} \right)}^{2}} \right]\left( \dot{\mathbf{R}}+\delta {{{\dot{\mathbf{r}}}}_{j}} \right)}+\\ & \sum\limits_{j=1}^{N}{b\sum\limits_{k\in {{N}_{j}}}{\nabla {{U}_{jk}}\left( {{\mathbf{x}}_{jk}} \right)}}+\sum\limits_{j=1}^{N}{\lambda {{\mathbf{F}}_{j}}} \end{aligned} $$ (15) 考虑到集群的交互拓扑是全连通的, 且势能梯度项$ \boldsymbol{\Gamma} _{i}^{U} $为保守力, 对于集群中的任意两个个体都具有对称性, 该性质与势能梯度项的具体表达式无关, 因此有:
$$ \begin{aligned} \sum\limits_{j=1}^{N}{b\sum\limits_{k\in {{N}_{j}}}{\nabla {{U}_{jk}}\left( {{\mathbf{x}}_{jk}} \right)}}=0 \end{aligned} $$ (16) 展开求和式(15)并将式(16)代入, 有:
$$ \begin{split} & N{\ddot{\mathbf{R}}} =\sum\limits_{j=1}^{N}{a\left[ {{v}_{0}}-\alpha \left( {{{\dot{\mathbf{R}}}}^{2}}+2\dot{\mathbf{R}}\delta {{{\dot{\mathbf{r}}}}_{j}}+\delta {{{\dot{\mathbf{r}}}}_{j}}^{2} \right) \right] \left( \dot{\mathbf{R}}+\delta {{{\dot{\mathbf{r}}}}_{j}} \right)}+\\ & \quad\sum\limits_{j=1}^{N}{\lambda {{\mathbf{F}}_{i}}} =a\sum\limits_{j=1}^{N}{\left[{{v}_{0}}-\alpha \left( {{{\dot{\mathbf{R}}}}^{2}}+2\dot{\mathbf{R}}\delta {{{\dot{\mathbf{r}}}}_{j}}+\delta {{{\dot{\mathbf{r}}}}_{j}}^{2} \right) \right]\dot{\mathbf{R}}}+\\ &\quad a\sum\limits_{j=1}^{N}{\left[ {{v}_{0}}-\alpha \left( {{{\dot{\mathbf{R}}}}^{2}}+2\dot{\mathbf{R}}\delta {{{\dot{\mathbf{r}}}}_{j}}+\delta {{{\dot{\mathbf{r}}}}_{j}}^{2} \right) \right]\delta {{{\dot{\mathbf{r}}}}_{j}}}+ \sum\limits_{j=1}^{N}{\lambda {{\mathbf{F}}_{j}}} \end{split} $$ (17) 考虑到式(12), 且$ \dot{\mathbf{R}} $与指标$ i $无关, 因此有:
$$ \begin{aligned}[b] N{\ddot{\mathbf{R}}} =\; & a\sum\limits_{j=1}^{N}{\left[ {{v}_{0}}-\alpha \left( {{{\dot{\mathbf{R}}}}^{2}}+\delta {{{\dot{\mathbf{r}}}}_{j}}^{2} \right) \right]\dot{\mathbf{R}}}+\\ & a\sum\limits_{j=1}^{N}{\left[ {{v}_{0}}-\alpha \left( 2\dot{\mathbf{R}}\delta {{{\dot{\mathbf{r}}}}_{j}}+\delta {{{\dot{\mathbf{r}}}}_{j}}^{2} \right) \right]\delta {{{\dot{\mathbf{r}}}}_{j}}}+\\ & \sum\limits_{j=1}^{N}{\lambda {{\mathbf{F}}_{j}}} \end{aligned} $$ (18) 将式(18)同除以集群中个体的数量$ N $:
$$ \begin{aligned}[b] {\ddot{\mathbf{R}}} =\; & a\dot{\mathbf{R}}\left( {{v}_{0}}-\alpha {{{\dot{\mathbf{R}}}}^{2}}-\frac{\alpha}{N}\sum\limits_{j=1}^{N}{\delta {{{\dot{\mathbf{r}}}}_{j}}^{2}} \right)+\\ & \frac{a}{N}\sum\limits_{j=1}^{N}{\left[ {{v}_{0}}-\alpha \left( 2\dot{\mathbf{R}}\delta {{{\dot{\mathbf{r}}}}_{j}}+\delta {{{\dot{\mathbf{r}}}}_{j}}^{2} \right) \right]\delta {{{\dot{\mathbf{r}}}}_{j}}}+\frac{1}{N}\sum\limits_{j=1}^{N}{\lambda {{\mathbf{F}}_{j}}} \end{aligned} $$ (19) 将式(19)代入式(14), 可以得到:
$$ \begin{aligned}[b] \delta {{{{\ddot{\mathbf{r}}}}}_{i}} =\; & a\left( -2\dot{\mathbf{R}}\delta {{{\dot{\mathbf{r}}}}_{i}}-\delta {{{\dot{\mathbf{r}}}}_{i}}^{2}+\frac{\alpha}{N}\sum\limits_{j=1}^{N}{\delta {{{\dot{\mathbf{r}}}}_{j}}^{2}} \right)\dot{\mathbf{R}}+\\ & a\left( {{v}_{0}}-\alpha {{\left\| \dot{\mathbf{R}}+\delta {{{\dot{\mathbf{r}}}}_{i}} \right\|}^{2}} \right)\delta {{{\dot{\mathbf{r}}}}_{i}}- \\ & \frac{a}{N}\sum\limits_{j=1}^{N}{\left[ {{v}_{0}}-\alpha \left( 2\dot{\mathbf{R}}\delta {{{\dot{\mathbf{r}}}}_{j}}+\delta {{{\dot{\mathbf{r}}}}_{j}}^{2} \right) \right]\delta {{{\dot{\mathbf{r}}}}_{j}}} +\\ & b\sum\limits_{j\in {{N}_{i}}}{\nabla {{U}_{ij}}\left( {{\mathbf{x}}_{ij}} \right)}+\lambda {{\mathbf{F}}_{i}}-\frac{1}{N}\sum\limits_{j=1}^{N}{\lambda {{\mathbf{F}}_{j}}} \end{aligned} $$ (20) 通过上述处理, 我们将原本关于$ {{\mathbf{x}}_{i}} $的$ N $个方程转变为了关于集群中心坐标$ \mathbf{R} $(式(19))和坐标矢量差$ \delta {{\mathbf{r}}_{i}} $(式(20))的$ N+1 $个方程. 考虑到式(12)的隐含关系, 实际上转化后只有$ N $个方程, 转化前后方程约束条件一致, 因此可以通过研究转化后的方程来研究转化前方程的相关特性.
受到平均场理论的启发, 为了研究集群的运动相态, 令$ N\to \infty $, 并忽略式(19)中$ \delta \dot{\mathbf{r}} $的波动, 因此可以得到与相变控制强度$ \lambda $和集群的空间维数的取值无关的集群方程:
$$ \begin{aligned} {\ddot{\mathbf{R}}}=a\dot{\mathbf{R}}\left( {{v}_{0}}-\alpha {{{\dot{\mathbf{R}}}}^{2}} \right)+\frac{1}{N}\sum\limits_{j=1}^{N}{\lambda {{\mathbf{F}}_{j}}} \end{aligned} $$ (21) 在公式中, 令相变控制强度$ \lambda =0 $, 可以得到简化后的集群运动方程:
$$ \begin{aligned} {\ddot{\mathbf{R}}}=a\dot{\mathbf{R}}\left( {{v}_{0}}-\alpha {{{\dot{\mathbf{R}}}}^{2}} \right) \end{aligned} $$ (22) 研究微分方程式(22), 可以得到方程的两个平衡解: 一个静态平衡解$ \mathbf{R}={{\mathbf{R}}_{0}} $, 即集群的中心坐标为一个常矢量, 集群的中心点不变; 和一个恒速运动解$ \mathbf{R}={{\mathbf{V}}_{0}}t+{{\mathbf{R}}_{0}} $, 其中$ \left\| {{\mathbf{V}}_{0}} \right\|=\sqrt{{{v}_{0}}/\alpha } $. 在控制所有无人机处于同一个高度的情况下, 两个静态平衡解分别对应集群涡旋相态和集群平移相态, 并可以据此实现无人机集群的相变控制.
(1) 集群涡旋相态稳定解
当$ \mathbf{R}={{\mathbf{R}}_{0}} $时, 即$ \dot{\mathbf{R}}=0 $, 代入集群运动式(14), 有:
$$ \begin{aligned} \delta {{{\ddot{\mathbf{r}}}}_{i}}=a\left( {{v}_{0}}-\alpha \delta {{{\dot{\mathbf{r}}}}_{i}}^{2} \right)\delta {{\dot{\mathbf{r}}}_{i}}+b\sum\limits_{j\in {{N}_{i}}}{\nabla {{U}_{ij}}\left( {{\mathbf{x}}_{ij}} \right)} \end{aligned} $$ (23) 方程(23)存在一个稳定解, 即$ \left\| \delta {{{\dot{\mathbf{r}}}}_{i}} \right\|=\sqrt{{{v}_{0}}/\alpha } $, $ \delta {{{\ddot{\mathbf{r}}}}_{i}}=b\sum\nolimits_{j\in {{N}_{i}}}{\nabla {{U}_{ij}}\left( {{\mathbf{x}}_{ij}} \right)} $. 当$ \left\| \delta {{{\dot{\mathbf{r}}}}_{i}} \right\| $不变时, 存在两种情况, $ \left\| \delta {{{\ddot{\mathbf{r}}}}_{i}}\right\|=0 $或$ \delta {{{\ddot{\mathbf{r}}}}_{i}} $垂直于$ \delta {{\dot{\mathbf{r}}}_{i}} $. 若无人机势能梯度项$ \delta {{{\ddot{\mathbf{r}}}}_{i}}=b\sum\nolimits_{j\in {{N}_{i}}}{\nabla {{U}_{ij}}\left( {{\mathbf{x}}_{ij}} \right)}=0 $, 即无人机加速度为0, 此时无人机将进行直线平移运动, 与集群中心$ \dot{\mathbf{R}}=0 $矛盾. 因此, 仅有可能无人机的加速度始终与无人机的速度垂直, 无人机围绕集群中心做匀速圆周运动, 运动方程中的势能梯度项$ \boldsymbol{\Gamma} _{i}^{U} $提供粒子运动的向心加速度, 因此可以得到单个无人机速度大小$ {{v}_{i}} $和圆周运动半径$ {{r}_{i}} $满足的关系式:
$$ \begin{aligned} \frac{{{v}_{i}}^{2}}{{{r}_{i}}}=b\sum\limits_{j\in {{N}_{i}}}{\nabla {{U}_{ij}}\left( {{\mathbf{x}}_{ij}} \right)} \end{aligned} $$ (24) 对势能梯度项进行分析, 在集群稳定状态下, 可以近似认为集群的所有个体分布在以集群中心为圆心的一个圆周上, 如图1所示:
稳定状态下, 可以认为集群中的所有个体是在圆周上的均匀分布, 角密度为$ \frac{N}{2\pi } $, 每一小段上的无人机数量为$ \frac{N}{2\pi }\text{d}\theta $. 由于无人集群的交互拓扑为全连通的, 因此需要对无人机集群中的所有个体进行积分. 由于圆的对称性, 无人机的加速度指向圆心, 因此集群圆弧上每一点的邻居对无人机$ i $的作用分量为$ \left( 2{{r}_{i}}\cos \theta -d \right)\cos \theta $. 根据圆周角和圆心角关系, 代入式(24), 可以得到积分式:
$$ \begin{aligned}[b] \frac{{{v}_{i}}^{2}}{{{r}_{i}}}=\;&b\sum\limits_{j\in {{N}_{i}}}{\nabla {{U}_{ij}}\left( {{\mathbf{x}}_{ij}} \right)}= \\ & b\int_{-\pi /2}^{\pi /2}{\frac{N}{2\pi }2\cos \theta \left( 2{{r}_{i}}\cos \theta -d \right)\text{d}\theta } \end{aligned} $$ (25) 对式(25)进行积分运算, 可以得到:
$$ \begin{aligned} \frac{{{v}_{i}}^{2}}{{{r}_{i}}}=b\left( Nr_i-2\frac{N}{\pi }d \right) \end{aligned} $$ (26) 式(26)是关于半径$ {{r}_{i}} $的二次方程. 求解上述方程, $ bN{{r}_{i}}^{2}-2b\frac{N}{\pi }d{{r}_{i}}-{{v}_{i}}^{2}=0 $, 并舍去没有实际意义的负数解, 可以解得涡旋相的旋转半径:
$$ \begin{aligned}[b] r_i =\; & \frac{2b\frac{N}{\pi }d+\sqrt{{{\left( 2b\frac{N}{\pi }d \right)}^{2}}+4{{v}_{i}}^{2}*bN}}{2bN} =\\ & \frac{d+\sqrt{{{d}^{2}}+{{v}_{i}}^{2}{{\pi }^{2}}/\left( bN \right)}}{\pi } \end{aligned} $$ (27) 当$ N\to \infty $时, $ {{v}_{i}}^{2}{{\pi }^{2}}/\left( bN \right)\to 0 $, 因此有
$$ \begin{aligned} r_i=\frac{2}{\pi }d \end{aligned} $$ (28) 此时, 所有无人机绕集群中心做圆周运动, 集群涡旋序参量$ {{V}_{c}}=1 $且集群平移序参量$ {{V}_{m}}=0 $.
经过讨论, 本文得到了一个稳定的涡旋状态解. 在这种状态下, 集群能够实现涡旋状态, 集群中的无人机为绕集群中心点的匀速圆周运动, 并且旋转半径与集群内无人机数目无关, 仅与势能项中设计的平衡距离有关.
(2) 集群平移相态稳定解
在这种情况下, 式(22)具有稳定运动解$ \mathbf{R}= {{\mathbf{V}}_{0}}t+{\mathbf{R}}_{0} $, 其中$ \left\| {{\mathbf{V}}_{0}} \right\|=\sqrt{{{v}_{0}}/\alpha } $, 代入式(14), 有:
$$ \begin{aligned}[b] \delta {{{\ddot{\mathbf{r}}}}_{i}} =\; & -a\left[ \alpha \left( 2\dot{\mathbf{R}}\delta {{{\dot{\mathbf{r}}}}_{i}}+\delta {{{\dot{\mathbf{r}}}}_{i}}^{2} \right) \right]\left( \dot{\mathbf{R}}+\delta {{{\dot{\mathbf{r}}}}_{i}} \right)+\\ & b\sum\limits_{j\in {{N}_{i}}}{\nabla {{U}_{ij}}\left( {{\mathbf{x}}_{ij}} \right)}+\lambda {{\mathbf{F}}_{i}} \end{aligned} $$ (29) 此时具有稳定解$ \delta {{\dot{\mathbf{r}}}_{i}}=0 $, 且$ b\sum\nolimits_{j\in {{N}_{i}}}{\nabla {{U}_{ij}} \left( {{\mathbf{x}}_{ij}} \right)} =0 $. 可以关于无人机位置列出$ 3N $个方程求解无人机集群的$ 3N $个坐标分量, 因此, 能够得到集群中所有无人机的稳定位置, 实现集群的稳定平移运动. 在这种情况下, 集群具有稳定的运动速度, 所有无人机以同样的速度进行直线运动. 此时, 集群平移序参量$ {{V}_{m}}=1 $, 涡旋序参量为$ {{V}_{c}}=0 $.
由上述讨论可知, 集群存在两个运动相态, 涡旋运动相态和平移运动相态, 定理1得证.
当相变控制项的强度$ \lambda \ne 0 $时, 能够通过对无人机集群中的部分无人机施加相变控制项$ \boldsymbol{\Gamma} _{i}^{p} $, 使无人机集群的中心速度发生变化, 进而使集群在平移运动相态和涡旋运动相态之间进行转化. 根据集群中心运动方程(21)可知, 集群中心速度存在两个解, 在稳定状态下, 集群中心速度不会发生变化. 而通过调节无人机个体的相变控制强度, 能够调节集群中心的速度.
当集群处于涡旋运动相态时, 随着集群中心的速度逐渐增大, 无人机相对于集群中心的速度逐渐发生较大的偏差, 在势能梯度项$ \boldsymbol{\Gamma} _{i}^{U} $没有较大变化时, 势能梯度项提供的向心控制项远远超出无人机圆周运动的需要, 因此集群的涡旋相态逐渐消失, 随着集群中心速度的增加, 集群个体的速度逐渐增加, 最终达到一致的平移速度, 随后势能梯度项将集群的所有个体位置控制到平衡位置附近, 实现集群的平移运动相态.
当集群处于平移运动相态时, 随着集群中心速度的逐渐减小, 集群势能项依旧保持在0附近波动, 此时无人机的速度自推进项开始发生作用. 促使单个无人机保持一定的运动速度, 因此, 无人机的速度开始成对变化以保持集群的速度不变, 并在势能梯度项的作用下逐渐变为绕集群中心点的圆周运动.
定理1中, 假设集群的通信拓扑为全连通的, 这个假设对集群稳定解的证明存在一定的影响. 一直到式(22), 全连通假设都没有对结果造成影响. 并且, 对于平移运动模态所对应的稳定解, 全连通假设并不会影响该稳定解的特性. 影响较大的主要是涡旋状态稳定解. 在全连通通信假设条件下, 集群的稳定涡旋解能够通过对集群中所有个体求积分得到; 而如果集群的通信拓扑是非连通的, 不妨讨论一种比较简化的情况, 即假设邻居的选取原则为通信半径范围内的所有邻居, 则此时的积分范围只能是无人机附近通信半径内的个体. 在这种情况下, 一方面积分的对象发生了变化, 需要在以该无人机为圆心的圆中进行积分, 另一方面也需要对不同半径处无人机的分布密度有一定的先验知识, 分析起来较为困难. 因此, 本文引入了全连通假设来简化相应的分析.
4. 仿真实验结果
考虑由$ N $架($ N=45 $) 无人机组成的无人机集群, 在三维空间中生成无人集群中无人机的初始飞行状态, 包括的无人机的空速$ {{V}_{i}} $, 航向角$ {{\psi }_{i}} $, 高度变化率$ {{h}_{i}} $和位置$ {{\mathbf{p}}_{i}}=\left[ {{x}_{i}},\;{{y}_{i}},\;{{z}_{i}} \right]^{\text{T}} $. 其中, 下标$ i $用于区分不同的无人机. 除了高度和高度变化率分别设置为$ {{z}_{i}}=30\,\;\text{m} $和$ {{h}_{i}}=0\,\;\text{m/s} $, 其余飞行状态均为随机生成. 无人机自动驾驶仪的时间常数分别设置为$ {{\tau }_{{{V}_{i}}}}=2\,\;\text{s} $, $ {{\tau }_{{{\psi }_{i}}}}=2\,\;\text{s} $, $ {{\tau }_{{{z}_{i}}}}=2\,\;\text{s} $和$ {{\tau }_{{{h}_{i}}}}=2\,\;\text{s} $. 无人机飞行速度、最大横向载荷和高度变化率限制分别设置为$ {{V}_{\min }}=10\,\;\text{m/s} $, $ {{V}_{\max }}=150\,\;\text{m/s} $, $ {{n}_{\max }}=6\,\;\text{m/}{{\text{s}}^{2}} $, $ {{h}_{\max }}=-5\,\;\text{m/s} $和$ {{h}_{\max }}=5\,\;\text{m/s} $. 仿鸟群相变控制律的控制增益为$ a=1/55 $, $ \alpha = 1/100 $, $ b=1 $, 基准速度$ v_0=20 $, 势能平衡距离$ d=50 $.
4.1 集群稳定运动相态
在集群中不存在相变控制项, 即$ \lambda \left( t \right)=0 $时, 设置无人机集群的位于不同的初始化位置, 进行多次实验.
图2给出了$ N=45 $时某次集群的运动相态变化情况, 集群初始时刻在空间中随机分布. 可以看出, 所提出的控制律在没有相变控制项的情况下, 能够使初始时刻空间中随机分布的无人机集群自发地形成涡旋相态, 整个集群围绕集群的中心点做圆周运动, 并且集群的中心位置几乎没有变化.
图3展示了平移序参量和涡旋序参量两种序参量指标的变化情况. 在初始阶段, 无人机集群的平移序参量和旋转序参量都比较低, 代表集群在运动的一开始处于无序的状态, 没有处于优势的运动相态. 经过一段时间, 集群的旋转序参量开始逐渐上升, 而集群的平移序参量依旧没有太多的变化, 代表集群开始逐渐转变为涡旋状态. 随着系统进一步演化, 最后集群的旋转序参量逐渐趋向于1, 而平移序参量依旧在0左右浮动, 表示集群的运动相态已经达到了涡旋的运动相态, 并且能够稳定保持在该运动相态.
改变初始条件进行多次测试, 集群最终的涡旋序参量均在1附近, 而集群的平移序参量均在0左右波动, 证明集群的涡旋状态是一个比较稳定的运动相态, 集群能够通过控制律(9)和控制律转化式(10)的作用来实现无人机集群从无序到涡旋有序的相态转变.
图4展示了无人机集群中的一个个体从无序到有序过程中的无人机运动速度、航向角速率的变化曲线. 可以发现, 集群在开始阶段, 由于无人机的初始状态是随机分布, 因此其可能会出现比较大的速度变化, 以快速达到所设计的期望速度. 在速度快速下降后, 无人机通过调整自身的航向来适应集群的变化. 在最后, 无人机的速度和航向角变化率均不再出现太大变化, 集群的运动趋于稳定. 除此之外可以看出, 无人机的相应参数满足模型的限制, 验证了本文所设计的相变控制律能够对无人机集群产生有效的控制效果.
调整不同的势能平衡距离, 作出集群圆周运动半径和势能平衡距离关系如图5所示, 图5中圆点为仿真得到的集群平均半径, 直线为式(28)得到的聚集群运动半径理论值, 可以看到, 涡旋半径的仿真值与理论值拟合得很好. 并且随着势能平衡距离的增加, 涡旋半径逐渐符合理论值, 验证了本文方法理论分析的有效性.
4.2 集群相态转换
无人机集群存在两个稳定的运动相态, 涡旋运动相态和平移运动相态, 测试无人机仿鸟群相变控制律能否能够仅调整相变控制项, 完成从一个相态到另外一个相态的转换.
仿真测试每200秒分为一个阶段, 总共分为三个阶段. 在第一阶段, 在空间中随机生成$ N=45 $架无人机, 设置集群相变控制强度为$ \lambda =0 $, 使集群自行演化为涡旋状态.
在第二阶段, 对处于涡旋状态的无人机集群施加一定的相变控制, 设置相变控制强度为$ \lambda =100 $, 集群中有13个无人机个体受到相变控制的作用, 进行集群涡旋相到平移相的相变测试, 使集群形成平移运动相态, 设计具体的相变控制强度$ \lambda $如下:
$$ \begin{aligned} \lambda =\left\{ \begin{aligned} & 100&& \| {\dot{\mathbf{R}}} \| \le 40\ \text{m/s} \\ & 0&& \| {\dot{\mathbf{R}}} \| > 40\ \text{m/s} \end{aligned} \right. \end{aligned} $$ (30) 第三阶段, 在已经形成直线相态的无人机集群中, 根据集群平均运动速度, 简单设计相变控制强度, 进行无人机集群从平移态到涡旋态的仿真实验, 观察集群是否能从平移运动相态转化为涡旋运动相态. 在这一阶段, 设计具体的相变控制强度$ \lambda $如下:
$$ \begin{aligned} \lambda =\left\{ \begin{aligned} & -100&& \| {\dot{\mathbf{R}}} \|>10\ \text{m/s} \\ & 0&& \| {\dot{\mathbf{R}}} \|\le 10\ \text{m/s} \end{aligned} \right. \end{aligned} $$ (31) 仿真的算法流程图如图6所示:
图7给出了仿真过程中集群序参量和集群运动相态的变化情况, 图7(a)中展示了在相变控制项的作用下, 集群能够很快从一个运动相转换到另外一个相态. 图中的虚线标明了相变控制项的作用时间范围.
图 7 集群相态转换结果. (a)集群序参量变化情况(第1、2条垂直虚线之间和第3、4条垂直虚线之间为相变控制项不为0的时间段. 第3、4条虚线由于距离过近在显示上略有重合, 在小图中进行了放大); (b) ~ (f) $t=180,\;205,\;300,\;405,\;500\;\text{s} $时的集群运动相态Fig. 7 Results of phase transition. (a) Order parameter in phase transition process. (b) ~ (f) Group motion phase at $ t=180,\;205,\;300,\;405,\;500\;\text{s}$在第一阶段, 集群初始处于无序的状态, 在相变控制律的作用下逐渐收敛到稳定的涡旋相态; 在第二阶段, 通过相变控制项, 集群中心速度迅速增加, 在增加到$ 40\;\text{m/s} $后, 停止施加相变控制项, 集群能够通过集群相互之间的作用逐渐收敛至稳定的直线运动相态; 在第三阶段, 同样通过相变控制项, 利用部分个体对集群的速度进行控制, 集群中心的速度很快降低. 在速度降低至$ 10\; \text{m/s} $后, 停止施加相变控制项, 集群最终仍然能够回到集群涡旋相态.
从仿真结果中可以看出, 在集群相态转换的过程中, 在无人机相变控制律的作用下, 通过相变控制项的作用, 无人机从各自的位置出发, 不断调整自身的运动状态和周围邻居保持一致, 使集群逐渐从一种有序的运动相态转换到另一种有序运动相态.
图8中展示了三个阶段中集群中心速度的变化曲线, 可以看出, 集群的中心速度在涡旋相态时处于较慢的状态, 集群中心的速度逐渐减小; 而当集群处于较高速度后, 停止集群的相变控制, 无人机集群也能够逐渐收敛到平移运动相态. 通过对集群中部分个体进行控制, 调整集群的平均速度, 实现了无人集群两种稳定相态的转换, 验证了本文所提出的无人机集群相变控制律的有效性.
4.3 相变模型对比
为了体现本文方法的优势, 将本文的算法和何亚琦[33]第六章中提到的社会力控制器进行对比, 将本文提出的相变控制项作用添加到文献的社会力控制器中, 测试集群的稳定运动模态和相态转换能力, 并与本文所提出的相变控制器进行对比.
使用文献第六章中使用的社会力模型, 设计模型参数如下: $ \beta =40/11 $, $ \gamma +\sigma =1/5500 $, $ {{l}_{r}}=400, {{l}_{a}}= 600,\;{{C}_{r}}=1,\;{{C}_{a}}=0.5,\;{{\alpha }_{p}}=50 $. 相变控制项的形式如式(30)(31)所示, 相变控制强度的数值$ \left| \lambda \right|=1000 $. 得到的仿真结果如图9所示.
从图中可以看出, 在社会力控制器作用下, 能够形成一个类似的涡旋状态的圆周运动的运动模态, 并且在本文提出的相变控制项的作用下, 能够实现类涡旋到平移运动模态的转换. 但是, 该控制器相比于本文的相变控制器而言还存在一些不足, 主要有如下两点:
其一, 在所给参数下, 给出的社会力模型的确存在一个类似的涡旋模态, 但是集群中无人机的旋转方向却并不完全一致, 在应用于实际的无人机集群中可能会导致碰撞. 这一点从序参量的变化中也能够看出;
其二, 在使用相变控制项对集群的相态进行控制时, 无人机集群的速度方向并不可控. 在给出一个方向的相变控制作用后, 集群的运动并没有达到一致, 不同个体之间的速度仍然有所差别. 一种可能得原因是由于集群中不同无人机个体的旋转方向不一致, 导致在运动模态转换的过程中与期望的平移运动速度出现了偏移, 形成了不同的运动方向. 因此, 相较于文献[33]给出的社会力模型, 可以认为本文所提出的相变控制器能够比较好地适应无人机集群相变应用场景.
5. 结论
本文针对自由环境中无人机集群的相变控制问题, 设计了基于仿鸟群自推进粒子模型的无人机集群相变控制方法, 通过序参量指标度量无人机集群的运动一致性程度并进而确定集群所处的运动相态, 实现了集群在两种运动相态之间的相互转换. 根据理论证明和仿真结果得出以下结论:
(1) 受现实中鸟群运动规律的启发, 设计了仿鸟群无人机集群相变控制律. 在相变控制律的作用下, 无人机集群在自组织原则的基础上能够形成两种稳定的集群运动相态, 包括平移相态和涡旋相态, 形成无人机集群稳定的一致性运动, 并分析了相关相态的一些重要参数.
(2) 通过调节具有简单形式的相变控制项, 能够仅对集群中部分个体进行控制, 实现集群中两种相态的自由切换, 通过仿真验证了无人机仿鸟群相变控制律的有效性.
-
表 1 主要符号说明
Table 1 Description of main symbols
主要符号 具体含义 $ N_r $ 机器人的数量 ${ S}_{{\rm cov}}^{k}$ 第$ k $个机器人搜索的面积大小 ${ S}_{{\rm cov}}^{\rm rep}$ $ N_r $个机器人重复搜索的面积大小 $ { S}(G(x,\;y)) $ 栅格$ G(x,\;y) $的状态 ${ S}(A(\hat{x},\;\hat{y}))$ 子区域$A(\hat{x},\;\hat{y})$的状态 $ K_{\rm u} $ 未搜索栅格状态标记 $ K_{\rm o} $ 障碍物栅格状态标记 $ K_{\rm c} $ 自由栅格状态标记 $ A $ 神经元活性值衰减速率 $ B $ 神经元活性值上限 $ -D $ 神经元活性值下限 $M_r$ 第$i$个神经元的相邻神经元个数 $\psi_{i}$ AS-BNN第$i$个神经元的活性值 $\psi_{i}'$ AC-BNN第$i$个神经元的活性值 $w_{ij} $ 神经元之间连接权重系数 $I_{i}$ AS-BNN神经元外部输入信号 $I_{i}'$ AC-BNN神经元外部输入信号 $L$ DMPC框架下机器人决策预测步长 $h_{s}(k)$ 机器人在栅格地图下位置状态 $h_{s}'(k)$ 机器人在覆盖地图下位置状态 $A(\hat{x}_g,\;\hat{y}_g)$ 机器人局部最优状态下预测的目标子区域 ${x}_s(k),\;{y}_s(k)$ $k$ 时刻机器人在栅格地图所处位置 $\hat{x}_{s}(k),\;\hat{y}_{s}(k)$ $k$ 时刻机器人在覆盖地图所处位置 $J$ 用于机器人正常搜索状态下搜索路径预测的搜索收益函数 $J_E$ 用于机器人局部最优搜索状态下子区域引导路径预测过程的搜索收益函数 $J_H$ 用于机器人局部最优搜索状态下目标子区域搜索路径预测过程的搜索收益函数 $ J^{(L)} $ 机器人$L$步累积搜索收益函数 $J_c$ 神经元活性值增益函数(搜索路径预测) $J_c'$ 神经元活性值增益函数(子区域引导路径预测) $J_t$ 转弯代价函数 $J_g$ 目标子区域引导函数 $\lambda_1$ 函数$J_c$对应的权重系数 $\lambda_2$ 函数$J_t$对应的权重系数 $\lambda_3$ 函数$J_g$对应的权重系数 表 3 不同机器人数量下4种算法区域搜索性能对比
Table 3 Comparison of area search performance of four algorithms under different number of robots
机器人
数量运动
步数BNN算法[26] A-RPSO算法[12] DCRS算法[6] 本文所提算法 AVE-C STD-C MAX-C MIN-C AVE-C STD-C MAX-C MIN-C AVE-C STD-C MAX-C MIN-C AVE-C STD-C MAX-C MIN-C 2 252 84.047% 0.1375 93.556% 72.111% 82.764% 0.0893 94.000% 64.333% 97.164% 0.0330 100.000% 83.556% 99.564% 0.0062 100.000% 98.778% 4 126 84.592% 0.0737 96.556% 76.333% 85.500% 0.0631 96.111% 65.000% 96.836% 0.0232 99.667% 91.111% 99.656% 0.0039 100.000% 99.111% 6 84 86.290% 0.0843 95.667% 75.556% 88.587% 0.0391 93.778% 82.889% 97.438% 0.0162 99.889% 92.778% 99.596% 0.0070 100.000% 98.778% 8 56 82.489% 0.0712 92.444% 71.333% 88.438% 0.0309 93.333% 80.111% 96.106% 0.0231 99.111% 87.444% 99.428% 0.0057 100.000% 98.889% -
[1] Cao X, Li M Y, Tao Y T, Lu P. HMA-SAR: Multi-agent search and rescue for unknown located dynamic targets in completely unknown environments. IEEE Robotics and Automation Letters, 2024, 9(6): 5567−5574 doi: 10.1109/LRA.2024.3396097 [2] Peng B, Zhang X R, Shang M S. A novel competition-based coordination model with dynamic feedback for multi-robot systems. IEEE/CAA Journal of Automatica Sinica, 2023, 10(10): 2029−2031 [3] Li K, Zhao K, Song Y D. Adaptive consensus of uncertain multi-agent systems with unified prescribed performance. IEEE/CAA Journal of Automatica Sinica, 2024, 11(5): 1310−1312 doi: 10.1109/JAS.2023.123723 [4] Huang J H, Zeng J, Chi X M, Sreenath K, Liu Z T, Su H Y. Velocity obstacle for polytopic collision avoidance for distributed multi-robot systems. IEEE Robotics and Automation Letters, 2023, 8(6): 3502−3509 doi: 10.1109/LRA.2023.3269295 [5] 张方方, 陈波, 班旋旋, 霍本岩, 彭金柱. 基于生物启发神经网络和DMPC的多机器人协同搜索算法. 控制与决策, 2021, 36(11): 2699−2706Zhang Fang-Fang, Chen Bo, Ban Xuan-Xuan, Huo Ben-Yan, Peng Jin-Zhu. Multi-robot cooperative search algorithm based on bio-inspired neural network and DMPC. Control and Decision, 2021, 36(11): 2699−2706 [6] Chen B, Zhang H, Zhang F F, Liu Y H, Tan C, Yu H N, et al. A multirobot distributed collaborative region coverage search algorithm based on Glasius bio-inspired neural network. IEEE Transactions on Cognitive and Developmental Systems, 2023, 15(3): 1449−1462 doi: 10.1109/TCDS.2022.3218718 [7] Chen B, Zhang H, Zhang F F, Jiang Y M, Miao Z Q, Yu H N, et al. DIBNN: A dual-improved-BNN based algorithm for multi-robot cooperative area search in complex obstacle environments. IEEE Transactions on Automation Science and Engineering, DOI: 10.1109/TASE.2024.3379166 [8] Zheng X M, Jain S, Koenig S, Kempe D. Multi-robot forest coverage. In: Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems. Edmonton, Canada: IEEE, 2005. 3852−3857 [9] Pehlivanoglu Y V. A new vibrational genetic algorithm enhanced with a Voronoi diagram for path planning of autonomous UAV. Aerospace Science and Technology, 2012, 16(1): 47−55 doi: 10.1016/j.ast.2011.02.006 [10] Dong W, Liu S S, Ding Y, Sheng X J, Zhu X Y. An artificially weighted spanning tree coverage algorithm for decentralized flying robots. IEEE Transactions on Automation Science and Engineering, 2020, 17(4): 1689−1698 [11] Nair V G, Guruprasad K R. MR-SimExCoverage: Multi-robot simultaneous exploration and coverage. Computers & Electrical Engineering, 2020, 85: Article No. 106680 [12] Dadgar M, Jafari S, Hamzeh A. A PSO-based multi-robot cooperation method for target searching in unknown environments. Neurocomputing, 2016, 177: 62−74 doi: 10.1016/j.neucom.2015.11.007 [13] Zhang J Q, Lin Y X, Zhou M C. Virtual-source and virtual-swarm-based particle swarm optimizer for large-scale multi-source location via robot swarm. IEEE Transactions on Evolutionary Computation, DOI: 10.1109/TEVC.2024.3391622 [14] Tang, H W, Sun W, Yu H S, Lin A P, Xue M. A multirobot target searching method based on bat algorithm in unknown environments. Expert Systems With Applications, 2020, 141: Article No. 112945 doi: 10.1016/j.eswa.2019.112945 [15] Zhou Z W, Luo D L, Shao J, Xu Y, You Y C. Immune genetic algorithm based multi-UAV cooperative target search with event-triggered mechanism. Physical Communication, 2020, 41: Article No. 101103 doi: 10.1016/j.phycom.2020.101103 [16] Yang B, Ding Y S, Jin Y C, Hao K R. Self-organized swarm robot for target search and trapping inspired by bacterial chemotaxis. Robotics and Autonomous Systems, 2015, 72: 83−92 doi: 10.1016/j.robot.2015.05.001 [17] Garg V. E2RGWO: Exploration enhanced robotic GWO for cooperative multiple target search for robotic swarms. Arabian Journal for Science and Engineering, 2023, 48(8): 9887−9903 doi: 10.1007/s13369-022-07438-5 [18] Hou K, Yang Y J, Yang X R, Lai J Z. Distributed cooperative search algorithm with task assignment and receding horizon predictive control for multiple unmanned aerial vehicles. IEEE Access, 2021, 9: 6122−6136 doi: 10.1109/ACCESS.2020.3048974 [19] Dai W, Lu H M, Xiao J H, Zeng Z W, Zheng Z Q. Multi-robot dynamic task allocation for exploration and destruction. Journal of Intelligent & Robotic Systems, 2020, 98: 455−479 [20] Li J, Tan Y. A two-stage imitation learning framework for the multi-target search problem in swarm robotics. Neurocomputing, 2019, 334: 249−264 doi: 10.1016/j.neucom.2019.01.035 [21] Liu B, Wang X P, Zhou W. Multi-UAV collaborative search and strike based on reinforcement learning. Journal of Physics: Conference Series, 2020, 1651 : Article No. 012115 [22] Wang X Y, Fang X. A multi-agent reinforcement learning algorithm with the action preference selection strategy for massive target cooperative search mission planning. Expert Systems With Applications, 2023, 231: Article No. 120643 doi: 10.1016/j.eswa.2023.120643 [23] Hodgkin A L, Huxley A F. A quantitative description of membrane current and its application to conduction and excitation in nerve. The Journal of physiology, 1952, 117(4): 500−544 doi: 10.1113/jphysiol.1952.sp004764 [24] Grossberg S. Contour enhancement, short term memory, and constancies in reverberating neural networks. Studies of Mind and Brain: Neural Principles of Learning, Perception, Development, Cognition, and Motor Control, 1982: 332−378 [25] Luo C M, Yang S X, Stacey D A. Real-time path planning with deadlock avoidance of multiple cleaning robots. In: Proceedings of the IEEE International Conference on Robotics and Automation (Cat. No. 03CH37422). Taiwan, China: IEEE, 2003. 4080−4085 [26] Luo C M, Yang S X, Li X D, Meng M Q H. Neural-dynamics-driven complete area coverage navigation through cooperation of multiple mobile robots. IEEE Transactions on Industrial Electronics, 2017, 64(1): 750−760 doi: 10.1109/TIE.2016.2609838 [27] Sun B, Zhu D Q, Tian C, Luo C M. Complete coverage autonomous underwater vehicles path planning based on Glasius bio-inspired neural network algorithm for discrete and centralized programming. IEEE Transactions on Cognitive and Developmental Systems, 2019, 11(1): 73−84 [28] Muthugala M A V J, Samarakoon S M B P, Elara M R. Toward energy-efficient online complete coverage path planning of a ship hull maintenance robot based on Glasius bio-inspired neural network. Expert Systems With Applications, 2022, 187: Article No. 115940 doi: 10.1016/j.eswa.2021.115940 [29] Zhao L, Li R, Han J D, Zhang J L. A distributed model predictive control-based method for multidifferent-target search in unknown environments. IEEE Transactions on Evolutionary Computation, 2023, 27(1): 111−125 doi: 10.1109/TEVC.2022.3161942 [30] Conte C, Jones C N, Morari M, Zeilinger M N. Distributed synthesis and stability of cooperative distributed model predictive control for linear systems. Automatica, 2016, 69: 117−125 doi: 10.1016/j.automatica.2016.02.009 [31] Qiao K J, Liang J, Yu K J, Yue C T, Lin H Y, Zhang D Z, et al. Evolutionary constrained multiobjective optimization: Scalable high-dimensional constraint benchmarks and algorithm. IEEE Transactions on Evolutionary Computation, 2024, 28(4): 965−979 [32] Grossberg S. Nonlinear neural networks: Principles, mechanisms, and architectures. Neural Networks, 1988, 1(1): 17−61 [33] Ni J J, Yang S X. Bioinspired neural network for real-time cooperative hunting by multirobots in unknown environments. IEEE Transactions on Neural Networks, 2011, 22(12): 2062−2077 doi: 10.1109/TNN.2011.2169808 -
计量
- 文章访问数: 356
- HTML全文浏览量: 151
- 被引次数: 0