2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于磁链在线辨识的异步电机超螺旋滑模控制

谢国超 段纳 万昌晖 臧航

曹凯, 陈阳泉, 魏云博, 刘志, 陈超波, 高嵩. 基于变分稀疏高斯过程的多机器人协同感知与围捕. 自动化学报, 2025, 51(3): 1−14 doi: 10.16383/j.aas.c240406
引用本文: 谢国超, 段纳, 万昌晖, 臧航. 基于磁链在线辨识的异步电机超螺旋滑模控制. 自动化学报, xxxx, xx(x): x−xx doi: 10.16383/j.aas.c240526
Cao Kai, Chen Yang-Quan, Wei Yun-Bo, Liu Zhi, Chen Chao-Bo, Gao Song. Multi-robot collaborative perception and capture based on variational sparse gaussian process. Acta Automatica Sinica, 2025, 51(3): 1−14 doi: 10.16383/j.aas.c240406
Citation: Xie Guo-Chao, Duan Na, Wan Chang-Hui, Zang Hang. Super-twisting sliding mode control for asynchronous motor based on rotor flux online identification. Acta Automatica Sinica, xxxx, xx(x): x−xx doi: 10.16383/j.aas.c240526

基于磁链在线辨识的异步电机超螺旋滑模控制

doi: 10.16383/j.aas.c240526 cstr: 32138.14.j.aas.c240526
基金项目: 国家自然科学基金项目(62173166), 江苏省研究生科研与实践创新计划项目(KYCX24_3061)资助
详细信息
    作者简介:

    谢国超:江苏师范大学电气工程及自动化学院硕士研究生.主要研究方向为异步电机无速度传感器控制. E-mail: Leorisc@163.com

    段纳:江苏师范大学电气工程及自动化学院教授. 主要研究方向为非线性系统控制理论及应用. 本文通信作者. E-mail: duanna08@163.com

    万昌晖:江苏师范大学电气工程及自动化学院硕士. 主要研究方向为异步电机自抗扰控制. E-mail: wch122320@163.com

    臧航:无锡信捷电气股份有限公司电机控制算法工程师. 主要研究方向为大功率电机控制. E-mail: ralph010216@gmail.com

Super-twisting Sliding Mode Control for Asynchronous Motor Based on Rotor Flux Online Identification

Funds: Supported by National Natural Science Foundation of China(62173166) and Jiangsu Province Postgraduate Research and Practice Innovation Programme(KYCX24_3061)
More Information
    Author Bio:

    XIE Guo-Chao Master student at the School of Electrical Engineering & Automation, Jiangsu Normal University. His main research focus is on sensorless speed control of asynchronous motors

    DUAN Na Professor at the School of Electrical Engineering & Automation, Jiangsu Normal University. Her main research focus is on nonlinear system control theory and applications. Corresponding author of this article

    WAN Chang-Hui Master's degree from the School of Electrical Engineering & Automation, Jiangsu Normal University. His main research focus is on active disturbance rejection control for asynchronous motors

    ZANG Hang Motor Control Algorithm Engineer at Wuxi Xinje Electric Co., Ltd. His main research focus is on the control of high-power motors

  • 摘要: 研究了基于磁链在线辨识的异步电机超螺旋滑模控制问题. 针对异步电机, 设计了一种改进的超螺旋滑模速度控制器 (Improved super-twisting sliding mode speed controller, IMSTSMC), 提升了系统的动态响应性能. 为抑制算法中符号函数高频切换所引起的系统抖振问题, 构造了一种可变指数切换函数. 进一步地, 考虑到转子磁链受惯性延迟的影响, 设计了磁链在线观测器 (Flux online observer, FOO), 可辨识转子磁链幅值, 提升系统的控制精度和参数鲁棒性. 数值仿真和实验结果验证了所提算法的可行性和有效性.
  • 由于单体机器人处理复杂任务的能力通常被认为是有限的, 而群体机器人系统由于其可协作的特殊性, 能够完成更为复杂的任务[1], 因此常被应用于协同围捕的研究中, 其核心是多个个体能力有限的机器人通过协同以完成对危险目标的捕获或控制. 然而, 传统的研究对于围捕目标的位置信息往往都是先验已知的, 只需驱动相应的算法对目标实现包围即可完成任务[2-3]. 但是面对目标位置未知的污染源时, 机器人需要对所处环境进行感知, 搜索目标源所发出的场源信息, 进而完成围捕任务. 如在战场环境中用多个小型无人机对移动电台进行探测和定位, 或者用多个移动机器人对丢失的放射性污染源进行寻找. 因此, 本文主要关注在围捕目标位置信息未知的情况下, 通过机器人协同感知环境信息主动获取围捕目标位置点, 完成围捕任务的问题, 从而为最终的捕获和处置奠定基础.

    针对多机器人协同感知源定位的问题, 目前已经有广泛的研究. 以多机器人为载体的集群感知研究主要有密度梯度[4]、信息熵[5-6]或贝叶斯[7-8]等基础方法. 许多研究者在基础的方法上进行了改进, Jabeen等[9]提出一种基于梯度策略和概率方法相结合的元启发式算法, 对污染源进行感知定位, 其中的梯度方法用于无人机的导航和跟踪, 而概率搜索则用于估计污染源的位置, 两种方法的结合极大地减少了无人机感知搜索源的时间与区域. 但梯度方法容易陷入局部最优解, 特别是在复杂的环境中, 可能导致机器人无法找到全局最优解, 从而影响感知与定位的准确性和效率. 因此, 一些学者使用深度强化学习方法来指导机器人的运动. 在不依赖先验地图的条件下, 让机器人与环境进行交互感知, 通过探索和利用环境反馈来学习最佳的污染源定位策略. Li等[10]提出一种基于深度强化学习的室内气味源定位方法, 该方法将气味源定位问题建模为马尔可夫决策过程, 并设计状态空间、动作空间和密集奖励来解决稀疏奖励问题, 最后通过近端策略优化(Proximal policy optimization, PPO)算法来生成机器人的最优决策. 该方法尽管在室内模拟环境中有效, 但其在室外环境或其他复杂场景下的泛化能力尚未得到充分测试, 算法在现实世界快速变化环境中的适应性和稳定性有限. Latif等[11]设计了一种全新的源搜索方法, 即粒子簇-深度Q网络(Particle cluster-deep Q-network, PC-DQN), 首次将深度强化学习(Deep reinforcement learning, DRL)技术作为源搜索方法.具体来说, 搜索过程被表述为部分可观察的马尔可夫决策过程, 然后根据置信状态(由粒子滤波器表示)转换为马尔可夫决策过程. PC-DQN利用基于密度的噪声应用空间聚类(Density-based spatial clustering of applications with noise, DBSCAN)算法提取置信状态特征, 并采用深度Q网络(Deep Q-network, DQN)算法为源搜索任务寻找最优策略, 其中还引入了迁移学习概念, 将训练有素的Q网络重用到新场景中. 然而PC-DQN方法的不足之处在于DQN算法通常需要大量的计算资源, 特别是在处理高维状态空间时, 会导致其搜索性能在实时或快速响应的应用场景中受到限制. Liao等[12] 提出一种无模型梯度自适应极值寻距控制(Gradient adaptive extremum seeking control, GA-ESC)算法, 以提高气味源定位(Odor source localization, OSL)的搜索效率和成功率. GA-ESC算法通过控制器规划OSL, 控制器估计气味羽流浓度的梯度, 并根据估计的梯度引导机器人接近气味源. 采用自适应反馈增益将估计梯度与输出控制量联系起来, 从而获得更稳定的气味场梯度. 随后, 引入了扰动幅度调整(Perturbation amplitude adjustment, PAA)策略, 以增强全局搜索能力. 但以上三种方法实验场景单一, 算法的适应性、实时性以及鲁棒性也有待提高.

    在感知到围捕目标的位置信息之后, 需要采取相应的策略对目标点进行围捕, 目前已存在许多有关围捕的方法, 其中包括强化学习[13-14]、人工势场[15]和Voronoi划分[16-17]等方法. 强化学习的围捕方法能够自主学习并处理复杂的多机器人围捕任务, 同时具有长期规划的能力. Li等[18]研究了一种基于深度强化学习的多无人机协同围捕算法, 提出一种新的多无人机智能决策控制方法, 使多无人机能够在复杂环境中实现协同决策和围捕, 但该方法缺少实际的无人机应用考虑. 而利用人工势场的围捕方法则是一种基于局部信息的路径规划技术, 它通过在目标点周围构建引力势场和在障碍物周围构建斥力势场来引导机器人的运动. 这种方法简单、高效, 但存在一些局限性, 如容易陷入局部最优解或与障碍物碰撞等. 为了解决这些问题, Zhao等[19]研究了一种基于动态速度势场的协同围捕算法, 利用一种新的吸引和排斥模型, 通过引入速度信息, 使机器人倾向于选择更短且安全的路径.但是该方法的实时性和在真实环境中对多目标的处理方面还有待提高. Fu等[20]则利用人工势函数解决了为围捕者制定合作策略并为被围捕者制定边界限制的问题, 在追围捕者之间引入动态排斥力以增强其合作能力, 提升了任务处理的实时性, 但该策略在计算上较为复杂, 限制了它们在资源受限的移动机器人平台上的实时应用. 受到Voronoi图的启发, 基于Voronoi的围捕策略具有灵活性高和鲁棒性强的优点. Tian等[21]则提出了一种基于缓冲Voronoi区域的贪婪追捕策略, 使多个追击者能够在障碍物环境中完成对逃逸者的捕获, 但该方法仅适用于二维场景和单个目标的场景. 针对此问题, Cao等[22]提出了一种全向最小体积3D-Voronoi算法, 将环境扩展到了三维场景, 同时利用最小体积策略实现了对动态目标和多目标的围捕. 但上述的围捕方法都没有考虑围捕者可以感知目标发出的场信息, 并逆向搜索的围捕方案. 我们采用了6个指标对捕获的类型进行分类: 单个或多个机器人; 单个或多个目标; 动态或静态目标; 2D或3D; 是否感知场源信息以及是否有实验验证. 指标和主要相关工作见表1.

    表 1  分类指标及相关工作
    Table 1  The criteria classification and related work
    分类指标[18][19][20][21][22]本文方法
    围捕机器人数量多机器人多机器人多机器人多机器人多机器人多机器人
    被围捕目标源数量单目标源单目标源单目标源单目标源多目标源多目标源
    2D/3D环境2D3D2D2D3D3D
    动态/静态目标源动态动态动态动态动态动态
    是否感知场源信息
    是否有实验验证
    下载: 导出CSV 
    | 显示表格

    因此, 本文提出了一个新的框架, 采用变分稀疏高斯过程回归的分布式学习感知与围捕算法, 考虑障碍物的影响, 引入分离超平面的质心维诺划分算法为机器人动态规划任务区域并探索和获取环境信息, 并通过变分自由能方法来近似模型的后验分布, 完成对未知环境的感知, 同时结合粒子群优化(Particle swarm optimization, PSO)算法最终成功实现均匀围捕. 机器人是通过自主决策来完成既定任务, 总体框架如图1所示.

    图 1  总体框架概述
    Fig. 1  Overview of the overall framework

    本文其余部分的结构如下: 第1节介绍了多机器人安全编队控制的基本理论; 第2节提出一种基于变分稀疏高斯过程回归的多机器人环境感知算法, 并通过构造Lyapunov函数证明系统的稳定性; 第3节对本文所用的围捕策略进行了介绍; 第4节给出了相应的仿真结果, 并进行了分析; 第5节通过设置无人机实验验证了算法的有效性; 结论见第6节.

    维诺划分是一种环境区域的划分方式, 利用两个相邻点间直线的垂直平分线构成维诺区域的边界. 每个维诺区域内的点到当前生成点的距离都小于到其他生成点的距离, 因此整个区域被划分为若干个子区域, 每个机器人负责其对应维诺分区内的任务. 在环境$ \mathbf{Q} \subseteq \mathbf{R}^N $中, 设$ {\boldsymbol{E}}=\left\{{\boldsymbol{e}}_1,\; {\boldsymbol{e}}_1,\; \cdots,\; {\boldsymbol{e}}_n\right\} $ 是$ n $个机器人集合, $ {\boldsymbol{P}}=\left\{{\boldsymbol{p}}_1,\; {\boldsymbol{p}}_2,\; \cdots,\; {\boldsymbol{p}}_n\right\} $ 是机器人的位置集合, $ {V}=\left\{{V}_1,\; {V}_2,\; \cdots,\; {V}_n\right\} $为区域内的维诺区域集合. 维诺区域的定义如下:

    $$ \mathcal{V}_i=\left\{{\boldsymbol{p}} \in Q\left\|{\boldsymbol{q}}-{\boldsymbol{p}}_i\right\| < \left\|{\boldsymbol{q}}-{\boldsymbol{p}}_j\right\|,\; \forall j \neq i\right\} $$ (1)

    其中, $ {\boldsymbol{p}}_i $, $ {\boldsymbol{p}}_j $表示维诺区域的生成点, 即机器人的位置, $ {V}_i $代表由$ {\boldsymbol{p}}_i $划分出的维诺区域, $ i,\; j= 1,\; \cdots, n,\; $ $ {\boldsymbol{q}} $表示环境$ \mathbf{Q} $中的任意一点. $ \|\cdot\| $ 表示$ \mathbf{R}^N $ 上的欧几里得范数. 而质心维诺划分是一种特殊的维诺划分, 它的生成点与区域的质心重合. 相较于维诺划分, 它的每个区域大小较为均衡, 这有利于将每个机器人合理分布在各自的空间中. 可以通过改变密度函数改变质心的位置, 从而驱动机器人前往指定位置. 在给定密度函数$ \rho $ 时, 区域覆盖的目标函数为:

    $$ J{\boldsymbol{_p}}=\sum\limits_{i=1}^n \int_{\nu_i}\left\|{\boldsymbol{q}}-{\boldsymbol{p}}_i\right\|^2 \rho({\boldsymbol{q}}) d {\boldsymbol{q}} $$ (2)

    根据惯性理论, 维诺区域的质量$ M_{\nu_i} $和质心$ {\boldsymbol{C}}_{\nu_i} $可以表示为:

    $$ M_{\nu_i}=\int_{\nu_i} \rho({\boldsymbol{q}}) d {\boldsymbol{q}},\; {\boldsymbol{C}}_{\nu_i}=\frac{1}{M_{\nu_i}} \int_{\nu_i} {\boldsymbol{q}} \rho({\boldsymbol{q}}) d {\boldsymbol{q}} $$ (3)

    此外, 第$ i $个机器人的极转动惯量表示为:

    $$ J_{\nu_{{\boldsymbol{p}}_i}}=\int_{\nu_i}\left\|{\boldsymbol{q}}-{\boldsymbol{p}}_i\right\|^2 \rho({\boldsymbol{q}}) d {\boldsymbol{q}} $$ (4)

    根据平行移轴定理, 知道一个物体相对于一个轴的转动惯量及物体的质心相对于这个轴的位置, 当物体相对于轴的位置变化时就可以得到物体相对于新轴的转动惯量. 则式(4)进一步可以表示为:

    $$ J_{\nu_{{\boldsymbol{p}}_i}}=J_{\nu_{{\boldsymbol{c}}_i}}+M_{\nu_i}\left\|{\boldsymbol{p}}_i-{\boldsymbol{C}}_{\nu_i}\right\|^2 $$ (5)

    式中$ J_{\nu_{{\boldsymbol{c}}_i}} $ 为Voronoi区域$ \nu_i $ 围绕其质心的极转动惯量.

    由上式可以推出$ J{\boldsymbol{_p}} $ 的另一种形式为:

    $$ J{\boldsymbol{_p}}=\sum\limits_{i=1}^n J_{\nu_{{\boldsymbol{c}}_i}}+\sum\limits_{i=1}^n M_{\nu_i}\left\|{\boldsymbol{p}}_i-{\boldsymbol{C}}_{\nu_i}\right\|^2 $$ (6)

    则$ J{\boldsymbol{_p}} $ 的导数为:

    $$ \frac{\partial J{\boldsymbol{_p}}}{\partial {\boldsymbol{p}}_i}=2 M_{\nu_i}\left({\boldsymbol{p}}_i-{\boldsymbol{C}}_{\nu_i}\right) $$ (7)

    控制律表达式为:

    $$ {\boldsymbol{u}}_i=2 K_i M_{\nu_i}\left({\boldsymbol{p}}_i-{\boldsymbol{C}}_{\nu_i}\right) $$ (8)

    其中, $ K_i $ 是一个正定增益矩阵, 一般为单位阵.

    当机器人位于质心时, 系统的代价函数最小:

    $$ {\boldsymbol{C}}_{\nu_i}=\arg \min J\left({\boldsymbol{p}}_1,\; \cdots,\; {\boldsymbol{p}}_n\right)=\frac{\int_{\nu_i} {\boldsymbol{q}} \rho({\boldsymbol{q}}) d {\boldsymbol{q}}}{\int_{\nu_i} \rho({\boldsymbol{q}}) d {\boldsymbol{q}}} $$ (9)

    其中, $ {\boldsymbol{C}}_{\nu_i} \subseteq \mathbf{R}^N $也表示每个维诺区域$ \nu_i $的质心.

    支持向量机(Support vector machine, SVM)是一种监督学习算法, 一般用于分类和回归分析. 它的主要思想是找到一个最优的超平面来区分不同类别的数据点, 同时最大化分类边界. 文献[17]基于机器人位置等周围环境信息, 通过支持向量机来构建一个分离超平面模型, 并对质心维诺划分算法产生的Voronoi区域进行二次约束, 以保证机器人能够选择沿着安全区域移动的路径. 给定位置点$ p_i $ 和$ p_j $, 则两个机器人之间的超平面可以通过下面的线性分割器来描述:

    $$ {\boldsymbol{a}}_{i j}^{\rm{T}} {\boldsymbol{p}}+b_{i j}=0 $$ (10)

    其中, $ {\boldsymbol{p}} \subseteq \mathbf{R}^N $, $ {\boldsymbol{a}}_{i j} $ 为决定超平面方向的法向量; $ b_{i j} $ 为距离项, 决定了超平面与原点之间的距离. 显然, 划分超平面可被法向量$ {\boldsymbol{a}}_{i j} $ 和位移$ b_{i j} $ 确定, 记为$ \left({\boldsymbol{a}}_{i j},\; b_{i j}\right) $.

    因此, 任务区域被分割为两部分: $ \mathcal{V}_{b,\; i}=\{{\boldsymbol{p}} \subseteq \mathbf{R}^N: {\boldsymbol{a}}_{i j}^{\rm{T}} {\boldsymbol{p}} < b_{i j}\},\; \mathcal{V}_{b,\; j}=\{{\boldsymbol{p}} \subseteq \mathbf{R}^N: {\boldsymbol{a}}_{i j}^{\rm{T}} {\boldsymbol{p}} > b_{i j}\} $. 为了让机器人避开路径中的障碍物, 同样采用分离超平面的方法来构造约束Voronoi区域. 设置障碍物的顶点集合为$ \mathcal{{\boldsymbol{O}}}_m=\{{\boldsymbol{o}}_1,\; {\boldsymbol{o}}_2,\; \cdots,\; {\boldsymbol{o}}_m\} $, 并通过计算机器人$ {\boldsymbol{p}}_i $ 与障碍物顶点集合$ \mathcal{{\boldsymbol{O}}}_m $ 的最佳分离超平面来分离两种不同的样本点.

    机器人与障碍物之间的约束Voronoi区域可以表示为:

    $$ \mathcal{V}_{{\boldsymbol{o}},\; i}=\left\{{\boldsymbol{p}} \subseteq \mathbf{R}^N: {\boldsymbol{a}}_{i {\boldsymbol{o}}}^{\rm{T}} {\boldsymbol{p}} < b_{i {\boldsymbol{o}}},\; i \in n\right\} $$ (11)

    图2所示, 在同时考虑机器人与机器人之间的分离超平面和机器人与障碍物之间的分离超平面时, Voronoi区域可以被表示为:

    $$ \begin{split} \mathcal{V}_i=\;&\{{\boldsymbol{p}} \subseteq \mathbf{R}^N: {\boldsymbol{a}}_{i j}^{\rm{T}} {\boldsymbol{p}} < b_{i j},\; \forall j \neq i,\; i,\; j \in n \\ &{\boldsymbol{a}}_{i {\boldsymbol{o}}}^{\rm{T}} {\boldsymbol{p}} < b_{i {\boldsymbol{o}}}\} \end{split} $$ (12)
    图 2  避碰维诺单元
    Fig. 2  Collision avoidance Voronoi unit

    在面对未知环境进行多机器人协同感知与围捕任务时, 环境的不确定性和动态变化对机器人的感知能力提出了更高的要求. 为了提高机器人对环境中污染源的感知精度并有效处理大量数据, 本文采用变分稀疏高斯过程回归(Variational sparse gaussian process regression, VS-GPR)作为核心算法. 高斯过程回归是一种基于概率的非参数化方法, 能够提供关于未知区域的可靠预测和不确定性估计, 而变分稀疏高斯过程回归则是通过变分推断来近似高斯过程的后验分布, 进一步增强了其在大规模数据环境感知问题上的应用能力.

    近年来, 稀疏高斯过程回归方法快速发展, 其核心思想是利用稀疏的诱导点来近似完整的高斯过程模型. 考虑到环境感知问题所需的实时性, 其需要较快的计算速度和较高的预测精度要求, 本文将基于变分稀疏高斯过程回归方法来训练模型, 并以此来指导机器人的运动.

    变分自由能(Variational free energy, VFE)是一种高效的变分推断技术, 它的核心是以变分推断的方式近似后验分布. 通过最小化变分分布与真实后验分布之间的库勒贝克-莱布勒(Kullback-leibler, KL)散度来优化模型参数, 调整变分分布来减少模型对训练数据中噪声和异常值的过度适应, 而不是直接对数据进行拟合, 从而在很大程度上解决了先验近似中存在的过拟合问题, 近似后验分布会更加趋于真实后验分布. 首先, 将后验分布参数化为一组诱导点, 并以最小化变分分布与真实后验分布之间的KL散度为目标进行优化. 这一过程中, 通过调整诱导点的位置, 逐步使变分分布逼近真实后验分布, 从而降低计算复杂度. 下面是对变分稀疏高斯过程回归理论的具体介绍.

    在变分稀疏高斯过程回归中引入一组诱导点来近似整个数据集, 这些诱导点用于构建一个稀疏的高斯过程, 从而减少计算复杂度. 设置诱导点集合为$ \mathbf{Z}=\{z_i\}_{i=1}^M $, 对应的函数值$ {\boldsymbol{u}}=\{u_i\}_{i=1}^N= \{{\boldsymbol{f}}(z_i)\}_{i=1}^N $. 假设在给定这些诱导点之后, 预测点与训练样本条件独立, 即:

    $$ p_r\left({\boldsymbol{f_*}} | y\right)=\int p_r\left({\boldsymbol{f_*}} | {\boldsymbol{u}}\right) p_r({\boldsymbol{u}} | y) d {\boldsymbol{u}} $$ (13)

    通过式(13)可以得到新的预测点的概率分布. 其中$pr({\boldsymbol{f}}*|y) $为在给定观测数据$y $的条件下, 新的预测点函数值$ {\boldsymbol{f}}* $的后验概率密度, $ p_r\left({\boldsymbol{u}}| y\right) $为诱导点函数值在给定观测数据$ y $时的后验分布. 积分号表示在$ {\boldsymbol{u}} $的全定义域上对其进行积分.

    在得到新的预测点概率分布之后, 为了有效估计模型的对数似然, 通过 Jensen 不等式, 计算对数边缘似然的下界:

    $$ \begin{split} \ln &p_r(y) = \ln \int p_r(y | {\boldsymbol{f}},\; {\boldsymbol{u}}) p_r({\boldsymbol{f}},\; {\boldsymbol{u}}) d {\boldsymbol{f}} d {\boldsymbol{u}}= \\ & \ln \int p_r(y | {\boldsymbol{f}},\; {\boldsymbol{u}}) p_r({\boldsymbol{f}},\; {\boldsymbol{u}}) \frac{q({\boldsymbol{f}},\; {\boldsymbol{u}})}{q({\boldsymbol{f}},\; {\boldsymbol{u}})} d {\boldsymbol{f}} d {\boldsymbol{u}} \geq\\& \int q({\boldsymbol{f}},\; {\boldsymbol{u}}) \ln \frac{p_r(y | {\boldsymbol{f}},\; {\boldsymbol{u}}) p_r({\boldsymbol{f}},\; {\boldsymbol{u}})}{q({\boldsymbol{f}},\; {\boldsymbol{u}})} d {\boldsymbol{f}} d {\boldsymbol{u}} \end{split} $$ (14)

    其中$Pr(y|{\boldsymbol{f}}, {\boldsymbol{u}}) $表示在给定函数值$ f $和$ u $的条件下, 观测数据$ y $的条件概率, 这里的$ f $是原始高斯过程模型中的函数值. 式(14)的目标是找到最佳的变分分布使其尽可能接近真实的后验分布$ pr(f,u|y) $, 从而进行准确的预测和不确定性估计, $ q({\boldsymbol{f}},\; {\boldsymbol{u}}) $ 称为变分分布. 当$ q({\boldsymbol{f}},\; {\boldsymbol{u}})\;=\;p_r({\boldsymbol{f}}, \, {\boldsymbol{u}} | y) $时, 等号成立.

    设定$ q({\boldsymbol{f}},\; {\boldsymbol{u}}) $ 的形式为:

    $$ q({\boldsymbol{f}},\; {\boldsymbol{u}})=p_r({\boldsymbol{f}} | {\boldsymbol{u}}) \phi({\boldsymbol{u}}) $$ (15)

    当$ q({\boldsymbol{f}},\; {\boldsymbol{u}}) $ 趋于$ p_r({\boldsymbol{f}},\; {\boldsymbol{u}} | {\boldsymbol{y}})时,\; \phi({\boldsymbol{u}}) \approx p_r({\boldsymbol{u}} | y) $, 同时$ p_r({\boldsymbol{f}} | {\boldsymbol{u}}) \approx p_r({\boldsymbol{f}} | {\boldsymbol{u}},\; y) $.

    消去对数中分子分母的$ p_r({\boldsymbol{f}} | {\boldsymbol{u}}) $, 得到:

    $$ \begin{split} &\ln p_r(y) \geq \int p_r({\boldsymbol{f}} | {\boldsymbol{u}}) \phi({\boldsymbol{u}}) \\ &\ln \frac{p_r(y | {\boldsymbol{f}}) p_r({\boldsymbol{u}})}{\phi({\boldsymbol{u}})} d {\boldsymbol{f}} d {\boldsymbol{u}}\triangleq F_V(Z,\; \phi) \end{split} $$ (16)

    其中, $ F_V(Z,\; \phi) $ 为目标函数. 通过优化诱导点的位置$ \mathbf{Z} $. 以及变分分布$ \phi({\boldsymbol{u}}) $ 来最大化$ F_V(Z,\; \phi) $. 当等号成立时, $ \mathrm{ln}p_r(y)\;=\;F_V(Z,\; \phi),\; q(\boldsymbol{f},\; \boldsymbol{u})\;=\;p_r(\boldsymbol{f},\; \boldsymbol{u}|y), \phi(\boldsymbol{u})=p_r(\boldsymbol{u}|y),\; p_r(\boldsymbol{f}|\boldsymbol{u},\; y)=p_r(\boldsymbol{f}|\boldsymbol{u}) $.

    进一步计算最优$ \phi({\boldsymbol{u}}) $ 的解析解:

    $$ \phi({\boldsymbol{u}})=\mathcal{N}\left(\sigma^{-2} K_Z \Sigma K_{Z X} y,\; K_Z \Sigma K_Z\right) $$ (17)

    其中, $ \Sigma $是在变分高斯过程中用于计算变分分布参数的一个矩阵, $ \Sigma=\left[K_Z+\sigma^{-2} K_{Z X} K_{X Z}\right]^{-1} $. 将最优$ \phi({\boldsymbol{u}}) $ 代人$ F_V(Z,\; \phi) $ 可得:

    $$ F_v(Z)=\ln \left[\mathcal{N}\left(0,\; {\boldsymbol{\sigma}}^2 Q_X+I_N\right)\right]-\frac{1}{2 {\boldsymbol{\sigma}}^2} \operatorname{Tr}(\tilde{K}) $$ (18)

    其中, $ K_Z $是$ \mathbf{Z} $空间的核函数矩阵, 衡量了$ \mathbf{Z} $空间中各个数据之间的相似程度. $ K_{Z X} $是$ X $和${\bf{ Z}} $空间的交叉核函数矩阵, 反映了$ X $空间(原始数据空间)中的数据点与$ \mathbf{Z} $空间的诱导点之间的相似度, $ K_{X Z} $为$ K_{Z X} $的转置. $ Q_X\,=\,K_{X Z}K_Z^{-1}K_{Z X},\; \tilde{K}\,=\, K_X- K_{X Z} K_Z^{-1} K_{Z X} $.

    优化完成之后, 可利用$ \phi({\boldsymbol{u}}) $ 进行预测:

    $$ p_r\left({\boldsymbol{f}}_* | y\right)=\mathcal{N}\left({\boldsymbol{m_*}},\; {\boldsymbol{\sigma_*}}^2\right) $$ (19)

    计算均值与方差的解析解:

    $$ {\boldsymbol{m_*}}={\boldsymbol{\sigma}}^{-2} k_{* Z} \Sigma K_{Z X} y \\ $$ (20)
    $$ {\boldsymbol{\sigma_*}}^2=k_*-k_{* Z} K_Z^{-1} k_{Z^*}+k_{* Z} \Sigma k_{Z^*} $$ (21)

    其中, $ k_{* Z}=k\left(x_*,\; Z\right),\; k_{Z *}=k\left(Z,\; x_*\right) $.

    VFE方法通过在模型中引入稀疏性, 即只保留部分数据点的信息, 来实现对于大规模数据集的有效建模和预测, 其训练时间复杂度为$ {\rm O}(N M^2) $, 预测时间复杂度为$ {\rm O}(M^2) $.

    本节提出一种环境感知方法, 以质心维诺划分为基本框架, 利用机器人在环境中的移动获取先验信息, 并通过更新变分稀疏高斯过程回归模型来得到预测的全局的密度函数模型, 最后引导机器人寻找未知环境中的污染源位置.

    首先作出以下假设:

    假设 1. 现有$ n $个机器人在有界区域$ \mathbf{Q} \subseteq \mathbf{R}^N $ 中执行环境感知任务, 其中密度函数在初始阶段是未知的.

    假设 2. $ n $个机器人之间始终保持通信, 忽略通信延迟.

    传统CVT算法下的多机器人控制受限于密度函数, 机器人对高密度区域具有更高的兴趣. 在未知环境下的感知任务中则需要机器人覆盖更多的区域以便寻找到污染源的位置. 在自适应采样中, 信息熵方法表现出良好的性能. 熵能够量化不确定性的高低, 较高的熵值指示了模型对环境的不确定性较大, 需要更多的信息来减少不确定性. 因此, 通过将模型误差方差的熵作为权重, 鼓励机器人探索那些信息量较少(即误差方差较大)、模型预测不确定性较高的区域, 而不是仅仅停留在已经探索过的或信息量较多的区域. 这种策略有助于机器人从全局角度进行探索, 不会过早地集中在某个局部区域, 从而能够避免机器人陷入局部最优解. 熵在信息论上定义为:

    $$ H(\sigma)=\sigma^2 \ln \sigma^2 $$ (22)

    其中, $ \sigma $ 表示预测模型的后验方差.

    CVT算法的代价函数可以被重新表示为:

    $$ J_e=\sum\limits_{i=1}^n \int_{\nu_i}[\varepsilon({\boldsymbol{q}})+H(\sigma)]\left\|{\boldsymbol{q}}-{\boldsymbol{p}}_i\right\|^2 d {\boldsymbol{q}} $$ (23)

    其中, $ \varepsilon({\boldsymbol{q}}) $ 表示维诺区域中点的预测浓度值.

    信息熵的引入使得机器人产生了探索和开发之间的权衡, 当机器人识别到未探索区域时, 会增加对未探索区域的权重. 因此, 信息熵的引入有助于CVT算法更快的完成感知覆盖, 同时能够降低模型的误差.

    $$ \begin{split} &M_{\nu_i}=\int_{\nu_i} \rho({\boldsymbol{q}}) d {\boldsymbol{q}}+\int_{\nu_i} \sigma^2 \ln \sigma^2 d {\boldsymbol{q}} \\ &{\boldsymbol{C}}_{\nu_i}=\frac{1}{M_\rho} \int_{\nu_i} {\boldsymbol{q}} \rho({\boldsymbol{q}}) d {\boldsymbol{q}}+\frac{1}{M_{H(\sigma)}} \int_{\nu_i} {\boldsymbol{q}} \sigma^2 \ln \sigma^2 d {\boldsymbol{q}} \end{split} $$ (24)

    其中, $ M_\rho=\int_{\nu_i} \rho({\boldsymbol{q}}) d {\boldsymbol{q}},\; M_{H(\sigma)}=\int_{\nu_i} \sigma^2 \ln \sigma^2 d {\boldsymbol{q}} $.

    因此, 维诺区域的质心由密度质心和不确定性质两部分构成.

    机器人的位置控制律可以更新为:

    $$ \dot{{\boldsymbol{p}}}_i=-k_p\left({\boldsymbol{p}}_i-{\boldsymbol{C}}_{\nu_i}\right) $$ (25)

    其中, $ k_p $ 表示常数, 用于调整机器人的步长, 以防止机器人移动过快.

    为了验证控制器的稳定性, 选择Lyapunov函数为:

    $$ V=\sum\limits_{i=1}^n \int_{\nu_i} \frac{k_1}{2}\left\|{\boldsymbol{q}}-{\boldsymbol{p}}_i\right\|^2 f({\boldsymbol{q}}) d {\boldsymbol{q}} $$ (26)

    其中, $ f({\boldsymbol{q}})=\varepsilon({\boldsymbol{q}})+H(\sigma) $, $ k_1 $为正常数.

    对其求导可得:

    $$ \dot{V}=\sum\limits_{i=1}^n \int_{\nu_i} k_1\left({\boldsymbol{q}}-{\boldsymbol{p}}_i\right)^{\rm{T}} f({\boldsymbol{q}}) d {\boldsymbol{q}} \dot{{\boldsymbol{p}}}_i $$ (27)

    将$ \dot{{\boldsymbol{p}}}_i $ 代入控制器, 则$ \dot{V} $ 变为:

    $$ \begin{split} \dot{V} =\;& \sum\limits_{i=1}^n \int_{V_i} k_1\left({\boldsymbol{q}}-{\boldsymbol{p}}_i\right)^{\rm{T}} f({\boldsymbol{q}}) d {\boldsymbol{q}}\left[k_p\left({\boldsymbol{C}}_{V_i}-{\boldsymbol{p}}_i\right)\right]= \\ & \sum\limits_{i=1}^n-k_1 M_{\nu_i}\left({\boldsymbol{C}}_{V_i}-{\boldsymbol{P}}_i\right)^{\rm{T}} k_p\left({\boldsymbol{C}}_{V_i}-{\boldsymbol{p}}_i\right) =\\ & -k_1 k_p \sum\limits_{i=1}^n M_{\nu_i}\left\|{\boldsymbol{C}}_{\nu_i}-{\boldsymbol{p}}_i\right\|^2 < 0\\[-1pt] \end{split} $$ (28)

    已知$ k_1 $ 和$ k_p $ 为正值, $ M_{\nu_i} $为正值, 那么$ \dot{V} \leq 0 $.

    由于$ \dot{V} \leq 0 $, 根据$ \mathrm{LaSalle} $的不变性原理, 可以得出系统收敛于$ \Omega $中的最大不变性集.

    考虑一个有界的凸任务区域$ \mathbf{Q} $, 其中存在$ n $个围捕机器人, 位置可以表示为$ x_p^i \in \mathbf{Q},\; i=1,\; \cdots,\; n $和$ m $ 个待围捕位置$ x_0^j \in \mathbf{Q},\; j=1,\; \cdots,\; m $. 为了保证围捕的效果, 设定每个机器人具有相同动力学模型, 则围捕机器人的运动可以被描述为:

    $$ \dot{{\boldsymbol{x}}}_p={\boldsymbol{u}}_p^i,\; {\boldsymbol{x}}_p^i(0)={\boldsymbol{x}}_p^{i,\; 0},\; i \in\{1,\; \cdots,\; n\} $$ (29)

    其中, $ {\boldsymbol{x}}_p^{i,\; 0} $表示第$ i $个围捕机器人的起始位置. 机器人的控制输入被表述为$ {\boldsymbol{u}}_p^i $.

    假设 1. 由于机器人本身的性能限制, 设定围捕者的最大速度为$ v_{\max } $, 即:

    $$ \left\|{\boldsymbol{u}}_p^i(t)\right\|_2 \leq v_{\max },\; \forall t \geq 0 $$ (30)

    假设2. 当围捕机器人的位置和待围捕位置点的距离小于$ r_d $时, 即可判定围捕成功. $ n $个围捕机器人$ x_p^i $和待围捕位置点$ x_0^j $之间的最小距离可以表示为$ r_d $时, 即可判定围捕成功. $ n $个围捕机器人$ x_p^i $和待围捕位置点$ x_0^j $之间的最小距离可以表示为:

    $$ d_{\text {min }}(t)=\min _i\|{\boldsymbol{x}}_p^i(t)-{\boldsymbol{x}}_0^j(t)\|_2 $$ (31)

    当任务区域中的每个机器人都满足$ d_{\min }(t) < r_d $ 时, 即可说明系统的围捕任务完成.

    在感知到污染源的位置后, 需要机器人前往合适的围捕点进行围捕. 而机器人前往哪个围捕点是未知的, 需要根据机器人和污染源之间的距离来为不同机器人动态分配围捕点. 针对此问题, 本文基于平均围捕距离最小化原则, 采用粒子群算法为所有机器人分配合适的围捕点, 以实现对污染源的全方位围捕. 假设$ n $个机器人参与围捕任务, 则围捕点的数量为$ n $. 这些均匀分布的围捕点分配受以下约束:

    $$ \left\{\begin{aligned} &\alpha=\frac{2 \pi}{n} \\ &\left(x-x_c^2\right)+\left(y-y_c^2\right)=R^2 \\ &\left\|{\boldsymbol{x}}_p^i-{\boldsymbol{x}}_o^j\right\| \leq r_d \end{aligned}\right. $$ (32)

    其中, $ \left(x_c,\; y_c\right) $ 表示污染源的中心位置, $ \alpha $为两个围捕点之间的角度差, $ x,\; y $代表二维空间的坐标变量. 对目标形成均匀围捕后$ n $个围捕机器人是处于同一个圆周上的, $ R $代表$ n $个围捕机器人所形成的圆的半径.

    图3所示为5个围捕机器人对单污染源的围捕点分配. 绿色点表示围捕机器人的位置, 蓝色点表示变分稀疏高斯过程回归估计的污染源位置, 黑色圆圈表示机器人的最小围捕范围. 定义粒子群算法需要优化的目标函数为:

    $$ J_{d x}=\min \sum\limits_{i=1}^n \sum\limits_{j=1}^s \int_{\varrho}\left\|{\boldsymbol{x}}_p^i-{\boldsymbol{x}}_o^j\right\|^2 d x $$ (33)

    此目标函数同时适用于单污染源和多污染源的情况, 其中$ i $为机器人数量, $ j $为被围捕的污染源数量. 粒子群算法用来确定围捕点归属于哪个机器人, 该目标函数能够确保所有围捕机器人的总行驶路程最短.

    图 3  对污染源的均匀围捕策略
    Fig. 3  Uniform capture strategy for a pollution source

    PSO算法通过模拟粒子在解空间中的运动来搜索最优解. 每个粒子根据自身的历史经验和整个群体的信息, 通过调整速度和位置来更新自己的位置. 最后PSO算法能够逐步收敛到最优解, 从而实现高效的围捕点分配. 利用PSO算法进行围捕点分配的步骤如下:

    步骤 1. 确定围捕点位置, 机器人的初始数量和任务分配的约束条件.

    步骤 2. 随机初始化一群粒子, 每个粒子代表一种任务分配方案, 其中每个粒子包含了围捕机器人到围捕点的映射关系.

    步骤 3. 根据每个粒子所代表的任务分配方案来计算目标函数(适应度函数)的值.

    步骤 4. 根据粒子群优化算法的原理, 更新每个粒子的速度和位置. 速度更新考虑了粒子自身的历史最佳位置和全局最佳位置, 以及随机因素的影响, 而位置更新则根据新的速度进行调整.

    步骤 5. 重复执行步骤3和步骤4, 直到满足停止条件. 通常情况下, 停止条件可以是达到最大迭代次数或者适应度达到某个预定阈值.

    步骤 6. 在迭代结束后, 从所有粒子中选择具有最优适应度的粒子所代表的任务分配方案作为最终结果.

    多机器人环境感知与围捕算法的伪代码如算法1所示:

      算法1 多机器人环境感知与围捕算法

    输入. $ n $ 个机器人的初始位置信息$ \left\{{\boldsymbol{p}}_i\right\}_{i=1,\; 2 \cdots n} $, 任务区域$ \mathbf{Q} \subseteq \mathbf{R}^N $, 任务切换阈值$ T $, 最大迭代次数$ t $, 围捕机器人和待围捕点的最小距离$ r_d $, 围捕者的最大速度$ v_{\max} $.

    过程.

    1: while编队迭代次数最大迭代次数$ t $ do

    2:  for $ i=1,\; \cdots,\; n $ do

    3:    获取每个机器人的位置信息$ {\boldsymbol{p}}_i $

    4:    计算每个机器人与任意区域点的距离$ \|{\boldsymbol{q}}- $ ${\boldsymbol{p}}_i\| $

    5:    基于SVM方法构造每个机器人的约束维诺区域$ \nu_i $

    6:    if 机器人检测的围捕点所在位置的密度值小于任务切换阈值$ \mathrm{T} $ then

    7:     获取机器人位置点的环境先验信息

    8:     计算变分稀疏高斯过程回归模型, 得到预测场的后验分布

    9:     驱动机器人前往该质心位置$ {\boldsymbol{p}}_i={\boldsymbol{C}}_{\nu_i} $

    10:    else

    11:    计算不同围捕机器人和预测污染源之间的距离$ \|{\boldsymbol{x}}_p^i(t)-{\boldsymbol{x}}_0^j(t)\|_2 $

    12:    基于PSO算法优化目标函数$ J_{d s} $

    13:    为不同机器人分配最优围捕点$ {\boldsymbol{x}}_0 $

    14:    if $ \|{\boldsymbol{x}}_p^i(t)-{\boldsymbol{x}}_0^j(t)\|_2 < r_d $ then

    15:     围捕任务完成

    16:    else

    17:     驱动机器人前往围捕点位置$ {\boldsymbol{x}}_p^J={\boldsymbol{x}}_o^j $

    18:    end if

    19:   end if

    20:  end for

    21:  综合历史信息得到已探索点集$ X=\left\{{\boldsymbol{x}}_n\right\}_{n=1}^N $

    22: end while

    本节将对本文中提出的VS-GPR算法和之前工作中的基于3D-Voronoi的全方位最小体积(Omni-directional minimum volume, ODMV)围捕算法进行对比. 通过仿真结果评估两种方法在污染源围捕效果方面的表现.

    4.1.1   VS-GPR算法仿真环境及参数设置

    对于VS-GPR算法详见第2节, 本小节主要描述仿真环境及参数设置. VS-GPR算法继承了高斯过程回归方法的优点, 同时引入变分稀疏, 以变分推断来近似真实后验分布, 降低了计算复杂度, 同时拥有较快的计算速度和较高的预测精度. 对算法的仿真考虑了只存在一个污染源的有界环境, 该环境范围为7 m$ \times $7 m$ \times $7 m, 围捕机器人的数量为5个, 障碍物的数量设置为3个. 围捕点的数量与机器人数量相等. 设定污染源的位置为(5.0 m, 4.5 m, 4.0 m), 如图4为高斯分布污染源的切片图, 因此定义真实的环境场密度函数为:

    图 4  高斯分布的污染源
    Fig. 4  Gaussian distribution of pollution sources
    $$ \rho_{x y z}=5 e^{-0.1*\left[(x-5)^2+(y-4.5)^2+(z-4)^2\right]} $$ (34)

    为了更加方便的观察围捕机器人的运动轨迹, 在该仿真中并未显示维诺区域. 表2为实验参数设置表, 设置了任务切换阈值、障碍物的尺寸及坐标位置、围捕机器人的速度等.

    表 2  仿真参数设置
    Table 2  Simulation parameter settings
    参数参数值
    任务切换阈值4.5
    障碍物的二维坐标(m)(5.0, 1.5)(1.2, 3.5)(4.0, 5.0)
    障碍物尺寸0.5 m$\times$0.5 m$\times$3.0 m
    UAV最大速度0.3 m/s
    机器人和待围捕点最小距离0.5 m
    下载: 导出CSV 
    | 显示表格

    本次仿真的目标是让5个围捕机器人先感知未知环境的信息, 预测出待围捕污染源的位置, 最终完成对污染源的均匀围捕. 其中, 任务中每个围捕机器人都需要避开路径中的障碍物. VS-GPR算法的仿真结果如图5所示, 其中图5(a), (b)和(c)中用不同颜色的曲线代表不同围捕机器人的运动轨迹, 黄色球体代表污染源, 3个黑色柱体表示环境中的障碍物.

    图 5  五个机器人使用VS-GPR策略对单污染源进行围捕的过程
    Fig. 5  Five robots capture single pollution source by VS-GPR

    由仿真结果可以看到, 5个机器人在编队过程中都能够避开障碍物, 编队的安全性得到保证. 图5(d)说明在编队过程中, 基于SVM的分离超平面方法能够保证任意机器人与障碍物不发生碰撞. 从图5(e)可以看出, 随着迭代次数的增加, 机器人与目标点位置间的位置误差不断减小, 最终完成收敛. 需要注意的是, 目标点在环境感知阶段被设定为维诺质心, 而在编队围捕阶段被设定为围捕点. 图5(f)则表明随着5个机器人在任务区域内的移动, 感知的环境模型越来越准确.

    4.1.2   基于3D-Voronoi的全方位最小体积围捕算法

    ODMV算法是在我们之前的工作中提出了另一种用于实现三维空间内多机器人围捕的算法, 见文献[22].该算法将三维任务空间中的目标点限制在对应的3D-Voronoi区域内, 并最小化其3D-Voronoi区域, 随着机器人围捕任务的进行, 目标点所在的3D-Voronoi区域的体积逐渐缩小, 最终完成围捕. 该算法对单污染源的仿真结果如图6所示. 两篇文章的均匀围捕策略不同, ODMV算法通过约束包围角实现均匀围捕, 本文方法通过PSO实现均匀围捕.两种方法对单污染源的围捕效果的仿真对比结果如表3所示, 可以看到在空间范围大小、源的数量、机器人数量、以及机器人移动速度都相同的条件下, VS-GPR算法在完成任务时的迭代次数和时间都要优于ODMV算法, 本文所提方法的搜索效率更高.

    图 6  五个机器人使用ODMV策略对单污染源进行围捕的过程
    Fig. 6  Five robots capture single pollution source by ODMV
    表 3  单污染源下两种围捕方法对比
    Table 3  Comparison of two capture methods
    围捕方法ODMV围捕VS-GPR围捕
    运行时间(s)197.62102.67
    迭代次数18070
    下载: 导出CSV 
    | 显示表格

    在更加复杂的场景中, 有多个污染源的存在. 假设在有界的环境中, 分别进行了6个机器人对2个至5个污染源的围捕仿真, 每个机器人的最大速度相同, 其余参数与4.1节相同. 在该仿真中, 机器人需要通过在环境内的移动来更新预测场模型, 并准确预测出污染源的位置, 然后由机器人分别对污染源进行围捕.

    多个污染源的位置分别设定在(2.0 m, 5.0 m, 3.5 m), (5.0 m, 3.0 m, 5.5 m), (4.0 m, 5.0 m, 3.5 m), (3.0 m, 4.0 m, 3.5 m)和(5.0 m, 1.5 m, 5.0 m). 污染源的数量根据仿真需要增减. 文中例举了2个污染源和4个污染源时的仿真结果, 其密度函数为复合高斯分布, 分别如式(35), 式(36)所示.围捕过程分别如图7图8所示, 结果表明该算法能够成功实现多个机器人对多个污染源的有效围捕, 同时保证机器人的安全性.图7(f)和图8(f)说明通过VS-GPR所建立的模型具有较高的精度. 而图8(c)显示了场景中存在4个污染源时每个污染源依次分配到了1个、1个、1个和3个围捕机器人.将VS-GPR方法与GPR算法的多机器人围捕多污染源方法进行比较, 结果如表4所示.

    图 7  六个机器人使用VS-GPR策略对两个污染源进行围捕
    Fig. 7  Six robots capture two pollution sources by VS-GPR
    图 8  六个机器人使用VS-GPR策略对四个污染源进行围捕
    Fig. 8  Six robots capture four pollution sources by VS-GPR
    表 4  多机器人围捕多污染源用时对比
    Table 4  Comparison of time consumption for multi-robot capture multi-pollution source
    污染源数量GPR耗时(s)VS-GPR耗时(s)
    2个278.63102.67
    3个319.37113.41
    4个345.56118.32
    5个352.17118.84
    下载: 导出CSV 
    | 显示表格
    $$ \begin{split} \rho_{x y}=\;&5 e^{-0.1*{[(x-2)^2+(y-5)^2+(z-3.5)^2]}} \;+\\ &10 e^{-0.1 *{[(x-5)^2+(y-3)^2+(z-5.5)^2]}} \end{split} $$ (35)
    $$ \begin{split} \rho_{x y}=\;&5 e^{-0.1*{[(x-2)^2+(y-5)^2+(z-3.5)^2]}} \;+\\ &10 e^{-0.1 *{[(x-5)^2+(y-3)^2+(z-5.5)^2]}}\; +\\ &5 e^{-0.1*{[(x-4)^2+(y-5)^2+(z-3.5)^2]}} \;+\\ &5 e^{-0.1*{[(x-3)^2+(y-4)^2+(z-3.5)^2]}} \end{split} $$ (36)

    可以看出VS-GPR算法在围捕2个至4个污染源的迭代总耗时分别增长了10.46$ \% $和4.32$ \% $. 而增加至5个污染源时迭代时间并未明显增加, 这是因为受到了空间范围及机器人数量的约束. VS-GPR算法的平均单次迭代时间为2.05s, 而GPR围捕的时间为5.57s. 根据以上仿真结果的分析可以得出, 本文所提多机器人围捕策略能够在减少迭代时间的同时, 保证较高的模型预测精度, 最后完成对污染源的围捕. 值得注意的是, 为了清楚的展示每个机器人围捕的过程的轨迹, 仿真中设置了较为密集的迭代次数, 即无人机步长较小, 这使得轨迹更为平滑, 所以迭代的总时长相对实验时长会更长.

    在动态目标仿真环境中, 设定了5个围捕机器人对1个动态目标源的围捕, 在整个仿真过程中, 目标源并没有采取逃逸策略, 只做直线运动. 仿真中动态目标源的起始位置和终点位置坐标分别是(10, 45, 50)和(50, 45, 50), 目标源的移动路线用虚线表示, 仿真结果如图9所示. 图9(d)中的最终捕获结果与图5(c)的捕获效果相似. 通过仿真结果可以观察到, 在VS-GPR策略下, 多机器人编队能够捕获目标.

    图 9  多机器人围捕动态污染源
    Fig. 9  Multi-robot capture dynamic pollution source

    室内实验环境长, 宽, 高分别为6 m$ \times $6 m$ \times $3 m, 如图10(a)所示. 红色的圆圈分别被标记为室内运动捕获相机、Crazyflies微型无人机. 该区域上方均匀安装了8个定位红外摄像头, 可用于跟踪多达6个不同的目标. 对于捕获实验, 选择了4个Crazyflie无人机, 如图10(b)所示. 每个Crazyflie无人机的轴距为92 mm, 重量约为30 g, 适合在狭小的室内空间进行实验. 在图10(a)中, Optitrack运动捕捉摄像头与4架Crazyflie无人机一起显示. 在每个Crazyflie无人机上安装了3$ \sim $4个反光球, 可以反射Optitrack摄像头发出的红外光, 便于系统获取无人机的位置.

    图 10  室内实验环境
    Fig. 10  Indoor laboratory environment

    多无人机控制系统的结构如图11所示. Optitrack运动捕捉系统用于跟踪无人机的实时位置. 然后, 通过机器人操作系统(Robot operating system, ROS)将捕获的位置传输到地面控制站(Ground control station, GCS). GCS使用VS-GPR算法计算下一步的目标位置, 并向Crazyflie无人机发送命令. 这使得我们能够控制多架无人机对目标进行追逐和捕获.

    图 11  多无人机控制系统结构框图
    Fig. 11  Block diagram of a multi-UAV control system

    实验在障碍物环境下存在两种不同的场景, 如图12(a), (b)所示分别是对单目标源和多目标源的围捕(多目标源为两个), 实验中的目标源均为光源. 单源情况下无人机初始位置位于左下角, 目标光源位于右上角(0.9 m, 0.9 m, 1.1 m)处; 多源情况下无人机初始位置不变, 新增一个位于左上角(2.7 m, 0.2 m, 0.5 m)处的光源. 实验中使用的无人机数量为4架, 无人机的速度为1.1 m/s. 为了避免因无人机距离太近时产生的湍流造成的碰撞, 每架无人机之间的安全距离设置为0.3 m. 在实验开始时, 每架无人机都已知环境地图, 其中包括目标的位置和障碍物.

    图 12  两种不同的实验场景
    Fig. 12  Two different experiments

    在单目标源、多障碍物环境中, 构建了3个圆柱形障碍物以及一个目标光源. 光源灯泡悬挂在实验场景右上角(0.9 m, 0.9 m, 1.1 m)的位置, 利用4个Crazyflie无人机对目标源进行围捕实验. 为了避免干扰OptiTrack系统对无人机的跟踪, 在中间障碍物的表面覆盖了绿色网状材料. 无人机与障碍物之间的安全距离设置为0.3 m, 实验最终目的是将目标光源围在由4个Crazyflie无人机组成的圆形区域内. 在这种环境下的捕获过程部分状态如图13所示. 从图13(d)的最终分布可以观察到, 在17s时无人机编队对目标光源进行了均匀围捕.

    图 13  多无人机围捕单目标源实验
    Fig. 13  Multi-UAV capture single-source experiment

    在单目标源的基础上增加了一个目标光源, 新增光源位置在左上角(2.7 m, 0.2 m, 0.5 m)处, 形成多目标源、多障碍物环境. 由于无人机数量有限, 利用4个Crazyflie无人机进行实验, 每个目标源分配2个无人机进行围捕. 围捕过程如图14所示, 从图14(d)中的最终分布可以观察到, 在18s时无人机编队完成了对2个目标源的有效围捕. 由于实验场地的限制, 无人机仅需要经过5次左右的迭代就到达光源位置, 所以实验中的总迭代用时相对仿真较少.

    图 14  多无人机围捕多目标源实验
    Fig. 14  Multi-UAV capture multi-source experiment

    通过实验过程可以观察到, 在VS-GPR策略下, 多无人机编队能够捕获目标. 这个结论可以扩展到更多数量无人机的围捕实验.

    针对在未知环境中多机器人环境感知和目标源围捕效率不足的问题, 结合VS-GPR方法和改进的CVT算法, 提出了一种基于变分稀疏高斯过程回归的多机器人协同感知与围捕方法.首先利用SVM方法动态规划多机器人任务区域, 避免机器人与障碍物之间的碰撞, 其次利用VS-GPR算法有效提高了多机器人在未知场源下的感知效率, 并利用粒子群优化算法对目标实现全方位均匀围捕. 在Matlab仿真环境与实验室真实场景下对所提出协同感知与围捕算法进行了验证, 具体结论如下:

    1) 算法通过SVM的分离超平面方法保证多机器人编队避障的同时实现较高的围捕效率, 并且通过PSO算法完成对目标源的均匀围捕.

    2) 在单污染源围捕中, 将本文所提VS-GPR算法与ODMV围捕算法进行了对比, 本文方法搜索效率更高、围捕效果更好, 具有显著的性能提升.

    3) 在多污染源围捕中, VS-GPR算法在2个至5个污染源的仿真环境下进行了比较, 本文方法在完成围捕的迭代时间上并没有表现出显著的增加, 并且每个污染源都分配有围捕机器人, 该算法较好的适应了多污染源的情况.

    4) 在动态源围捕方面, 本文所提出的方法展现了良好的围捕能力, 实现了对直线运动污染源围捕的仿真.

    本文在多机器人协同感知与围捕方面进行探索研究, 所研究的污染源特征是呈高斯分布的, 未来将在此基础上进行烟羽扩散场源的感知, 及增加围捕机器人与目标源的博弈策略研究.

  • 图  1  s-$ \dot{s}$相平面

    Fig.  1  The phase plane of s-$\dot{s} $

    图  2  可变指数切换函数

    Fig.  2  Variable exponent switching function

    图  3  磁链在线观测器模型

    Fig.  3  The model of flux online observer

    图  4  IMSTSMC-FOO下的异步电机系统框图

    Fig.  4  Block diagram of asynchronous motor system under IMSTSMC-FOO

    图  5  阶跃转速响应曲线

    Fig.  5  Step response speed curve

    图  6  阶跃转速误差曲线

    Fig.  6  Step response speed error curve

    图  7  突变转速响应曲线

    Fig.  7  Sudden speed response curve

    图  8  突变转速误差曲线

    Fig.  8  Sudden speed error curve

    图  9  突增负载响应曲线

    Fig.  9  Sudden load increase response curve

    图  10  FOO磁链在线辨识曲线

    Fig.  10  Flux online identification curve for FOO

    图  11  异步电机实验平台

    Fig.  11  Asynchronous motor experimental platform

    图  12  实验平台工作原理

    Fig.  12  The working of the experimental platform

    图  13  三种控制方案下的阶跃转速响应曲线

    Fig.  13  The step response speed curves under three control schemes

    图  14  三种控制方案下的阶跃转速误差响应曲线

    Fig.  14  The step response error curves of speed under three control schemes

    图  15  三种控制方案下的突变转速跟踪响应曲线

    Fig.  15  The response curves of tracking for sudden speed changes under three control schemes

    图  16  三种控制方案下的突变转速跟踪误差响应曲线

    Fig.  16  The response curves of tracking errors for sudden speed changes under three control schemes

    图  17  三种控制方案下的突增负载转速响应曲线

    Fig.  17  The response curves of sudden load increase speed under three control schemes

    图  18  三种控制方案下的q轴电流响应曲线

    Fig.  18  The q-axis current response curves under three control schemes

    图  19  磁链在线辨识曲线

    Fig.  19  Flux online identification curve

    表  1  异步电机基本参数

    Table  1  Basic parameters of asynchronous motor

    参数 数值
    额度功率$ \rm (kW) $ 5.5000
    额度转速$ \rm (r/min) $ 1455
    定子电阻$ (\Omega) $ 0.6930
    转子电阻$ (\Omega) $ 0.5850
    定子漏感$ \rm (H) $ 0.0018
    转子漏感$ \rm (H) $ 0.0018
    转动惯量$ \rm (kg{\cdot }m^{2}) $ 0.0233
    极对数 2
    下载: 导出CSV

    表  2  IMSTSMC-FOO参数

    Table  2  Parameters of IMSTSMC-FOO

    参数 数值
    调节系数$ \lambda $ 35
    调节比例系数$ k $ 5
    调节系数$ \alpha $ 2
    可调节指数$ m $ 0.2
    调节系数$ K $ 1
    阻尼系数$ \xi $ 100
    中心频率$ \omega_{c1} $ 1
    截止频率$ \omega_{c2} $ 100
    下载: 导出CSV

    表  3  三种控制方案下的阶跃转速控制性能表

    Table  3  The performance table of step response speed control under three control

    控制方式 收敛时间(s) 超调量(%) 转速波动(r/min)
    PI 5.722 3.040 ±3.0
    STSMC 5.510 0.653 ±3.0
    IMSTSMC-FOO 5.276 0.039 ±1.0
    下载: 导出CSV

    表  4  三种控制方案下的突变转速控制性能表

    Table  4  The performance table of sudden speed control under three control schemes

    控制方式 收敛时间(s) 超调量(%) 转速波动(r/min)
    第一段 PI 4.028 5.493 ±2.0
    STSMC 3.658 1.178 ±2.0
    IMSTSMC-FOO 3.420 0.067 ±1.5
    第二段 PI 9.516 1.347 ±3.0
    STSMC 9.284 0.544 ±4.0
    IMSTSMC-FOO 9.013 0.096 ±1.5
    第三段 PI 14.741 2.184 ±2.5
    STSMC 14.548 0.774 ±2.0
    IMSTSMC-FOO 14.405 0.055 ±1.0
    第四段 PI 20.117 12.992 ±1.5
    STSMC 20.193 14.167 ±1.5
    IMSTSMC-FOO 19.972 1.128 ±1.0
    下载: 导出CSV

    表  5  三种控制方案下的突增负载转速控制性能表

    Table  5  The performance table of sudden load increase speed control under three control schemes

    控制方式 收敛时间(s) 掉落量(r/min)
    PI 0.241 33.7
    STSMC 0.219 29.2
    IMSTSMC-FOO 0.184 23.1
    下载: 导出CSV
  • [1] Zhang J, Yu J, Chen X, Liu J. Discrete-time adaptive fuzzy event-triggered command filtered control for induction motors with input saturation. IEEE Transactions on Circuits and Systems II: Express Briefs, 2023, 71(3): 1271−1275
    [2] Jung C, Torrico C R C, Carati E G. Adaptive loss model control for robustness and efficiency improvement of induction motor drives. IEEE Transactions on Industrial Electronics, 2022, 69(11): 10893−10903 doi: 10.1109/TIE.2021.3125648
    [3] Luo C, Wang B, Yu Y. Decoupled stator resistance estimation for speed-sensorless induction motor drives considering speed and load torque variations. IEEE Journal of Emerging and Selected Topics in Power Electronics, 2019, 8(2): 1193−1207
    [4] 刘乐, 刘鹏, 王馨. 基于龙伯格观测器的感应电机预设性能位置跟踪优化控制. 控制理论与应用, 2023, 40(6): 1043−1052 doi: 10.7641/CTA.2022.11194

    Liu Le, Liu Peng, Wang Xin. Position tracking optimization control of induction motor with prescribed performance based on luenberger observer. Control Theory & Applications, 2023, 40(6): 1043−1052 doi: 10.7641/CTA.2022.11194
    [5] 王淑平, 张国山. 基于PI控制器的线性系统的鲁棒耗散控制. 控制与决策, 2012, 27(8): 1139−1144

    Wang Shu-ping, Zhang Guo-shan. Robust dissipative control for linear systems via PI controller. Control and Decision, 2012, 27(8): 1139−1144
    [6] Gunabalam R, Subbiah V. Speed sensorless vector control of induction motor drive with PI and fuzzy controller. International Journal of Power Electronics and Drive Systems, 2015, 5(3): 315−325
    [7] Zhang Y, Yin Z, Li W. Adaptive sliding-mode-based speed control in finite control set model predictive torque control for induction motors. IEEE Transactions on Power Electronics, 2021, 36(7): 8076−8087 doi: 10.1109/TPEL.2020.3042181
    [8] 王正齐, 刘贤兴. 基于神经网络逆系统的无轴承异步电机非线性内模控制. 自动化学报, 2013, 39(4): 433−439 doi: 10.1016/S1874-1029(13)60043-9

    Wang Zheng-Qi, Liu Xian-Xing. Nonlinear internal model control for bearingless induction motor based on neural network inversion. Acta Automatica Sinica, 2013, 39(4): 433−439 doi: 10.1016/S1874-1029(13)60043-9
    [9] Ma P, Yu J, Wang Q G. Filter-and observer-based finite-time adaptive fuzzy control for induction motors systems considering stochastic disturbance and load variation. IEEE Transactions on Power Electronics, 2023, 38(2): 1599−1609 doi: 10.1109/TPEL.2022.3211412
    [10] Ei-Sousy F F M, Amin M M, Mohammed O A. Robust adaptive neural network tracking control with optimized super-twisting sliding-mode technique for induction motor drive system. IEEE Transactions on Industry Applications, 2022, 58(3): 4134−4157 doi: 10.1109/TIA.2022.3160136
    [11] 陈闯, 王勃, 于泳. 基于改进指数趋近律的感应电机滑模转速观测器研究. 电工技术学报, 2020, 35(S1): 155−163

    Chen Chuang, Wang Bo, Yu Yong. An improved exponential reaching law based-sliding mode observer for speed-sensorless induction motor drives. Transactions of China Electrotechnical Society, 2020, 35(S1): 155−163
    [12] 李中奇, 周靓, 杨辉. 高速动车组数据驱动无模型自适应积分滑模预测控制. 自动化学报, 2024, 50(1): 194−210

    Li Zhong-Qi, Zhou Liang, Yang Hui. Data-driven model-free adaptive integral sliding mode predictive control for high-speed electric multiple unit. Acta Automatica Sinica, 2024, 50(1): 194−210
    [13] 蔡运颂, 许璟, 牛玉刚. 基于自适应多尺度超螺旋算法的无人机集群姿态同步控制. 自动化学报, 2023, 49(8): 1656−1666

    Cai Yun-Song, Xu Jing, Niu Yu-Gang. Attitude consensus control of UAV swarm based on adaptive multi-scale super-twisting algorithm. Acta Automatica Sinica, 2023, 49(8): 1656−1666
    [14] Lian S, Meng W, Shao K, Zheng J, Zhu S, Li H. Full attitude control of a quadrotor using fast nonsingular terminal sliding mode with angular velocity planning. IEEE Transactions on Industrial Electronics, 2022, 70(4): 3975−3984
    [15] Krim S, Gdaim S, Mtibaa A. FPGA-based real-time implementation of a direct torque control with second-order sliding mode control and input–output feedback linearisation for an induction motor drive. IET Electric Power Applications, 2020, 14(3): 480−491 doi: 10.1049/iet-epa.2018.5829
    [16] 刘陆, 丁世宏, 李世华. 高阶滑模控制理论综述. 控制理论与应用, 2022, 39(12): 2193−2201

    Liu Lu, Ding Shi-Hong, Li Shi-Hua. A survey for high-order sliding mode control theory. Control Theory & Applications, 2022, 39(12): 2193−2201
    [17] Kali Y, Ayala M, RODAS J. Time delay estimation based discrete-time super-twisting current control for a six-phase induction motor. IEEE Transactions on Power Electronics, 2020, 35(11): 12570−12580 doi: 10.1109/TPEL.2020.2995773
    [18] Nurettin A, Ínanç N. High-performance induction motor speed control using a robust hybrid controller with a supertwisting sliding mode load disturbance observer. IEEE Transactions on Industrial Electronics, 2022, 70(8): 7743−7752
    [19] Halimi H, Elgarouaz M, Lazrak L. High-order sliding mode control with hyperbolic evaluation function for improving performances of a squirrel-cage induction motor fed by a two-level inverter. International Journal of Dynamics and Control, 2024, 12(8): 2929−2943 doi: 10.1007/s40435-023-01378-0
    [20] 宁博文, 周凤星, 卢少武. 基于高阶滑模速度控制器的异步电机模型预测转矩控制. 控制与决策, 2021, 36(4): 953−958

    Ning Bo-Wen, Zhou Feng-Xing, LU Shao-Wu. A model predictive torque control for induction motor based on high order sliding mode speed controller. Control and Decision, 2021, 36(4): 953−958
    [21] Wang B, Wang T, Yu Y. Second-Order terminal sliding-mode speed controller for induction motor drives with nonlinear control gain. IEEE Transactions on Industrial Electronics, 2023, 70(11): 10923−10934 doi: 10.1109/TIE.2022.3231248
    [22] Teja A V R, Chakraborty C, Pal B C. Disturbance rejection analysis and fpga-based implementation of a second-order sliding mode controller fed induction motor drive. IEEE Transactions on Energy Conversion, 2018, 33(3): 1453−1462 doi: 10.1109/TEC.2018.2808325
    [23] 张杰, 柴建云, 孙旭东. 基于反电动势与磁链正交性的异步电机电压模型积分改进算法. 电工技术学报, 2014, 29(3): 41−49 doi: 10.3969/j.issn.1000-6753.2014.03.006

    Zhang Jie, Chai Jian-Yun, Sun Xu-Dong. An improved voltage model integral algorithm of induction motors based on the orthogonality between back EMF and flux. Transactions of China Electrotechnical Society, 2014, 29(3): 41−49 doi: 10.3969/j.issn.1000-6753.2014.03.006
    [24] Devanshu A, Singh M, Kumar N. An improved nonlinear flux observer based sensorless FOC IM drive with adaptive predictive current control. IEEE Transactions on Power Electronics, 2020, 35(1): 652−666 doi: 10.1109/TPEL.2019.2912265
    [25] Jo G J, Choi J W. Rotor flux estimator design with offset extractor for sensorless-driven induction motors. IEEE Transactions on Power Electronics, 2021, 37(4): 4497−4510
    [26] 何志明, 廖勇, 向大为. 定子磁链观测器低通滤波器的改进. 中国电机工程学报, 2008, 28(18): 61−65

    He Zhi-Ming, Liao Yong, Xiang Da-Wei. Improvement of low-pass filter algorithm for stator flux estimator. Proceedings of the CSEE, 2008, 28(18): 61−65
    [27] 孙宇新, 唐敬伟, 施凯. 改进型MRAS无速度传感器的无轴承异步电机矢量控制. 控制理论与应用, 2019, 36 (6): 939−950

    Sun Yu-Xin, Tang Jing-Wei, Shi Kai. Control Theory & Applications, 2019, 36 (6): 939−950
    [28] Çavuş B, Aktaş M. A new adaptive terminal sliding mode speed control in flux weakening region for DTC controlled induction motor drive. IEEE Transactions on Power Electronics, 2023, 39(1): 449−458
    [29] Jiang D, Yu W, Wang J. Dynamic analysis of DFIG fault detection and its suppression using sliding mode control. IEEE Journal of Emerging and Selected Topics in Power Electronics, 2020, 11(1): 643−656
    [30] Seeber R, Horn M. Stability proof for a well-established super-twisting parameter setting. Automatica, 2017, 84: 241−243 doi: 10.1016/j.automatica.2017.07.002
    [31] Jo G J, Choi J W. Gopinath model-based voltage model flux observer design for field-oriented control of induction motor. IEEE Transactions on Power Electronics, 2018, 34(5): 4581−4592
    [32] Wang Z. Adaptive smooth second-order sliding mode control method with application to missile guidance. Transactions of the Institute of Measurement and Control, 2017, 39(6): 848−860 doi: 10.1177/0142331215621616
  • 加载中
计量
  • 文章访问数:  105
  • HTML全文浏览量:  28
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-07-26
  • 录用日期:  2024-12-13
  • 网络出版日期:  2025-01-14

目录

/

返回文章
返回