2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

具有反馈延迟分布式在线复合优化的动态遗憾性能

侯瑞捷 李修贤 易新蕾 洪奕光 谢立华

江涌, 王蒙一, 王林波. 基于覆盖理论的高速强机动目标集群协同围捕. 自动化学报, xxxx, xx(x): x−xx doi: 10.16383/j.aas.c240606
引用本文: 侯瑞捷, 李修贤, 易新蕾, 洪奕光, 谢立华. 具有反馈延迟分布式在线复合优化的动态遗憾性能. 自动化学报, 2025, 51(4): 835−856 doi: 10.16383/j.aas.c240414
Jiang Yong, Wang Meng-Yi, Wang Lin-Bo. Coverage-based cluster cooperative encirclement of high-speed and highly maneuverable targets. Acta Automatica Sinica, xxxx, xx(x): x−xx doi: 10.16383/j.aas.c240606
Citation: Hou Rui-Jie, Li Xiu-Xian, Yi Xin-Lei, Hong Yi-Guang, Xie Li-Hua. Dynamic regret for distributed online composite optimization with delayed feedbacks. Acta Automatica Sinica, 2025, 51(4): 835−856 doi: 10.16383/j.aas.c240414

具有反馈延迟分布式在线复合优化的动态遗憾性能

doi: 10.16383/j.aas.c240414 cstr: 32138.14.j.aas.c240414
基金项目: 国家自然科学基金(62473292, 62088101), 上海市科技重大专项(2021SHZDZX0100)资助
详细信息
    作者简介:

    侯瑞捷:同济大学电子与信息工程学院控制科学与工程系博士研究生. 2021年获得兰州大学学士学位. 主要研究方向为分布式在线优化. E-mail: hourj21@tongji.edu.cn

    李修贤:同济大学电子与信息工程学院控制科学与工程系、上海自主智能无人系统科学中心教授. 主要研究方向为分布式控制与优化, 智能算法, 博弈论及自主智能无人系统. 本文通信作者. E-mail: xli@tongji.edu.cn

    易新蕾:美国麻省理工学院信息与决策系统实验室博士后, 现为同济大学准聘教授. 主要研究方向为分布式优化, 在线优化, 元学习和图神经网络. E-mail: xinleiy@kth.se

    洪奕光:同济大学电子与信息工程学院控制科学与工程系、上海自主智能无人系统科学中心教授. 他是 IEEE会士, CAA会士. 主要研究方向为非线性控制, 多智能体系统, 分布式优化与博弈, 机器学习和社交网络. E-mail: yghong@tongji.edu.cn

    谢立华:新加坡南洋理工大学电气与电子工程学院教授. 他是新加坡工程院院士、IEEE会士、IFAC会士和CAA会士. 主要研究方向为鲁棒控制与估计, 网络控制系统, 分布式优化, 多智能体网络、定位和无人系统. E-mail: elhxie@ntu.edu.sg

Dynamic Regret for Distributed Online Composite Optimization With Delayed Feedbacks

Funds: Supported by National Natural Science Foundation of China (62473292, 62088101) and Shanghai Municipal Science and Technology Major Project (2021SHZDZX0100)
More Information
    Author Bio:

    HOU Rui-Jie Ph.D. candidate in the Department of Control Science and Engineering, College of Electronic and Information Engineering, Tongji University. She received her bachelor degree from Lanzhou University in 2021. Her main research interest is distributed online optimization

    LI Xiu-Xian Professor in the Department of Control Science and Engineering, College of Electronic and Information Engineering, and Shanghai Research Institute for Intelligent Autonomous Systems, Tongji University. His research interest covers distributed control and optimization, intelligent algorithms, game theory, and autonomous vehicles. Corresponding author of this paper

    YI Xin-Lei Postdoctor with the Laboratory for Information and Decision Systems, Massachusetts Institute of Technology, USA. He is a tenure-track professor at Tongji University. His research interest covers distributed optimization, online optimization, meta-learning, and graph neural networks

    HONG Yi-Guang Professor in the Department of Control Science and Engineering, College of Electronic and Information Engineering, and Shanghai Research Institute for Intelligent AutonomousSystems, Tongji University. He is Fellow of IEEE and CAA. His research interest covers nonlinear control, multi-agent systems, distributed optimization and game, machine learning, and social networks

    XIE Li-Hua Professor at the School of Electrical and Electronic Engineering, Nanyang Technological University, Singapore. Dr Xie is Fellow of Academy of Engineering, Singapore, IEEE, IFAC, and CAA. His research interest covers robust control and estimation, networked control systems, distributed optimization, multi-agent networks, and localization and unmanned systems

  • 摘要: 研究分布式在线复合优化场景中的几种反馈延迟, 包括梯度反馈、单点Bandit反馈和两点Bandit反馈. 其中, 每个智能体的局部目标函数由一个强凸光滑函数与一个凸的非光滑正则项组成. 在分布式场景下, 研究每个智能体具有不同时变延迟的场景. 基于近端梯度下降算法, 分别设计这三种延迟反馈的分布式在线复合优化算法, 并且对动态遗憾上界进行分析. 分析结果表示, 延迟梯度反馈和延迟两点Bandit反馈的动态遗憾上界阶数在期望意义下相同, 而延迟单点Bandit反馈的动态遗憾上界稍差于前两者. 这表明, 存在延迟时, 两点Bandit反馈可以在期望意义下达到与梯度反馈相同阶数的动态遗憾上界, 且在步长选择合适的情况下, 三种反馈类型的平均延迟在动态遗憾上具有相同的阶数. 最后通过仿真实验验证了算法的性能和理论分析结果.
  • 空天防御领域是维护国家安全的重要军事技术领域之一, 多飞行器协同围捕技术在其中扮演愈加关键的角色. 根据“围捕”的起源内涵, 多飞行器协同围捕可解构“先围后捕”, “围”即为根据高速机动目标的位置形成围捕队形以构建围捕制胜态势, 是实现围捕的先决条件; “ 捕”即为根据高速机动目标的机动实时调节围捕队形并精准捕获目标, 是实现围捕的最终目的.

    当前, 基于覆盖理论的多飞行器协同围捕由于对过载的需求相对较小, 逐渐成为了多飞行器协同围捕技术的热门研究方向. 基于覆盖理论的协同围捕通过合理的设计初始阵位形成更大的围捕区, 以实现对目标最大逃逸区的完全覆盖, 并通过对围捕区的实时调节保持覆盖, 保证最终至少有一个防御飞行器能够精准捕获目标, 以实现围捕任务. 其中围捕区是多飞行器可达域的并集. 可达域/集的分析方法最早由Salmon等[1]在传统的一对一拦截模式中提出, 其将目标和防御飞行器在未来可能达到状态的演化集称为可达集. Robb等[12]确定了飞行器捕获目标的能力是一个常见的不确定性域, 由此引入旋转等时渐开线提出了可达域. 可达域的分析在追逃问题中也有相关研究[4], Chung等[56]提出了一种基于前向可达集(Forward reachable sets, FRS) 分析的追捕控制策略, 以捕获比追捕者机动性更高的逃逸目标. 该策略首先寻找追捕者的捕获状态, 在该状态下追捕者的FRS覆盖了逃跑者的整个FRS, 从而提高捕获的可能性. 于大腾等[7]在考虑能量约束的情况下, 基于飞行器和目标的机动范围得到了三维可达域的空间形状, 并基于可达域的投影分时段计算了攻击区范围与捕获逃逸区. 从几何角度, 可达域可以根据最小长度Dubins路径[89]进行分析, 但该方法主要应用于机器人领域而非制导领域[1011]. 可达域也可以利用Apollonius圆来分析飞行器与目标的速度比和相对位置与围捕成功的内在联系(文献[1215]), 但基于Apollonius圆的初始阵位研究模型相对简单, 且主要应用类似无人机的完整系统, 不存在最小转弯半径的约束.

    在多飞行器协同围捕中, 多飞行器系统往往存在过载限制, 同时初始时的零控脱靶量也是影响围捕成功与否的重要因素, 因此有大量研究考虑过载约束并基于零控脱靶量设计了初始阵位. 文献[10]考虑飞行器与目标的最大过载, 引入Dubins曲线建立二维平面的协同覆盖模型, 利用航向角的限制计算飞行器的最优数量, 文献[11]在协同覆盖性能指标的约束下, 计算出多个飞行器的最优零控终端位置, 并将零控终端位置转化为每个飞行器的制导终端位置约束. Su等结合零控脱靶量和最大加速度将可达域的覆盖转化为终端位置的覆盖, 并对目标的终端位置对多飞行器的初始位置进行预先分配, 分别实现了二维平面[16]和三维空间下[17]的多枚无机动性优势的飞行器对强机动目标的覆盖. 肖惟等[18]进一步基于非线性模型研究了过载约束下的协同覆盖问题, 引入标准弹道的概念, 在二维平面内得到了飞行器在初始时刻需要满足的约束条件. 文献[19]将上述研究扩展到了三维, 将三维空间的相对运动方程解耦为水平面和包含视线的铅垂面, 得到了标准弹道在分别在两个平面内的约束条件. 文献[20]基于改进灰狼算法优化了多飞行器在拦截平面的位置, 实现了对机动目标的最优覆盖. Zhang等[21]提出了直线弹道的概念, 推导了初始和终端时刻的弹道约束, 并在二维情况下将覆盖问题转化为期望航迹角跟踪的问题. 文献[22] 在二维平面分析了速度比与角度范围的关系, 文献[23]三维空间内将可达域等效为一个球, 给出了飞行器与目标不同过载比下飞行器的最优数量.

    Zhai在文献[24]中, 基于覆盖理论提出了由协同制导律和最优控制律组成的协同拦截算法, 在适当的假设下通过理论分析证明了增加飞行器的数量可以弥补单个飞行器机动性的不足, 并在文献[25] 中进一步设计了能够最大化覆盖率的协同制导律. 上述基于覆盖理论进行阵位设计的研究, 也进行了协同制导律的设计. Su等[16]基于零控脱靶量, 得到多飞行器与目标终端位置的覆盖关系, 然后反推得到多飞行器的初始位置并进行预分配和实时调节, 分别设计了开环和闭环协同制导律实现了二维平面多枚无机动性优势的飞行器对强机动目标的捕获. 之后Su将该方法扩展到了三维空间内, 提出了虚拟瞄准点的概念, 对真比例导航制导律的可达域进行预期偏置, 基于偏置比例导引设计了协同制导律, 并基于覆盖率设计了覆盖动态调节策略[17]. 上述研究都是基于线性系统模型开展的, 但实际复杂环境下目标的大机动会增加围捕过程中的非线性特性, 仍使用线性模型将会存在非线性耦合误差. 肖惟等[18]基于非线性模型引入标准弹道的概念, 通过加速度评价函数计算出偏置比例导引的偏置项, 得到了更适用于大机动目标的协同制导律. 文献[21]基于有限时间状态相关Riccati方程研究了二维非线性的覆盖问题, 设计了偏置比例导引律实现了多飞行器对目标加速度的覆盖, 仿真结果表明该策略下多飞行器中最小脱靶量远小于其他制导策略. 文献[19]与[23]将上述研究扩展到了三维, 建立了非线性过载约束模型, 提出了基于覆盖理论的协同制导律, 确保至少有一个飞行器可以准确拦截高超声速飞行器, 充分发挥了低成本飞行器的规模优势.

    随着作战环境和任务需求日益复杂化, 基于覆盖理论的协同围捕在不同场景下面临多种物理和信息层面的工程实际约束[26], 为协同围捕的实现带来了更高的挑战. 本文在文献[19]与[23]的启发下, 在三维空间内针对非线性动态模型研究了高速强机动目标的协同围捕问题. 在围捕末段, 目标的大机动特性会增加拦截过程中的非线性误差, 相比于文献[1617, 2425], 本文基于非线性模型开展研究, 能够更好地应对大机动目标. 相比于文献[23] 采用球形可达域, 本文基于三维圆锥体可达域提出新的碰撞平面覆盖等效方法, 阐释了加速度覆盖和位置覆盖的区别与联系, 并从几何角度分析了交会角对完全覆盖的影响, 因而扩宽了应用范围. 另外, 不同于文献[19]在无重力情况下以脱靶量减小为唯一目标进行覆盖调节, 本文在实际环境下基于覆盖率和零控脱靶量提出了分段覆盖动态调节与快速收敛策略, 使得多飞行器前期能够保持高覆盖率, 后期能够降低整体的脱靶量, 以数量和协作的优势弥补机动能力的不足, 完成“以弱胜强”.

    本文中符号统一规定为: $ V,\; a,\; \theta ,\; \varphi $, 和$ R $分别表示速度、加速度、弹道倾角、弹道偏角和相对距离, $ \eta $表示前置角, $ {{t}_{go}} $代表剩余时间, $ {{q}_{\beta }} $和$ {{q}_{\varepsilon }} $分别是视线角在铅垂和水平面的分量, 角度均逆时针方向为正. 下标有先后顺序, 且不同字母含义分别为: 下标$ M $和$ T $分别表示飞行器和机动目标, 下标$ y $和$ {z} $代表某一物理量在铅垂面和水平面上的投影, 下标$ i $代表第$ i $个飞行器, 下标$ 0 $和$ f $分别代表初始时刻和碰撞时刻.

    在考虑三维空间内飞行器与高速机动目标迎面对抗的场景, 参考文献[10]在二维平面对飞行器可达域的分析, 将三维空间中飞行器与目标的的可达域描述为三维圆锥体, 如图1所示.

    图 1  三维空间内飞行器可达域
    Fig. 1  The reachable domain of an interceptor in three-dimensional space

    图中, $ {{r}_{M,\; i}} $和$ {{r}_{T}} $为飞行器与目标可达域圆锥底圆的半径, 根据覆盖方式不同可分别计算为:

    1)若采用位置覆盖, 需假设飞行器加速度始终垂直于速度方向, 则

    $$ \begin{equation} \left\{ \begin{aligned} &r_{M,\; i} = \frac{V_{M,\; i}^2}{a_{M,\; i}} \left( 1 - \cos \left( \frac{a_{M,\; i} t_{\text{go}}}{V_{M,\; i}} \right) \right) \\ &r_T = \frac{V_T^2}{a_T} \left( 1 - \cos \left( \frac{a_T t_{\text{go}}}{V_T} \right) \right) \end{aligned} \right. \end{equation} $$ (1)

    2)采用加速度覆盖, 需假设碰撞时间短, 飞行器速度方向变化不大, 加速度始终垂直于视线, 有

    $$ \begin{equation} \left\{ \begin{aligned} & {{r}_{M,\; i}}\text{ = }\frac{1}{2}{{a}_{M,\; i}}t_{\text{go}}^{2} \\ & {{r}_{T}}\text{ = }\frac{1}{2}{{a}_{T}}t_{\text{go}}^{2} \end{aligned} \right. \end{equation} $$ (2)

    圆锥顶角分别为

    $$ \begin{equation} \left\{ \begin{aligned} & {{\alpha }_{M,\; i}} = \frac{1}{{{V}_{M,\;i}}}{{a}_{M,\;i,\;\max }}{{t}_{\text{go}}} \\ & {{\alpha }_{T}} = \frac{1}{{{V}_{T}}}{{a}_{T,\;\max }}{{t}_{\text{go}}} \end{aligned} \right. \end{equation} $$ (3)

    为了简化两个三维圆锥体之间的覆盖关系, 下面提出了碰撞平面的定义.

    定义1(碰撞平面). 飞行器与目标中间存在一个虚拟平面, 该平面垂直于目标速度矢量, 且包含预测命中点, 称之为”碰撞平面”. 其中, 预测命中点为考虑目标最大机动时可能的命中点. 若假设初始时飞行器与目标的速度方向平行, 则目标和飞行器可达域的底圆在该平面的投影均为圆, 两者的空间覆盖关系可简单等效为平面几何覆盖关系, 如图2所示.

    图 2  碰撞平面
    Fig. 2  Collision plane

    由此, 可以将三维空间内的可达域覆盖问题转化为碰撞平面内投影圆的覆盖问题.

    然而, 飞行器速度方向与目标速度方向通常不平行, 导致飞行器可达域的底圆在该平面的投影变为椭圆, 可采用冗余覆盖策略将投影椭圆的短半轴作为半径形成新的投影圆. 如图3所示, 飞行器与目标投影椭圆的相交部分即为可拦截区域, 而$ r{{'}_{M,\; i}} $则为新的投影圆的半径, 有如下关系存在

    图 3  冗余覆盖策略
    Fig. 3  Redundant coverage strategy
    $$ \begin{align} & r{{'}_{M,\; i}} = {{\kappa }_{\beta ,\; i}}{{\kappa }_{a,\; r,\; i}}{{r}_{M,\; i}} \end{align} $$ (4)

    其中$ {{\kappa }_{\beta ,\; i}} $为与交会角$ \beta $相关的修正因子, $ {{\kappa}_{a,\; r,\; i}} $为与制导律相关的修正因子.

    图4所示, 交会角修正因子可通过三角形内的正弦定理和相似定理计算, 整理得到下式

    $$ \begin{align} {{\kappa }_{\beta ,\; i}} = 1-\frac{\sin (0.5 {\alpha }_{M,\; i})\sin \beta }{\cos (0.5 {\alpha }_{M,\; i}-\beta )} \end{align} $$ (5)
    图 4  交会角影响
    Fig. 4  Influence of miss angle

    制导律修正因子是由于飞行器受到视线角转率趋于零的限制, 使其无法发挥全部过载能力而产生的. 制导律对可达域的影响与制导方式、制导参数和目标的机动有关, 对于比例导引而言$ \frac{N-2}{N}\le {{\kappa }_{i,\; a,\; r}}\le 1 $, 其中$ N $为比例系数, 其他制导方式可取一个经验值但必须满足$ 0<{{\kappa }_{i,\; a,\; r}}\le 1 $. 令$ {{\mu }_{i}} $为飞行器实际可达域与目标机动范围的比值, 有

    $$ \begin{align} {{\mu }_{i}} = \frac{r{{'}_{M,\; i}}}{{{r}_{T}}} = \frac{{{\kappa }_{\beta ,\; i}}{{\kappa }_{a,\; r,\; i}}{{r}_{M,\; i}}}{{{r}_{T}}} \end{align} $$ (6)

    考虑高速强机动目标过载大以及围捕剩余时间短, 本文采用加速度覆盖的方式对其形成完全覆盖, 考虑末制导时剩余时间达成一致, 有

    $$ \begin{align} {{\mu }_{i}} = \frac{{{\kappa }_{\beta ,\; i}}{{\kappa }_{a,\; r,\; i}}{{a}_{i,\; \max }}t_{go}^{2}}{{{a}_{T,\; \max }}t_{go}^{2}} = {{\kappa }_{\beta ,\; i}}{{\kappa }_{a,\; r,\; i}}\frac{{{a}_{i,\; \max }}}{{{a}_{T,\; \max }}} \end{align} $$ (7)

    由此, 位置覆盖可转化为加速度平面内的覆盖. 显然单个飞行器在碰撞平面内难以覆盖目标的可达域, 如图5所示, 需要多个飞行器协同组成围捕区, 对目标的逃逸区进行完全覆盖.

    图 5  协同围捕
    Fig. 5  Cooperative interception

    下面引入单位圆覆盖理论. 计算多飞行器对目标的可达域实现完全覆盖的最优数量.

    引理1(文献[19]). 若将目标可行域的投影圆归一化为一个单位圆, 将多飞行器可行域的投影圆等比缩小为半径为$ \mu $的小圆, $ \mu $为飞行器与目标的最大过载比, 则存在最小正整数$ n $, 使得归一化的单位圆能够被$ n $个半径为$ \mu $的小圆完全覆盖, 即能找到完全覆盖目标投影圆的多飞行器最优数量, 具体对应关系如表1所示. 引理1是基于单位圆覆盖理论提出的, 几何覆盖关系不会因为等比缩放而变化, 因此显然可证. 具体阵位关系如为: 飞行器5个及以下可采用切于圆心的方式, 6个及以上需要在中心处安排一个以上的飞行器, 其余飞行器可距离目标投影点$ 2\mu \cos (\frac{\pi }{{{n}_{c}}}) $均匀排列, 其中$ {{n}_{c}}\ge n $.

    表 1  不同过载比下的数量选取
    Table 1  Initial osculating orbit elements
    $\mu$$[\sqrt{3}/2,\; 1)$$[\sqrt{2}/2,\; \sqrt{3}/2)$$[0. 609,\; \sqrt{2}/2)$[0. 555, 0. 609)[0. 5, 0. 555)
    $n$34567
    下载: 导出CSV 
    | 显示表格

    基于覆盖理论的协同制导设计旨在确保至少有一个飞行器能够成功拦截具有过载上限的机动目标. 为了方便设计过程, 在铅垂和水平面上对制导律进行解耦. 由于制导系统的状态变量收敛速度快, 将三维制导问题解耦为两个二维问题不会影响制导系统的稳定性, 即在铅垂(水平)平面上设计制导律时, 考虑水平(铅垂)运动对制导模型的影响可以忽略不计. 因此可将三维相对运动模型通过投影法分解为铅垂($ [X-Y $)平面和水平($ X-Z $)平面, 以下简称铅垂面和水平面.

    图6给出了飞行器与目标在铅垂面上的相对位置, 第$ i $个飞行器和目标的速度和相对距离在水平面的投影分别为

    $$ \begin{equation} \left\{ \begin{aligned} & {{V}_{My,\; i}} = {{V}_{i}}\cos {{\theta }_{Mz,\; i}} \\ & {{V}_{Ty}}\text{ = }{{V}_{T}}\cos {{\theta }_{Mz,\; i}} \\ & {{R}_{y,\; i}} = {{R}_{i}}\cos {{q}_{\varepsilon }} \end{aligned} \right. \end{equation} $$ (8)
    图 6  $X-Y$平面的相对位置
    Fig. 6  $X-Y$ plane relative position

    在实际情况中需考虑重力的影响, 则飞行器与目标在铅垂面上的相对运动可以表示为

    $$ \begin{equation} \left\{ \begin{aligned} & {{{\dot{R}}}_{y,\; i}} = {{V}_{Ty}}\cos {{\eta }_{Ty,\; i}}-{{V}_{My,\; i}}\cos {{\eta }_{My,\; i}} \\ & {{R}_{y,\; i}}{{{\dot{q}}}_{\beta ,\; i}} = {{V}_{My,\; i}}\sin {{\eta }_{My,\; i}}-{{V}_{Ty}}\sin {{\eta }_{Ty,\; i}} \\ & {{{\dot{\theta }}}_{My,\; i}} = \frac{{{a}_{My,\; i}}-g\cos {{\theta }_{My,\; i}}}{{{V}_{My,\; i}}} \\ & {{{\dot{\theta }}}_{Ty}} = \frac{{{a}_{Ty}}-g\cos {{\theta }_{Ty}}}{{{V}_{Ty}}} \\ & {{\eta }_{My,\; i}} = {{q}_{\beta ,\; i}}-{{\theta }_{My,\; i}} \\ & {{\eta }_{Ty,\; i}} = {{q}_{\beta ,\; i}}-{{\theta }_{Ty}} \end{aligned} \right. \end{equation} $$ (9)

    图7给出了飞行器与目标在水平面上的相对位置, 可推导出第$ i $个飞行器与目标在水平面内的速度和相对距离分别为

    图 7  $X-Z$平面的相对位置
    Fig. 7  $X-Z$ plane relative position
    $$ \begin{equation} \left\{ \begin{aligned} & {{V}_{Mz,\; i}} = {{V}_{i}}\cos {{\theta }_{My,\; i}} \\ & {{V}_{Tz}}\text{ = }{{V}_{T}}\cos {{\theta }_{Ty}} \\ & {{R}_{z,\; i}} = {{R}_{i}}\cos {{q}_{\beta }} \end{aligned} \right. \end{equation} $$ (10)

    根据图7, 第$ i $个飞行器与目标在水平面上的相对运动可以表示为

    $$ \begin{equation} \left\{ \begin{aligned} & {{{\dot{R}}}_{z,\; i}} = {{V}_{Tz}}\cos {{\eta }_{Tz,\; i}}-{{V}_{Mz,\; i}}\cos {{\eta }_{Mz,\; i}} \\ & {{R}_{z,\; i}}{{{\dot{q}}}_{\varepsilon ,\; i}} = {{V}_{Mz,\; i}}\sin {{\eta }_{Mz,\; i}}-{{V}_{Tz}}\sin {{\eta }_{Tz,\; i}} \\ & {{{\dot{\theta }}}_{Mz,\; i}} = \frac{{{a}_{Mz,\; i}}}{{{V}_{Mz,\; i}}} \\ & {{{\dot{\theta }}}_{Tz}} = \frac{{{a}_{Tz}}}{{{V}_{Tz}}} \\ & {{\eta }_{Mz,\; i}} = {{q}_{\varepsilon ,\; i}}-{{\theta }_{Mz,\; i}} \\ & {{\eta }_{Tz,\; i}} = {{q}_{\varepsilon ,\; i}}-{{\theta }_{Tz}} \end{aligned} \right. \end{equation} $$ (11)

    在三维空间内建立了考虑重力的飞行器与目标的非线性动力学模型之后, 剩余部分为: 首先, 基于偏置比例导引设计了三维空间非线性协同制导律, 形成了对目标最大加速度的覆盖, 其次, 提出了同时考虑覆盖率和脱靶量的制导参数动态调节与快速收敛策略. 最后进行了仿真验证.

    受文献[18]的启发, 本节引入了标准弹道来设计协同制导律以实现对目标最大加速度的覆盖. 当目标以期望恒定加速度$ {{a}_{T,\; i,\; s}} $进行机动时, 合理设计第$ i $个飞行器$ {{M}_{i}} $的初始阵位和制导律, 使其轨迹最接近直线, 则$ {{M}_{i}} $在整个拦截过程中的弹道可定义为标准弹道, 标准弹道的曲率最小, 对飞行器的加速度要求也是最小. 当目标以恒定加速度$ {{a}_{T,\; i,\; s}}+ \delta $($ \delta $为一个小量)机动时, 飞行器$ {{M}_{i}} $的轨迹将分布在标准轨迹邻域内, 定义为非标准弹道. $ \delta $的绝对值越大, 轨迹越弯曲, 拦截目标所需的加速度就越大. 因此, 对于给定的具有过载约束的飞行器, 在$ {{a}_{T,\; i,\; s}} $附近存在一个飞行器加速度不饱和的邻域, 能够成功拦截目标, 该领域即飞行器能够成功拦截机动目标的范围. 基于标准弹道和覆盖策略, 可以推导出对飞行器初始位置的约束和初始制导参数的偏置项. 因此, 基于解耦的相对运动方程, 可从铅垂和水平两个平面设计如下偏置比例协同制导律

    $$ \begin{equation} \left\{ \begin{aligned} & {{a}_{My,\; i}} = N(| {{{\dot{R}}}_{y,\; i}} |{{{\dot{q}}}_{\beta ,\; i}}-{{B}_{y,\; i}}) \\ & {{a}_{Mz,\; i}} = N(| {{{\dot{R}}}_{z,\; i}} |{{{\dot{q}}}_{\varepsilon ,\; i}}-{{B}_{z,\; i}}) \end{aligned} \right. \end{equation} $$ (12)

    其中, $ {{B}_{y,\; i}} $和$ {{B}_{z,\; i}} $分别是铅垂面和水平面上的偏置项. $ N $为导航系数, 一般设置在2到6之间.

    首先对铅垂面进行分析, 对式(9)第二式求导有

    $$ \begin{split} {{{\dot{R}}}_{y,\; i}}{{{\dot{q}}}_{\beta ,\; i}} &+ {{R}_{y,\; i}}{{{\ddot{q}}}_{\beta ,\; i}} = \\ &{{{\dot{V}}}_{My,\; i}}\sin {{\eta }_{My,\; i}}+{{V}_{My,\; i}}{{{\dot{\eta }}}_{My,\; i}}\cos {{\eta }_{My,\; i}}- \\ &{{{\dot{V}}}_{Ty}}\sin {{\eta }_{Ty,\; i}}-{{V}_{Ty}}{{{\dot{\eta }}}_{Ty,\; i}}\cos {{\eta }_{Ty,\; i}} \\[-1pt]\end{split} $$ (13)

    考虑多飞行器与目标在高速强机动过程中加速度只改变速度方向, 即$ {{\dot{V}}_{My,\; i}} = {{\dot{V}}_{Ty,\; i}} = 0 $, 并代入式(9)有

    $$ \begin{split} {{{\dot{R}}}_{y,\; i}}& {{{\dot{q}}}_{\beta ,\; i}} +{{R}_{y,\; i}}{{{\ddot{q}}}_{\beta ,\; i}} = \\ &{{V}_{My,\; i}}{{{\dot{\eta }}}_{My,\; i}}\cos {{\eta }_{My,\; i}}-{{V}_{Ty}}{{{\dot{\eta }}}_{Ty,\; i}}\cos {{\eta }_{Ty,\; i}} = \\ &{{V}_{My,\; i}}({{{\dot{q}}}_{\beta ,\; i}}-\frac{{{a}_{My,\; i}}-g\cos {{\theta }_{My,\; i}}}{{{V}_{My,\; i}}})\cos {{\eta }_{My,\; i}}- \\ &{{V}_{Ty}}({{{\dot{q}}}_{\beta ,\; i}}-\frac{{{a}_{Ty}}-g\cos {{\theta }_{Ty}}}{{{V}_{Ty}}})\cos {{\eta }_{Ty,\; i}} = \\ &({{V}_{My,\; i}}{{{\dot{q}}}_{\beta ,\; i}}-({{a}_{My,\; i}}-g\cos {{\theta }_{My,\; i}}))\cos {{\eta }_{My,\; i}}- \\ &({{V}_{Ty}}{{{\dot{q}}}_{\beta ,\; i}}-({{a}_{Ty}}-g\cos {{\theta }_{Ty}}))\cos {{\eta }_{Ty,\; i}}\\[-1pt] \end{split} $$ (14)

    合并同类项并代入(9)第一式, 整理可得

    $$ \begin{split} {{R}_{y,\; i}}{{{\ddot{q}}}_{\beta ,\; i}} & = ({{a}_{Ty}}-g\cos {{\theta }_{Ty}})\cos {{\eta }_{Ty,\; i}} - \\ &2{{{\dot{R}}}_{y,\; i}}{{{\dot{q}}}_{\beta ,\; i}}-({{a}_{My,\; i}}-g\cos {{\theta }_{My,\; i}})\cos {{\eta }_{My,\; i}} \end{split} $$ (15)

    结合式(12)第一式可简写为如下形式

    $$ \begin{align} {{R}_{y,\; i}}{{\ddot{q}}_{\beta ,\; i}} = -( 2{{{\dot{R}}}_{y,\; i}}+N| {{{\dot{R}}}_{y,\; i}} |\cos {{\eta }_{My,\; i}} )( {{{\dot{q}}}_{\beta ,\; i}}-\dot{q}_{\beta ,\; i}^{*} ) \end{align} $$ (16)

    其中

    $$ \begin{split} \dot{q}_{\beta ,\; i}^{*} =\;& \frac{N{{B}_{y,\; i}}\cos {{\eta }_{My,\; i}}+g\cos {{\theta }_{My,\; i}}\cos {{\eta }_{My,\; i}}}{2{{{\dot{R}}}_{y,\; i}}+N| {{{\dot{R}}}_{y,\; i}} |\cos {{\eta }_{My,\; i}}} + \\ &\frac{{{a}_{Ty}}\cos {{\eta }_{Ty,\; i}}-g\cos {{\theta }_{Ty}}\cos {{\eta }_{Ty,\; i}}}{2{{{\dot{R}}}_{y,\; i}}+N| {{{\dot{R}}}_{y,\; i}} |\cos {{\eta }_{My,\; i}}}\\[-1pt] \end{split} $$ (17)

    选取$ N $使得$ 2{{\dot{R}}_{y,\; i}}+N| {{{\dot{R}}}_{y,\; i}} |\cos {{\eta }_{My,\; i}}>0 $, 可见$ \dot{q}_{\beta ,\; i}^{*} $是有限的, 此时存在两种情况, 若$ {{\dot{q}}_{\beta ,\; i}}- \dot{q}_{\beta ,\; i}^{*}>0 $, 则有$ {{\ddot{q}}_{\beta ,\; i}}<0 $, 此时$ {{\dot{q}}_{\beta ,\; i}} $逐渐递减到$ \dot{q}_{_{\beta ,\; i}}^{*} $; 若$ {{\dot{q}}_{\beta ,\; i}}-\dot{q}_{\beta ,\; i}^{*}<0 $, 则有$ {{\ddot{q}}_{\beta ,\; i}}>0 $, 此时$ {{\dot{q}}_{\beta ,\; i}} $逐渐递增到$ \dot{q}_{_{\beta ,\; i}}^{*} $. 因此在两种情况下, $ {{\dot{q}}_{\beta ,\; i}} $都将收敛到$ \dot{q}_{\beta ,\; i}^{*} $且是有限的. 在碰撞时刻, $ {{R}_{y,\; i}} = 0 $, 由式(16) 可知

    $$ \begin{align} {{\dot{q}}_{\beta ,\; i}} = \dot{q}_{\beta ,\; i}^{*} \end{align} $$ (18)

    同理, 在水平面对(11)第二式求导并通过与式(13)到式(16)类似的处理方法有

    $$ {{R}_{z,\; i}}{{\ddot{q}}_{\varepsilon ,\; i}} = -( 2{{{\dot{R}}}_{z,\; i}}+N| {{{\dot{R}}}_{z,\; i}} |\cos {{\eta }_{Mz,\; i}} )( {{{\dot{q}}}_{\varepsilon ,\; i}}-\dot{q}_{\varepsilon ,\; i}^{*} ) $$ (19)

    其中

    $$ \begin{align} \dot{q}_{\varepsilon ,\; i}^{*} = \frac{N{{B}_{z,\; i}}\cos {{\eta }_{Mz,\; i}}+{{a}_{Tz}}\cos {{\eta }_{Tz,\; i}}}{2{{{\dot{R}}}_{z,\; i}}+N| {{{\dot{R}}}_{z,\; i}} |\cos {{\eta }_{Mz,\; i}}} \end{align} $$ (20)

    同样的, 选取$ N $使得$ 2{{\dot{R}}_{z,\; i}}+N| {{{\dot{R}}}_{z,\; i}} |\cos {{\eta }_{Mz,\; i}} >0 $, 则$ \dot{q}_{\varepsilon ,\; i}^{*} $是有限的, 且$ {{\dot{q}}_{\varepsilon ,\; i}} $都将收敛到$ \dot{q}_{\varepsilon ,\; i}^{*} $. 在碰撞时刻, 也有

    $$ \begin{align} {{\dot{q}}_{\varepsilon ,\; i}} = \dot{q}_{\varepsilon ,\; i}^{*} \end{align} $$ (21)

    最小化初始和碰撞时刻的加速度有助于减少拦截过程中的加速度需求, 因此定义弹道评价函数为

    $$ \begin{align} J = a_{M,\; i,\; 0}^{2}+a_{M,\; i,\; f}^{2} \end{align} $$ (22)

    其中, 下标$ 0 $和$ f $分别为初始时间和碰撞时间. 根据评价函数, 为使飞行器在标准弹道下拦截机动目标时的加速度需求最小, 可在铅垂面和水平面上选取初始和碰撞时刻的加速度输入信号约束为

    $$ \begin{equation} \left\{ \begin{aligned} & {{a}_{My,\; i,\; 0}} = {{a}_{My,\; i,\; f}} = 0 \\ & {{a}_{Mz,\; i,\; 0}} = {{a}_{Mz,\; i,\; f}} = 0 \end{aligned} \right. \end{equation} $$ (23)

    因此, 结合式(12)与式(23), 碰撞时刻铅垂面和水平面的偏置项可表示为

    $$ \begin{equation} \left\{ \begin{aligned} & {{B}_{y,\; i}} = | {{{\dot{R}}}_{y,\; i,\; f}} |\dot{q}_{\beta ,\; i,\; f}^{*} \\ & {{B}_{z,\; i}} = | {{{\dot{R}}}_{z,\; i,\; f}} |\dot{q}_{\varepsilon ,\; i,\; f}^{*} \end{aligned} \right. \end{equation} $$ (24)

    代入式(17)与式(20)得

    $$ \begin{equation} \left\{ \begin{aligned} & {{B}_{y,\, i}} = \\ &\frac{N{{B}_{y,\, i}}\cos {{\eta }_{My,\, i,\, f}}+{{a}_{Ty,\, i,\, s}}\cos {{\eta }_{Ty,\, i,\, f}}}{( 2{{{\dot{R}}}_{y,\, i,\, f}}+N| {{{\dot{R}}}_{y,\, i,\, f}} |\cos {{\eta }_{My,\, i,\, f}} )/| {{{\dot{R}}}_{y,\, i,\, f}} |}+ \\ &\frac{g\cos {{\theta }_{My,\, i,\, f}}\cos {{\eta }_{My,\, i,\, f}}-g\cos {{\theta }_{Ty,\, i,\, f}}\cos {{\eta }_{Ty,\, i,\, f}}}{( 2{{{\dot{R}}}_{y,\, i,\, f}}+N| {{{\dot{R}}}_{y,\, i,\, f}} |\cos {{\eta }_{My,\, i,\, f}} )/| {{{\dot{R}}}_{y,\, i,\, f}} |} \\ & {{B}_{z,\, i}} = \\ &| {{{\dot{R}}}_{z,\, i,\, f}} |\left( \frac{N{{B}_{z,\, i}}\cos {{\eta }_{Mz,\, i,\, f}}+{{a}_{Tz,\, i,\, s}}\cos {{\eta }_{Tz,\, i,\, f}}}{2{{{\dot{R}}}_{z,\, i,\, f}}+N| {{{\dot{R}}}_{z,\, i,\, f}} |\cos {{\eta }_{Mz,\, i,\, f}}} \right) \end{aligned} \right. \end{equation} $$ (25)

    对于迎面拦截的情况, 有$ {{\dot{R}}_{y,\; i,\; f}} = -| {{{\dot{R}}}_{y,\; i,\; f}} | $, $ {{\dot{R}}_{z,\; i,\; f}} = -| {{{\dot{R}}}_{z,\; i,\; f}} | $, 代入到式(25)则可得到如下表达式

    $$ \begin{equation} \left\{ \begin{aligned} & {{B}_{y,\; i}} = -\frac{1}{2}({{a}_{Ty,\; i,\; s}}\cos {{\eta }_{Ty,\; i,\; f}}+ \\ &g\cos {{\theta }_{My,\; i,\; f}}\cos {{\eta }_{My,\; i,\; f}}-g\cos {{\theta }_{Ty,\; f}}\cos {{\eta }_{Ty,\; i,\; f}}) \\ & {{B}_{z,\; i}} = -\frac{1}{2}{{a}_{Tz,\; i,\; s}}\cos {{\eta }_{Tz,\; i,\; f}} \end{aligned} \right. \end{equation} $$ (26)

    定理 1. 若初始时已形成了引理1中的覆盖阵位, 则可采用基于加速度覆盖的偏置比例协同制导律(12) 使得多飞行器实现对高速强机动目标的协同围捕, 其中偏置项(26)可通过初始参数计算得到.

    证明. 由于重力的影响, 偏置项包含了弹道角信息, 因此除了碰撞时刻的目标前置角以外还需要在铅垂面得到碰撞时刻的弹道角, 由式(9)知弹道角满足以下关系

    $$ \begin{equation} \left\{ \begin{aligned} & {{{\dot{\theta }}}_{My,\; i}} = \frac{{{a}_{My,\; i}}-g\cos {{\theta }_{My,\; i}}}{{{V}_{My,\; i}}} \\ & {{{\dot{\theta }}}_{Ty}} = \frac{{{a}_{Ty}}-g\cos {{\theta }_{Ty}}}{{{V}_{Ty}}} \end{aligned} \right. \end{equation} $$ (27)

    首先在铅垂面上的碰撞时刻可表示为

    $$ \begin{split} {{t}_{y,\; i,\; f}} =\;& \frac{-R_{y,\; i,\; 0}^{{}}}{|\dot{R}_{y,\; i,\; 0}^{{}}|} = \\ &\frac{-\dot{R}_{y,\; i,\; 0}^{{}}}{{{V}_{Ty}}\cos {{\eta }_{Ty,\; i,\; 0}}-{{V}_{My,\; i}}\cos {{\eta }_{My,\; i,\; 0}}} \end{split} $$ (28)

    然后代入式(12)到(27)第一式有

    $$ \begin{align} {{\dot{\theta }}_{My,\; i}} = \frac{N(| {{{\dot{R}}}_{y,\; i}} |{{{\dot{q}}}_{\beta ,\; i}}-{{B}_{y,\; i}})-g\cos {{\theta }_{My,\; i}}}{{{V}_{My,\; i}}} \end{align} $$ (29)

    由于剩余时间较短, 多飞行器视线方向速度大小受到加速度影响不大, 即 变化不大, 则对(27) 从初始时刻到碰撞时刻积分, 可得到碰撞时刻的约束为

    $$ \begin{split} {{\theta }_{My,\; i,\; f}} & -{{\theta }_{My,\; i,\; 0}} = \frac{N{{t}_{y,\;i,\;f}}}{{{V}_{My,\;i}}} \left( | {{{\dot{R}}}_{y,\; i}} |{{{\dot{q}}}_{\beta ,\; i}}-{{B}_{y,\; i}} \right) - \\ & \frac{1}{{{V}_{My,\;i}}} \left( g\sin {{\theta }_{My,\; i,\; f}}-g\sin {{\theta }_{My,\; i,\; 0}} \right) \\ {{\theta }_{Ty,\; f}} - & {{\theta }_{Ty,\; 0}} = \\ &\frac{({{a}_{Ty,\; i}}{{t}_{y,\; i,\; f}}-g\sin {{\theta }_{Ty,\; f}}+g\sin {{\theta }_{Ty,\; 0}})}{{{V}_{Ty}}}\\[-1pt] \end{split} $$ (30)

    由此可见, 在重力的影响下, 偏置项不仅仅只与目标的标准加速度和碰撞时刻的前置角相关, 而是与整个弹道的约束都有关系. 注意, 此时得到的约束是标准弹道和非标准弹道均满足的约束. 接下来根据弹道评价函数分析标准弹道的约束条件. 结合式(12)与式(23), 可得在标准弹道下初始时刻偏置项为

    $$ \begin{equation} \left\{ \begin{aligned} & {{B}_{y,\; i}} = | {{{\dot{R}}}_{y,\; i,\; 0}} |\dot{q}_{\beta ,\; i,\; 0}^{{}} \\ & {{B}_{z,\; i}} = | {{{\dot{R}}}_{z,\; i,\; 0}} |\dot{q}_{\varepsilon ,\; i,\; 0}^{{}} \end{aligned} \right. \end{equation} $$ (31)

    同时乘以$ {{R}_{y,\; i,\; 0}} $, 有

    $$ \begin{equation} \left\{ \begin{aligned} & {{B}_{y,\; i}}R_{y,\; i,\; 0}^{{}} = -\dot{R}_{y,\; i,\; 0}^{{}}(R_{y,\; i,\; 0}^{{}}\dot{q}_{\beta ,\; i,\; 0}^{{}}) \\ &{{B}_{z,\; i}}R_{z,\; i,\; 0}^{{}} = -{{{\dot{R}}}_{z,\; i,\; 0}}({{{\dot{R}}}_{z,\; i,\; 0}}\dot{q}_{\varepsilon ,\; i,\; 0}^{{}}) \end{aligned} \right. \end{equation} $$ (32)

    代入式(9)则可得到初始时刻标准弹道的约束为

    $$ \left\{ \begin{aligned} {{B}_{y,\; i}}R_{y,\; i,\; 0}^{{}}=\; & ({{V}_{My,\; i}}\cos {{\eta }_{My,\; i,\; 0,\; s}}-\\ &{{V}_{Ty}}\cos {{\eta }_{Ty,\; i,\; 0,\; s}}) \times \\ & ({{V}_{My,\; i}}\sin {{\eta }_{My,\; i,\; 0,\; s}}-\\ &{{V}_{Ty}}\sin {{\eta }_{Ty,\; i,\; 0,\; s}}) \\ {{B}_{z,\; i}}R_{z,\; i,\; 0}^{{}} =\;& ({{V}_{Mz,\; i}}\cos {{\eta }_{Mz,\; i,\; 0,\; s}}-\\ &{{V}_{Tz}}\cos {{\eta }_{Tz,\; i,\; 0,\; s}}) \times \\ & ({{V}_{Mz,\; i}}\sin {{\eta }_{Mz,\; i,\; 0,\; s}}-\\ &{{V}_{Tz}}\sin {{\eta }_{Tz,\; i,\; 0,\; s}}) \end{aligned} \right. $$ (33)

    由于$ {{\dot{q}}_{\beta ,\; i}} $和$ {{\dot{q}}_{\varepsilon ,\; i}} $在碰撞时刻是有限的, $ {{R}_{y,\; i}} = 0 $和$ {{R}_{z,\; i}} = 0 $, 则可通过式(9)和(11)得到碰撞时刻满足的约束如下

    $$ \begin{equation} \left\{ \begin{aligned} & {{V}_{Ty,\; i}}\sin {{\eta }_{Ty,\; i,\; f}} = {{V}_{My,\; i}}\sin {{\eta }_{My,\; i,\; f}} \\ & {{V}_{Tz,\; i}}\sin {{\eta }_{Tz,\; i,\; f}} = {{V}_{Mz,\; i}}\sin {{\eta }_{Mz,\; i,\; f}} \end{aligned} \right. \end{equation} $$ (34)

    此时, 由初始时刻和碰撞时刻的弹道评价函数得到了六个关于弹道约束的方程和六个关于碰撞时刻的未知数, 但式(33)只是对初始条件的约束, 并没有涉及到碰撞时刻的未知数, 因此为了求解偏置项, 需要在不增加碰撞时刻未知数的情况下增加两个方程, 以研究初始条件与碰撞时刻未知数的关系. 同时可以发现, 方程(30)在给定了初始状态的情况下, 可以直接求解出终端的飞行器和目标在铅垂面的弹道角$ {{\theta }_{My,\; i,\; f}} $和$ {{\theta }_{Ty,\; f}} $, 可见重力对多飞行器弹道约束的影响能够被完全消除. 由式(9)第五个和第六个方程求导有

    $$ \begin{equation} \left\{ \begin{aligned} & {{{\dot{\eta }}}_{My,\; i}} = \frac{1}{{{V}_{My,\;i}}}{{{\dot{q}}}_{\beta ,\; i}}-\left( {{a}_{My,\; i}}-g\cos {{\theta }_{My,\; i}} \right) \\ & {{{\dot{\eta }}}_{Ty,\; i}} = \frac{1}{{{V}_{Ty}}} {{{\dot{q}}}_{\beta ,\; i}}-\left( {{a}_{Ty}}-g\cos {{\theta }_{Ty}} \right) \\ \end{aligned} \right. \end{equation} $$ (35)

    合并两式, 并结合式(12)第一式有

    $$ \begin{split} & {{{\dot{\eta }}}_{Ty,\; i}} +\frac{1}{{{V}_{Ty}}}\left( {{a}_{Ty}}-g\cos {{\theta }_{Ty}} \right) = \\ &\qquad{{{\dot{\eta }}}_{My,\; i}} + \frac{1}{{{V}_{My,\;i}}} ( N(| {{{\dot{R}}}_{y,\; i}} |{{{\dot{q}}}_{\beta ,\; i}}-{{B}_{y,\; i}})-\\ &\qquad g\cos {{\theta }_{My,\; i}} ) \end{split} $$ (36)

    则从初始时刻到碰撞时刻对上式积分, 得到碰撞时刻未知数需满足的约束为

    $$ \begin{split} \frac{1}{{{V}_{My,\; i}}} & \left( {{\Delta }_{i}}-g\sin {{\theta }_{My,\; i,\; f}}+g\sin {{\theta }_{My,\; i,\; 0}} \right) + \\ & {{\eta }_{My,\; i,\; f}}-{{\eta }_{My,\; i,\; 0}} = {{\eta }_{Ty,\; f}}-{{\eta }_{Ty,\; 0}} +\\ &\frac{1}{{{V}_{Ty}}} ({{a}_{Ty,\; i}}{{t}_{y,\; i,\; f}}-g\sin {{\theta }_{Ty,\; f}}+g\sin {{\theta }_{Ty,\; 0}}) \end{split} $$ (37)

    其中, $ {{\Delta }_{i}} = N{{t}_{y,\; i,\; f}}( | {{{\dot{R}}}_{y,\; i}} |{{{\dot{q}}}_{\beta ,\; i}}-{{B}_{y,\; i}} ) $. 同理, 在水平面上的拦截时间可以表示为

    $$ \begin{split} {{t}_{z,\; i,\; f}} =\; & \frac{-R_{z,\; i,\; 0}^{{}}}{|\dot{R}_{z,\; i,\; 0}^{{}}|} = \\ & \frac{-\dot{R}_{z,\; i,\; 0}^{{}}}{{{V}_{Tz}}\cos {{\eta }_{Tz,\; i,\; 0}}-{{V}_{Mz,\; i}}\cos {{\eta }_{Mz,\; i,\; 0}}} \end{split} $$ (38)

    则从初始时刻到碰撞时刻对上式积分, 得到如下约束

    $$ \begin{split} {{\eta }_{Mz,\; i,\; f}} & -{{\eta }_{Mz,\; i,\; 0}}+\\ &\frac{1}{{{V}_{Mz,\; i}}}N{{t}_{z,\; i,\; f}}(\left| {{{\dot{R}}}_{z,\; i}} \right|{{{\dot{q}}}_{\varepsilon ,\; i}}-{{B}_{z,\; i}}) = \\ &{{\eta }_{Tz,\; f}}-{{\eta }_{Tz,\; 0}}+\frac{1}{{{V}_{Tz}}}{{a}_{Tz,\; i}}{{t}_{z,\; i,\; f}} \end{split} $$ (39)

    综上所述, 整理得弹道约束如式(40)所示. 对于迎面拦截场景, 可以通过适当设置初始前置角、弹道角和初始相对距离$ {{r}_{i,\; s,\; 0}} $来求解偏置项. 在该情况下, 第$ i $个飞行器可以成功拦截机动性为$ {{a}_{Ty,\; i,\; s}} $和$ {{a}_{Tz,\; i,\; s}} $的目标, 定理1得证.

    设计完协同制导律的偏置项之后, 形成了对高速强机动目标的加速度覆盖, 之后对覆盖参数动态调节策略进行分析和设计, 主要克服以下两个问题: 一是由于中末交班过程中不可避免的角度或位置误差, 多个飞行器在末制导初始时刻可能无法实现目标最大加速度的完全覆盖; 二是目标的机动形式可能是不断变化的, 这将使得某些飞行器可能成为无效飞行器. 因此, 本节基于脱靶量和覆盖率优化提出了实时调整制导参数的覆盖动态调节策略, 一方面在前期尽可能的保持对目标机动逃逸区域的高覆盖率, 另一方面在目标改变机动形式时能够调节失效飞行器, 使其更接近目标, 降低整体的脱靶量, 提升对目标的拦截概率. 如图8所示, 覆盖率指的是在碰撞平面内, 个飞行器可达域投影圆的并集对目标可达域投影圆的覆盖比例, 计算公式为

    图 8  碰撞平面内的覆盖比例
    Fig. 8  Coverage ratio within the collision plane
    $$ \begin{align} \mu = \frac{C(\mathop {\mathop \cup \limits^n }\limits_i \,\; {{M}_{i}})\cap C(T)}{C(T)} \end{align} $$ (41)

    其中, $ C(\mathop {\mathop \cup \nolimits^n }\limits_i \,\; {{M}_{i}}) $表示所有飞行器可达域投影圆的并集, $ C(T) $表示目标的可达域的投影圆. 显然$ \mu $是一个与两者最大加速度和投影点位置相关的函数. 除初始时刻以外, 投影点的位置与偏置项相关.

    参考文献[18], 在三维空间内非线性模型的零控脱靶量可由下式计算

    $$ \begin{align} ZEM = R\sqrt{\frac{{{(R\dot{q})}^{2}}}{{{(\dot{R})}^{2}}+{{(R\dot{q})}^{2}}}} \end{align} $$ (42)

    可通过坐标转换, 将其投影到碰撞平面内得到第 个飞行器的零控脱靶量为

    $$ \begin{align} {ZEM}_{MTi,\; o} = [ZEM_{yi,\; o}^{{}},\; ZEM_{zi,\; o}^{{}}] \end{align} $$ (43)

    则其与目标的相对距离为

    $$ \begin{equation} \left\{ \begin{aligned} & {{\theta }_{My,\; i,\; f}}-{{\theta }_{My,\; i,\; 0}} = \frac{1}{{{V}_{My,\; i}}}(N{{t}_{y,\; i,\; f}}(| {{{\dot{R}}}_{y,\; i}} |{{{\dot{q}}}_{\beta ,\; i}}-{{B}_{y,\; i}})-g\sin {{\theta }_{My,\; i,\; f}}+g\sin {{\theta }_{My,\; i,\; 0}}) \\ & {{\theta }_{Ty,\; f}}-{{\theta }_{Ty,\; 0}} = \frac{1}{{{V}_{Ty}}}({{a}_{Ty,\; i}}{{t}_{y,\; i,\; f}}-g\sin {{\theta }_{Ty,\; f}}+g\sin {{\theta }_{Ty,\; 0}}) \\ & {{B}_{z,\; i}}R_{z,\; i,\; 0}^{{}} = -({{V}_{Tz}}\cos {{\eta }_{Tz,\; i,\; 0,\; s}}-{{V}_{Mz,\; i}}\cos {{\eta }_{Mz,\; i,\; 0,\; s}})({{V}_{Mz,\; i}}\sin {{\eta }_{Mz,\; i,\; 0,\; s}}-{{V}_{Tz}}\sin {{\eta }_{Tz,\; i,\; 0,\; s}}) \\ & {{B}_{y,\; i}}R_{y,\; i,\; 0}^{{}} = -({{V}_{Ty}}\cos {{\eta }_{Ty,\; i,\; 0,\; s}}-{{V}_{My,\; i}}\cos {{\eta }_{My,\; i,\; 0,\; s}})({{V}_{My,\; i}}\sin {{\eta }_{My,\; i,\; 0,\; s}}-{{V}_{Ty}}\sin {{\eta }_{Ty,\; i,\; 0,\; s}}) \\ & {{V}_{Ty,\; i}}\sin {{\eta }_{Ty,\; i,\; f}} = {{V}_{My,\; i}}\sin {{\eta }_{My,\; i,\; f}} \\ & {{V}_{Tz,\; i}}\sin {{\eta }_{Tz,\; i,\; f}} = {{V}_{Mz,\; i}}\sin {{\eta }_{Mz,\; i,\; f}} \\ & {{\eta }_{My,\; i,\; f}}-{{\eta }_{My,\; i,\; 0}}+\frac{1}{{{V}_{My,\; i}}}(N{{t}_{y,\; i,\; f}}(| {{{\dot{R}}}_{y,\; i}} |{{{\dot{q}}}_{\beta ,\; i}}-{{B}_{y,\; i}})-g\sin {{\theta }_{My,\; i,\; f}}+g\sin {{\theta }_{My,\; i,\; 0}}) = \\ &{{\eta }_{Ty,\; f}}-{{\eta }_{Ty,\; 0}}+\frac{1}{{{V}_{Ty}}}({{a}_{Ty,\; i}}{{t}_{y,\; i,\; f}}-g\sin {{\theta }_{Ty,\; f}}+g\sin {{\theta }_{Ty,\; 0}}) \\ & {{\eta }_{Mz,\; i,\; f}}-{{\eta }_{Mz,\; i,\; 0}}+\frac{1}{{{V}_{Mz,\; i}}}N{{t}_{z,\; i,\; f}}(| {{{\dot{R}}}_{z,\; i}} |{{{\dot{q}}}_{\varepsilon ,\; i}}-{{B}_{z,\; i}}) = {{\eta }_{Tz,\; f}}-{{\eta }_{Tz,\; 0}}+\frac{1}{{{V}_{Tz}}}{{a}_{Tz,\; i}}{{t}_{z,\; i,\; f}} \end{aligned} \right. \end{equation} $$ (40)
    $$ \begin{align} {{D}_{MTi,\; o}} = \sqrt{ZEM_{yi,\; o}^{2}+ZEM_{zi. o}^{2}} \end{align} $$ (44)

    在$ {{t}_{i}}<\frac{1}{2}{{t}_{i,\; f}} $时, 此时可认为是围捕前期, 多飞行器需要保持对目标机动逃逸区域的高覆盖率, 即

    $$ \begin{split} & (\Delta {{B}_{y,\; i}},\; \Delta {{B}_{z,\; i}}) = \\ &\qquad\arg \max \mu ({{B}_{y,\; i}}+\Delta {{B}_{y,\; i}},\; {{B}_{z,\; i}}+\Delta {{B}_{z,\; i}}) \end{split} $$ (45)

    上式的解析计算难度较大, 采用蒙特卡洛打靶法等数值方法耗时较长, 此处将之转化为投影点的相对位置$ {{D}_{MT,\; o}} $与投影圆半径$ {{R}_{Mi}},\; {{R}_{T}} $之间的关系. 在覆盖分析中, 要求形成完全覆盖时小圆在大圆的圆心处相切, 因此有以下两种情况:

    1)$ {{D}_{MTi,\; o}}+{{R}_{Mi}}>{{R}_{T}} $, 则此时该飞行器的投影点应该靠近目标的投影点;

    2)$ {{D}_{MTi,\; o}}+{{R}_{Mi}}<{{R}_{T}} $, 则此时该飞行器的投影点应该远离目标的投影点.

    一般$ \mu >0. 9 $即可认为多飞行器基本实现了对目标的完全覆盖, 因此若在$ \Delta t $时间内满足

    $$ \begin{align} 0. 9{{R}_{T}}<{{D}_{MTi,\; o}}+{{R}_{Mi}}<1. 1{{R}_{T}} \end{align} $$ (46)

    则称该时段内实现了覆盖, 为$ \Delta {{t}_{\operatorname{cov}\text{er,\; k}}} $则有

    $$ \begin{align} {{t}_{\operatorname{cov}\text{er}}} = \sum\limits_{k = 1}^{{{n}_{k}}}{\Delta {{t}_{\operatorname{cov}\text{er,\; k}}}} \end{align} $$ (47)

    定义$ \Delta {ZEM}_{yi} = {{ZEM}_{yi}}({{t}_{k}})-ZE{{M}_{yi}}({{t}_{k-1}}) $为铅垂面内零控脱靶量的变化量. $ \Delta {{ZEM}_{yi}}<0 $说明第$ i $个飞行器的零控脱靶量在减小, 即碰撞平面内该飞行器与目标投影点的距离在变小, 反之则说明距离在增大. 若第$ \Delta {{ZEM}_{yj}} = \mathop {\min }\nolimits_{i = 1,\;2,\;\cdots,n} \,\; \Delta ZE{{M}_{yi}} $, 则第$ j $个飞行器与目标投影点距离减小的梯度是最大的, 因此, 可设计偏置项的调节策略为

    $$ \begin{equation} \left\{ \begin{aligned} {{B}_{y,\; i}}({{t}_{k+1}})=\;& {{\rho }_{ij}}{{B}_{y,\; i,\; 0}}+(1-{{\rho }_{ij}}){{B}_{y,\; j}}({{t}_{k}}),\; when\\ &{{D}_{MTi,\; o}}+{{R}_{Mi}}>{{R}_{T}} \\ {{B}_{y,\; i}}({{t}_{k+1}}) =\;& (1-{{\rho }_{ij}}){{B}_{y,\; i,\; 0}}+{{\rho }_{ij}}{{B}_{y,\; j}}({{t}_{k}}),\; when \\ &{{D}_{MTi,\; o}}+{{R}_{Mi}}<{{R}_{T}} \end{aligned} \right. \end{equation} $$ (48)

    其中$ {{\rho }_{ij}} = {{e}^{\Delta ZE{{M}_{yj}}}}/{{e}^{\Delta {{ZEM}_{yi}}}} $.

    在$ {{t}_{i}}>\frac{1}{2}{{t}_{i,\; f}} $时, 此时多飞行器以降低整体的脱靶量为主要任务, 有

    $$ \begin{equation} \left\{ \begin{aligned} {{B}_{y,\; i}}({{t}_{k+1}}) =\;& {{\rho }_{ij}}{{B}_{y,\; i,\; 0}}+(1-{{\rho }_{ij}}){{B}_{y,\; j}}({{t}_{k}}),\; \\ & when\nabla >\tau \\ {{B}_{y,\; i}}({{t}_{k+1}}) & = {{B}_{y,\; i}}({{t}_{k}}),\; when \;\nabla <\tau \end{aligned} \right. \end{equation} $$ (49)

    其中$ \nabla = \Delta ZE{{M}_{yi}}-\Delta ZE{{M}_{yj}} $, $ \tau $为一个小量, 在围捕末段越靠近目标, $ \nabla $越可能发生跳变, 因此设置阈值$ \tau $防止制导参数频繁跳变. 在水平面同理可得在不同时间段关于$ {{B}_{z,\; i}} $的调节策略.

    考虑三维空间内多个飞行器围捕一个高速强机动目标的场景, 设置目标加速度上限$ 11.3g $, $ g $取$ 9.81\;\text{m/}{{\text{s}}^{\text{2}}} $, 速度为5 Ma, 初始位置为$ {{(100,\; 0,\; 0)}^{T}}\;\text{km} $, 设置队形中心的初始位置为$ {{(50,\; 0,\; 0)}^{T}}\;\text{km} $, 认为在之前已经形成了满足约束的初始队形. 设置多飞行器加速度上限$ 10.6g $, 速度6 Ma, 采用基于偏置比例导引的协同制导律, $ N $取5, 得到$ {{\kappa }_{a,\; r}} = 0. 6 $, 计算得到$ \alpha \approx 40{}^\circ $, 取交会角$ \beta = 5{}^\circ $, 计算得到$ {{\kappa }_{\beta }} = 0.978 $, $ \mu \text{ = }0. 5557 $, 查表可知最优飞行器数量为6架, 编号为$ {{M}_{1}} $到$ {{M}_{6}} $, 分别对应飞行器1到飞行器6. 此时实际能够使用的最大加速度只有6. 36g, 可见多飞行器为了捕获目标, 最大加速度受到了制导律的限制, 可行域相比可达域显著减小. 考虑多飞行器和目标均有重力影响, 可得碰撞平面的覆盖情况如图9(a)所示, 此时设计多飞行器与目标的初始位置为$ {{M}_{6}} $的圆心在编队中心处, $ {{M}_{1}} $到$ {{M}_{5}} $的圆心均匀分布在目标可达域投影圆的周长上, $ {{M}_{2}} $在$ {{M}_{6}} $的正上方, $ {{M}_{1}} $到$ {{M}_{5}} $与编队中心的连线间隔72度. 对应的加速度的覆盖关系如图9(b)所示, 蓝色圆表示目标以加速度上限为半径形成的加速度覆盖域, 虚线为不考虑重力加速度时的覆盖域, 可见在考虑了重力加速度之后, 加速度覆盖域实际为原覆盖域向下平移了g. 红色圆表示飞行器以覆盖加速度上限为半径形成的加速度覆盖域, 即为飞行器在当前制导律下过载不饱和时能够拦截的目标加速度范围. 红色圆心的数值表示在重力加速度的影响下, 该飞行器以标准弹道能够拦截的目标标准加速度的大小. 可以看到, 此时多飞行器的加速度覆盖域能够对目标的覆盖域形成完全覆盖.

    图 9  对高速强机动目标最大正向机动的围捕覆盖
    Fig. 9  Encirclement for positive direction maneuvering the target

    初始覆盖完成后, 可计算出初始的前置角和偏置项如表2所示, 下面将通过数值仿真分别对比基于加速度覆盖的协同制导律与传统基于比例导引的协同制导律的协同围捕效果, 其中基于加速度覆盖的协同制导律采用偏置比例导引, 可根据是否采用覆盖调节策略分为预设覆盖调节与动态覆盖调节两类.

    表 2  初始的制导参数
    Table 2  Initial guidance parameters
    制导参数 ${{{M}}_{{{1}}}}$ ${{{M}}_{{{2}}}}$ ${{{M}}_{{{3}}}}$ ${{{M}}_{{{4}}}}$ ${{{M}}_{{{5}}}}$ ${{{M}}_{{{6}}}}$
    $B_{y}$ 44.49338 0 44.4938 28.1938 28.1938 0
    $B_{z}$ 14.7910 46.5865 14.7910 38.0842 38.0842 0
    $\eta_{My,\; 0}\; ({}^\circ)$ 9.4049 0 9.4049 5.8450 5.8450 0
    $\eta_{Mz,\; 0}\; ({}^\circ)$ 3.0309 9.8796 3.0309 7.9790 7.9790 0
    下载: 导出CSV 
    | 显示表格

    首先假定目标以最大加速度进行机动, 多飞行器分别基于加速度覆盖和比例导引对目标进行围捕. 定义目标的最大正向机动为以最大加速度往Y和Z的正方向机动, 最大负向机动为以最大加速度往Y和Z的负方向机动, 仿真结果分别如图10图11所示.

    图 10  对高速强机动目标最大正向机动的围捕覆盖
    Fig. 10  Encirclement for positive direction maneuvering the target
    图 11  对高速强机动目标最大负向机动的围捕覆盖
    Fig. 11  Encirclement for negative direction maneuvering the target

    表3给出了目标以最大加速度机动时每个飞行器在不同制导律下的脱靶量. 通过图10图11以及表3可以看到, 在目标以最大加速度进行正向和负向机动时, 基于比例导引的协同制导律的多飞行器脱靶量较大, 均未有效拦截目标. 而基于加速度覆盖的协同制导律的仿真中, 多飞行器能够保证至少有一个飞行器有效拦截目标, 其中采用动态覆盖调节策略的结果与采用预设覆盖调节策略的结果相比而言, 增加了有效拦截目标的飞行器数量, 多飞行器的最小脱靶量有所减小, 整体脱靶量得到了显著减小.

    表 3  目标以最大加速度机动的情况下的脱靶量
    Table 3  Miss distance under target maximum acceleration maneuver
    机动形式 调节策略 有效拦截目标的飞行器 对应脱靶量
    最大正向机动预设调节$M_3$1.18 m
    动态调节$M_2,\; M_3$0. 95 m 1.12 m
    最大负向机动预设调节$M_5$1.35 m
    动态调节$M_5$1.22 m
    下载: 导出CSV 
    | 显示表格

    结合上述分析可知, 当目标以最大加速度机动时, 基于加速度覆盖的协同制导律明显优于基于比例导引的协同制导律, 而其中采用动态调节的策略能够降低平均脱靶量, 增加有效拦截目标的飞行器数量, 能够更好地发挥其他飞行器的作用, 增强系统的鲁棒性和容错能力. 此外, 当目标最大负向机动时, 由于重力加速度的耦合影响, 基于加速度覆盖的多飞行器脱靶量整体都有增加, 但仍能保证至少一个飞行器有效拦截目标.

    其次, 假定目标以某一恒定加速度$ \lambda {{a}_{T,\; \max }} $机动, 其中$ \lambda \in \left[ -1,\; 1 \right] $, 同样的初始阵位下多飞行器分别基于加速度覆盖和比例导引对高速强机动目标进行围捕. 将多飞行器中最小的脱靶量记为协同围捕的脱靶量, 得到如图12所示的脱靶量关于目标机动的分布情况, 比例导引在$ \lambda \ge 0.45 $以及$ \lambda \le -0.35 $时均出现了较大的脱靶量, 并且由于重力加速度的影响, 负向的脱靶量整体相比正向更大. 由此可见在当前阵位下, 基于比例导引的协同制导律只在目标加速度范围属于$ \left[ -0.35{{a}_{T,\; \max }},\; 0.45{{a}_{T,\; \max }} \right] $内时有效, 而基于加速度覆盖的协同制导律在目标加速度范围$ \left[ -{{a}_{T,\; \max }},\; {{a}_{T,\; \max }} \right] $内均能有效拦截目标, 显然其能够有效应对大机动逃逸的目标, 上述结果进一步证明了基于加速度覆盖的协同制导律的优越性.

    图 12  脱靶量关于目标机动的分布
    Fig. 12  Distribution of miss distance with respect to target maneuvering

    最后, 假定目标以最大加速度$ {{a}_{T,\; \max }} $做方波机动, 如图13所示, 切换时间随机, 以此验证基于加速度覆盖的协同制导律在应对变机动目标的鲁棒性. 仿真结果如图14所示, 可见目标作随机方波机动时, 基于加速度覆盖的多飞行器能够保证至少有一个飞行器$ {{M}_{6}} $有效拦截变机动目标, 脱靶量如表4所示. 采用动态覆盖调节策略下, 还有飞行器$ {{M}_{2}} $与$ {{M}_{3}} $也能实现对变机动目标的有效拦截, 整体实现了对变机动目标的覆盖调节与收敛, 并在过载约束内最终捕获目标.

    图 13  目标以随机时间切换的方波机动过载
    Fig. 13  Overload of target maneuvering with random time-switched square wave pattern
    图 14  对目标随机时间方波机动的围捕覆盖
    Fig. 14  Encirclement for random square wave maneuvering the target
    表 4  目标以随机方波机动的情况下的脱靶量
    Table 4  Miss distance under target maneuvering with random square wave pattern
    机动形式 调节策略 有效拦截目标的飞行器 对应脱靶量
    随机方
    波机动
    预设调节 $M_6$ 0.85 m
    动态调节 $M_2,\; M_3,\; M_6$ 0.62 m 0.73 m 0.80 m
    下载: 导出CSV 
    | 显示表格

    综上, 通过数值仿验证了算法的扩展性和工程实用性, 多飞行器在机动能力严格弱于目标的情况下仍能够有效拦截高速强机动目标, 实现了以数量优势弥补机动性不足的完全弱围强.

    本文研究了多飞行器协同围捕覆盖动态调节与快速收敛策略, 基于加速度覆盖设计了偏置比例协同制导律, 提出了根据动态过程在线调整多飞行器围捕区的覆盖策略, 有效延长对目标的覆盖时间, 提升对目标的覆盖率并最终保证捕获目标. 此外, 结合数值仿真对比了基于比例导引的协同制导律, 得出了基于加速度覆盖的协同制导律能够有效应对更大机动逃逸目标的结论, 并通过目标作随机机动验证了所提策略的优越性. 未来可在覆盖阵位形成、最优覆盖调节及覆盖博弈对抗等方面深入开展研究.

  • 图  1  4种不同规模的网络

    Fig.  1  Four networks with different sizes

    图  2  不同网络规模下本文所提出算法的性能表现

    Fig.  2  Performance of the proposed algorithms under different network sizes

    图  3  2种不同的网络拓扑

    Fig.  3  Two different network topologies

    图  4  不同网络拓扑下本文所提出算法的性能表现

    Fig.  4  Performance of the proposed algorithms under different network topologies

    图  5  不同数据集下本文所提出算法的性能表现

    Fig.  5  Performance of the proposed algorithms under different datasets

    图  6  4种不同延迟分布

    Fig.  6  Four different delay distributions

    图  7  不同延迟分布下本文所提出算法的性能表现

    Fig.  7  Performance of the proposed algorithms under different delay distributions

    图  8  在小网络的不同延迟大小下本文所提出算法的性能表现 (小网络: N = 20)

    Fig.  8  Performance of the proposed algorithms under different delays of small networks (small network: N = 20)

    图  9  在大网络的不同延迟大小下本文所提出算法的性能表现 (大网络: N = 100)

    Fig.  9  Performance of the proposed algorithms under different delays of large networks (large network: N = 100)

  • [1] Bedi A S, Sarma P, Rajawat K. Adversarial multi-agent target tracking with inexact online gradient descent. In: Proceedings of the IEEE International Conference on Aconstics, Speech and Signal Processing. Calgary, Canada: IEEE, 2018. 2881−2885
    [2] Karuga G G, Khraban A M, Nair S K, Rice D O. AdPalette: An algorithm for customizing online advertisements on the fly. Decision Support Systems, 2001, 32(2): 85−106 doi: 10.1016/S0167-9236(01)00104-X
    [3] Li X X, Xie L H, Li N. A survey on distributed online optimization and online games. Annual Reviews in Control, 2023, 56: Article No. 100904 doi: 10.1016/j.arcontrol.2023.100904
    [4] Eshraghi N, Liang B. Dynamic regret of online mirror descent for relatively smooth convex cost functions. IEEE Control Systems Letters, 2022, 6: 2395−2400 doi: 10.1109/LCSYS.2022.3155067
    [5] Yuan D M, Hong Y G, Ho D W C, Xu S Y. Distributed mirror descent for online composite optimization. IEEE Transactions on Automatic Control, 2020, 66(2): 714−729
    [6] Dixit R, Bedi A S, Rajawat K. Online learning over dynamic graphs via distributed proximal gradient algorithm. IEEE Transactions on Automatic Control, 2020, 66(11): 5065−5079
    [7] Yuan D M, Zhang B Y, Xu S Y, Zhao H Y. Distributed regularized online optimization using forward-backward splitting. Control Theory and Technology, 2023, 21(2): 212−221 doi: 10.1007/s11768-023-00134-1
    [8] Yi X L, Li X X, Yang T, Xie L H, Chai T Y, Karl H J. Regret and cumulative constraint violation analysis for distributed online constrained convex optimization. IEEE Transactions on Automatic Control, 2022, 68(5): 2875−2890
    [9] Molzahn D K, Dörfler F, Sandberg H, Low S H, Chakrabarti S, Baldick R, et al. A survey of distributed optimization and control algorithms for electric power systems. IEEE Transactions on Smart Grid, 2017, 8(6): 2941−2962 doi: 10.1109/TSG.2017.2720471
    [10] Li Z W, Zhang J L. Study on the distributed model predictive control for multi-zone buildings in personalized heating. Energy and Buildings, 2021, 231: Article No. 110627 doi: 10.1016/j.enbuild.2020.110627
    [11] 吴庆涛, 朱军龙, 葛泉波, 张明川. 一种基于条件梯度的加速分布式在线学习算法. 自动化学报, 2024, 50(2): 386−402

    Wu Qing-Tao, Zhu Jun-Long, Ge Quan-Bo, Zhang Ming-Chuan. An accelerated distributed online learning algorithm based on conditional gradient. Acta Automatica Sinica, 2024, 50(2): 386−402
    [12] 刘奕葶, 马铭莙, 付俊. 基于有向图的分布式连续时间非光滑耦合约束凸优化分析. 自动化学报, 2024, 50(1): 66−75

    Liu Yi-Ting, Ma Ming-Jun, Fu Jun. Distributed continuous-time non-smooth convex optimization analysis with coupled constraints over directed graphs. Acta Automatica Sinica, 2024, 50(1): 66−75
    [13] Yuan D M, Proutiere A, Shi G D. Distributed online optimization with long-term constraints. IEEE Transactions on Automatic Control, 2021, 67(3): 1089−1104
    [14] Li X X, Yi X L, Xie L H. Distributed online convex optimization with an aggregative variable. IEEE Transactions on Control of Network Systems, 2021, 9(1): 438−449
    [15] Zhang Y J, Dall'Anese E, Hong M Y. Online proximal-ADMM for time-varying constrained convex optimization. IEEE Transactions on Signal and Information Processing Over Networks, 2021, 7: 144−155 doi: 10.1109/TSIPN.2021.3051292
    [16] Jin D Q, Chen J, Richard C, Chen J D. Online proximal learning over jointly sparse multitask networks with ${\ell_{\infty,\; 1}}$ regularization. IEEE Transactions on Signal Processing, 2020, 68: 6319−6335 doi: 10.1109/TSP.2020.3021247
    [17] Wang C, Tang J H, Cheng X H, Liu Y C, Wang C C. Distributed cooperative task planning algorithm for multiple satellites in delayed communication environment. Journal of Systems Engineering and Electronics, 2016, 27(3): 619−633 doi: 10.1109/JSEE.2016.00066
    [18] Quanrud K, Khashabi D. Online learning with adversarial delays. In: Proceedings of the 29th International Conference on Neural Information Processing System. Montreal, Canada: MIT, 2015. 1270−1278
    [19] Wang J C, Dong M, Liang B, Boudreau G, Abou-Zeid H. Delay-tolerant OCO with long-term constraints: Algorithm and its application to network resource allocation. IEEE/ACM Transactions on Networking, 2022, 31(1): 147−163
    [20] Wan Y Y, Tu W W, Zhang L J. Online strongly convex optimization with unknown delays. Machine Learning, 2022, 111(3): 871−893 doi: 10.1007/s10994-021-06072-w
    [21] Wang D, Liu J X, Lian J, Liu Y, Wang Z, Wang W. Distributed delayed dual averaging for distributed optimization over time-varying digraphs. Automatica, 2023, 150: Article No. 110869 doi: 10.1016/j.automatica.2023.110869
    [22] Bedi A S, Koppel A, Rajawat K. Asynchronous online learning in multi-agent systems with proximity constraints. IEEE Transactions on Signal and Information Processing Over Networks, 2019, 5(3): 479−94 doi: 10.1109/TSIPN.2019.2902493
    [23] Inoue K, Hayashi N, Takai S. Distributed online optimization with dynamic coupling constraints under time-varying communication delays. IEEE Access, 2023, 11: 87256−87269 doi: 10.1109/ACCESS.2023.3305529
    [24] Liu B, Wen G, Fang X, Huang T, Chen G. Distributed online generalized Nash Equilibrium learning in multi-cluster games: A delay-tolerant algorithm. arXiv preprint arXiv: 2407.03578, 2024.
    [25] Cao X Y, Başar T. Decentralized online convex optimization based on signs of relative states. Automatica, 2021, 129: Article No. 109676 doi: 10.1016/j.automatica.2021.109676
    [26] Flaxman A D, Kalai A T, McMahan H B. Online convex optimization in the bandit setting: Gradient descent without a gradient. In: Proceedings of the 16th Annual ACM-SIAM Symposium on Discrete Algorithms. 2005. 385−394
    [27] Cao X Y, Başar T. Decentralized online convex optimization with feedback delays. IEEE Transactions on Automatic Control, 2021, 67(6): 2889−904
    [28] Wang C, Xu S Y. Distributed online constrained optimization with feedback delays. IEEE Transactions on Neural Networks and Learning Systems, 2022, 35(2): 1708−1720
    [29] Xiong M H, Zhang B Y, Yuan D M, Zhang Y J, Chen J. Event-triggered distributed online convex optimization with delayed bandit feedback. Applied Mathematics and Computation, 2023, 445: Article No. 127865 doi: 10.1016/j.amc.2023.127865
    [30] Kocic M, Brady D, Stojanovic M. Sparse equalization for real-time digital underwater acoustic communications. In: Proceedings of the Conference of “Challenges of Our Changing Global Environment”. San Diego, USA: MTS/IEEE, 1995. 1417−1422
    [31] Yi X L, Li X X, Xie L H, Johansson K H. Distributed online convex optimization with time-varying coupled inequality constraints. IEEE Transactions on Signal Processing, 2020, 68: 731−746 doi: 10.1109/TSP.2020.2964200
    [32] Xiong M H, Ho D W C, Zhang B Y, Yuan D M, Xu S Y. Distributed online mirror descent with delayed subgradient and event-triggered communications. IEEE Transactions on Network Science and Engineering, 2024, 11(2): 1702−1715 doi: 10.1109/TNSE.2023.3329523
    [33] Meng M, Li X X, Chen J. Decentralized Nash equilibria learning for online game with Bandit feedback. IEEE Transactions on Automatic Control, 2024, 69(6): 4050−4057 doi: 10.1109/TAC.2023.3342850
    [34] Nguyen T A, Kim Thang N, Trystram D. Handling delayed feedback in distributed online optimization: A projection-free approach. In: Proceedings of the Joint European Conference on Machine Learning and Knowledge Discovery in Databases. 2024. 197−211
    [35] Matamoros J. Asynchronous online ADMM for consensus problems. In: Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). New Orleans, USA: IEEE, 2017. 5875−5879
    [36] Li X X, Yi X L, Xie L H. Distributed online optimization for multi-agent networks with coupled inequality constraints. IEEE Transactions on Automatic Control, 2020, 66(8): 3575−3591
    [37] Ajalloeian A, Simonetto A, Dall'Anese E. Inexact online proximal-gradient method for time-varying convex optimization. In: Proceedings of the American Control Conference (ACC). Denver, USA: IEEE, 2020. 2850−2857
    [38] 杨涛, 徐磊, 易新蕾, 张圣军, 陈蕊娟, 李渝哲. 基于事件触发的分布式优化算法. 自动化学报, 2022, 48(1): 133−143

    Yang Tao, Xu Lei, Yi Xin-Lei, Zhang Sheng-Jun, Chen Rui-Juan, Li Yu-Zhe. Event-triggered distributed optimization algorithms. Acta Automatica Sinica, 2022, 48(1): 133−143
    [39] Zhang J Q, You K Y, Başar T. Distributed discrete-time optimization in multiagent networks using only sign of relative state. IEEE Transactions on Automatic Control, 2018, 64(6): 2352−2367
    [40] Iutzeler F, Ciblat P, Jakubowicz J. Analysis of max-consensus algorithms in wireless channels. IEEE Transactions on Signal Processing, 2012, 60(11): 6103−6107 doi: 10.1109/TSP.2012.2211593
    [41] Cao X Y, Liu K J R. Online convex optimization with time-varying constraints and bandit feedback. IEEE Transactions on Automatic Control, 2018, 64(7): 2665−2680
    [42] Yi X L, Li X X, Yang T, Xie L H, Chai T Y, Johansson K H. Distributed bandit online convex optimization with time-varying coupled inequality constraints. IEEE Transactions on Automatic Control, 2020, 66(10): 4620−4635
    [43] Ito S. An optimal algorithm for bandit convex optimization with strongly-convex and smooth loss. In: Proceedings of the 23rd International Conference on Artificial Intelligence and Statistics. Palermo, Italy: PMLR, 2020. 2229−2239
    [44] Hazan E, Levy K. Bandit convex optimization: Towards tight bounds. In: Proceedings of the 28th International Conference on Neural Information Processing system. Montreal, Canada: MIT, 2014. 784−792
    [45] Cassel A, Koren T. Bandit linear control. Advances in Neural Information Processing Systems, 2020, 33: 8872−8882
    [46] Parikh N, Boyd S. Proximal algorithms. Foundations and TrendsⓇ in Optimization, 2014, 1(3): 127−239 doi: 10.1561/2400000003
  • 加载中
图(9)
计量
  • 文章访问数:  342
  • HTML全文浏览量:  154
  • PDF下载量:  66
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-06-29
  • 录用日期:  2024-11-21
  • 网络出版日期:  2024-12-25
  • 刊出日期:  2025-04-15

目录

/

返回文章
返回