Distributed Resource Allocation Algorithm for Second-order Multi-agent Systems in Continuous-time
-
摘要:
针对二阶多智能体系统中的分布式资源分配问题, 本文设计两种连续时间算法. 基于KKT (Karush−Kuhn−Tucker, 卡罗需−库恩−塔克)优化条件, 第一种控制算法利用节点局部不等式及其梯度信息来约束节点状态. 与上述梯度方法不同, 第二种控制算法包括一致性梯度下降法和固定时间收敛映射算子, 其中固定时间收敛映射算子确保算法的节点状态在固定时间收敛到局部约束集, 一致性梯度下降法目的是确保节点迭代到资源分配问题最优解. 两种控制算法都对状态无初始值约束, 且控制参数都是常数. 利用凸优化理论和固定时间李雅普诺夫方法, 分别分析了上述控制策略在有向平衡网络条件下的渐近和指数收敛性. 最后通过数值仿真验证了所设计算法在一维和高维资源分配问题的有效性.
Abstract:For the distributed resource allocation problem in second-order multi-agent systems (MASs), this paper proposes two continuous-time distributed algorithms. Based on the KKT (Karush-Kuhn-Tucker) optimal condition, the constrained state of each agent is ensured by applying the information of the local inequality constraints and its gradient in the first proposed control algorithm. Different from the previous gradient method, the second proposed algorithm consists of two parts: a consensus-based gradient descent algorithm and a fixed-time convergent projection operator, in which the projection operator plays a key role in ensuring local inequality constraints and the optimal solution of the distributed resource allocation problem is guaranteed by the gradient descent iteration. The above two proposed algorithms with constant control parameters is initialization-free. Based on convex optimization theory and fixed-time Lyapunov analysis, the asymptotic and exponential convergence results are given for weight-balanced directed network, respectively. Finally, the effectiveness of our proposed algorithm in one-dimensional and high-dimensional resource allocation problems is validated by several simulations.
-
随着控制技术的发展, 将控制技术与优化算法相结合, 以分布式方式求解网络优化问题成为近年来的研究热点[1-7]. 作为网络优化领域里一个重要分支, 资源分配在网络系统中有很广泛的应用, 例如能源系统中的经济调度和通讯网络中的网络利用率最优化等问题.
近些年来, 基于离散时间算法的分布式优化问题已经得到了一些很好的结果. 例如, 文献[8-10]等针对有约束或无约束最优协调问题设计了一种基于梯度的算法. 而对于强连通有向网络下的资源分配问题, 文献[11-13]等基于多智能体一致性理论, 分别设计一种基于余量和基于Push-sum (推和)的分布式优化算法. 更多离散时间算法可参考文献[14-19]及它们的引用文献, 其中收敛速度最快的为文献[17]的线性收敛, 但是依然无法预知其收敛时间. 另一方面, 随着信息物理系统和连续时间控制技术的发展[20-25], 利用基于连续时间的分布式控制策略也已被广泛应用于解决资源分配问题, 特别是其中的有限/固定/预定时间收敛理论, 更符合实际系统需求. 为了解决无向网络下的无约束资源分配问题, 基于多智能体一致性理论, 文献[26]设计了一种指数收敛速度二阶连续时间算法. 不同于文献[26]的渐近式收敛, 文献[27-30]分别设计一种基于固定时间和预定时间收敛的连续时间算法. 在此基础上, 文献[31-35]提出了一种考虑不等式约束的分布式算法, 该算法利用映射算子将节点状态限制在不等式约束集合内, 从而得到了一种无初值约束分布式算法, 并在文献[35]中实现了固定时间收敛. 与映射法不同, 文献[36-38]和文献[39]利用精确罚函数法将局部等式约束转移到目标函数中, 分别设计了一阶和二阶连续时间算法. 而对于有向网络下的资源分配问题, 也有很多学者提出了解决方法, 例如奇异摄动算法[40]、原始对偶算法[41]、映射法[42]、二阶连续时间算法[43]以及微分映射法[44].
从前面的讨论可以看出, 目前只有一阶分布式优化算法在连续时间和离散时间情况下都取得了显著的效果. 而有关二阶多智能体分布式优化算法的文献不是很多. 其中文献[26, 45-46]研究了无约束资源分配问题, 并没有将节点局部不等式约束考虑进来. 但在许多工程应用中, 节点的决策会受到局部约束, 这些约束可能来自安全考虑、生产能力、执行能力等, 如电力系统中发电机的输出功率的边界限制[1]. 文献[39]和文献[43]分别利用精确罚函数法和微分映射法解决了资源分配问题中的局部不等式约束. 但是上述两篇文献所提出的算法都对初始状态进行限定. 而这种初始化协调过程可能只适应于静态网络. 然而对于一个动态网络来说, 一旦网络发生变化或者节点生产约束发生突变时, 就必须重新分配资源配置更改. 因此这些优化算法重新启动时, 必须重新进行初始化协调, 这大大降低了它们的适用性. 此外, 文献[26, 39, 45-46]中考虑的都是无向网络.
然而, 由于通信延迟等造成的通信中断会使得无向网络变成有向网络, 进而可能会使得一些基于无向网络的分布式算法失效. 另外, 无向网络是有向平衡网络的一个特例, 在工程应用中, 有向平衡网络比无向网络也更易于实现, 因此研究有向平衡网络上的资源分配问题是有意义的. 由于二阶多智能体系统的广泛存在, 如: 移动机器人、发电机等, 本文考虑二阶多智能体的分布式资源分配问题. 针对有向平衡网络下的资源分配问题, 本文首先利用局部不等式及其梯度设计第一种算法, 其次利用固定时间理论和映射算子设计第二种算法, 其中映射算子用于处理不等式约束, 且确保此不等式在固定时间内即可满足, 此方法可推广到同类型带局部不等式约束的分布式优化问题中.
本文所提算法创新点如下:
1) 相比于文献[26, 45-46], 本文将二阶多智能体节点的局部不等式约束考虑进来;
2) 与文献[39]的无向网络相比, 我们研究有向平衡网络下的资源分配问题;
3) 相比于文献[43], 本文所提两种算法均对初始值无要求, 且分别实现渐近和指数收敛;
4) 针对节点局部不等式约束, 本文结合了固定时间收敛理论和映射算子, 使得收敛速度上会比单纯使用映射算子方法的算法要快, 并通过案例仿真可以验证此性质.
本文后续内容结构如下: 在第1节中, 将完成问题描述以及预备知识, 其中预备知识包括代数图论、固定时间收敛理论等; 在第2节中, 首先进行算法设计, 分别是渐近收敛算法和指数收敛算法, 其次给出相应的最优性引理以及各自算法的收敛性分析; 在第3节中, 给出3个仿真案例;本文的总结与展望放在第4节中.
1. 问题描述及预备知识
在后续描述中, 令
$ \mathbf{R} $ 、$ \mathbf{R}_{+} $ 和$ \mathbf{R}^m $ 分别表示实数、非负实数和$ m $ 维实空间. 对于闭集合$\Omega\in\mathbf{R}^m,$ 定义映射算子$P_{\Omega}(\boldsymbol x) = \arg\min_{\forall \boldsymbol y\in\Omega}\{\Vert\boldsymbol x-\boldsymbol y\Vert\}$ , 且有性质$(\boldsymbol x- $ $ P_{\Omega}(\boldsymbol x))^{\text{T}}(\boldsymbol z-P_{\Omega}(\boldsymbol x))\le0,\forall \boldsymbol z\in\Omega,\boldsymbol x\in\mathbf{R}^m$ .$ \text{sign}(\cdot) $ 表示符号函数.$ (x)^+ = \max\{x,0\} $ .$ \otimes $ 表示克罗内克积, 对于矩阵$ \boldsymbol A,\boldsymbol B\in\mathbf{R}^{n \times n} $ ,$\boldsymbol A\otimes\boldsymbol B := [a_{ij}\boldsymbol B]\in $ $ \mathbf{R}^{n^2\times n^2}$ .$ \partial f(\boldsymbol x) $ 表示函数$ f(\boldsymbol x) $ 的梯度.1.1 问题描述
本文所研究的二阶多智能体系统包含
$ n $ 个智能体节点, 每个智能体$ i $ 都采用如下动力学模型:$$ \ddot{\boldsymbol x}_i = \boldsymbol u_i $$ (1) 其中,
$ \boldsymbol x_i\in\mathbf{R}^m $ 表示第$ i $ 个智能体的资源分配量,$\boldsymbol u_i\in $ $ \mathbf{R}^m$ 表示节点$ i $ 的控制输入. 并且每个智能体节点$ i $ 都拥有一个决策变量$ \boldsymbol x_i $ 和私有代价函数$ f_i(\boldsymbol x_i):\mathbf{R}^m\to\mathbf{R} $ , 其中$ \boldsymbol x_i $ 满足私有约束$ \boldsymbol x_i\in\Omega_i $ . 智能体系统的目标就是在满足自身节点约束的同时, 如何以最小的代价通过邻居节点信息交互把有限的资源$ \sum_{i = 1}^n\boldsymbol d_i $ 分配给所有智能体节点, 且各节点只能利用自己的私有信息$\Omega_i$ 和$ f_i(\boldsymbol x_i) $ , 其中资源量$ \boldsymbol d_i $ 为各节点的虚拟分配量或期望资源量. 上述多智能体系统的资源分配问题数学模型表示如下:$$ \begin{split} &\min f(\boldsymbol x) = \sum\limits_{i = 1}^nf_i(\boldsymbol x_i)\\ &\text{s.\;t. }\sum\limits_{i = 1}^n\boldsymbol x_i = \sum\limits_{i = 1}^n\boldsymbol d_i\\ &\qquad\boldsymbol x_i\in\Omega_i,\forall i\in V \end{split} $$ (2) 其中,
$ f(\boldsymbol x) $ 为全局目标函数: 集合$\Omega_i$ 表示每个智能体的局部约束, 集合$ V $ 表示智能体(编号)集合. 此外, 局部约束也可描述为$\Omega_i = \{\boldsymbol x_i|\varphi_i(\boldsymbol x_i)\le{\bf 0}_{s_i}\}$ , 其中$\varphi_i(\boldsymbol x_i) = $ $ [\varphi_{i,1}(\boldsymbol x_i),\varphi_{i,2}(\boldsymbol x_i),\cdots,\varphi_{i,s_i}(\boldsymbol x_i)]^{\text{T}},\;s_i\in\mathbf{N}$ 表示节点$ i $ 不等式约束的个数, 令$ s = \sum_{i = 1}^ns_i $ . 以智能电网中的经济调度问题为例,$ f_i(\boldsymbol x_i) $ 表示发电机组的发电成本函数, 变量$ \boldsymbol d_i $ 表示负荷侧/用户侧的用电需求, 此物理量可以是各发电公司利用神经网络等技术, 结合用户侧的历史数据做出的短期负荷预测.假设 1. 目标函数
$ f(\boldsymbol x) $ 是$\omega-$ 强凸函数, 二次可微, 且其梯度满足$ \theta- $ 李普希茨性质. 即存在$\omega > $ $ 0,\theta > 0$ , 使得$(\boldsymbol x-\boldsymbol y)^{\text{T}}(\partial f(\boldsymbol x)-\partial f(\boldsymbol y))\ge \omega\Vert\boldsymbol x-\boldsymbol y\Vert^2, \Vert\partial f(\boldsymbol x)- $ $ \partial f(\boldsymbol y)\Vert\le\theta\Vert\boldsymbol x-\boldsymbol y\Vert.$ 假设 2. 局部不等式约束中
$ \varphi(\boldsymbol x) $ 为凸函数且存在一点$ \boldsymbol x $ 使得$ \varphi(\boldsymbol x)\le0 $ 和$ \sum_{i = 1}^n\boldsymbol x_i = \sum_{i = 1}^n\boldsymbol d_i $ 且存在某一智能体$ i $ 满足$ \varphi_i(\boldsymbol x_i)<0 $ , 其中$\varphi(\boldsymbol x) = [(\varphi_i (\boldsymbol x_i))^{\text{T}},\cdots, $ $ (\varphi_n(\boldsymbol x_n))^{\text{T}}]^{\text{T}}\in\mathbf{R}^s,\boldsymbol x = [\boldsymbol x_1^{\text{T}},\cdots,\boldsymbol x_n^{\text{T}}]^{\text{T}}\in\mathbf{R}^{mn} .$ 注 1. 假设1中的强凸性保证了问题 (2)最优解的唯一性. 此假设已广泛应用于此类问题的算法设计中, 如离散时间算法[12-13, 17, 19]和连续时间算法[26, 31-32, 34-35, 39, 43], 有助于作者分析所设计算法的收敛性. 假设2是约束优化问题中常用的Slater条件, 此条件确保了后续引理2的有效性.
引理 1[39]. 若假设1和2成立, 则
$ \boldsymbol x^*\in\mathbf{R}^{nm} $ 是问题 (2)的最优解, 当且仅当存在$ \boldsymbol y^*\in\mathbf{R}^m $ , 使得$ (\boldsymbol x^*,\boldsymbol y^*) $ 满足$$ \begin{split} &{\bf 0}_{nm}\in\partial f(\boldsymbol x^*)+{\bf 1}_n\otimes {\boldsymbol y}^*\\ &\sum\limits_{i = 1}^n\boldsymbol x_i^* = \sum\limits_{i = 1}^n{\boldsymbol d}_i,\forall {\boldsymbol x}_i^*\in\varOmega_i \end{split} $$ (3) 引理 2[41]. (KKT) 若假设1和2成立, 则
$\boldsymbol x^*\in $ $ \mathbf{R}^{nm}$ 是问题 (2)的最优解, 当且仅当存在$\boldsymbol y^*\in $ $ \mathbf{R}^m,\;\boldsymbol{\mu}^*\in\mathbf{R}^s$ , 使得$ (\boldsymbol x^*,\boldsymbol y^*,\boldsymbol{\mu}^*) $ 满足$$ \begin{split} &{\bf 0}_{nm}\in\partial f(\boldsymbol x^*)+{\bf 1}_n\otimes \boldsymbol y^*+\partial(\varphi(\boldsymbol x^*))^{\text{T}}\boldsymbol{\mu}^*\\ &\sum\limits_{i = 1}^n\boldsymbol x_i^* = \sum\limits_{i = 1}^n\boldsymbol d_i\\ &\varphi(\boldsymbol x^*)\le0,\boldsymbol{\mu}^*\ge0,(\boldsymbol{\mu}^*)^{\rm{T}}\varphi(\boldsymbol x^*) = 0 \end{split} $$ (4) 1.2 代数图论
针对式 (1)所示的多智能体系统, 智能体节点间的通信链路可以用图
$ G = (V,E,\boldsymbol A) $ 表示, 其中$V = \{1,2,\cdots, $ $ n\}$ 表示节点集合,$ E $ 表示节点间的通信链路集合,$ \boldsymbol A $ 表示各节点间的通信权重. 若存在有向对$ (i,j)\in E $ , 则表示节点$ i $ 能够接收到来自节点$ j $ 的信息, 此时就有$ a_{ij}>0 $ . 此外, 本文中不考虑节点存在自环, 即$ a_{ii} = 0 $ . 若网络$ G $ 中存在一组有向对$(i,i_1),(i_1,i_2),\cdots,(i_k,j)$ , 则称节点$ j $ 到节点$ i $ 是可达的. 若网络$ G $ 任意一点到其他节点都是可达的, 则称网络$ G $ 是强连通的. 定义网络$ G $ 的拉普拉斯矩阵为$ \boldsymbol L = [l_{ij}]\in\mathbf{R}^{n\times n} $ , 其中$l_{ii} = \sum_{j = 1}^na_{ij}, \; l_{ij} = -a_{ij}, $ $ \forall j\not = i$ . 所以必有结论$ \boldsymbol {L1}_n = {\bf 0}_n $ . 对于有向网络$ G $ , 若满足$ \boldsymbol 1_n^{\text{T}}\boldsymbol L = {\bf 0}_n^{\text{T}} $ , 则称$ G $ 为平衡网络.假设 3. 本文假设通信网络
$ G $ 是有向平衡网络且强连通.引理 3[42]. 若假设3成立, 则有
$$ \begin{array}{l} \rho_2 = \min\limits_{\boldsymbol 1_n^{\text{T}}\boldsymbol x = 0}\dfrac{\boldsymbol x^{\text{T}}\hat{L}\boldsymbol x}{\boldsymbol x^{\text{T}}\boldsymbol x}>0 \end{array} $$ (5) 其中
$\hat{\boldsymbol L} = \dfrac{{\boldsymbol L}+{\boldsymbol L}^{\text{T}}}{2}$ .引理 4[47]. 考虑如下微分方程
$$ \begin{array}{l} \dot{\boldsymbol x} = f(\boldsymbol x(t)),\boldsymbol x(0) = \boldsymbol x_0 \end{array} $$ (6) 其中,
$ \boldsymbol x\in\mathbf{R}^{n},f(\boldsymbol x):\mathbf{R}^n\to\mathbf{R}^n $ 在实数域$ \mathbf{R}^n $ 上连续, 且满足$ f({\bf 0}_n) = {\bf 0}_n $ . 若存在一连续正定函数$V(\boldsymbol x): \mathbf{R}^n\to $ $ \mathbf{R}$ 和正实数$ \alpha,\beta>0,0<\mu<1,\nu>1 $ 使得不等式$\dot{V}\le $ $ -\alpha V^{\mu}-\beta V^{\nu}$ . 则存在一正实数$T > 0,\;$ 使得对任意$ t\ge T $ , 有$ \boldsymbol x(t) = {\bf 0}_n $ , 即系统 (6)在固定时间$ T $ 收敛到源点, 且固定时间$ T $ 满足$T\le\dfrac{1}{\alpha(1-\mu)}+ $ $ \dfrac{1}{\beta(\nu-1)}$ .引理 5[47]. 对于实数
$x_1,x_2,\cdots,x_n\in\mathbf{R}$ , 有$$ \begin{split} &\left(\sum\limits_{i = 1}^nx_i\right)^p\le\sum\limits_{i = 1}^nx_i^p,0<p<1\\ &n^{1-p}\left(\sum\limits_{i = 1}^nx_i\right)^p\le\sum\limits_{i = 1}^nx_i^p,\infty>p>1 \end{split} $$ (7) 引理 6[8]. 令
$\Vert P_{\Omega}(\boldsymbol x)-\boldsymbol x\Vert$ 表示点$ \boldsymbol x $ 到集合$\Omega$ 的距离, 则$\Vert P_{\Omega}(\boldsymbol x)-\boldsymbol x\Vert$ 关于变量$ \boldsymbol x $ 连续, 且其关于变量$ \boldsymbol x $ 的微分为$\nabla(\Vert P_{\Omega}(\boldsymbol x)\!-\!\boldsymbol x\Vert^2) \!=\! -\!2(P_{\Omega} (\boldsymbol x)-\boldsymbol x).$ 2. 分布式连续时间控制算法
针对问题 (2), 基于多智能体固定时间理论, 本节将设计两种基于映射的分布式优化算法, 首先设计一类渐近收敛算法, 其次设计一类指数收敛算法, 并给出算法的收敛性分析.
2.1 算法设计
由引理1可知, 解决问题 (2)的关键是找到最优拉格朗日乘子. 为实现算法分布式演化, 本文为每个智能体都分配一个本地拉格朗日乘子
$ \boldsymbol{\lambda}_i\in\mathbf{R}^m $ , 基于状态反馈和梯度下降法, 利用局部不等式约束的梯度信息, 每个节点将通过以下算法自主收敛到问题 (2)的最优分配方案:$$ \begin{split} &\dot{\boldsymbol x}_i = \boldsymbol v_i\\ &\dot{\boldsymbol v}_i = \ddot{\boldsymbol y}_i-\gamma((\boldsymbol v_i-\dot{\boldsymbol y}_i)+(\boldsymbol x_i-\boldsymbol y_i))\\ &\dot{\boldsymbol y}_i = -\nabla f_i(\boldsymbol x_i)-\boldsymbol{\lambda}_i-\partial\varphi_i(\boldsymbol x_i)^{\text{T}}\boldsymbol{\tau_i}\\ &\dot{\boldsymbol{\lambda}}_i = \alpha\left(\sum\limits_{j = 1}^na_{ij}(\boldsymbol z_i-\boldsymbol z_j)-\boldsymbol d_i+\boldsymbol y_i\right)- \\ &\qquad\beta\sum\limits_{j = 1}^na_{ij}(\boldsymbol{\lambda}_i-\boldsymbol{\lambda}_j)- \end{split} $$ $$ \begin{split} &\qquad(\nabla f_i(\boldsymbol x_i)+\boldsymbol{\lambda}_i+\partial(\varphi_i(\boldsymbol y_i))^{\text{T}}\boldsymbol{\tau_i})\\ &\dot{\boldsymbol z}_i = -\left(\sum\limits_{j = 1}^na_{ij}(\boldsymbol z_i-\boldsymbol z_j)-\boldsymbol d_i+\boldsymbol y_i\right)\\ &\dot{\boldsymbol{\mu}}_i = \frac{\alpha}{2}(-\boldsymbol{\mu}_i+\boldsymbol{\tau}_i) \end{split} $$ (8) 其中
$ \boldsymbol{\tau}_i = (\boldsymbol{\mu}_i+\varphi_i(\boldsymbol x_i))^+ $ , 控制参数$ \alpha,\beta,\gamma>0 $ ,$\boldsymbol y_i\in $ $ \mathbf{R}^m$ 表示为节点资源变量$ \boldsymbol x_i $ 的估计, 其最终目的是收敛到问题 (2)的最优值, 辅助变量$ \boldsymbol z_i\in\mathbf{R}^m $ 是为了平衡资源变量估计值$ \boldsymbol y_i $ 与期望资源量$ \boldsymbol d_i $ 之间的差值.与上述映射机制不同, 利用映射算子和固定时间收敛理论, 第二种算法设计如下:
$$ \begin{split} &\dot{\boldsymbol{x}}_i = \boldsymbol v_i\\ &\dot{\boldsymbol v}_i = \ddot{\boldsymbol y}_i-\gamma((\boldsymbol v_i-\dot{\boldsymbol y}_i)+(\boldsymbol x_i-\boldsymbol y_i))\\ &\dot{\boldsymbol y}_i = -\nabla f_i(\boldsymbol x_i)-\boldsymbol{\lambda}_i+\\ &\qquad|-\nabla f_i(\boldsymbol x_i)-\boldsymbol{\lambda}_i|\text{sign}(P_{\varOmega_i}(\boldsymbol y_i)-\boldsymbol y_i)+\\ &\qquad|(P_{\varOmega_i}(\boldsymbol y_i)-\boldsymbol y_i)|^{\mu}\text{sign}(P_{\varOmega_i}(\boldsymbol y_i)-\boldsymbol y_i )+\\ &\qquad|(P_{\varOmega_i}(\boldsymbol y_i)-\boldsymbol y_i)|^{\nu}\text{sign}(P_{\varOmega_i}(\boldsymbol y_i)-\boldsymbol y_i )\\ &\dot{\lambda}_i = \alpha\left(\sum\limits_{j = 1}^na_{ij}(\boldsymbol z_i-\boldsymbol z_j)-\boldsymbol d_i+\boldsymbol y_i\right)-\\ &\qquad\beta\sum\limits_{j = 1}^na_{ij}(\boldsymbol{\lambda}_i-\boldsymbol{\lambda}_j)\\ &\dot{\boldsymbol z}_i = -\left(\sum\limits_{j = 1}^na_{ij}(\boldsymbol z_i-\boldsymbol z_j)-\boldsymbol d_i+\boldsymbol y_i\right) \end{split} $$ (9) 其中固定时间收敛理论是为了确保智能体可在固定时间内将状态收敛到约束范围内.
注 2. 由引理1可知, 求解问题 (2)的最优解关键在于求解最优朗格朗日乘子, 与之对应的等式约束是全局性的, 所以要给每个智能体分配一个局部拉格朗日乘子
$ \lambda_i $ , 利用经典控制理论的PI (Proportional integral, 比例积分)控制思想, 对其建立基于状态反馈的PI微分方程. 为了将拉格朗日乘子$ \lambda_i $ 与多智能体状态$ x_i $ 联系起来, 本文通过对辅助变量$ y_i $ 建立一阶迭代算法, 使其沿着局部目标函数的负梯度$ -\nabla f_i(x_i) $ 方向下降, 然后对$ x_i $ 建立二阶跟踪算法, 最终$ x_i $ 跟踪$ y_i $ 同步收敛到问题 (2)的最优解. 针对问题 (2), 本文设计了两种连续时间算法, 两者的区别在于采用不同的方法处理局部约束. 其中, 算法 (8)利用局部约束函数的梯度信息将节点状态引导到局部约束$\Omega_i$ 内, 基于固定时间收敛理论, 而算法 (9)采用映射法将节点状态限制在局部约束$\Omega_i$ 内部. 在案例仿真中, 算法 (9) 的优势在于高效处理简单的局部约束, 例如电力资源分配问题中的发电机组生产能力约束$ x_i\in[x_i^{\min},x_i^{\max}] $ , 其中$ x_i^{\min}, $ $ x_i^{\max} $ 分别表示发电机组$ i $ 的最小和最大输出功率[13]. 而算法 (8)的优势在处理局部不等式凸约束, 例如在二次布局问题中, 节点$ i $ 的约束范围为$x_{i,1}^2+x_{i,2}\le10, \; -4\le x_{i,j}\le 4,\; $ $ j = 1,2$ .注 3. 在现有二阶多智能体连续时间算法中, 文献[39]使用精确罚函数法将节点局部约束项转移到目标函数中, 即令
$f_i^{\varsigma} = f_i(x_i)+\frac{1}{\varsigma}[(x_{i}^{\min}-x_i)^++ $ $ (x_i-x_{i}^{\max})^+]$ , 其中$ \varsigma $ 为惩罚因子,$ x_{i}^{\min}\le x_i\le x_{i}^{\max} $ . 进而将原问题等价于解决无约束资源分配问题. 且定义端点$ x_i = x_i^{\max} $ 处的梯度为$\nabla f_i^{\varsigma}\in [\nabla f_i(x_{i}^{\max}), $ $ \nabla f_i(x_{i}^{\max})+\frac{1}{\varsigma}]$ , 此方法会导致目标函数梯度在端点处不唯一, 且惩罚因子过小容易引起算法在稳定点时产生波动, 过大无法确保算法收敛到最优值. 此外, 该文献只提供了解决一维资源分配问题的算法, 此外相比于文献[39]算法需要交互3个变量信息, 本文设计算法减少了节点间的通信负担. 针对问题 (2), 文献[43]通过微分映射算子$\Pi_{\Omega_i}(\cdot)$ 解决其中的局部不等式约束, 为了确保算法收敛, 该文献通过奇异摄动法进行收敛性分析, 这就需要一个很小正实数$ \epsilon $ 来确保算法的收敛, 但并没有给出其收敛范围. 此外该文献的微分映射算子是在本文所设计映射算子上继续求微分得到, 即将变量$ -\nabla f_i(x_i)-\lambda_i $ 映射到正切锥$T_{\Omega_i}(x_i)$ . 所以其增加了计算约束$\Omega_i$ 正切锥的额外负担[31]. 为了确保微分映射算子的有效性, 该文献对节点初始值进行约束.2.2 算法收敛性分析
在给出算法收敛性分析之前, 先给出一个有关问题 (2)最优解的引理.
引理 7. 假定系统 (9)的平衡点为
$(\boldsymbol x^*,\boldsymbol v^*,\boldsymbol y^*, \boldsymbol{\lambda}^*, $ $ \boldsymbol{z}^*)$ , 则$ \boldsymbol x^* $ 为问题 (2)的最优解. 反之若$ \boldsymbol x^* $ 为问题 (2)的最优解, 则存在$ (\boldsymbol x^*,\boldsymbol v^*,\boldsymbol y^*,\boldsymbol{\lambda}^*,\boldsymbol{z}^*) $ 为系统 (9)的平衡点.证明 . 由于
$ (\boldsymbol x^*,\boldsymbol v^*,\boldsymbol y^*,\boldsymbol{\lambda}^*,\boldsymbol{z}^*) $ 为系统 (9)的平衡点, 则有$$ \begin{split} &{\bf 0}_{nm} = \boldsymbol v^*\\ &{\bf 0}_{nm} = \boldsymbol x^* -\boldsymbol y^* \\ &{\bf 0}_{nm} = -\nabla f (\boldsymbol x^* )-\boldsymbol{\lambda}^* \\ &{\bf 0}_{nm} = \alpha (\boldsymbol{L}\otimes\boldsymbol{I}_m)\boldsymbol{z}^*-\boldsymbol d +\boldsymbol y^*-\beta(\boldsymbol{L}\otimes\boldsymbol{I}_m)\boldsymbol{\lambda}^*\\ &{\bf 0}_{nm} = -(\boldsymbol{L}\otimes\boldsymbol{I}_m)\boldsymbol z^*-\boldsymbol d +\boldsymbol y^*\\ &{\bf 0}_{nm} = P_{\Omega}(y^*)-\boldsymbol y^* \end{split} $$ (10) 其中最后一个等式可由后续定理1给出, 结合
$ \boldsymbol x^* = \boldsymbol y^* $ , 所以有$\boldsymbol x^*\in\Omega$ , 即引理1中的不等式约束成立. 所以有$ (\boldsymbol{L}\otimes\boldsymbol{I}_m)\boldsymbol{\lambda}^* = 0_{nm} $ , 结合矩阵$ \boldsymbol L $ 的定义和假设3, 可知$ \boldsymbol{\lambda}^* = \boldsymbol 1_{n}\otimes\boldsymbol c,\boldsymbol c\in\mathbf{R}^m $ . 进而有$ {\bf 0}_{nm}\in\partial f(\boldsymbol x)+\boldsymbol c\otimes\boldsymbol 1_n $ . 紧接着由于有向平衡网络中矩阵$ \boldsymbol L $ 满足$\boldsymbol 1_{mn}^{\text{T}}(\boldsymbol{L}\otimes $ $ \boldsymbol{I}_m) = {\bf 0}_{nm}$ , 所以有结论$ \sum_{i = 1}^n\boldsymbol x_i^* = \sum_{i = 1}^n\boldsymbol d_i^* $ . 综上分析, 由引理1可知$ \boldsymbol x^* $ 为问题 (2)的最优解. 反之亦成立. □对于系统 (8)也有同样的结论. 可以发现系统 (9)与系统 (8)的区别在如何解决局部不等式约束, 假设
$(\boldsymbol x^*, $ $ \boldsymbol v^*,\boldsymbol y^*,\boldsymbol{\lambda}^*,\boldsymbol{z}^*,\boldsymbol{\mu}^*,\boldsymbol{\tau}^*)$ 为系统 (8)的平衡点, 则有$\boldsymbol{\mu}^* = $ $ (\boldsymbol{\mu}^*+\varphi(\boldsymbol x))^+ ,\;$ 则必然有结论$\varphi(\boldsymbol x^*)\le 0,\boldsymbol{\mu}^*\ge0, (\boldsymbol{\mu}^*)^{\text{T}}\times $ $ \varphi(\boldsymbol x^*) = 0.$ □现在开始收敛性分析, 首先给出系统 (8)的收敛定理.
定理 1. 若假设1、2和3成立, 且控制参数满足
$\alpha > \dfrac{1}{\rho_2\omega}+\dfrac{1}{2\omega},\beta>\dfrac{\Vert\boldsymbol L\Vert^2\alpha^2}{\rho_2^2},\gamma>\dfrac{\alpha\theta\sqrt{2\varepsilon}}{2}$ , 其中$ \varepsilon>0 $ . 多智能体系统 (8)渐近收敛到问题 (2)的最优分配方案.证明. 为简便分析, 不失一般性, 这里只考虑
$ m = 1 $ 情形. 首先对系统 (8)进行坐标变换, 令对上述系统作坐标变换${\bar{\boldsymbol x}} = \boldsymbol x-\boldsymbol y,\;{\bar{\boldsymbol v}} = \boldsymbol v- {\dot {{y}}}, \;{\bar{\boldsymbol y}} = \boldsymbol y-\boldsymbol y^*, \; {\bar{\boldsymbol{\lambda}}} = \boldsymbol{\lambda}-\boldsymbol{\lambda}^*, $ $ \;{\bar{z}} = z-z^*$ . 可得$$ \begin{split} &{\dot{\bar{\boldsymbol{x}}}} = \bar{\boldsymbol{v}}\\ &{\dot{\bar{\boldsymbol{v}}}} = -\gamma\bar{\boldsymbol{v}}-\gamma\bar{\boldsymbol{x}}\\ &{\dot{\bar{\boldsymbol{y}}}} = -\bar{\boldsymbol{\lambda}}-\boldsymbol{e}\\ &\dot{\bar{\boldsymbol{\lambda}}} = \alpha(\boldsymbol L\bar{\boldsymbol z}+\bar{\boldsymbol y})-\beta\boldsymbol{L}\bar{\boldsymbol{\lambda}}-\bar{\boldsymbol{\lambda}}-\boldsymbol{e}\\ &{\dot{\bar{\boldsymbol z}}} = -(\boldsymbol{L}\bar{\boldsymbol z}+\bar{\boldsymbol y})\\ &{\dot{\bar{\boldsymbol{\mu}}}} = -\frac{\alpha}{2}(-\bar{\boldsymbol{\mu}}+\bar{\boldsymbol{\tau}}) \end{split} $$ (11) 其中
$ \boldsymbol e = \partial f(\boldsymbol x)+\partial\varphi(\boldsymbol y)^{\text{T}}\boldsymbol{\tau}-\partial f(\boldsymbol y^*)+\partial\varphi(\boldsymbol y^*) $ . 第二个等式推导如下:$ {\dot{\bar{\boldsymbol{v}}}} = \dot{\boldsymbol v}-\ddot{y} = -\gamma\bar{\boldsymbol{v}}-\gamma\bar{\boldsymbol{x}} $ . 在上述第四个等式中, 利用到公式 (10)中的第四个等式. 继续作如下正交变换:$$ \begin{split} &\boldsymbol{\xi} = \text{col}(\xi_1,\boldsymbol{\xi}_2) = \left[\boldsymbol r\quad \boldsymbol R\right]^{\text{T}}\bar{\boldsymbol y}\\ &\boldsymbol{\eta} = \text{col}(\eta_1,\boldsymbol{\eta}_2) = \left[\boldsymbol r\quad\boldsymbol R\right]^{\text{T}}\bar{\boldsymbol{\lambda}}\\ &\boldsymbol{\delta} = \text{col}(\delta_1,\boldsymbol{\delta}_2) = \left[\boldsymbol r\quad\boldsymbol R\right]^{\text{T}}\bar{\boldsymbol z} \end{split} $$ (12) 其中,
$\xi_1,\;\eta_1,\;\delta_1\in\mathbf{R},\;\boldsymbol{\xi}_2,\;\boldsymbol{\eta}_2,\;\boldsymbol{\delta}_2\in\mathbf{R}^{n-1},\; \boldsymbol r = \dfrac{1}{\sqrt{n}}\boldsymbol 1_n,\; $ $ \boldsymbol r^{\text{T}}\boldsymbol R = {\bf 0}_{n-1}^{\text{T}},\;\boldsymbol R^{\text{T}}\boldsymbol R = \boldsymbol I_{n-1},\;\boldsymbol R\boldsymbol R^{\text{T}} = \boldsymbol I_n-\dfrac{1}{n}\boldsymbol 1_n\boldsymbol 1_n^{\text{T}}$ . 正交变换之后的系统如下:$$ \left\{\begin{aligned} &\dot{\bar{\boldsymbol{x}}} = \bar{\boldsymbol{v}}\\ &\dot{\bar{\boldsymbol{v}}} = -\gamma\bar{\boldsymbol{v}}-\gamma\bar{\boldsymbol{x}}\\ &\dot{\xi}_1 = -(\eta_1+\boldsymbol r^{\text{T}}\boldsymbol{e})\\ &\dot{\eta}_1 = \alpha\xi_1-(\boldsymbol r^{\text{T}}\boldsymbol e+\eta_1)\\ &\dot{\delta}_1 = -\xi_1\\ &\dot{\varrho}_1 = \frac{\alpha}{2}(-\varrho_1+\boldsymbol r^{\text{T}}\bar{\boldsymbol{\tau}})\\ &\dot{\boldsymbol{\xi}}_2 = -(\boldsymbol{\eta}_2+\boldsymbol R^{\text{T}}\bar{\boldsymbol{h})}\\ &\dot{\boldsymbol{\eta}}_2 = \alpha\boldsymbol{\xi}_2-\boldsymbol Q^{\text{T}}\boldsymbol e-\boldsymbol{\eta}_2+\alpha\boldsymbol R^{\text{T}}\boldsymbol{LR\delta}_2-\beta\boldsymbol R^{\text{T}}\boldsymbol{LR\eta}_2\\ &\dot{\boldsymbol{\delta}}_2 = -\xi_2-\boldsymbol Q^{\text{T}}\boldsymbol{LQ\delta}_2\\ &\dot{\boldsymbol{\varrho}}_2 = \frac{\alpha}{2}(-\boldsymbol{\varrho}_2+\boldsymbol R^{\text{T}}\bar{\boldsymbol{\tau}}) \end{aligned}\right. $$ (13) 其中
$,\boldsymbol{\varrho} = \left[\boldsymbol r\;\; \boldsymbol R\right]^{\text{T}}(\boldsymbol{\mu}-\boldsymbol{\mu}^*)$ .定义李雅普诺夫函数如下:
$$ \begin{split} V_1 = \;&\frac{1}{2}\Vert\gamma\bar{\boldsymbol x}+\bar{\boldsymbol v}\Vert^2+\frac{1}{2}\Vert\bar{\boldsymbol v}\Vert^2+\gamma\Vert\bar{\boldsymbol{x}}\Vert^2+\\ &\varepsilon\left(f(\boldsymbol x)-f(\boldsymbol x^*)+\frac{1}{2}\Vert\boldsymbol{\tau}\Vert^2-\frac{1}{2}\Vert\boldsymbol{\tau}^*\Vert^2\right.-\\ &(\bar{\boldsymbol{\mu}})^{\text{T}}\boldsymbol{\tau}^*-(\bar{\boldsymbol x})^{\text{T}}(\partial f(\boldsymbol x^*)+\partial\varphi(\boldsymbol x)^{\text{T}}\boldsymbol{\tau}^*)+\\ &\left.\frac{\alpha}{2}\Vert\boldsymbol{\xi}\Vert^2+\frac{1}{2}\Vert\boldsymbol{\eta}\Vert^2+\frac{1}{2}\Vert\boldsymbol{\delta}_2\Vert^2+\frac{1}{2}\Vert\boldsymbol{\varrho}\Vert^2\right) \end{split} $$ (14) 其中,
$ 0<\varepsilon<\dfrac{2\gamma^2}{\alpha^2\theta^2} $ . 上述李雅普诺夫函数的有效性通过凸函数$f(\boldsymbol x)+\dfrac{1}{2}\Vert\boldsymbol{\tau}\Vert^2$ 的性质得以保证. 进而函数$ V_1 $ 在系统 (13)关于时间$ t $ 的微分为$$ \begin{split} \dot{V}_1 =\;& -\gamma^2\Vert\bar{\boldsymbol{x}}\Vert^2-\gamma\Vert\bar{\boldsymbol v}\Vert^2+\\ &\varepsilon\Big(([\boldsymbol r,\boldsymbol R]^{\text{T}}\boldsymbol e+\alpha\boldsymbol{\xi})(-\boldsymbol{\eta}-[\boldsymbol r,\boldsymbol R]^{\text{T}}\boldsymbol e)+\\ &\boldsymbol{\eta}^{\text{T}}(\alpha\boldsymbol{\xi}-(\boldsymbol{\eta}+[\boldsymbol r,\boldsymbol R]^{\text{T}}\boldsymbol e))-\\ &\beta\boldsymbol{\eta}_2^{\text{T}}\boldsymbol R^{\text{T}}\boldsymbol{LR\eta}_2+\alpha\boldsymbol{\delta}_2\boldsymbol R^{\text{T}}\boldsymbol{LR\delta}_2+\\ &\boldsymbol{\delta}_2^{\text{T}}(-\boldsymbol{\xi}_2-\boldsymbol R^{\text{T}}\boldsymbol{LR\delta}_2)+\\ &\frac{\alpha}{2}(\boldsymbol{\varrho}+[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}})^{\text{T}}(-\boldsymbol{\varrho}+[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}})\Big)=\\ & -\gamma^2\Vert\bar{\boldsymbol{x}}\Vert^2-\gamma\Vert\bar{\boldsymbol v}\Vert^2-\\ &\varepsilon\Vert[\boldsymbol r,\boldsymbol R]^{\text{T}}\boldsymbol e+\boldsymbol{\eta}\Vert^2-\alpha\varepsilon\boldsymbol{\xi}^{\text{T}}[\boldsymbol r,\boldsymbol R]^{\text{T}}\boldsymbol e-\\ &\beta\varepsilon\boldsymbol{\eta}_2^{\text{T}}\boldsymbol R^{\text{T}}\boldsymbol{LR\eta}_2+\alpha\varepsilon\boldsymbol{\eta}_2\boldsymbol R^{\text{T}}\boldsymbol{LR\delta}_2-\\ &\varepsilon\boldsymbol{\delta}_2^{\text{T}}\boldsymbol{\xi}_2-\varepsilon\boldsymbol{\delta}_2^{\text{T}}\boldsymbol R^{\text{T}}\boldsymbol{LR\delta}_2+\\ &\frac{\alpha\varepsilon}{2}(\boldsymbol{\varrho}+[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}})^{\text{T}}(-\boldsymbol{\varrho}+[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}}) \end{split} $$ (15) 结合引理3和Young不等式, 我们有结论:
$$ \begin{split} &-\beta\boldsymbol{\eta}_2^{\text{T}}\boldsymbol{R}^{\text{T}}\boldsymbol{LR\eta}_2 \le-\beta\rho_2\Vert\boldsymbol{\eta}_2\Vert^2\\ &-\boldsymbol{\delta}_2^{\text{T}}\boldsymbol R^{\text{T}}\boldsymbol{LR\delta}_2 \le-\rho_2\Vert\boldsymbol{\delta}_2\Vert^2\\ &-\boldsymbol{\delta}_2^{\text{T}}\boldsymbol{\xi}_2 \le\frac{\rho_2}{4}\Vert\boldsymbol{\delta}_2\Vert^2+\frac{1}{\rho_2}\Vert\boldsymbol{\xi}\Vert^2\\ &\alpha\boldsymbol{\eta}_2\boldsymbol R^{\text{T}}\boldsymbol{LR\delta}_2 \le\frac{\rho_2}{4}\Vert\boldsymbol{\delta}_2\Vert^2+\frac{\Vert\boldsymbol L\Vert^2\alpha^2}{\rho_2}\Vert\boldsymbol{\eta}_2\Vert^2 \end{split} $$ (16) 接下来分析
$\phi: = \alpha\boldsymbol{\xi}^{\text{T}}[\boldsymbol r,\boldsymbol R]^{\text{T}}\boldsymbol e+\dfrac{\alpha}{2}(\boldsymbol{\varrho}+[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}})^{\text{T}}.\; $ $ (-\boldsymbol{\varrho}+[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}})$ , 我们有$$ \begin{split} \phi =\;& \alpha\boldsymbol{\xi}^{\text{T}}[\boldsymbol r,\boldsymbol R]^{\text{T}}(\partial f(\boldsymbol x)+\partial(\varphi(\boldsymbol y))^{\text{T}}\boldsymbol{\tau}\;-\\ &\partial f(\boldsymbol y^*)+\partial\varphi(\boldsymbol y^*))+\\ &\frac{\alpha}{2}(\boldsymbol{\varrho}+[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}})^{\text{T}}(-\boldsymbol{\varrho}+[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}})=\\ & \alpha\boldsymbol{\xi}^{\text{T}}[\boldsymbol r,\boldsymbol R]^{\text{T}}(\partial f(\boldsymbol y)+\partial(\varphi(\boldsymbol y))^{\text{T}}\boldsymbol{\tau}-\partial f(\boldsymbol y^*)+\\ &\partial\varphi(\boldsymbol y^*))+\alpha\boldsymbol{\xi}^{\text{T}}[\boldsymbol r,\boldsymbol R]^{\text{T}}(\partial f(\boldsymbol x)-\partial f(\boldsymbol y))+\\ &\frac{\alpha}{2}(\boldsymbol{\varrho}+[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}})^{\text{T}}(-\boldsymbol{\varrho}+[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}})\le\\ &\alpha\boldsymbol{\xi}^{\text{T}}[\boldsymbol r,\boldsymbol R]^{\text{T}}(\partial f(\boldsymbol x)-\partial f(\boldsymbol y))-\\ &\alpha\omega\Vert\boldsymbol{\xi}\Vert^2-\frac{\alpha}{2}\Vert\boldsymbol{\varrho}-[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}}\Vert^2-\\ &\alpha\boldsymbol{\xi}^{\text{T}}[\boldsymbol r,\boldsymbol R]^{\text{T}}(\partial(\varphi(\boldsymbol y))^{\text{T}}\boldsymbol{\tau}-\partial(\varphi(\boldsymbol y^*))^{\text{T}}\boldsymbol{\tau}^*)-\\ &\alpha([\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}})^{\text{T}}(\boldsymbol{\varrho}-[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\tau}) \end{split} $$ (17) 其中式 (17)中的最后两项为
$$ \begin{split} -\alpha\boldsymbol{\xi}^{\text{T}}&[\boldsymbol r,\boldsymbol R]^{\text{T}}(\partial(\varphi(\boldsymbol y))^{\text{T}}\boldsymbol{\tau}-\partial(\varphi(\boldsymbol y^*))^{\text{T}}\boldsymbol{\tau}^*)-\\ &\alpha([\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}})^{\text{T}}(\boldsymbol{\varrho}-[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\tau})=\\ &\alpha(\boldsymbol y-\boldsymbol y^*)^{\text{T}}(\partial(\varphi(\boldsymbol y))^{\text{T}}\boldsymbol{\tau}-\partial(\varphi(\boldsymbol y^*))^{\text{T}}\boldsymbol{\tau}^*-\\ &\alpha(\boldsymbol{\mu}-\boldsymbol{\tau})^{\text{T}}(\boldsymbol{\tau}-\boldsymbol{\tau}^*))\le\\ &\alpha(\boldsymbol y-\boldsymbol y^*)^{\text{T}}(\partial(\varphi(\boldsymbol y))^{\text{T}}\boldsymbol{\tau}-\partial(\varphi(\boldsymbol y^*))^{\text{T}}\boldsymbol{\tau}^*)+\\ &\alpha(\varphi(\boldsymbol y))^{\text{T}}(\boldsymbol{\tau}-\boldsymbol{\tau}^*)=\\ &-\alpha\boldsymbol{\tau}^{\text{T}}(\varphi(\boldsymbol y^*)-\varphi(\boldsymbol y)-\partial\varphi(\boldsymbol y)(\boldsymbol y^*-\boldsymbol y))+\\ &\alpha\boldsymbol{\tau}^{\text{T}}\varphi(\boldsymbol y^*)-\alpha(\boldsymbol{\tau}^*)^{\text{T}}(\varphi(\boldsymbol y)-\varphi(\boldsymbol y^*)-\\ &\partial\varphi(\boldsymbol y^*)(\boldsymbol y-\boldsymbol y^*))-\alpha(\boldsymbol{\tau}^*)^{\text{T}}\varphi(\boldsymbol y^*)\le0 \end{split} $$ (18) 上式中第一个不等式利用了结论
$(\boldsymbol{\mu}+\varphi(\boldsymbol y)- $ $ \boldsymbol{\tau})^{\text{T}}(\boldsymbol{\tau}^*-\boldsymbol{\tau})\le0$ , 其中我们考虑了$ \boldsymbol{\tau},\boldsymbol{\tau}^* $ 在集合$ \mathbf{R}_{+} $ 上的映射$ P_{\mathbf{R}_{+}}(\cdot) $ . 最后一个不等式利用了函数$ \varphi(\boldsymbol x) $ 的凸性、$ \boldsymbol{\tau},\boldsymbol{\tau}^* $ 的非负性、$ (\boldsymbol{\tau}^*)^{\text{T}}\varphi(\boldsymbol x^*) = 0 $ 和$ \varphi(\boldsymbol x^*)\le $ $ 0 $ . 将结论 (18)代回式 (17), 同时利用函数$ f(\boldsymbol x) $ 的李普希茨性质可得$$ \begin{split} \phi \le\;&\frac{1}{2}\Vert\boldsymbol{\xi}\Vert^2+\frac{1}{2}\theta^2\alpha^2\Vert\bar{\boldsymbol{x}}\Vert^2-\\ &\alpha\omega\Vert\boldsymbol{\xi}\Vert^2-\frac{\alpha}{2}\Vert\boldsymbol{\varrho}-[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}}\Vert^2 \end{split} $$ (19) 将式(16)和(19)代入式(15), 我们有
$$ \begin{split} \dot{V}_1 \le\;&-\left(\gamma^2-\frac{\alpha^2\theta^2}{2}\varepsilon\right)\Vert\bar{\boldsymbol x}\Vert^2-\gamma\Vert\bar{\boldsymbol v}\Vert^2-\\ &\frac{\alpha\varepsilon}{2}\Vert\boldsymbol{\varrho}-[\boldsymbol r,\boldsymbol R]^{\text{T}}\bar{\boldsymbol{\tau}}\Vert^2-\\ &\varepsilon\Vert[\boldsymbol r,\boldsymbol R]^{\text{T}}\boldsymbol e+\boldsymbol{\eta}\Vert^2-\\ &\left(\beta\rho_2-\frac{\Vert \boldsymbol L\Vert^2\alpha^2}{\rho_2}\right)\varepsilon\Vert\boldsymbol{\eta}_2\Vert^2-\\ &\frac{\varepsilon\rho_2}{2}\Vert\boldsymbol{\delta}_2\Vert^2-\left(\alpha\omega-\frac{1}{\rho_2}-\frac{1}{2}\right)\varepsilon\Vert\boldsymbol{\xi}\Vert^2 \end{split} $$ (20) 由李雅普诺夫定理可知, 系统(8)渐近收敛到问题(2)的最优解. □
定理 2. 若假设1、2和3成立, 且控制参数满足
$\alpha > \max\{\dfrac{(\omega+1)}{\rho_2\omega^2}+\dfrac{1}{2\omega},1\},\;\beta>\dfrac{\Vert\boldsymbol L\Vert^2\alpha^2}{\rho_2^2},\;\gamma>\dfrac{\sqrt{\varepsilon}\alpha\theta(1+\omega)}{\omega},$ $ 0<\mu<1,\;1<\nu $ , 其中$ \varepsilon>0 $ , 多智能体系统 (9)指数收敛到问题 (2) 的最优解.证明. 为简便分析, 不失一般性, 这里只考虑
$ m = 1 $ 情形. 证明将分两步进行. 1) 首先证明算法 (9)在时间$ t\ge T_1 $ 后节点变量$ y_i $ 满足条件$y_i\in\Omega_i$ , 即$P_{\Omega_i}( y_i)- y_i = 0$ , 其中$T_1 = \dfrac{2^{\frac{1-\mu}{2}}}{1-\mu}+\dfrac{2^{\frac{1-\nu}{2}}}{n^{\frac{1-\nu}{2}}(\nu-1)}$ ; 2) 其次证明当时间$ t\ge T_1 $ 后, 算法(9)指数收敛到问题(2)的最优分配方案.步骤 1. 令
$V_2 = \dfrac{1}{2}\sum_{i = 1}^n\Vert P_{\Omega_i}( y_i)- y_i\Vert^2$ , 很容易验证$ V_2 $ 是有效的李雅普诺夫函数. 且当且仅当$y_i\in\Omega_i,\; \forall i\in $ $ V$ 时有$ V_2 = 0 $ .$ V_2 $ 在系统(9)上关于时间$ t $ 的微分为$$ \begin{split} \dot{V}_2 = \;&-\sum\limits_{i = 1}^n(P_{\Omega_i}( y_i)- y_i)^{\text{T}}\dot{ y}_i=\\ & \sum\limits_{i = 1}^n(P_{\Omega_i}( y_i)- y_i)^{\text{T}}\cdot\left(\right.(\nabla f_i( x_i)+ \lambda_i)+\\ &|\nabla f_i( x_i)+ \lambda_i|\cdot\text{sign}(P_{\Omega_i}(y_i)-y_i)-\\ &|(P_{\Omega_i}( y_i)- y_i)|^{\mu}\cdot\text{sign}(P_{\Omega_i}( y_i)-y_i )-\\ &\left.|(P_{\Omega_i}(y_i)-y_i)|^{\nu}\cdot\text{sign}(P_{\Omega_i}(y_i)- y_i )\right)\le\\ &-\sum\limits_{i = 1}^n|(P_{\Omega_i}( y_i)- y_i)|^{1+\mu}- \\ &\sum\limits_{i = 1}^n|(P_{\Omega_i}( y_i)- y_i)|^{1+\nu} \end{split} $$ (21) 其中第一个不等式利用了结论
$(P_{\Omega_i}( y_i)- y_i)^{\text{T}} (\nabla f_i $ $ ( x_i)+ \lambda_i)\!-\!|P_{\Omega_i}( y_i)\!-\! y_i|\cdot|\nabla f_i( x_i)+ \lambda_i|\le0.$ 由于$\dfrac{1+\mu}{2} < 1$ , 结合引理5, 可得$$ \left(\sum\limits_{i = 1}^n|(P_{\Omega_i}( y_i)- y_i)|^2\right)^{\tfrac{1+\mu}{2}} \le\sum\limits_{i = 1}^n|(P_{\Omega_i}( y_i)- y_i)|^{1+\mu} $$ (22) 同理, 由于
$\dfrac{1+\nu}{2} > 1$ , 所以有$$ \begin{split} &n^{\tfrac{1-\nu}{2}}\left(\sum\limits_{i = 1}^n|(P_{\Omega_i}( y_i)- y_i)|^2\right)^{\tfrac{1+\nu}{2}} \le\\ &\qquad\sum\limits_{i = 1}^n|(P_{\Omega_i}( y_i)- y_i)|^{1+\nu} \end{split} $$ (23) 将式(22)和(23)代入式(21), 可得
$$ \begin{array}{l} \dot{V}_2 \le-2^{\tfrac{1+\mu}{2}}V_2^{\tfrac{1+\mu}{2}}-n^{\tfrac{1-\nu}{2}}2^{\tfrac{1+\nu}{2}}V_2^{\tfrac{1+\nu}{2}} \end{array} $$ (24) 由引理4可知, 在时间
$ t\ge T_1 $ 后, 变量$y_i\in\Omega_i$ , 且固定时间为$T_1 = \dfrac{2^{\frac{1-\mu}{2}}}{1-\mu}+\dfrac{2^{\frac{1-\nu}{2}}}{n^{\frac{1-\nu}{2}}(\nu-1)}$ .步骤 2. 当
$ t\ge T_1 $ 后, 系统 (9)演变为如下系统$$ \begin{split} &\dot{ x}_i = v_i\\ &\dot{ v}_i = \ddot{ y}_i-\gamma(( v_i-\dot{y}_i)+(x_i-y_i))\\ &\dot{ y}_i = -\nabla f_i(x_i)+\lambda_i\\ &\dot{\lambda}_i = \alpha\left(\sum\limits_{j = 1}^na_{ij}(z_i- z_j)-d_i+y_i\right)-\\ &\qquad\beta\sum\limits_{j = 1}^na_{ij}(\lambda_i-\lambda_j)\\ &\dot{z}_i = -\left(\sum\limits_{j = 1}^na_{ij}(z_i-z_j)-d_i+y_i\right) \end{split} $$ (25) 对上述系统做类似于定理1中的坐标变换, 此时有
$$ \left\{\begin{aligned} &\dot{\bar{\boldsymbol{x}}} = \bar{\boldsymbol{v}}\\ &\dot{\bar{\boldsymbol{v}}} = -\gamma\bar{\boldsymbol{v}}-\gamma\bar{\boldsymbol{x}}\\ &\dot{\xi}_1 = -(\eta_1+\boldsymbol r^{\text{T}}\bar{\boldsymbol{h})}\\ &\dot{\eta}_1 = \alpha\xi_1\\ &\dot{\delta}_1 = -\xi_1\\ &\dot{\boldsymbol{\xi}}_2 = -(\boldsymbol{\eta}_2+\boldsymbol R^{\text{T}}\bar{\boldsymbol{h})}\\ &\dot{\boldsymbol{\eta}}_2 = \alpha(\boldsymbol{\xi}_2+\boldsymbol R^{\text{T}}\boldsymbol{LR\delta}_2)-\beta\boldsymbol R^{\text{T}}\boldsymbol{LR\eta}_2\\ &\dot{\boldsymbol{\delta}}_2 = -(\boldsymbol{\xi}_2+\boldsymbol R^{\text{T}}\boldsymbol{LR\delta}_2) \end{aligned}\right. $$ (26) 其中
$ \bar{\boldsymbol h} = \nabla f(\boldsymbol x)-\nabla f(\boldsymbol x^*) $ . 求解系统 (25)的平衡点等价于求解系统 (26)的平衡点, 且原点就是系统 (26)的平衡点. 令李雅普诺夫函数为$$ \begin{split} V_3 =\;& \frac{1}{2}\Vert\gamma\bar{\boldsymbol x}+\bar{\boldsymbol v}\Vert^2+\frac{1}{2}\Vert\bar{\boldsymbol v}\Vert^2+\gamma\Vert\bar{\boldsymbol{x}}\Vert^2+\\ &\varepsilon\left(\frac{1}{2}\left(\frac{\omega+1}{\omega}\alpha-1\right)\right.\Vert\xi_1\Vert^2+\frac{1}{2}\Vert\xi_1+\eta_1\Vert^2+\\ &\frac{1}{2\omega}\Vert\eta_1\Vert^2+\left.\frac{\omega+1}{2\omega}\left(\alpha\Vert\boldsymbol{\xi}_2\Vert^2+\Vert\boldsymbol{\eta}_2\Vert^2+\Vert\boldsymbol{\delta}_2\Vert^2\right)\right) \end{split} $$ (27) 其中,
$0 < \varepsilon<\dfrac{\omega^2\gamma^2}{\theta^2(\omega+1)^2\alpha^2}$ .$ V_3 $ 在系统 (26) 上关于时间$ t $ 的微分为$$ \begin{split} \dot{V}_3 =\;& -\gamma^2\Vert\bar{\boldsymbol x}\Vert^2-\gamma\Vert\bar{\boldsymbol v}\Vert^2-\\ &\varepsilon\left(\frac{\omega+1}{\omega}\alpha(\xi_1\boldsymbol r^{\text{T}}\bar{\boldsymbol h}+\boldsymbol{\xi}_2^{\text{T}}\boldsymbol R^{\text{T}}\bar{\boldsymbol h})+\Vert\eta_1\Vert^2\right.+\\ &\frac{\omega+1}{\omega}(\beta\boldsymbol{\eta}_2^{\text{T}}\boldsymbol R^{\text{T}}\boldsymbol{LR\eta}_2+\boldsymbol{\delta}_2^{\text{T}}\boldsymbol R^{\text{T}}\boldsymbol{LR\delta}_2)-\alpha\Vert\xi_1\Vert^2+\\ &\left.\eta_1\boldsymbol r^{\text{T}}\bar{\boldsymbol h}+\frac{\omega+1}{\omega}(\boldsymbol{\delta}_2^{\text{T}}\boldsymbol{\xi}_2-\alpha\boldsymbol{\eta}_2^{\text{T}}\boldsymbol R^{\text{T}}\boldsymbol{LR\delta}_2)\right) \\[-15pt] \end{split} $$ (28) 其中
$$ \begin{split} &-\frac{\omega+1}{\omega}\alpha(\xi_1\boldsymbol r^{\text{T}}\bar{\boldsymbol h}+\boldsymbol{\xi}_2^{\text{T}}\boldsymbol R^{\text{T}}\bar{\boldsymbol h})=\\ &\qquad -\frac{\omega+1}{\omega}\alpha(\boldsymbol y-\boldsymbol y^*)^{\text{T}}(\nabla f(\boldsymbol y)-\nabla f(\boldsymbol y^*))-\\ &\qquad\frac{\omega+1}{\omega}\alpha(\boldsymbol y-\boldsymbol y^*)^{\text{T}}(\nabla f(\boldsymbol x)-\nabla f(\boldsymbol y)) \end{split} $$ (29) 利用目标函数的强凸性, 我们有
$$ \begin{array}{l} (\boldsymbol y-\boldsymbol y^*)^{\text{T}}(\nabla f(\boldsymbol y)-\nabla f(\boldsymbol y^*))\ge\omega\Vert\bar{\boldsymbol y}\Vert^2 = \omega\Vert\boldsymbol{\xi}\Vert^2 \end{array} $$ (30) 利用目标函数梯度的李普希茨性质, 可得
$$ \begin{split} &-\frac{\omega+1}{\omega}\alpha(\boldsymbol y-\boldsymbol y^*)^{\text{T}}(\nabla f(\boldsymbol x)-\nabla f(\boldsymbol y))\le\\ &\qquad\frac{\omega+1}{\omega}\alpha\theta\Vert\boldsymbol y-\boldsymbol y^*\Vert\cdot\Vert\boldsymbol x-\boldsymbol y\Vert\le\\ &\qquad\frac{1}{2}\Vert\boldsymbol{\xi}\Vert^2+\frac{(\omega+1)^2}{2\omega^2}\theta^2\alpha^2\Vert\bar{\boldsymbol x}\Vert^2 \end{split} $$ (31) 将上述不等式代回式(29), 可得
$$ \begin{split} &-\frac{\omega+1}{\omega}\alpha(\xi_1\boldsymbol r^{\text{T}}\bar{\boldsymbol h}+\boldsymbol{\xi}_2^{\text{T}}\boldsymbol R^{\text{T}}\bar{\boldsymbol h})\le\\ &\qquad-\left((1+\omega)\alpha-\frac{1}{2}\right)\Vert\boldsymbol{\xi}\Vert^2+\frac{(\omega+1)^2\theta^2\alpha^2}{2\omega^2}\Vert\bar{\boldsymbol x}\Vert^2 \end{split} $$ (32) 同理, 有
$$ -\eta_1\boldsymbol r^{\text{T}}\bar{\boldsymbol h}\le\frac{\omega^2}{2(\omega+1)^2\alpha^2}\Vert\eta_1\Vert^2+\frac{(\omega+1)^2\theta^2\alpha^2}{2\omega^2}\Vert\bar{\boldsymbol x}\Vert^2 $$ (33) 由于
$ \boldsymbol 1_n^{\text{T}}\boldsymbol{R\eta}_2 = {\bf 0}_n $ , 利用引理3, 我们有$$ \begin{split} &\boldsymbol{\eta}_2^{\text{T}}\boldsymbol R^{\text{T}}\boldsymbol{LR\eta}_2 \ge\rho_2\Vert\boldsymbol{\eta}_2\Vert^2\\ &\boldsymbol{\delta}_2^{\text{T}}\boldsymbol R^{\text{T}}\boldsymbol{LR\delta}_2 \ge\rho_2\Vert\boldsymbol{\delta}_2\Vert^2 \end{split} $$ (34) 进一步, 利用Young不等式, 我们有
$$ \begin{split} &\boldsymbol{\delta}_2^{\text{T}}\boldsymbol{\xi}_2 \le\frac{\rho_2}{4}\Vert\boldsymbol{\delta}_2\Vert^2+\frac{1}{\rho_2}\Vert\boldsymbol{\xi}\Vert^2\\ &\alpha\boldsymbol{\eta}_2^{\text{T}}\boldsymbol R^{\text{T}}\boldsymbol{LR\delta}_2 \le\frac{\rho_2}{4}\Vert\boldsymbol{\delta}_2\Vert^2+\frac{\Vert\boldsymbol L\Vert^2\alpha^2}{\rho_2}\Vert\boldsymbol{\eta}_2\Vert^2 \end{split} $$ (35) 将式(32) ~ (35)代入式(28), 可得
$$ \begin{split} \dot{V}_3 \le\;&-\left(\gamma^2-\frac{(1+\omega)^2}{\omega^2}\varepsilon\theta^2\alpha^2\right)\Vert\bar{\boldsymbol x}\Vert^2-\\ &\gamma\Vert\bar{\boldsymbol v}\Vert^2-\left(\alpha\omega-\frac{(\omega+1)}{\rho_2\omega}-\frac{1}{2}\right)\varepsilon\Vert\boldsymbol{\xi}\Vert^2-\\ &\varepsilon(1-\frac{\omega^2}{2(\omega+1)^2\alpha^2})\Vert\boldsymbol{\eta}_1\Vert^2-\\ &\frac{\varepsilon\rho_2(\omega+1)}{2\omega}\Vert\boldsymbol{\delta}_2\Vert^2-\\ &\frac{\varepsilon(\omega+1)}{\omega}\left(\beta\rho_2-\frac{\Vert\boldsymbol L\Vert^2\alpha^2}{\rho_2}\right)\Vert\boldsymbol{\eta}_2\Vert^2 \le-\kappa\Vert\boldsymbol{\chi}\Vert^2 \end{split} $$ (36) 其中
$ \boldsymbol{\chi} = \text{col}(\bar{\boldsymbol x},\bar{\boldsymbol v},\boldsymbol{\xi},\boldsymbol{\eta},\boldsymbol{\delta}_2) $ ,$ \kappa $ 定义如下$$ \begin{split} \kappa =\;& \min\Bigg\{\gamma^2-\frac{(1+\omega)^2}{\omega^2}\varepsilon\theta^2\alpha^2,\gamma,\\ &\left(\alpha\omega-\frac{(\omega+1)}{\rho_2\omega}-\frac{1}{2}\right)\varepsilon,\frac{\varepsilon\rho_2(\omega+1)}{2\omega},\\ &\varepsilon\left(1-\frac{\omega^2}{2(\omega+1)^2\alpha^2}\right),\\ &\frac{\varepsilon(\omega+1)}{\omega}\left(\beta\rho_2-\frac{\Vert\boldsymbol L\Vert^2\alpha^2}{\rho_2}\right)\Bigg\} \end{split} $$ 从式 (36)可知, 当
$ t\ge T_1 $ 后, 系统(9)指数收敛到问题(2)的最优解. □3. 案例仿真
现在我们提供仿真案例来验证之前所提算法的有效性. 第一个案例数据来自文献[43], 第二个仿真案例数据来自文献[44].
案例 1. 针对6发电机系统, 每个发动机的代价函数采用如下二次函数形式:
$f_i(x_i) = a_{i1}x_i^2+ a_{i2}x_i+ $ $ a_{i3}$ . 各发电机代价函数系数、初始值$ x_i(0) $ 、期望功率$ d_i $ 和输出功率约束总结在表1中. 令算法(8)和算法(9)中控制参数为$\alpha = 2.75,\;\beta = 380,\;\gamma = 30, $ $ \;\mu = 0.5,\;\nu = 2$ . 从任意初始状态出发, 详细的仿真轨迹分别如如图1和图2所示, 从图中可知问题的最优值为$\boldsymbol x^* = [23.01;\;35;50; \;31.01; $ $ \;45.78;\; 30.19]^{\rm{T}}$ , 此结果与文献[43]一致. 相比于算法(8)中的梯度法, 由于算法(9)采用映射算子和固定时间收敛理论处理问题(2)中的局部不等式约束, 所以算法(9)可以很快地将超出约束范围的节点快速拉回到约束范围内. 所以图1相比图2, 在算法到达约束边界时, 有更大的波动性. 基于案例1中的数据, 接下来从同一初始状态出发, 将本文所设计算法与文献[43]和文献[39]进行收敛速度对比, 结果如图3所示(文献[43]中控制参数设置与本文相同). 其中算法误差定义为$e = \ln(\dfrac{1}{2}\sum_{i = 1}^n(x_i-x_i^*)^2)$ , 其中最优值$ x_i^* $ 由集中式拉格朗日乘子法求得. 则$ e $ 表示算法运行解与理论最优解的差值. 从图3可以看出, 本文所设计算法下误差下降较快, 即拥有更快的收敛速度, 且算法在稳定点时有更好的稳定性. 而文献[39]由于在端点处梯度不唯一, 会导致算法在稳定点时有轻微波动. 此外, 算法 (9)和文献[39]在边界点的波动性导致其误差$ e $ 要比算法 (8)和文献[43]中的误差稍大.表 1 案例1各节点参数Table 1 System parameters in case 1Agent $a_{i1}$ $a_{i2}$ $a_{i3}$ 功率约束 $d_i$ $x_i(0)$ 1 2 3 0.5 $[20,40]$ 45 40 2 1 4 1.5 $[25,35]$ 40 24 3 0.5 5 3 $[35,50]$ $25$ 35 4 1.5 2 1 $[25,45]$ 35 45 5 1 3.5 2.5 $[30,47]$ 30 28 6 1.5 4.5 2 $[28,42]$ 40 50 案例 2. 针对4节点环形网络, 其中资源决策变量
$\boldsymbol x_i\in{\bf{R}}^2$ , 且节点目标函数分别为$$ \begin{split} &f_1(\boldsymbol x_1) = x_{1,1}^2+x_{1,2}^2+\sqrt{(x_{1,1}-2)^2+(x_{1,2}-2)^2}\\ &f_2(\boldsymbol x_2) = \frac{x_{2,1}^2}{20\sqrt{x_{2,1}^2+1}}+\frac{x_{2,2}^2}{20\sqrt{x_{2,2}^2+1}}+x_{2,1}^2+x_{2,2}^2\\ &f_3(\boldsymbol x_3) = (x_{3,1}-2)^2+(x_{3,2}-3)^2\\ &f_4(\boldsymbol x_4) = \text{ln}\left({\rm{e}}^{-0.05x_{4,1}}+{\rm{e}}^{0.05x_{4,1}}\right)+x_{4,1}^2+\\ & \qquad\qquad\text{ln}\left({\rm{e}}^{-0.05x_{4,2}}+{\rm{e}}^{0.05x_{4,2}}\right)+x_{4,2}^2 \end{split} $$ 其中
$$ \begin{split} &\boldsymbol x_1\in\Omega_1 = \{\boldsymbol x_1|(x_{1,1}-2)^2+(x_{1,2}-2)^2\le4\}\\ &\boldsymbol x_2\in\Omega_2 = \{\boldsymbol x_2|1\le x_{2,1}\le2,0\le x_{2,2}\le1\}\\ &\boldsymbol x_3\in\Omega_3 = \{\boldsymbol x_3|x_{3,1}\ge0.5,x_{3,2}\ge1,x_{3,1}+x_{3,2}\le6\}\\ &\boldsymbol x_4\in\Omega_4 = \{\boldsymbol x_4|(x_{4,1}-3)^2+(x_{4,2}-5)^2\le4\} \end{split} $$ 虚拟资源量
$ \boldsymbol d $ 设定为$\boldsymbol d_1 \!=\! [2,1]^{\text{T}},\;\boldsymbol d_2 \!=\! [2,3]^{\text{T}}, \;\boldsymbol d_3 = $ $ [2,4]^{\text{T}},\;\boldsymbol d_4 = [1,5]^{\text{T}}$ . 算法初始值设定为$\boldsymbol x_1(0) = [2,0]^{\text{T}}$ ,$\boldsymbol x_2(0) \!=\! [1.5,0.5]^{\text{T}},\;\boldsymbol x_3(0) \!=\! [1,1]^{\text{T}},\;\boldsymbol x_4 = [4,6]^{\text{T}}$ , 算法控制参数设定为$\alpha = 2,\;\beta = 75,\;\gamma = 30, \;\mu = $ $ 0.2,\;\nu = 2$ . 其仿真曲线分别如图4和图5所示, 星点表示各节点的最优解位置. 通过仿真案例2可以发现, 本文所设计算法对高维资源分配问题亦是有效的. 为了展示各算法在二维资源分配问题上的收敛速度, 现将本文所设计算法与文献[43]进行对比, 收敛速度图展示在图6, 从图中可以看出, 指数收敛算法 (9)比渐近收敛算法 (8)收敛稍快, 该结果与一维资源问题图3所得结论一致.案例 3. 针对IEEE-39总线系统, 包含10个发电单元, 各发电单元的通信链路及其权重如下图7所示. 各发电单元的发电成本为
$f_i(x_i) = a_{i,1}x_i^2+ a_{i2}x_i$ 且有${\boldsymbol{a}}_1=[0.096$ $0.072,\;0.105,\;0.082,\;0.078,\; 0.90,\; 0.085,\; 0.092,\; 0.155,$ $\;0.082]^{\text{T}}\in\mathbf{R}^{10}$ 和$\boldsymbol a_2 = [1.22,\;\; 3.41,\;\;2.53,\;\;4.02,\; 2.90,$ $2.72,\;1.22,\;4.20,\;\;3.53,\;\;3.02]^{\text{T}}\;\in \; \mathbf{R}^{10},$ 其中$\boldsymbol a_1 = $ $ [ a_{1,1},\cdots,a_{n,1}],\boldsymbol a_2 = [a_{1,1},\cdots,a_{n,1}]\in \mathbf{R}^{10}$ . 各节点的局部不等式约束和虚拟分配量分别为$ x_i\in[0,300] $ 和$ d_i = 250 $ . 以零初始状态出发, 在控制参数$\alpha = 2.75,\; $ $ \beta = 380,\;\gamma = 30$ 作用下, 算法 (8)和 (9)各自对应的状态轨迹如图8和图9所示. 此外两种算法的误差$ e $ 轨迹如图10所示, 其中误差$ e $ 定义同案例1. 从图10可知, 上述系统最终收敛到最优分配方案$\boldsymbol x^* =$ [243.6524, 300, 216.5298, 268.1785, 289.1107, 251.5626, 275.1839, 238.0504, 143.4557, 274.2760] .4. 总结
本文针对有向平衡网络下的带约束分布式资源分配问题, 基于固定时间映射算子和基于多智能体一致性的梯度下降法, 设计了两种基于二阶多智能体系统的连续时间算法. 所设计算法对节点初始状态无约束, 并且控制参数全为常数. 通过对一维和二维资源分配问题数值仿真, 本文所提算法的有效性也得以保证. 然而在实际系统中, 通信网络通常会存在信息交互延迟, 而信息延迟给算法分析带来了很大的困难. 此外, 非平衡有向网络在实际系统中也是存在的, 所以在后续研究中, 我们将考虑由通信延迟等造成的有向非平衡网络下二阶多智能体资源分配问题.
-
表 1 案例1各节点参数
Table 1 System parameters in case 1
Agent $a_{i1}$ $a_{i2}$ $a_{i3}$ 功率约束 $d_i$ $x_i(0)$ 1 2 3 0.5 $[20,40]$ 45 40 2 1 4 1.5 $[25,35]$ 40 24 3 0.5 5 3 $[35,50]$ $25$ 35 4 1.5 2 1 $[25,45]$ 35 45 5 1 3.5 2.5 $[30,47]$ 30 28 6 1.5 4.5 2 $[28,42]$ 40 50 -
[1] Yang S F, Liu Q S, Wang J. Distributed optimization based on a multiagent system in the presence of communication delays. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2017, 47(5): 717-728 doi: 10.1109/TSMC.2016.2531649 [2] He X, Huang T W, Yu J Z, Li C J, Zhang Y S. A continuous-time algorithm for distributed optimization based on multiagent networks. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2019, 49(12): 2700-2709 doi: 10.1109/TSMC.2017.2780194 [3] Zhu Y N, Yu W W, Wen G H, Chen G R. Projected primal–dual dynamics for distributed constrained nonsmooth convex optimization. IEEE Transactions on Cybernetics, 2020, 50(4): 1776-1782 doi: 10.1109/TCYB.2018.2883095 [4] 洪奕光, 张艳琼. 分布式优化: 算法设计和收敛性分析. 控制理论与应用, 2014, 31(7): 850-857 doi: 10.7641/CTA.2014.40012Hong Yi-Guang, Zhang Yan-Qiong. Distributed optimization: Algorithm design and convergence analysis. Control Theory & Application, 2014, 31(7): 850-857 doi: 10.7641/CTA.2014.40012 [5] 谢佩, 游科友, 洪奕光, 谢立华. 网络化分布式凸优化算法研究进展. 控制理论与应用, 2018, 35(7): 918-927 doi: 10.7641/CTA.2018.80205Xie Pei, You Ke-You, Hong Yi-Guang, Xie Li-Hua. A survey of distributed convex optimization algorithms over networks. Control Theory & Application, 2018, 35(7): 918-927 doi: 10.7641/CTA.2018.80205 [6] 王龙, 卢开红, 关永强. 分布式优化的多智能体方法. 控制理论与应用, 2019, 36(11): 1820-1833 doi: 10.7641/CTA.2019.90502Wang Long, Lu Kai-Hong, Guan Yong-Qiang. Distributed optimization via multi-agent systems. Control Theory & Application, 2019, 36(11): 1820-1833 doi: 10.7641/CTA.2019.90502 [7] 杨涛, 柴天佑. 分布式协同优化的研究现状与展望. 中国科学: 技术科学, 2020, 50(11): 1414-1425 doi: 10.1360/SST-2020-0040Yang Tao, Chai Tian-You. Research status and prospects of distributed collaborative optimization. Scientia Sinica Technologica, 2020, 50(11): 1414-1425 doi: 10.1360/SST-2020-0040 [8] Nedic A, Ozdaglar A, Parrilo P A. Constrained consensus and optimization in multi-agent networks. IEEE Transactions on Automatic Control, 2010, 55(4): 922-938 doi: 10.1109/TAC.2010.2041686 [9] Bianchi P, Hachem W, Iutzeler F. A coordinate descent primal-dual algorithm and application to distributed asynchronous optimization. IEEE Transactions on Automatic Control, 2016, 61(10): 2947-2957 doi: 10.1109/TAC.2015.2512043 [10] Wang P, Lin P, Ren W, Song YD. Distributed subgradient-based multiagent optimization with more general step sizes. IEEE Transactions on Automatic Control, 2018, 63(7): 2295-2302 doi: 10.1109/TAC.2017.2763782 [11] Yang S P, Tan S C, Xu J X. Consensus based approach for economic dispatch problem in a smart grid. IEEE Transactions on Power Systems, 2013, 28(4): 4416-4426 doi: 10.1109/TPWRS.2013.2271640 [12] Xu Y, Han T R, Cai K, Lin Z Y, Yan G F, Fu M Y. A distributed algorithm for resource allocation over dynamic digraphs. IEEE Transactions on Signal Processing, 2017, 65(10): 2600-2612 doi: 10.1109/TSP.2017.2669896 [13] Yang T, Lu J, Wu D, Wu J F, Shi G D, Meng Z Y, et al. A distributed algorithm for economic dispatch over time-varying directed networks with delays. IEEE Transactions on Industrial Electronics, 2017, 64(6): 5095-5106 doi: 10.1109/TIE.2016.2617832 [14] Xing H, Mou Y T, Fu M Y, Lin Z Y. Distributed bisection method for economic power dispatch in smart grid. IEEE Transactions on Power Systems, 2015, 30(6): 3024-3035 doi: 10.1109/TPWRS.2014.2376935 [15] Li C J, Yu X H, Yu W W, Huang T W, Liu Z W. Distributed event-triggered scheme for economic dispatch in smart grids. IEEE Transactions on Industrial Informatics, 2016, 12(5): 1775-1785 doi: 10.1109/TII.2015.2479558 [16] Xing H, Fu M Y, Lin Z Y, Mou Y T. Decentralized optimal scheduling for charging and discharging of plug-in electric vehicles in smart grids. IEEE Transactions on Power Systems, 2016, 31(5): 4118-4127 doi: 10.1109/TPWRS.2015.2507179 [17] Li H Q, Lu Q G, Huang T W. Distributed projection subgradient algorithm over time-varying general unbalanced directed graphs. IEEE Transactions on Automatic Control, 2019, 64(3): 1309-1316 doi: 10.1109/TAC.2018.2849616 [18] Yang T, Yi X L, Wu J F, Yuan Y, Wu D, Meng Z Y, et al. A survey of distributed optimization. Annual Reviews in Control, 2019, 47: 278-305 doi: 10.1016/j.arcontrol.2019.05.006 [19] Zhang J Q, You K Y, Cai K. Distributed dual gradient tracking for resource allocation in unbalanced networks. IEEE Transactions on Signal Processing, 2020, 68: 2186-2198 doi: 10.1109/TSP.2020.2981762 [20] He X, Ho D W C, Huang T W, Yu J Z, Abu-Rub H, Li C J. Second-order continuous-time algorithms for economic power dispatch in smart grids. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2018, 48(9): 1482-1492 doi: 10.1109/TSMC.2017.2672205 [21] 张青, 弓志坤, 杨正全, 陈增强. 多智能体系统的自适应群集分布式优化. 控制理论与应用, 2019, 36(4): 666-672 doi: 10.7641/CTA.2018.80562Zhang Qing, Gong Zhi-Kun, Yang Zheng-Quan, Chen Zeng-Qiang. Distributed optimization for adaptive flocking of multi-agent systems. Control Theory & Applications, 2019, 36(4): 666-672 doi: 10.7641/CTA.2018.80562 [22] 周琪, 陈广登, 鲁仁全, 白伟伟. 基于干扰观测器的输入饱和多智能体系统事件触发控制. 中国科学: 信息科学, 2019, 49(11): 1502-1516 doi: 10.1360/SSI-2019-0105Zhou Qi, Chen Guang-Deng, Lu Ren-Quan, Bai Wei-Wei. Disturbance-observer-based event-triggered control for multi-agent systems with input saturation. Scientia Sinica Information, 2019, 49(11): 1502-1516 doi: 10.1360/SSI-2019-0105 [23] 杨彬, 周琪, 曹亮, 鲁仁全. 具有指定性能和全状态约束的多智能体系统事件触发控制. 自动化学报, 2019, 45(8): 1527-1535Yang Bin, Zhou Qi, Cao Liang, Lu Ren-Quan. Event-triggered control for multi-agent systems with prescribed performance and full state constraints. Acta Automatica Sinica, 2019, 45(8): 1527-1535 [24] 陈刚, 李志勇. 集合约束下多智能体系统分布式固定时间优化控制, 自动化学报, DOI: 10.16383/j.aas.c190416Chen Gang, Li Zhi-Yong. Distributed fixed-time optimization control for multi-agent systems with set constraints, Acta Automatica Sinica, DOI: 10.16383/j.aas.c190416 [25] 杨涛, 徐磊, 易新蕾, 张圣军, 陈蕊娟, 李渝哲. 基于事件触发的分布式优化算法, 自动化学报, DOI: 10.16383/j.aas.c200838Yang Tao, Xu Lei, Yi Xin-Lei, Zhang Sheng-Jun, Chen Rui-Juan, Li Yu-Zhe. Event-triggered distributed optimization algorithms, Acta Automatica Sinica, DOI: 10.16383/j.aas.c200838 [26] Deng Z H, Liang S, Yu W Y. Distributed optimal resource allocation of second-order multiagent systems. International Journal of Robust and Nonlinear Control, 2018, 28(14): 4246-4260 doi: 10.1002/rnc.4233 [27] Chen G, Li Z Y. A fixed-time convergent algorithm for distributed convex optimization in multi-agent systems. Automatica, 2018, 95: 539-543 doi: 10.1016/j.automatica.2018.05.032 [28] Dai H, Jia J P, Yan L, Fang X P, Chen W S. Distributed fixed-time optimization in economic dispatch over directed networks. IEEE Transactions on Industrial Informatics, 2021, 17(5): 3011-3019 doi: 10.1109/TII.2020.3010282 [29] Lin W T, Wang Y W, Li C J, Yu X H. Predefined-time optimization for distributed resource allocation. Journal of the Franklin Institute, 2020, 357(16): 11323-11348 doi: 10.1016/j.jfranklin.2019.06.024 [30] Cherukuri A, Cortes J. Initialization-free distributed coordination for economic dispatch under varying loads and generator commitment. Automatica, 2016, 74: 183-193 doi: 10.1016/j.automatica.2016.07.003 [31] Yi P, Hong Y G, Liu F. Initialization-free distributed algorithms for optimal resource allocation with feasibility constraints and application to economic dispatch of power systems. Automatica, 2016, 74: 259-269 doi: 10.1016/j.automatica.2016.08.007 [32] Li K X, Liu Q S, Yang S F, Cao J D, Lu G P. Cooperative optimization of dual multiagent system for optimal resource allocation. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2020, 50(11): 4676-4687 doi: 10.1109/TSMC.2018.2859364 [33] Deng Z H, Nian X H, Hu C. Distributed algorithm design for nonsmooth resource allocation problems. IEEE Transactions on Cybernetics, 2020, 50(7): 3208-3217 doi: 10.1109/TCYB.2019.2901256 [34] Li R R. Distributed algorithm design for optimal resource allocation problems via incremental passivity theory. Systems & Control Letters, 2020, 138: Article No. 104650 [35] Chen G, Guo Z J. Initialization-free distributed fixed-time convergent algorithms for optimal resource allocation. IEEE Transactions on Systems, Man, and Cybernetics: Systems, DOI: 10.1109/TSMC.2020.3005169 [36] Cherukuri A, Cortes J. Distributed generator coordination for initialization and anytime optimization in economic dispatch. IEEE Transactions on Control of Network Systems, 2015, 2(3): 226-237 doi: 10.1109/TCNS.2015.2399191 [37] Zhao T Q, Ding Z T. Distributed initialization-free cost-optimal charging control of plug-in electric vehicles for demand management. IEEE Transactions on Industrial Informatics, 2017, 13(6): 2791-2801 doi: 10.1109/TII.2017.2685422 [38] Guo Z, Chen G. Predefined-time distributed optimal allocation of resources: A time-base generator scheme. IEEE Transactions on Systems, Man, and Cybernetics: Systems DOI: 10.1109/TSMC.2020.2997697 [39] Wang D, Wang Z, Wen C Y, Wang W. Second-order continuous-time algorithm for optimal resource allocation in power systems. IEEE Transactions on Industrial Informatics, 2019, 15(2): 626-637 doi: 10.1109/TII.2018.2881974 [40] Liang S, Zeng X L, Hong Y G. Distributed sub-optimal resource allocation over weight-balanced graph via singular perturbation. Automatica, 2018, 95: 222-228 doi: 10.1016/j.automatica.2018.05.013 [41] Yang Q, Chen G, Ren J H. Continuous-time algorithm for distributed constrained optimization over directed graphs. In: Proceedings of the IEEE 15th International Conference on Control and Automation (ICCA). Edinburgh, UK: IEEE, 2019. 1020−1025 [42] Zhu Y N, Ren W, Yu W W, Wen G H. Distributed resource allocation over directed graphs via continuous-time algorithms. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2021, 51(2): 1097-1106 doi: 10.1109/TSMC.2019.2894862 [43] Deng Z H. Distributed algorithm design for resource allocation problems of second-order multiagent systems over weight-balanced digraphs. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2021, 51(6): 3512-3521 doi: 10.1109/TSMC.2019.2930672 [44] Deng Z H, Liang S, Hong Y G. Distributed continuous-time algorithms for resource allocation problems over weight-balanced digraphs. IEEE Transactions on Cybernetics, 2018, 48(11): 3116-3125 doi: 10.1109/TCYB.2017.2759141 [45] Deng Z H, Wang L. Distributed event-triggered algorithm for optimal resource allocation of second-order multi-agent systems. IET Control Theory & Applications, 2020, 14(14): 1937-1946 [46] Li S L, Nian X H, Deng Z H. Distributed resource allocation of second-order multiagent systems with exogenous disturbances. International Journal of Robust and Nonlinear Control, 2020, 30(3): 1298-1310 doi: 10.1002/rnc.4830 [47] Polyakov A. Nonlinear feedback design for fixed-time stabilization of linear control systems. IEEE Transactions on Automatic Control, 2012, 57(8): 2106-2110 doi: 10.1109/TAC.2011.2179869 期刊类型引用(13)
1. 徐磊,时侠圣. 一种初始值自由的固定时间分布式最优一致性算法. 控制与决策. 2025(04): 1377-1385 . 百度学术
2. 刘奕葶,马铭莙,付俊. 基于有向图的分布式连续时间非光滑耦合约束凸优化分析. 自动化学报. 2024(01): 66-75 . 本站查看
3. 时侠圣,孙长银,穆朝絮. 扰动线性多智能体系统的分布式资源分配算法. 中国科学:信息科学. 2024(04): 911-926 . 百度学术
4. 时侠圣,任璐,孙长银. 自适应分布式聚合博弈广义纳什均衡算法. 自动化学报. 2024(06): 1210-1220 . 本站查看
5. 时侠圣,孙佳月,徐磊,杨涛. 二阶智能体的分布式非光滑资源分配算法. 控制与决策. 2023(05): 1336-1344 . 百度学术
6. 时侠圣,徐磊,杨涛. 基于鞍点法的自适应分布式资源分配算法. 控制与决策. 2023(07): 2042-2048 . 百度学术
7. 李建华,王泽鼎. 考虑路径耗时的城市汽车分布式充电桩选点规划. 吉林大学学报(工学版). 2023(08): 2298-2303 . 百度学术
8. 时侠圣,林志赟. 基于固定时间的二阶智能体分布式优化算法. 北京航空航天大学学报. 2023(11): 2951-2959 . 百度学术
9. 梁鑫龙,徐永贵,史君. 依据散列查找的分布式网络数据分流算法. 新乡学院学报. 2023(12): 26-30 . 百度学术
10. 唐彬峰,强国栋,张博. 基于一致性理论的微电网分层控制策略. 红水河. 2023(06): 78-84 . 百度学术
11. 时侠圣,林志赟,王雪松,董世建. 非平衡有向网络的完全分布式凸优化. 控制理论与应用. 2022(06): 1071-1078 . 百度学术
12. 叶应辉. 基于深度学习的卫星遥感图像边缘检测方法. 计算机测量与控制. 2022(10): 39-44 . 百度学术
13. 时侠圣,徐磊,杨涛. 基于自适应精确罚函数的分布式资源分配算法. 控制理论与应用. 2022(10): 1937-1945 . 百度学术
其他类型引用(15)
-