Optimal Output Regulation of Partially Linear Discrete-time Systems Using Reinforcement Learning
-
摘要: 针对同时具有线性外部干扰与非线性不确定性下的离散时间部分线性系统的最优输出调节问题, 提出了仅利用在线数据的基于强化学习的数据驱动控制方法. 首先, 该问题可拆分为一个受约束的静态优化问题和一个动态规划问题, 第一个问题可以解出调节器方程的解. 第二个问题可以确定出控制器的最优反馈增益. 然后, 运用小增益定理证明了存在非线性不确定性离散时间部分线性系统的最优输出调节问题的稳定性. 针对传统的控制方法需要准确的系统模型参数用来解决这两个优化问题, 提出了一种数据驱动离线策略更新算法, 该算法仅使用在线数据找到动态规划问题的解. 然后, 基于动态规划问题的解, 利用在线数据为静态优化问题提供了最优解. 最后, 仿真结果验证了该方法的有效性.Abstract: A data-driven control method only using online data based on reinforcement learning is proposed for the optimal output regulation problem of discrete-time partially linear systems with both linear disturbance and nonlinear uncertainties. First, the problem can be split into a constrained static optimization problem and a dynamic one. The solution of the first problem is corresponding to the solution of the regulator equation. The second can determine the optimal feedback gain of the controller. Then the small-gain theorem is used to prove the stability of the optimal output regulation problem of discrete-time partially linear systems with nonlinear uncertainties. The traditional control method needs the dynamics of the system to solve the two problems. But for this problem, a data-driven off-policy algorithm is proposed using only the measured data to find the solution of the dynamic optimization problem. Then, based on the solution of the dynamic one, the solution of the static optimization problem can be found only using data online. Finally, simulation results verify the effectiveness of the proposed method.
-
同步(一致)行为是生物、生态、工程和社会科学等领域中最普遍的群聚现象之一. 在过去十几年里, 耦合系统中仅由局部交互引起的同步问题引起了大量研究者的关注[1-5]. 在自然和工程系统中, 合作、竞争关系普遍存在, 且很多实际系统同时存在合作与竞争关系, 例如社会网络[6]、存在合作与竞争的种群[7]、竞争性细胞神经元[8]和个性化推荐[9]. 为了描述系统中的合作与竞争关系, 研究者们引入了符号图, 其中正数边表示合作关系, 负数边表示竞争关系.
目前, 越来越多的研究人员开始利用符号图来研究网络中的各种群聚现象[10-16]. 在文献[10]中, Altafini研究了定义在符号图上的一个积分器网络, 并得到了关于双向一致的一些定理. 这里的双向一致表示所有的智能体都收敛到一个模量相等、符号不同的值. 其中, 作者假设符号图是结构平衡的, 即所有节点可以被分为两个阵营, 每个阵营内部是合作关系, 两个阵营之间是竞争关系. 这个假设对双向一致性结论的得出至关重要. 文献[10]的结论推广到了更一般的线性多智能体系统[11-13], 其中每个智能体都由一个线性时不变系统表示. 例如对于有向图上的积分器网络, 文献[13] 在符号图含有生成树的情况下得到了达到双向一致的一些充分条件. 很多研究者陆续对各种特定网络展开了双向同步问题研究, 例如双向聚集[14]、区间双向一致[15]、含有时滞的双向一致[16]等. 基于压缩性分析, 文献[17] 研究了耦合非线性网络的双向同步问题. 对于耦合离散系统构成的网络, 其双向同步问题也受到了很多研究者的关注[18-19]. 对于更多的关于双向同步的研究, 可以参见综述文献[20-21].
在实际系统中, 随着时间的推移, 网络的拓扑结构可能会发生变化. 而且, 网络所形成的符号图可能不满足结构平衡特性. 例如, 在社会网络中, 个体之间的关系可能会由合作(友谊)到竞争(敌意)变化, 反之亦然; 在多党制的国家, 很多成员经常会从一个党派转向另一个党派. 当符号图不满足结构平衡性时, 网络不能达到双向同步. 在文献[22]中, 作者利用矩阵的最终为正性质, 分别研究了连续和离散时间舆论动力学模型的动力学行为. 当符号图随着时间变化的时候, 网络构成一个切换系统. 文献[23-24]考虑了所有符号图在结构上都是平衡的, 且敌对阵营的成员随着时间的推移是不变的情况. 具体地, 在文献[23]中, 作者得到了使非线性系统达到模同步的充分条件; 在文献[24]中, 作者设计了一种牵引控制, 使闭环系统实现双向同步. 如果这些符号图中的节点随着时间变化, 那么双向同步将不可能达到.
本文将研究含有对抗性关系和时变拓扑的耦合离散系统的有界双向同步(Bounded bipartite synchronization, BBS)问题. 考虑以下情形: 1)在某些时刻, 所有个体不能被分为两个敌对阵营; 2)虽然所有个体可以被划分为两个阵营. 但所形成敌对阵营中的成员会随时间改变. 当情形1)和2)出现时, 将这种耦合离散系统看成是一个特定网络的扰动, 在这个特定网络中, 所有的个体都可以被分成两个敌对阵营, 且二者中的成员随着时间的推移会保持不变. 在该特定网络的所有符号图都是连通的条件下, 本文得到了使系统达到有界双向同步的一些充分条件. 最后, 利用一个数值例子来说明所得结论的有效性.
本文符号说明如下:
$ \vert x \vert $ 表示实数$ x $ 的绝对值,$ {\bf Z}^+ $ 表示正整数域,$ \vert\vert {\boldsymbol y}\vert\vert $ 表示向量$ {\boldsymbol y} $ 的范数,$ I_N $ 表示$ N $ 维单位矩阵,$ {\boldsymbol 1}_N $ 表示元素都为$ 1 $ 的$ N $ 维列向量, 运算符$ \otimes $ 表示Kronecker积. 对于矩阵$ A $ , 符号$ \lambda _{\min}(A) $ ,$ \lambda_{\max}(A) $ 分别表示矩阵$ A $ 的最小特征值和最大特征值.${\rm diag}\{{\cdot}\}$ 表示一个对角矩阵,$ {\rm sgn}(\cdot ) $ 代表符号函数. 如果对于每个固定的$ s $ , 函数$ \beta \left( {r,\;s} \right) $ 是严格递增的且$ \beta \left( {\rm{0},\;s} \right)\equiv \rm{0} $ , 对于每个固定的$ r, $ 函数$ \beta \left( {r,\;s} \right) $ 是严格递减的且$\lim\nolimits_{s\to \infty } \beta \left( {r,\;s} \right) = 0, $ 那么函数$ \beta \left( {r,\;s} \right) $ 称为 KL类函数.1. 问题描述
考虑包含
$ N $ 个离散系统的网络$$ x_i (k+1) = Ax_i (k)+Bu_i (k) $$ (1) 其中,
$ i = 1,2,\cdots ,N. $ $ x_i \in {\bf R}^n $ 是第$ i $ 个节点的状态, A, B 是常数矩阵,$ u_i(k) $ 是控制输入. 假设网络的拓扑在$ p $ 个无向符号图$G\left( {E^k}\right)$ (符号图定义见附录A),$k = 1,2,\cdots ,p$ 之间切换, 其中切换信号是$\sigma (k):{\bf Z}^+\to $ $ P: = \{1,\;2,\;\cdots \;,\rm{}p\}$ , 它是一个分段右连续的函数. 控制输入$ u_i (k) $ 设计为$$\begin{split} u_i (k) = K\sum\limits_{i = 1}^N {\left| {e_{ij}^{\sigma (k)} } \right|} \left( {{\rm sgn}\left( {e_{ij}^{\sigma (k)} } \right)x_j (k)-x_i (k)} \right)\;\;\; \\[-20pt]\end{split}$$ (2) 其中,
$ K $ 是一个需要设计的增益矩阵,$ e_{ij} $ 是图$ G({E^k} ) $ 的边值. 令$x = [{x_1^{\rm T} \;\cdots\;x_N^{\rm T}} ]^{\rm T}$ ,$\{k_i:i = 0,1,\cdots\}$ 是$ \sigma (k) $ 的切换时刻. 存在正常数$ T>1 $ , 使得$ k_{i+1} -k_i \ge T , $ $ \forall i\ge 0. $ 注1. 网络在切换信号下构成一个切换系统. 本文中要求存在正常数
$ T>1 $ , 使得$ k_{i+1} -k_i \ge T $ ,$ \forall i\ge 0 $ . 这里的$ T>1 $ 可以看成是驻留时间. 如果没有驻留时间, 那么在有限时间内可能会有无限次切换, 对于系统的收敛性会有很大影响.通常来说, 如果符号图结构平衡, 那么其所有节点可以划分为两个敌对阵营, 其中每个阵营中的个体之间的关系是合作的, 属于不同阵营的个体之间的关系是对立的. 对于符号图
$ G({E^k} ),\,k = 1,2,\cdots,p $ , 可能存在以下情况: 1)虽然每一个符号图都满足结构平衡, 即每个符号图都可以划分为两个敌对阵营, 但是每一个符号图的两个敌对阵营中的个体是不一样的, 例如在多党派执政的国家, 一些个体随着时间变化从一个阵营转移到另一个阵营; 2)可能存在某些不满足结构平衡的符号图. 在这些情况下, 网络很难达到双向同步. 为了研究这两种情况下的网络的同步问题, 将这些符号图看成是某些特定结构平衡符号图的扰动. 具体地, 假设符号图$ G( {E^k} ) $ 的邻接矩阵可以分为两个邻接矩阵, 即$ E^k = \bar{E}^k+w^k $ , 其中,$ \bar {E}^k $ 是关于符号图$ G({\bar{E}^k}) $ 的一个邻接矩阵. 把控制输入(2)中的符号图改为$ G( {\bar {E}^k} ) $ 可以得到一个新的输入$$\begin{split} \bar {u}_i (k) = K\sum\limits_{i = 1}^N {\left| {\bar {e}_{ij}^{\sigma (k)} } \right|} \left( {{\rm sgn}\left( {\bar {e}_{ij}^{\sigma (k)} } \right)x_j (k)-x_i (k)} \right) \\[-12pt]\end{split}$$ (3) 因此, 由符号图
$ G\left( {E^k}\right) $ 形成的耦合系统(1)和(2)可以看成是由符号图$ G( {\bar {E}^k}) $ 形成的耦合系统(1)和(3)的扰动. 而且, 假设符号图$ G( {\bar{E}^k} ) $ ,$ k = 1,2, \cdots , $ $ p $ 的节点$ \{1,2,\cdots ,N\} $ 可以划分为两个敌对阵营$ V_1 $ ,$ V_2 $ , 且存在一个符号矩阵$ \Psi\; (\Psi = {\rm diag}\{\sigma _1 ,\cdots ,\sigma _N \},$ $ \,\sigma _i \in \{\pm 1\}) $ , 使得矩阵$ \Psi \bar {E}^k\Psi $ ,$ k = 1,2,\cdots ,p $ 都是非负矩阵.接下来, 本文将研究当控制输入为式(2)时, 网络(1)将在何种条件下达到有界双向同步. 双向同步和有界双向同步的定义分别如下.
定义1. 如果存在依赖于非零初始条件的函数
$ \zeta(k)\ne 0, $ 使得以下条件成立:$\lim\nolimits_{k\to \infty }( {x_i(k)-\zeta(k)} ) = $ $ 0 ,$ $ \forall i\in V_1, \lim\nolimits_{k\to \infty } \left({x_i (k)+\zeta(k)}\right) = 0, \forall i\in V_2, $ 那么控制输入为式(3)的网络(1)达到双向同步.定义2. 如果满足以下两个条件, 那么控制输入为式(2)的网络(1)达到有界双向同步: 1)网络(1)在形式为式(3)的控制输入下达到双向同步; 2)存在一个正常数
$ \xi $ (依赖于非零初始条件), 一个KL类函数$ \beta (\cdot ,\cdot ) $ (依赖于图$ G( {E^k}) $ ,$ k = 1,2,\cdots ,p )$ , 使得${\vert \vert }\delta (k){\vert \vert }\le \beta $ $ \left(\vert \vert \delta(0)\vert \vert , t\right)+\xi $ 成立, 其中$ \delta (k) = \;x(k)-$ $\frac{1}{N}{\rm {\bf 1}}_N \otimes {\rm {\bf 1}}_N^{\rm T} \otimes I_n x(k). $ 2. 主要结论
本节将研究以下两种情形: 1)在某些时刻, 所有个体不能划分为两个敌对阵营; 2)虽然所有个体可以划分为两个阵营, 但形成的敌对阵营中的成员会随时间改变. 如果符号图
$ G( {\bar {E}^k} ) $ ,$ k = 1,2,\cdots ,\;p $ 都是连通的, 那么可以得到条件使得控制输入为式(2)的网络(1)达到有界双向同步. 为此, 给出以下假设:假设1. 假设矩阵
$ A $ 的所有特征值是模为1的半单特征值, 即所有约当块都是一维的.进而, 针对存在对抗关系和时变拓扑的耦合离散系统, 可以得到定理1.
定理1. 考虑网络(1), 假定假设1成立且符号图
$G( {\bar {E}^k})$ ,$ k = 1,2,\cdots ,p $ 连通. 如果存在$ \mu $ 使得不等式(4)成立(其中$ \Delta ^j = L^j-\bar {L}^j $ ),$$\begin{split} 0<\mu \le \mathop {\min }\limits_{\forall j\in P} \left\{ {\frac{1}{\left ( {\left\| {\Psi \bar {L}^j\Psi } \right\|+\left\| {\Delta ^j} \right\|} \right)\left\| {\left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right\|}} \right\}\;\; \;\\[-20pt]\end{split}$$ (4) 那么控制输入为式(2)的网络(1)在
$ K = \mu B^{\rm T}P^{\rm T}PA $ 时可以达到有界双向同步, 其中,$ \bar {A} = PAP^{-1} $ ,$ \bar {B} = $ $ PB $ , 可逆矩阵$ P $ 使得$ \bar {A} $ 是$ A $ 的约当标准型. 而且, 其最终界为$ \xi = \sqrt {\frac{\sigma _2 }{\sigma _1 }} \frac{\left\| {x(0)} \right\|( {\rm{1+}\sqrt {\rm{1+}\theta \alpha } } )}{\theta \alpha } ,$ 其中$ 0< \theta < $ $ 1 ,\; \alpha =\frac{\mu \lambda _2 \lambda _{\min } ( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} )}{2},\; \sigma _1 = \lambda _{\min },\; \sigma _2 = \lambda _{\max }\; (P^{\rm{T}}P), $ $ \lambda _2 = $ $ \min _{k = 1,2,\cdots ,p} \lambda _2( {\bar {L}^k}). $ 证明. 选择
$ K = \mu B^{\rm T}P^{\rm T}PA $ , 则控制输入为式(2)的网络(1)变为$$ \begin{split} x_i (k+1) =\;& Ax_i (k)+\mu BB^{\rm T}P^{\rm T}PA\times\\[2.5pt] &\sum\limits_{j = 1}^N {\left| {e_{ij}^{\sigma (k)} } \right|} \left[ {{\rm sgn}\left( {e_{ij}^{\sigma (k)} } \right)x_j (k)-x_i (k)} \right] \\[-14pt]\end{split} $$ (5) 其中,
$ i = 1,2,\cdots ,N $ . 式(5)可以写成如下所示的紧凑形式.$$ \begin{split}&x(k+1)= \\[2.5pt] &\qquad\left[{\left( {I_N \otimes A} \right)-L^{\sigma (k)}\otimes\left( {\mu BB^{\rm T}P^{\rm T}PA} \right)}\right]x(k) \end{split} $$ (6) 令
$ \bar {x}(k) = \left( {I_N \otimes P} \right)x(k) $ , 那么$$\begin{split} \bar {x}(k+1) = \left( {\left( {I_N \otimes \bar {A}} \right)-L^{\sigma (k)}\otimes \left( {\mu \bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)\bar {x}(k)\;\; \\[-15pt]\end{split}$$ (7) 令
$ V_1 \left( {\bar {x}(k)} \right) = \frac{1}{2}\bar {x}^{\rm T}(k)\bar {x}(k) $ , 那么$ V_1 $ 沿着式(7)的差分满足$$ \begin{split} &V_1\left( {\bar {x}(k+1)} \right)-V_1 \left( {\bar {x}(k)} \right)= \\[2.5pt] &\qquad-\frac{\mu }{2}\bar {x}^{\rm T}(k)\left( {L^{\sigma (k)}\otimes \left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)\times\\[2.5pt] &\qquad\left( {2I_N \otimes I_n -\mu L^{\sigma (k)} \otimes \left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)\bar {x}(k) \end{split} $$ (8) 基于条件(4), 可得
$$ \begin{split} &\left\| {\left( {2I_N \otimes I_n -\mu L^{\sigma (k)}\otimes \left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)} \right\|\ge\\[2.5pt] &\qquad 2-\left\| {\mu L^{\sigma (k)} \otimes \left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right\|\ge 2-1 = 1\\[2.5pt] &V_1 \left( {\bar {x}(k+1)} \right)-V_1 \left( {\bar {x}(k)} \right)\le\\[2.5pt] &\qquad-\frac{\mu }{2}\bar {x}^{\rm T}(k)\left( {L^{\sigma (k)}\otimes \left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)\bar {x}(k)\le 0 \end{split} $$ (9) 即得
$ V_1 \left( {\bar {x}(k)} \right) $ 是非递增的, 且有$ \left\| {\bar {x}(k)} \right\|\le \left\| {\bar {x}(0)} \right\| $ . 令$ \bar {y}(k) = \left( {\Psi \otimes P} \right)x(k) $ , 在控制输入为式(3)时, 形成的闭环系统可表示为$$ \begin{split} &\bar {y}(k+1)=\\ & \qquad \left( {\left( {I_N \otimes \bar {A}} \right) - \left( {\Psi \bar {L}^{\sigma (k)}\Psi } \right) \otimes \left( {\mu \bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)\bar {y}(k) \end{split} $$ (10) 由于图
$ G( {\bar {E}^k} ) , $ $k = 1,2,\cdots ,p$ 的节点$\{i = 1,2, \cdots , $ $ N\}$ 可划分为两个敌对阵营$ V_1 $ 和$ V_2 $ , 且图$ G( {\bar {E}^k}), $ $ k = 1,$ $ 2,\cdots ,p $ 是连通的, 基于定理1[25], 可知网络(1)和(3)在任意切换信号下达到双向同步.令
$ z(k) = \left( {\Psi \otimes P} \right)x(k) $ , 则控制输入为式(2)的网络(1)可表示为$$ \begin{split} &z(k+1)=\\ &\qquad \left( {\left( {I_N \otimes \bar {A}} \right)-\left( {\Psi L^{\sigma (k)}\Psi } \right)\otimes \left( {\mu \bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)z(k) \end{split} $$ (11) 令
$ z_c (k) = \frac{1}{N}\sum\nolimits_{j = 1}^N {z_j (k)}, \bar {\delta }_i = z_i (k)-z_c (k) $ , 则有$ \bar {\delta }(k) = $ $ \left( {\Psi \otimes P} \right)\delta (k), $ 其中$\bar {\delta } =[ {\bar {\delta }_1^{\rm T}\, \cdots \,\bar {\delta }_N^{\rm T} } ]^{\rm{T}},$ 易得$$ \begin{split}\bar {\delta }(k+1) =& \left( {\left( {I_N \otimes A} \right)-\left( {\Psi \bar {L}^{\sigma (k)}\Psi } \right)\otimes \left( {\mu \bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)\times\\ &\bar{\delta}(k)-\left( {\Psi \Delta ^{\sigma (k)}\Psi } \right)\otimes \left( {\mu \bar {B}\bar {B}^{\rm T}\bar {A}} \right)z(k) \\[-15pt]\end{split} $$ (12) 令
$ V_2( {\bar {\delta }(k)}) = \frac{1}{2}\bar {\delta }^{\rm T}(k)\bar {\delta }(k) $ , 那么$ V_2 $ 沿着式(12)的差分满足$$ \begin{split} &V_2 \left( {\bar {\delta }(k+1)} \right)-V_2 \left( {\bar {\delta }(k)} \right)= \\ &\qquad-\frac{\mu }{2}\bar {\delta }^{\rm T}(k)\left( {\Psi \bar {L}^{\sigma (k)}\Psi \otimes \left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)\times\\ &\qquad\left({2I_N \otimes I_n -\mu \Psi \bar {L}^{\sigma (k)}\Psi \otimes \left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)\bar {\delta }(k) -\quad\\ &\qquad\bar {\delta }^T(k)\left( {\left( {I_N \otimes \bar {A}^{\rm T}} \right) -\left( {\Psi \bar {L}^{\sigma (k)}\Psi } \right)\otimes \left( {\mu \bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}} \right)} \right)\times\\ &\qquad\left( {\Psi \Delta ^{\sigma (k)}\Psi } \right)\otimes \left( {\mu \bar {B}\bar {B}^{\rm T}\bar {A}} \right)z(k) +\\ &\qquad z^{\rm T}(k)\left( {\Psi \Delta ^{\sigma (k)}\Psi } \right)^2\otimes \left({\mu \bar {B}\bar {B}^{\rm T}\bar {A}} \right)^2z(k)\le \\ &\qquad-\frac{\mu }{2}\bar {\delta }^{\rm T}\left( k \right)\left( {\Psi \bar {L}^{\sigma \left( k \right)}\Psi \otimes \left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)\bar {\delta }\left( k \right)+\\ &\qquad2\left\| {\bar {\delta }\left( k \right)} \right\|\left\| {z\left( k \right)} \right\|+\left\| {z\left( k \right)} \right\|^2 \\ \end{split} $$ 其中, 不等式第1部分可由条件(4)得到. 由于图
$ G( {\bar {E}^k} ) $ ,$ k = 1,2,\cdots ,p $ 是连通的, 因而存在正交矩阵$ Q^{\sigma \left( k \right)}\in$ $ {\bf R}^{N\times N} $ , 使得$$ \begin{split} &\left( {Q^{\sigma (k)}} \right)^{\rm T}\left( {\Psi \bar {L}^{\sigma (k)}\Psi } \right)Q^{\sigma (k)}=\\ & \qquad {\rm diag}\left\{ {\lambda _1^{\sigma (k)} ,\lambda _2^{\sigma (k)} ,\cdots ,\lambda _N^{\sigma (k)} } \right\} \end{split} $$ 其中,
$0 = \lambda _1^{\sigma (k)} < \lambda _2^{\sigma (k)}\,\le\,\cdots \,\le\, \lambda _N^{\sigma (k)}, Q^{\sigma (k)} = [q_1^{\sigma (k)} ,$ $ q_2^{\sigma (k)} ,\cdots, q_N^{\sigma (k)}] $ ,$ q_1^{\sigma (k)} = \frac{{\rm {\bf 1}}_N }{\sqrt N } $ 是特征值$ \lambda _1^{\sigma (k)} \rm{ = 0} $ 对应的特征向量. 令$\bar {\delta }(k) = ( Q^{\sigma (k)}\otimes I_n )\hat {\delta }(k)$ , 由$(( {Q^{\sigma (k)}} )^{\rm T}\otimes $ $ I_n ) ( Q^{\sigma (k)}\otimes I_n )= I_{nN}$ , 可得$ \bar {\delta }^{\rm T}\bar {\delta } = \hat {\delta }^{\rm T}\hat {\delta } $ . 又由于$ \bar {\delta }_1 = $ $ ( q_1^{\sigma (k)} \otimes I_n ) \hat {\delta }(k) = 0 $ , 则可得$$ \begin{split} &\frac{\mu }{2}\bar {\delta }^{\rm T}(k)\left( {\Psi \bar {L}^{\sigma (k)}\Psi \otimes \left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)\bar {\delta }(k)= \\ &\qquad\frac{\mu }{2}\hat {\delta }^{\rm T}(k)\left( {\left( {Q^{\sigma (k)}} \right)^{\rm T}\Psi \bar {L}^{\sigma (k)}\Psi Q^{\sigma (k)}\otimes \left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)\times\\ &\qquad\hat {\delta }(k)= \frac{\mu }{2}\hat {\delta }^{\rm T}(k)\times\\ &\qquad\left({{\rm diag}\left\{ {\lambda _1^{\sigma (k)} ,\lambda _2^{\sigma (k)} ,\cdots ,\lambda _N^{\sigma (k)} } \right\}\otimes\left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)\times\\ &\qquad \hat {\delta }(k) \ge \frac{\mu \lambda _2 }{2}\hat {\delta }^T(k)\left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)\hat {\delta }(k)\ge\\ &\qquad\frac{\mu \lambda _2 \lambda _{\min } \left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)}{2}\left\| {\bar {\delta }(k)} \right\|^2 =\\ &\qquad\alpha \left\| {\bar {\delta }(k)} \right\|^2 \end{split} $$ 因此,
$$ \begin{split} & V\left( {\bar {\delta }(k+1)} \right)-V\left( {\bar {\delta }(k)} \right) \le\\ &\qquad\;\;\;\;\;\;\;-\frac{\mu }{2}\bar {\delta }^{\rm T}(k)\left( {\Psi \bar {L}^{\sigma (k)}\Psi \otimes \left( {\bar {A}^{\rm T}\bar {B}\bar {B}^{\rm T}\bar {A}} \right)} \right)\bar {\delta }(k)+\\ &\qquad\;\;\;\;\;\;\; 2\left\| {\bar {\delta }(k)} \right\|\left\| {z(k)} \right\|+\left\| {z(k)} \right\|^2= \\ &\qquad\;\;\;\;\;\;\; -\left( {1-\theta } \right)\alpha \left\| {\bar {\delta }(k)} \right\|^2-\theta \alpha \left\| {\bar {\delta }(k)} \right\|^2+\\ &\qquad\;\;\;\;\;\;\; 2\left\| {\bar {\delta }(k)} \right\|\left\| {z(k)} \right\|+\left\| {z(k)} \right\|^2 \\[-10pt] \end{split} $$ (13) 其中,
$ 0<\theta <1 $ . 所以下面的关系成立:$$ \begin{split} &-\theta \alpha \left\| {\bar {\delta }(k)} \right\|^2+2\left\| {\bar {\delta }(k)} \right\|\left\| {z(k)} \right\|+\left\| {z(k)} \right\|^2\le 0\Rightarrow \quad\\ &\qquad V_2 \left({\bar {\delta }(k+1)} \right)-V_2 \left( {\bar {\delta }(k)} \right)\le -\left( {1-\theta } \right)\alpha \left\| {\bar {\delta }(k)} \right\|^2 \;\;\;\; \\[-12pt]\end{split} $$ (14) 由
$\delta (k) = ({\Psi \otimes P^{-1}})\bar {\delta }(k)z(k) = \left( {\Psi \otimes I_n } \right)\bar {x}(k) = $ $\left(\Psi \;\otimes\; P \right) x(k) ,\;\left\| {\bar {x}(k)} \right\|\;\le \;\left\| {\bar {x}(0)} \right\|$ , 可得$\lambda _{\min }( {P^{\rm T}P})\times $ $ \left\| {\delta (k)} \right\|^2\le$ $ \| {\bar {\delta }(k)} \|^2 \le \lambda _{\max }( {P^{\rm T}P} )\left\|{\delta (k)}\right\|^2 $ 以及$\left\|{z(k)} \right\|^2\le $ $ \lambda _{\max } ( {P^{\rm T}P} )\left\| {x(0)} \right\|^2$ . 若不等式条件(15)成立, 则式(14)的左边部分成立.$$\begin{split} &-\theta \alpha \left\| {\bar {\delta }(k)} \right\|^2+2\sqrt {\sigma _2 } \left\| {x(0)} \right\|\left\| {\bar {\delta }(k)} \right\|+\\ &\qquad\sigma _2 \left\| {x(0)} \right\|^2\le 0 \end{split}$$ (15) 当式(16)成立时, 式(15)成立.
$$ \left\| {\bar {\delta }(k)} \right\|\ge \frac{\sqrt {\sigma _2 } \left\| {x(0)} \right\|\left( {1+\sqrt {1+\theta \alpha } } \right)}{\theta \alpha } $$ (16) 因此, 对于
$ \forall \left\| {\bar {\delta }(k)} \right\|\ge \frac{\sqrt {\sigma _2 } \left\| {x(0)} \right\|\left( {1+\sqrt {1+\theta \alpha } } \right)}{\theta \alpha } $ ,$$ V_2 \left( {\bar {\delta }(k+1)} \right)-V_2 \left( {\bar {\delta }(k)} \right)\le -\left( {1-\theta } \right)\alpha \left\| {\bar {\delta }(k)} \right\|^2 $$ (17) 为了应用引理1 (证明见附录B), 取
$c_1 = c_2 = $ $ {1}/{2},$ $ c_3 = -\left( {1-\theta } \right)\alpha, $ $ c = \frac{\sqrt {\sigma _2 } \left\| {x(0)} \right\|\left( {1+\sqrt {1+\theta \alpha } } \right)}{\theta \alpha } $ . 因此, 存在正常数$ \rho \ge 1, $ $ 0<\gamma <1, $ 使得对于每个初始状态$ x(0) $ , 网络(1)和(2)的解满足$$ \begin{split} \left\| {\overline \delta (k)} \right\|\le \rho \left\| {\overline \delta (0)} \right\|\gamma ^k+\frac{\sqrt {\sigma _2 } \left\| {x(0)} \right\|\left( {1+\sqrt {1+\theta \alpha } } \right)}{\theta \alpha },\\ \forall k\ge 0\\\end{split} $$ (18) 由于
$ \sigma _1 \left\| {\delta (0)} \right\|^2\le \left\| {\bar {\delta }(0)} \right\|^2\le \sigma _2 \left\| {\delta (0)} \right\|^2 $ , 可得$$ \begin{split} &\left\| {\delta (k)} \right\|\le \rho \sqrt {\frac{\sigma _2 }{\sigma _1 }} \left\| {\delta (0)} \right\|\gamma ^k+\\ &\qquad\sqrt {\frac{\sigma _2 }{\sigma _1 }} \frac{\left\| {x(0)} \right\|\left( {1+\sqrt {1+\theta \alpha } } \right)}{\theta \alpha },\\ &\qquad\qquad\qquad\qquad\qquad\;\;\,\forall k\ge 0 \end{split} $$ (19) 从而得到控制输入为式(2)的网络(1)达到有界双向同步. □
注2. 由定理1的证明过程可以看出, 最终界为
$\sqrt \frac{\sigma _2 }{\sigma _1 }\frac{\left\| {x(0)} \right\|\left( {1+\sqrt {1+\theta \alpha } } \right)}{\theta \alpha }.$ 因此, 为了使最终界比较小, 可以选择使$ \left\| {x(0)} \right\| $ 很小或者$ \alpha $ 很大的初始条件.注3. 在定理1中, 假设矩阵
$ A $ 的所有特征值是模为1的半单特征值, 即所有约当块都是一维的. 在这种假设条件下, 矩阵$ A $ 是正交矩阵, 即$ A^{\rm T}A = I. $ 这时矩阵$ A $ 是中立稳定的.3. 数值例子
本节将给出一个数值例子来验证所得结论的有效性.
例1. 对于网络(1), 令
$ N = 4 $ , 其中矩阵$ A, B $ 为$$ A = \left[{{\begin{array}{*{20}c} {\frac{\sqrt 2 }{2}} & {\frac{\sqrt 2 }{2}} \\ {-\frac{\sqrt 2 }{2}} & {\frac{\sqrt 2 }{2}} \\ \end{array} }} \right],\;\;B = \left[ {{\begin{array}{*{20}c} {-1} & 2 \\ 2 & {0.5} \\[2.5pt] \end{array} }} \right] $$ (20) 因为矩阵
$ A $ 是正交的, 所以假设1成立. 定义切换信号$ \sigma(k) $ 如式(21), 其中$ s\in {\bf Z}^+. $ $$ \sigma (k) = \left\{ {{ \begin{aligned} &{1,\qquad\;k = 4s+1\;{\text{或}}\;4s+2} \\[2.5pt] &{2,\qquad\;k = 4s+3\;{\text{或}}\;4s+4} \\ \end{aligned}}} \right. $$ (21) 假设有两个无向图
$ G({E^i}) $ ,$ i = 1,2, $ 如图1所示, 图$ G( {E^2}) $ 的节点不能划分为两个敌对阵营$ V_1 $ 和$ V_2 $ . 假设$ G( {\bar{E}^1}) $ 和$ G({\bar{E}^2}) $ 分别对应于图2(a)和图2(b). 可知图$ G( {\bar {E}^i} ) $ ,$ i = 1,2 $ 的节点能划分为两个敌对阵营$ V_1 = \{1,2\} $ ,$ V_2 = \{3,4\} $ .对于图
$ G({\bar{E}^i}), $ $ i \;=\; 1,\;2, $ 可选择符号矩阵$\Psi = $ $ {\rm diag}\{1,1,-1,-1\} $ 使得$ \Psi\bar{E}^k\Psi $ ,$ k = 1,2 $ 是非负矩阵, 根据其拉普拉斯矩阵$ \bar{L}^1 $ 和$ \bar{L}^2 $ $$ \begin{split} \begin{smallmatrix} &\bar{L}^1 = \left[{{\begin{array}{*{20}c} {1.7} & {-1} & 0 & {0.7} \\[2.5pt] {-1} & 2 & 1 & 0 \\[2.5pt] 0 & 1 & 3 & {-2} \\[2.5pt] {0.7} & 0 & {-2} & {2.7} \\[2.5pt] \end{array}}}\right]&\end{smallmatrix} \end{split} $$ $$ \begin{smallmatrix} &\bar{L}^2\; = \left[{{\begin{array}{*{20}c} {2.5} & {-1} & 0 & {1.5} \\[2.5pt] {-1} & {1.5} & {0.5} & 0 \\[2.5pt] 0 & {0.5} & {1.5} & {-1} \\[2.5pt] {1.5} & 0 & {-1} & {2.5} \\[2.5pt] \end{array} }}\right] \end{smallmatrix} $$ 可得
$ \lambda _2 = \min _{k = 1,2} \lambda _2( {\bar {L}^k} ) = 1.5858 $ . 又由于$ \sigma _1 =$ $ \sigma _2 = $ $1 , \lambda _{\min } ({\bar {A}^{\rm T}\bar {B}\bar{B}^{\rm T}\bar{A}}) = 3.5570 $ . 如果选择$ \mu = \rm{0.}1, \theta = 0.9,$ $ \alpha = 0.2820, \xi = 0.6272, $ 那么图$ G({\bar {E}^i}) $ ,$ i = 1,2 $ 描述的网络(1)和(3)在切换信号$ \sigma (k) $ 下的状态演变如图3所示, 可知该网络达到双向同步. 对于网络(1), 在图$ G({E^i}) $ ,$ i = 1,2 $ 和切换信号$ \sigma (k) $ 下的时间演变图如图4所示, 根据定理1, 控制输入为式(2)的网络(1)能达到有界双向同步, 且终值为$ \xi = 0.6272 $ . 在图5中, 明确地描述了范数误差和最终界.4. 结论
当存在对抗关系和切换拓扑时, 本文研究了耦合离散线性系统的同步问题. 针对实际中可能存在的两种情形, 研究了耦合离散系统的有界双向同步问题, 得到了使闭环系统在任意切换信号下达到有界双向同步的充分条件. 数值仿真验证了本文所得理论的正确性. 本文的结论对于系统矩阵有一定的要求, 后续工作将考虑更一般的情况.
附录 A. 符号图
符号图
$ G\left( {V,\varepsilon } \right) $ 由一个有限节点集和一个边集组成, 节点集记为$ V = \{1,2,\cdots ,N\} $ , 边集记为$\varepsilon = \{ \left( {i,j} \right):i\ne j, i, j\in $ $ V \}\subseteq V\times V$ . 令$ E = ( {e_{ij} } ) $ 是图$ G $ 的一个邻接矩阵, 利用$ G\left( E \right) $ 来表示邻接矩阵为E 的符号图, 图$ G\left( E \right) $ 的拉普拉斯矩阵定义为$ L= C_r-E , $ 其中$C_r = {\rm diag}\{ \sum\nolimits_{j = 1}^N{| {e_{1j} } |, \cdots , \sum\nolimits_{j = 1}^N {| {e_{Nj} }|} } \}$ . 由 i到j 的边$ \left( {i,j} \right)\in \varepsilon $ 是有向边, 其中节点$ i ,j$ 分别称为父节点和子节点. 如果$ \left( {j,i} \right),\left( {i,j} \right)\in \varepsilon, $ 那么图$ G\left( E \right) $ 是无向图. 文中定义$\varepsilon ^+ \,=\, \{ \left( {i,j} \right)\vert e_{ij} \, > \,0\},\ \varepsilon ^- = \{ \left( {i,j} \right) \vert e_{ij} < 0\} , \varepsilon = $ $ \varepsilon ^+\cup\varepsilon^-.$ 由不同节点$ \left( {i_1 ,i_2 } \right), \left( {i_2 ,i_3 } \right), \cdots, $ $ \left( i_{l-1} , \right. $ $ \left. i_l \right) $ 所组成的边的一个序列称为路径(路径长度为$ l-1 )$ . 若符号图中的任意两个不同节点之间存在路径, 则该图称为是强连通的. 已知包含相同节点集的$ p $ 个符号图$ G\left( {E^k} \right) = $ $ ( {V,\varepsilon _k ,E^k}) $ ,$ k = 1,2,\cdots, p $ , 则在切换信号$ \sigma(k) $ 下, 可以定义一个时变符号图, 即$G( {E^{\sigma (k)}} ) = $ $ ( {V,\varepsilon ^{\sigma (k)},E^{\sigma(k)}} ) $ .附录 B. 预备引理
考虑如下差分方程
$$ x(k+1) = f\left( {x(k)} \right) \tag{B1}$$ 其中,
$ x\in {\bf R}^n $ ,$ f:{\bf R}^n\to {\bf R}^n $ 是连续的,$ f(0) = 0 $ .引理1. 令
$ V:{\bf R}^n\to {\bf R}^n $ 是一个连续函数, 且满足$$ c_1 \left\| {x(k)} \right\|^2\le V\left( {x(k)} \right)\le c_2 \left\| {x(k)} \right\|^2 \qquad\qquad \tag{B2}$$ $$ \Delta V\left( {x(k)} \right)\le -c_3 \left\| {x(k)} \right\|^2,\;\;\forall \left\| {x(k)} \right\|\ge c\ge 0 \tag{B3}$$ 其中,
$ \forall k\ge 0 $ ,$ \forall x\in {\bf R}^n $ ,$ c,c_1 ,c_2 ,c_3 $ 是正常数. 那么, 对每个初始状态$ x(0) $ , 存在正常数$ \rho \ge 1 $ ,$ 0<\gamma <1 $ , 有$ T\ge 0 $ (取决于$ x(0) $ 和$ c) $ , 使得系统(B1)的解满足$$ \left\| {x(k)} \right\|\le \rho \left\| {x(0)} \right\|\gamma ^k,\;\;\forall 0\le k\le T \tag{B4}$$ $$ \left\| {x(k)} \right\|\le \frac{cc_2 }{c_1 },\;\;\forall t\ge T \qquad\qquad\;\;\;\; \tag{B5}$$ 证明. 本引理证明类似于定理4.18[26]的证明. 令
$\Omega _c = $ $ \{ x\in {\bf R}^n\vert V(x)\le $ $ c \},$ 若初始$ x(0)\in \Omega $ , 则系统 (B1) 的解依赖于$\Omega _c $ , 这是因为$ V(x(k)) $ 在边界上是负的. 对于$ {\bf R}^n-\Omega _c $ 内部的某个解, 令$ T $ 是它进入$ \Omega _c $ 的起始时刻, 则对于所有的$ k\in \left[ {0,T} \right]\cap {\bf Z}^+ $ , 有下式成立:$$ \Delta V\left( {x(k)} \right)\le -c_3 \left\| {x(k)} \right\|^2\le -\frac{c_3 }{c_2 }V\left( {x(k)} \right) $$ 因此,
$$ \begin{split} V\left( {x(k+1)} \right)\le& \left( {1-\frac{c_3 }{c_2 }} \right)V\left( {x(k)} \right)\le \cdots \le\\ &\left( {1-\frac{c_3 }{c_2 }} \right)^kV\left( {x(0)} \right) \end{split} $$ 又由于
$ V\left( {x(k)} \right)\ge 0, $ 易得${c_3 }/{c_2 } < 1.$ 所以$( {1-{c_3 }/{c_2 }} ) < 1 .$ 可以得到$$ \begin{split} \left\| {x(k)} \right\|\le& \left( {\frac{V\left( {x(k)} \right)}{c_1 }} \right)^{\frac{1}{2}}\le \left[ {\frac{1}{c_1 }\left( {1-\frac{c_3 }{c_2 }} \right)^kc_2 \left\| {x(0)} \right\|^2} \right]^{\frac{1}{2}}=\\ &\sqrt {\frac{c_2 }{c_1 }} \sqrt {\left( {1-\frac{c_3 }{c_2 }} \right)^k} \left\| {x(0)} \right\| \end{split} $$ 令
$\rho = \sqrt {{c_2 }/{c_1 }}$ ,$\gamma = \sqrt {1-{c_3 }/{c_2 }}$ , 则可以得到$$ \qquad\qquad\quad\quad\left\| {x(k)} \right\|\le \rho \left\| {x(0)} \right\|\gamma ^k,\;\;\forall 0\le k\le T \qquad\qquad\quad\square $$ -
表 1 对比实验评价指标
Table 1 Performance index of comparison experiment
$220<k<280$ IAE RMSE 本文方法 1.8330×10−6 3.6653×10−8 对比方法 8.2293 0.1349 -
[1] Francis B A. The linear multivariable regulator problem. SIAM Journal on Control Optimization, 1977, 15(3): 486−505 doi: 10.1137/0315033 [2] Davison E, Goldenberg A. Robust control of a general servomechanism problem: The servo compensator. Automatica, 1975, 11(5): 461−471 doi: 10.1016/0005-1098(75)90022-9 [3] Davison E. The robust control of a servomechanism problem for linear time-invariant multivariable systems. IEEE Transactions on Automatic Control, 1976, 1(1): 25−34 [4] Sontag E D. Adaptation and regulation with signal detection implies internal model. System. & Control Letters, 2003, 50(2): 119−126 [5] Huang J. Nonlinear Output Regulation: Theory and Applications. Philadelphia: Society for Industrial and Applied Mathematics, 2004. [6] Saberi A, Stoorvogel A A, Sannuti P, Shi G Y. On optimal output regulation for linear systems. International Journal of Control, 76(4): 2003, 319−333 doi: 10.1080/0020717031000073054 [7] Gao W N, Jiang Z P. Global optimal output regulation of partially linear systems via robust adaptive dynamic programming. IFAC-Papers OnLine, 2015, 48(11): 742−747 doi: 10.1016/j.ifacol.2015.09.278 [8] Gao W N, Jiang Z P. Adaptive dynamics programming and adptive optimal output regulation of linear systems. IEEE Transactions on Automatic Control, 2016, 61(12): 4164−4169 doi: 10.1109/TAC.2016.2548662 [9] Kiumarsi B, Vamvoudakis K G, Modares H, Lewis F L. Optimal and autonomous control using reinforcement learning: a survey. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(6): 2042−2062 doi: 10.1109/TNNLS.2017.2773458 [10] 李臻, 范家璐, 姜艺, 柴天佑. 一种基于Off-policy的无模型输出数据反馈H∞控制方法. 自动化学报, 2021, 47(9): 2182−2193Li Zhen, Fan Jia-Lu, Jiang Yi, Chai Tian-You. A model-free H∞ method based on off-policy with output data feedback. Acta Automatica Sinica, 2021,47(9): 2182−2193 [11] 姜艺. 数据驱动的复杂工业过程运行优化控制方法研究[博士论文], 东北大学, 中国, 2020Jiang Yi. Research on Data-driven Operational Optimization Control Approach for Complex Industrial Processes[Ph.D. disse-rtation], Northeastern University, China, 2020 [12] Kiumarsi B, Lewis F L, Modares H, Karimpour A, Naghibi M B. Reinforcement Q-learning for optimal tracking control of linear discrete-time systems with unknown dynamics. Automatica, 2014, 50(4): 1167−1175 doi: 10.1016/j.automatica.2014.02.015 [13] Kiumarsi B, Lewis F L, Naghibi M B, Karimpour A. Optimal tracking control of unknown discrete-time linear systems using input-output measured data. IEEE Transactions on Cybernetics, 2015, 4(12): 2770−2779 [14] Kiumarsi B, Lewis F L. Actor-critic-based optimal tracking for partially unknown nonlinear discrete-time systems. IEEE Transactions on Neural Networks and Learning Systems, 2015, 26(1): 140−151 doi: 10.1109/TNNLS.2014.2358227 [15] Kiumarsi B, Lewis F L, Jiang Z P. H∞ control of linear discrete-time systems: off-policy reinforcement learning. Automatica A Journal of Ifac the International Federation of Automatic Control, 2017, 78: 144−152 [16] Modares H, Lewis F L, Jiang Z P. H∞ tracking control of completely unknown continuous-time systems via off-policy reinforcement learning. IEEE Transactions on Neural Networks and learning systems, 2015, 26(10): 2550−2562 doi: 10.1109/TNNLS.2015.2441749 [17] Jiang Y, Fan J L, Chai T Y, Lewis F L, Li J N. Tracking control for linear discrete-time networked control systems with unknown dynamics and dropout. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(10): 4607-4620 [18] Jiang Y, Kiumarsi B, Fan J L, Chai T Y, Li J N, Lewis F L. Optimal output regulation of linear discrete-time system with unknow dynamics using reinforcement learning. IEEE Transactions on Cybernetics, 2020, 50(4): 3147−3156 [19] Khalil H K, Grizzle J W. Nonlinear Systems. Upper Saddle Riv-er: Prentice hall, 2002. [20] Lan W Y, Huang J. Robust output regulation for discrete-time nonlinear systems. International Journal of Robust and Nonlinear Control, 2005, 15(2):63−81 doi: 10.1002/rnc.970 [21] Hewer G. An iterative technique for the computation of the steady state gains for the discrete optimal regulator. IEEE Transactions on Automatic Control, 1971, 16(4): 382−384 doi: 10.1109/TAC.1971.1099755 [22] Werbos P J. Neural network for control and system identification. In: Proceedings of the 28th IEEE Conference on Decision and Control. Tampa, USA: 1989, 260−265 [23] Jiang Z P, Wang Y. Input-to-state stability for discrete-time nonlinear systems. Automatica, 2001, 37: 857−869. doi: 10.1016/S0005-1098(01)00028-0 [24] Jiang Z P, Teel A R, Praly L. Small-gain theorem for ISS systems and applications. Mathematics of Control Signals and Systems, 1994, 7(2):95−120 doi: 10.1007/BF01211469 [25] 刘腾飞, 姜钟平. 信息约束下的非线性控制, 北京: 科学出版社, 2018.Liu Teng-Fei, Jiang Zhong-Ping. Nonlinear Control Under Information Constraints, Beijing: Science Press, 2018. [26] Jiang Y, Fan J L, Chai T Y, Lewis F L. Dual-rate operational optimal control for flotation industrial process with unknown operational model. IEEE Transaction on Industrial Electronics, 2019, 66(6): 4587−4599 doi: 10.1109/TIE.2018.2856198 [27] Jiang Y, Fan J L, Chai T Y, Li J N, Lewis F L. Data driven flotation industrial process operational optimal control based on reinforcement learning. IEEE Transcations on Industrial Informatics, 2018, 66(5): 1974−1989 [28] 吴倩, 范家璐, 姜艺, 柴天佑. 无线网络环境下数据驱动混合选别浓密过程双率控制方法. 自动化学报, 2019, 45(6): 1128−1141Wu Qian, Fan Jia-Lu, Jiang Yi, Chai Tian-You. Data-Driven Dual-Rate Control for Mixed Separation Thickening Process in a Wireless Network Environment. Acta Automatica Sinica, 2019, 45(6): 1128−1141. [29] 姜艺, 范家璐, 贾瑶, 柴天佑. 数据驱动的浮选过程运行反馈解耦控制方法. 自动化学报, 2019, 45(4): 759−770Jiang Yi, Fan Jia-Lu, Jia Yao, Chai Tian-You. Data-driven flotation process operational feedback decoupling control. Acta Automatica Sinica, 2019, 45(4): 759−770 期刊类型引用(1)
1. 陈世明,姜根兰,张正. 通信受限的多智能体系统二分实用一致性. 自动化学报. 2022(05): 1318-1326 . 本站查看
其他类型引用(1)
-