Optimal Tracking Control Method for Discrete-time Linear Multivariable Systems With Decoupling Performance
-
摘要: 在传统线性二次跟踪控制方法的基础上, 针对一类具有强耦合特性的离散时间线性多变量系统, 提出了一种具有解耦性能的最优跟踪控制方法. 首先为实现解耦, 将耦合项作为可测干扰, 基于零和博弈思想提出了一种新的性能指标; 然后针对该性能指标, 利用极小值原理设计最优跟踪控制器, 通过适当加权矩阵的选择, 同步实现解耦和跟踪; 最后进行仿真实验, 仿真结果表明了该方法的有效性以及在最优性能等方面的优越性.Abstract: In this paper, for a class of discrete-time multivariable linear systems with strong coupling property, based on the traditional linear quadratic tracking control method, an optimal tracking controller with decoupling performance is proposed. First, in order to achieve decoupling, the coupling term is viewed as the measurable disturbance, and then a novel performance index which is inspired by the two-player Zero-Sum game problem is introduced. Based on the novel performance index, the optimal tracking controller is derived by using the minimum principle. Then, it is proved that by choosing appropriate weighting matrices, the proposed method can simultaneously decouple the closed-loop system in dynamic and make the tracking error converge asymptotically. Finally, simulations are conducted, whose results demonstrate the effectiveness of the proposed method and its superiority in optimal performance comparing with the traditional controller.
-
Key words:
- Decoupling /
- tracking control /
- discrete-time linear systems /
- multivariable systems
-
跟踪和镇定是控制领域的两个典型问题. 一般来说, 相较于镇定问题, 跟踪更为困难. 这是因为镇定只需要在系统的状态或输出受到干扰而偏离原平衡状态时, 施加控制作用, 使得系统状态或输出恢复到原平衡状态即可, 而跟踪控制问题要求系统的状态或输出能够跟随任意参考输入. 跟踪控制不仅是控制理论研究的热点问题, 在工程领域也具有很强的应用背景, 比如机器人运动轨迹跟踪控制[1]、船舶轨迹跟踪控制[2]和飞行器姿态控制[3]等.
跟踪控制器的设计方法主要分为两类, 一类是追求跟踪误差渐近收敛的常规跟踪控制方法, 另一类是兼顾跟踪误差和整体性能的最优跟踪控制方法. 常规跟踪控制方法通过反馈实现调节, 利用前馈使得系统状态跟踪参考输入. 由于该方法基于零极点对消原理, 如果系统存在不可对消的不稳定零点, 会导致闭环系统输出产生相移和增益误差[4]. 为解决该问题, 文献[4-5]提出了一种多速率前馈跟踪控制方法, 使得存在不稳定零点的线性系统能够完全跟踪参考输入. 20世纪90年代初, 随着自适应控制的发展以及模糊逻辑系统和神经网络等智能算法的引入, 具有不确定性和非线性特性的复杂系统的跟踪控制问题受到人们的广泛关注. 文献[6]针对一类具有不确定动态的回滞非线性系统, 提出了一种鲁棒自适应反步跟踪控制方法, 该方法将整个非线性系统划分为多个子系统, 对每个子系统进行设计, 直到倒推至系统输入. 随着系统阶数的增加, 该方法的推导过程会变得非常复杂, 容易产生复杂度爆炸问题. 文献[7]针对一类模型未知的严反馈的单输入单输出非线性系统, 通过引入动态表面控制技术和最小学习参数方法来解决传统反步法带来的复杂度爆炸的问题, 提出了一种鲁棒自适应跟踪控制方法, 使得系统能够跟踪任意参考输入. 文献[8]针对一类含有外部干扰和建模不确定性的非线性多输入多输出系统, 将模糊控制方法与反步法相结合, 设计鲁棒自适应模糊控制器, 保证系统输出信号一致有界并能收敛到参考输入附近. 文献[9]提出一种基于输出跟踪误差的自适应模糊控制方法, 设计带有模糊观测器的模糊控制器, 来减小未知非线性系统的跟踪误差.
上述常规跟踪控制方法的目标是找到一个稳定的控制器, 使得系统状态或输出跟踪参考轨迹. 在控制器设计中, 常常要兼顾到系统的跟踪误差和整体性能. 最优跟踪控制方法可以通过最小化二次型性能指标, 一方面使系统跟踪误差渐近收敛, 另一方面使系统获得最优性能. 文献[10]指出线性二次型最优跟踪(Linear quadratic tracking, LQT)控制器由反馈项和前馈项两部分组成, 其中反馈项使闭环系统稳定, 前馈项使闭环系统输出跟踪参考输入. 文献[11]针对连续时间线性多变量系统, 将开环解耦控制与LQT 相结合, 提出了一种近似最优跟踪控制方法, 实现了多变量系统的解耦和跟踪控制. 设计线性最优跟踪控制器的关键在于求解代数黎卡提方程, 由于该方程中包含着系统模型参数信息, 所以对于这种传统的最优跟踪控制方法, 当系统模型参数未知时, 就无法得到有效应用. 为解决这一问题, 文献[12]针对模型参数部分未知的连续时间线性系统, 提出了一种基于策略迭代的自适应动态规划方法, 通过计算代数黎卡提方程的数值解, 进而得到近似最优跟踪控制律. 不过这类方法大多要求系统状态完全已知, 为了解决这个问题, 文献[13] 针对模型参数部分未知的离散时间线性系统, 仅使用系统输入输出数据, 提出了一种基于值迭代和策略迭代的自适应动态规划方法, 设计近似最优跟踪控制器, 使得系统输出能够跟踪参考输入. 与线性最优跟踪控制器设计方法类似, 设计非线性最优跟踪控制器时需要求解非线性哈密顿−雅可比−贝尔曼方程. 许多专家学者针对这一问题也展开了深入研究. 文献[14]针对模型参数部分未知的连续时间非线性系统, 提出了一种基于多层神经网络的近似最优跟踪控制器设计方法, 先使用神经网络辨识系统模型, 再分别设计反馈神经控制器和前馈神经控制器, 使得系统可以较好的跟踪参考输入, 不过该方法使系统输出和控制输入在初始时刻会产生较大的震荡. 为了抑制这种震荡, 文献[15-16]设计了一种新型性能指标, 并提出了一种启发式动态规划方法, 不仅减小了系统输出和控制输入的波动, 还获得了更好的跟踪性能. 文献[17-19]针对模型参数未知的连续时间非线性系统, 提出了一种数据驱动的自适应动态规划方法, 先利用递归神经网络建立数据驱动模型, 在该模型的基础上设计了基于自适应动态规划的近似最优跟踪控制器, 使得系统状态输出能够渐近跟踪期望轨迹. 毫无疑问, 上述研究工作推动了最优跟踪控制方法的进一步发展与应用, 丰富了跟踪控制的研究内容.
实际系统往往具有多变量和强耦合特性, 上述跟踪控制方法没有考虑到多变量系统中可能存在的强耦合特性, 无法保证系统的整体性能最优. 本文针对一类具有强耦合特性的离散时间线性多变量系统, 提出了一种具有解耦性能的最优跟踪控制方法. 首先将耦合项看作可测干扰, 基于零和博弈思想设计一个由系统跟踪误差、控制输入和耦合干扰补偿构成的性能指标; 然后通过最小化这个新的性能指标, 得到最优跟踪控制律, 并给出了加权矩阵的选择方法, 证明了通过该加权矩阵的选择, 一方面可以动态解耦闭环系统并使其稳定, 另一方面可使闭环系统的状态完全跟踪参考输入; 最后进行了仿真对比实验, 实验结果表明与传统的LQT控制器相比, 该方法无论在跟踪误差还是在系统的整体性能方面都具有一定的优越性.
1. 问题描述
考虑如下离散时间线性多变量系统:
$$ {{\boldsymbol{x}}_{k + 1}} = A{{\boldsymbol{x}}_k} + B{{\boldsymbol{u}}_k} $$ (1) 式中,
$ {\boldsymbol{x}}_k = [x_1(k), x_2(k),\cdots, x_n(k)]^{\rm T}\in{\bf{R}}^{n} $ 是系统的状态向量,$ {\boldsymbol{u}}_k = [u_1(k), u_2(k), \cdots , u_n(k)]^{\rm T}\in{\bf{R}}^{n} $ 是系统的控制输入向量,$ A\in{\bf{R}}^{n\times n} $ 和$ B $ $ \in $ $ {\bf{R}}^{n\times n} $ 均为常值矩阵, 并且$ B $ 是可逆的.传统的LQT控制问题是寻找最优跟踪控制律
$ {\boldsymbol{u}}_k^* $ , 使得闭环系统的状态能够跟踪给定参考输入$ {\boldsymbol{x}}_{r, k} = [x_{r1}(k), x_{r2}(k),\cdots , x_{rn}(k)]^{\rm T}\in{\bf{R}}^{n} $ , 并使如下性能指标最小:$$ \begin{split} J =\,& \frac{1}{2}{({{\boldsymbol{x}}_N} - {{\boldsymbol{x}}_{r, N}})^{\rm T}}P({{\boldsymbol{x}}_N} - {{\boldsymbol{x}}_{r, N}})+\\ &\frac{1}{2}\sum\limits_{k = 0}^{N - 1} {[{\boldsymbol{e}}_k^{\rm T}Q{{\boldsymbol{e}}_k}} + {\boldsymbol{u}}_k^{\rm T}R{{\boldsymbol{u}}_k}] \end{split} $$ (2) 式中,
$ N $ 为大于1的正整数, 表示终端时刻,$ {\boldsymbol{x}}_N $ 为终端时刻系统状态,$ {\boldsymbol{x}}_{r, N} $ 为终端时刻参考输入,${\boldsymbol{e}}_{k} = $ $ {\boldsymbol{x}}_{r, k}-{\boldsymbol{x}}_{k} $ 为$ k $ 时刻的跟踪误差,$ P $ 和$ Q $ 为半正定矩阵,$ R $ 为正定矩阵. 易知, 最优跟踪控制律为[14]:$$ \begin{split} {{\boldsymbol{u}}_k^*} =\,& {({B^{\rm T}}{S_{k + 1}}B + R)^{ - 1}}{B^{\rm T}}\times\\ & (-{S_{k + 1}}A{{\boldsymbol{x}}_k} + {V_{k + 1}}) \end{split} $$ (3) 式中,
$ S_k $ 和$ V_k $ 分别根据下式反向迭代求解:$$ \begin{split} &{S_k} = A^{\rm T}S_{k+1}(I+BR^{-1}B^{\rm T}S_{k+1})^{-1}A+Q,\;\;\;\;\\ &{S_N} = P \end{split} $$ (4) $$ \begin{split} {V_k} =\,& [A^{\rm T}-A^{\rm T}S_{k+1}(I+BR^{-1}B^{\rm T}S_{k+1})^{-1}\times\\ & B{R^{ - 1}}{B^{\rm T}}]{V_{k + 1}} + Q{{\boldsymbol{x}}_{r, k}}, \; \; \; \; {V_N} = P{{\boldsymbol{x}}_{r, N}} \end{split} $$ (5) 将式(3)代入式(1), 得到闭环系统方程:
$$ \begin{split} {\boldsymbol{x}}_{k + 1}=\,& [A - B{({B^{\rm T}}{S_{k + 1}}B + R)^{ - 1}}{B^{\rm T}}{S_{k + 1}}A]{\boldsymbol{x}}_k+\\ & B{({B^{\rm T}}{S_{k + 1}}B + R)^{ - 1}}{B^{\rm T}}{V_{k + 1}} \\[-10pt]\end{split} $$ (6) 由式(4) ~ (6)可以看出, 即使加权矩阵
$ P $ ,$ Q $ 和$ R $ 都为对角矩阵, 也难以保证从$ {\boldsymbol{x}}_{r, k} $ 到$ {\boldsymbol{x}}_k $ 的传递函数矩阵是对角的, 也就是说某一个参考输入$x_{ri}(k),\;i =$ $1,\cdots, n$ 的变化会导致其他状态$ x_{j}(k)(j = 1, \cdots , n; $ $i \ne j) $ 的变化. 造成这种现象的原因是不同控制回路之间存在耦合. 如果被控对象是线性多变量弱耦合系统, 可以采用分布式控制、模型预测控制等方法, 然而如果被控对象是强耦合的, 上述方法难以获得良好的控制效果.本文的目的是提出一种具有解耦性能的最优跟踪控制方法, 针对已知的离散时间线性多变量系统(1), 通过预先给定合适的对角半正定矩阵
$ P $ , 对角正定矩阵$\varLambda _1$ 和$\varLambda _2$ , 得到矩阵序列$ S_k $ 和$ V_k $ 以及对角半正定矩阵$ Q $ , 设计最优跟踪控制器, 使得闭环系统状态$ {\boldsymbol{x}}_{k} $ 能够尽可能的跟踪任意参考输入$ {\boldsymbol{x}}_{r, k} $ 的变化, 同时尽可能减少不同控制回路之间的耦合影响, 使闭环系统达到最优性能.2. 具有解耦性能的最优跟踪控制方法
为了实现解耦控制, 首先令
${A_1} = {\rm{diag}}{\{}{A_{ii}}{\}} , {B_1} =$ ${\rm{diag}}\{{B_{ii}}\}$ , 即$ {A_1} $ 和$ {B_1} $ 均为对角矩阵, 其对角线元素分别等于$ A $ 和$ B $ 的主对角元素; 令$ {A_2} = A - {A_1} , {B_2} =$ $ B - {B_1}, $ 即$ {A_2} $ 和$ {B_2} $ 均为主对角元素为零的矩阵, 于是如式(7)所示, 将系统(1)分成2个部分, 第1部分无耦合特性, 第2部分可视为所有耦合干扰:$$ \begin{align} {{\boldsymbol{x}}_{k + 1}} = \mathop {\underline {{A_1}{{\boldsymbol{x}}_k} + {B_1}{{\boldsymbol{u}}_k}} }\limits_{1)} + \mathop {\underline {{A_2}{{\boldsymbol{x}}_k} + {B_2}{{\boldsymbol{u}}_k}} }\limits_{2)} \end{align} $$ (7) 受到二人零和博弈问题的启发, 将式(7)中的耦合干扰
$ {A_2}{{\boldsymbol{x}}_k} + {B_2}{{\boldsymbol{u}}_k} $ 看作可测干扰, 引入如下考虑耦合影响的性能指标:$$ \begin{split} J =\,& \frac{1}{2}{({{\boldsymbol{x}}_N} - {{\boldsymbol{x}}_{r, N}})^{\rm T}}P({{\boldsymbol{x}}_N} - {{\boldsymbol{x}}_{r, N}})+\\ & \frac{1}{2}\sum\limits_{k = 0}^{N - 1} {[{\boldsymbol{e}}_k^{\rm T}Q_k{{\boldsymbol{e}}_k}} + {\boldsymbol{u}}_k^{\rm T}R_k{{\boldsymbol{u}}_k} - {\boldsymbol{z}}_k^{\rm T}M_k{{\boldsymbol{z}}_k}] \end{split} $$ (8) 式中,
$ {{\boldsymbol{z}}_k} = W_k{{\boldsymbol{x}}_k} + X_k{{\boldsymbol{u}}_k} $ 作为可测干扰$ {A_2}{{\boldsymbol{x}}_k} + {B_2}{{\boldsymbol{u}}_k} $ 的补偿项,$ P $ 为半正定矩阵,$ Q_k $ 为时变半正定矩阵,$ R_k $ 和$ M_k $ 为时变对称矩阵,$ W_k $ 和$ X_k $ 为时变加权矩阵. 为了描述方便, 在不引起混淆的情况下, 后文将上述时变矩阵的下角标$ k $ 省略.定理1. 考虑由式(1)以及参考轨迹
$ {\boldsymbol{x}}_{r, k} $ 构成的最优跟踪控制问题. 对任意的矩阵$ X $ 和$ M $ , 选择加权对称矩阵$ R $ 满 足$ R - {X^{\rm T}}MX: = \bar R > 0 $ , 则最小化式(8)的最优跟踪控制律为:$$ \begin{split} {\boldsymbol{u}}_k^* =\,& {({B^{\rm T}}{S_{k + 1}}B+R - {X^{\rm T}}MX)^{ - 1}}\times\\ &[({X^{\rm T}}MW-{B^{\rm T}}{S_{k + 1}}A){{\boldsymbol{x}}_k} + {B^{\rm T}}{V_{k + 1}}] \end{split} $$ (9) 式中,
$ S_{k}\in{\bf R}^{n\times n} $ 和$ V_k\in{\bf R}^{n} $ 分别根据下式反向迭代求解:$$ \begin{split}& {S_k} = {(A + B{{\bar R}^{ - 1}}{X^{\rm T}}MW)^{\rm T}}{S_{k + 1}}\times\\ &\qquad{(I + B{{\bar R}^{ - 1}}{B^{\rm T}}{S_{k + 1}})^{ - 1}}(A + B{\bar R}^{ - 1}{X^{\rm T}}MW)-\\ &\qquad{W^{\rm T}}MX{{\bar R}^{ - 1}}{X^{\rm T}}MW+Q-{W^{\rm{T}}}MW,\\ &{S_N} = P\\[-10pt] \end{split} $$ (10) $$ \begin{split} {V_k} =\,& Q{{\boldsymbol{x}}_{r, k}}+[{(A + B{{\bar R}^{ - {\rm T}}}{X^{\rm T}}MW)^{\rm T}}\times\\ & (I -S_{k+1}{( I+ B{{\bar R}^{ - 1}}{B^{\rm T}}S_{k+1})^{ - 1}}\times\\ & B{{\bar R}^{ - 1}}{B^{\rm T}})]{V_{k + 1}},\; \; \; \; \; \; \; \; {V_N} = P{{\boldsymbol{x}}_{r, N}} \end{split} $$ (11) 证明. 根据最小值原理, 定义如下哈密顿函数:
$$ \begin{split} {H_k} =\,& \frac{1}{2}[{{\boldsymbol{e}}_k^ {\rm {T}}}Q{{\boldsymbol{e}}_k} + {\boldsymbol{u}}_k^{\rm{ T}}R{{\boldsymbol{u}}_k} - {\boldsymbol{z}}_k^{\rm {T}}M{{\boldsymbol{z}}_k}]+\\ & \lambda _{k + 1}^{\rm T}(A{{\boldsymbol{x}}_k} + B{{\boldsymbol{u}}_k}) \end{split} $$ (12) 式中,
$ {\lambda _{k + 1}}\in{\bf R}^{n} $ 是拉格朗日乘子向量函数. 根据极值条件, 求$ H_k $ 对$ {\boldsymbol{u}}_k $ 的一阶偏导数:$$ \begin{split} \frac{{\partial {H_k}}}{{\partial {{\boldsymbol{u}}_k}}} =\,& R{{\boldsymbol{u}}_k} - {X^{\rm T}}M(W{{\boldsymbol{x}}_k} + X{{\boldsymbol{u}}_k})+\\ & {B^{\rm T}}{\lambda _{k + 1}} \end{split} $$ (13) 令
${\partial {H_k}}/{\partial {{\boldsymbol{u}}_k}}=0$ , 得到最优跟踪控制律:$$ {\boldsymbol{u}}_k^* = - {\bar R^{ - 1}}({B^{\rm T}}{\lambda _{k + 1}} - {X^{\rm T}}MW{{\boldsymbol{x}}_k}) $$ (14) 由于二阶偏导数
$ {{\partial ^2}{H_k}}/{{\partial {\boldsymbol{u}}_k^2}} = R - {X^{\rm T}}MX > 0 $ , 因此性能指标式(8)可以通过式(14)实现最小化.根据式(12), 得到状态方程和协态方程分别为:
$$ {{\boldsymbol{x}}_{k + 1}} = \frac{{\partial {H_k}}}{{\partial \lambda _{k + 1}^{\rm T}}} = A{{\boldsymbol{x}}_k} + B{{\boldsymbol{u}}_k} $$ (15) $$ \begin{split} {\lambda _k} = \frac{{\partial {H_k}}}{{\partial {{\boldsymbol{x}}_k}}} =\, & {A^{\rm T}}{\lambda _{k + 1}} + Q{{\boldsymbol{x}}_k} - Q{{\boldsymbol{x}}_{r, k}}- \\ &{W^{\rm T}}M(W{{\boldsymbol{x}}_k} + X{{\boldsymbol{u}}_k}) \end{split} $$ (16) 与文献[14]类似, 假设:
$$ {\lambda _k} = {S_k}{{\boldsymbol{x}}_k} - {V_k} $$ (17) 将式(17)代入式(14), 可得:
$$ \begin{split} {\boldsymbol{u}}_k^* =\,& - {\bar R^{ - 1}}{B^{\rm T}}({S_{k + 1}}{{\boldsymbol{x}}_{k + 1}} - {V_{k + 1}})+\\ & {\bar R^{ - 1}}{X^{\rm T}}MW{{\boldsymbol{x}}_k} \end{split} $$ (18) 由式(18)可知,
$ {\boldsymbol{u}}_k^* $ 依赖未来时刻的状态$ {\boldsymbol{x}}_{k+1} $ , 考虑到物理可实现性, 将式(1)代入式(18), 可得:$$ \begin{split} {\boldsymbol{u}}_k^* = \,&-{\bar R^{ - 1}}{B^{\rm T}}({S_{k + 1}}(A{{\boldsymbol{x}}_k} + B{\boldsymbol{u}}_k^*) - {V_{k + 1}})+\\ & {\bar R^{ - 1}}{X^{\rm T}}MW{{\boldsymbol{x}}_k} \end{split} $$ (19) 对式(19)进行移项整理后即得到式(9).
将式(1)、式 (14)和式(17)同时代入式(16), 得到:
$$ \begin{split} {\lambda _k} =\,& [({A^{\rm T}} + {W^{\rm T}}MX{{\bar R}^{ - 1}}{B^{\rm T}}){S_{k + 1}}\times\\ & {(I + B{{\bar R}^{ - 1}}{B^{\rm T}}{S_{k + 1}})^{ - 1}}(A + B{{\bar R}^{ - 1}}{X^{\rm T}}MW)+ \\ & Q- {W^{\rm T}}M(I + X{{\bar R}^{ - 1}}{X^{\rm T}}M)W]{{\boldsymbol{x}}_k}+\\ &[({A^{\rm T}} + {W^{\rm T}}MX{{\bar R}^{ - 1}}{B^{\rm T}}){S_{k + 1}}\times\\ & {(I + B{{\bar R}^{ - 1}}{B^{\rm T}}{S_{k + 1}})^{ - 1}} B{{\bar R}^{ - 1}}{B^{\rm T}}-\\ & {A^{\rm T}}-{W^{\rm T}}MX{{\bar R}^{ - 1}}{B^{\rm T}}]{V_{k + 1}}- Q{{\boldsymbol{x}}_{r, k}}\\[-10pt] \end{split} $$ (20) 利用待定系数法, 对比式(20)与式(17), 得到式(10) ~ (11)反向迭代方程.
在初始状态
$ {\boldsymbol x}_0 $ 已知的情况下, 最优跟踪问题的边界条件为:$$ \begin{split} {\lambda _N} =\,& \frac{{\partial [{{({{\boldsymbol{x}}_N} - {{\boldsymbol{x}}_{r, N}})}^{\rm T}}P({{\boldsymbol{x}}_N} - {{\boldsymbol{x}}_{r, N}})]}}{{\partial {{\boldsymbol{x}}_N}}} =\\ &P({{\boldsymbol{x}}_N} - {{\boldsymbol{x}}_{r, N}}) \end{split} $$ (21) 将式(21)与式(17)进行对比, 可得式(10) ~ (11)中的边界条件. □
推论1. 对任意对角正定矩阵
$\varLambda_{1}$ , 加权对称矩阵$ R $ , 以及任意可逆矩阵$ X $ , 加权矩阵$ M $ 和$ W $ 按照式(22) ~ (23)选择:$$ M = {X^{ - {\rm T}}}(R - {B^{\rm T}}{\varLambda _1}B){X^{ - 1}} $$ (22) $$ W = - {M^{ - 1}}{X^{ - {\rm T}}}\bar{R}{B^{ - 1}}{A_2} $$ (23) 则对任意的对角正定矩阵
$\varLambda_2$ , 当最优跟踪控制律为:$$ \begin{split} {\boldsymbol{u}}_k^* =\,& {({B^{\rm T}}{S_{k + 1}}B+{B^{\rm T}}{\varLambda _1}B)^{ - 1}}\times[( - {B^{\rm T}}{S_{k + 1}}A-\\ & {B^{\rm T}}{\varLambda _1}{A_2}){{\boldsymbol{x}}_k} + {B^{\rm T}}{V_{k + 1}}] \\[-10pt]\end{split} $$ (24) 式中, 矩阵
$ S_{k}\in{\bf R}^{n\times n} $ 满足:$$ \begin{split} {S_k} = A_{1}^{{\rm T}}{S_{k + 1}}{(I + \varLambda _1^{ - 1}{S_{k + 1}})^{ - 1}}{A_1}+{\varLambda _2},\; {S_N} = P \end{split} $$ (25) 向量
$ V_k\in{\bf R}^{n} $ 满足:$$ \begin{split} {V_k} =\,& [{A_1} - {A_1}{S_{k + 1}}{(I + \varLambda _1^{ - 1}{S_{k + 1}})^{ - 1}}\varLambda _1^{ - 1}]{V_{k + 1}}+\\ & Q{{\boldsymbol{x}}_{r, k}}, \; \; \; \; {V_N} = P{{\boldsymbol{x}}_{r, N}} \\[-10pt]\end{split} $$ (26) 加权矩阵
$ P $ 为对角半正定矩阵, 加权对角矩阵$ Q $ 满足:$$ \begin{split} Q = \,&\varLambda _1(I-A_{1}+\varLambda _1^{-1}S_{k+1})\times\\ & [I-A_{1}+A_1S_{k+1}(\varLambda _1+S_{k+1})^{-1}] \end{split} $$ (27) 不仅能够实现闭环系统的解耦, 而且使跟踪误差渐近收敛到零.
证明. 观察式(10), 为了实现解耦控制, 首先令:
$$ {\varLambda _1} = {[B{(R-X^{T}MX)^{ - 1}}{B^{\rm T}}]^{ - 1}} $$ (28) $$ A_1 = (A + B{\bar R^{ - 1}}{X^{\rm T}}MW) $$ (29) 根据式(28)和式(29), 可得到式(22)和式(23). 将式(22) ~ (23)代入式(10), 得到:
$$ \begin{split} {S_k} =\,& {A_1}{S_{k + 1}}{(I + \varLambda _1^{ - 1}{S_{k + 1}})^{ - 1}}{A_1}-A_{2}^{{\rm T}}\varLambda _1A_2-\\ & A_2^{\rm T}{\varLambda _1}B{(R - {B^{\rm T}}{\varLambda _1}B)^{ - 1}}{B^{\rm T}}{\varLambda _1}{A_2}+Q \end{split} $$ (30) 令式(30)等号右边后3项之和等于任意的对角正定矩阵
$\varLambda_2$ , 即:$$ \begin{split} \varLambda _2 =\,& Q-A_{2}^{{\rm T}}\varLambda _1A_2-A_2^{\rm T}{\varLambda _1}B{(R - {B^{\rm T}}{\varLambda _1}B)^{ - 1}}\times\\ & {B^{\rm T}}{\varLambda _1}{A_2} \end{split} $$ (31) 由于
$ R $ 为自由选择参数矩阵, 因此当给定对角正定矩阵$\varLambda _1$ 和$\varLambda _2$ 以后, 对任意对角半正定矩阵$ Q $ , 总可以找到$ R $ 使上式成立. 将式(31)代入式(30)可得式(25), 因此对任意对角正定矩阵$\varLambda _1$ 和$\varLambda _2$ , 都能保证$ S_{k} $ 是对角矩阵. 将式(22) ~ (23)分别代入式(9)和式(11), 可得式(24)和式(26).将式(24)代入式(1)中, 得到闭环系统方程:
$$ {{\boldsymbol{x}}_{k + 1}} = {(I + \varLambda _1^{ - 1}{S_{k + 1}})^{ - 1}}[A_1{{\boldsymbol{x}}_k} + \varLambda _1^{ - 1}{V_{k + 1}}] $$ (32) 由于矩阵
${A_1}、{\varLambda _1} 、{\varLambda _2} 、 Q$ 和$ S_k $ 都是对角矩阵, 从式(25) ~ (26)不难发现闭环系统式(32)已经实现了解耦.将选择对角半正定矩阵
$ Q $ , 使得系统在稳态时, 从$ x_{r, k} $ 到$ x_k $ 的传递函数矩阵为单位阵, 实现状态完全跟踪参考输入.将式(26)进行
$ z $ 变换后, 通过移项整理可得:$${V_{k+1}} = \dfrac{{Q{{\boldsymbol{x}}_{r, k + 1}}{z^{ - 1}}}}{{{z^{ - 1}}I + {A_1}{S_{k + 1}}(I + \varLambda _1^{ - 1}{S_{k + 1}})^{-1}\varLambda _1^{ - 1} - {A_1}}} $$ (33) 将式(33)代入式(32)后, 再进行
$ z $ 变换, 移项整理可得:$$ \begin{split} \frac{{\boldsymbol{x}}_{k+1}}{{\boldsymbol{x}}_{r, {k+1}}} =\,& \frac{(I + \varLambda^{-1}_1S_{k+1})^{-1}}{z^{-1}I + A_1S_{k+1}(I + \varLambda^{-1}_1S_{k+1})^{-1}\varLambda^{-1}_1 - A_1}\times\\ & \frac{\varLambda^{-1}_1Qz^{-1}}{I-(I+\varLambda^{-1}_1S_{k+1})^{-1}A_1z^{-1}}\\[-15pt] \end{split} $$ (34) 由极值条件可知, 对于阶跃的参考输入, 稳态时
$ z \to 1 $ , 因此稳态时要想保证从$ x_{r, k} $ 到$ x_k $ 的传递函数矩阵为单位阵, 那么对角半正定矩阵$ Q $ 需要满足:$$ \begin{split} Q =\,& {\varLambda _1}(I + \varLambda _1^{ - 1}{S_{k + 1}})(I - {(I + \varLambda _1^{ - 1}{S_{k + 1}})^{ - 1}}{A_1})\times\\ & (I + {A_1}{S_{k + 1}}{(I + \varLambda _1^{ - 1}{S_{k + 1}})^{ - 1}}\varLambda _1^{ - 1} - {A_1}) \\[-10pt]\end{split} $$ (35) 进一步化简整理得到式(27). 由式(27)易知, 加权矩阵
$ Q $ 是对角的. 下面证明由式(27)给出的对角矩阵$ Q $ 是半正定矩阵.由于式(27)中涉及到的矩阵
$Q 、\varLambda _1、A_1$ 和$ S_{k+1} $ 都是对角矩阵, 令$Q = {\rm{diag}}\{{Q_{ii}}\} ,\; \varLambda _1 = {\rm{diag}}\{\varLambda _1^{ii}\},$ $ A _1 = {\rm{diag}}\{A_1^{ii}\}$ 和$ S_{k+1} = {\rm{diag}}\{S_{k + 1}^{ii}\}$ .下面针对2种情况进行讨论:
1) 当
$ A_1^{ii}\leq 1 $ 时, 由式(27)可知:$$ \begin{split} Q_{ii}=\;& \varLambda _1^{ii}\left(1-A_1^{ii}+\frac{S_{k + 1}^{ii}}{\varLambda _1^{ii}}\right)\times\\ & \left(1-A_1^{ii}\frac{\varLambda _1^{ii}}{\varLambda _1^{ii}+S_{k + 1}^{ii}}\right) \end{split} $$ (36) 由于
$1-A_1^{ii}\ge 0$ ,$0 < {\varLambda _1^{ii}}/({\varLambda _1^{ii}+S_{k + 1}^{ii}})<1$ , 因此式(36)等号右边2个括号内的元素都大于等于零, 故$ Q_{ii}\ge 0 $ 成立.2) 当
$ A_1^{ii}> 1 $ 时, 由式(27)可知:$$ \begin{split} Q_{ii}=\;& \varLambda _1^{ii}\left(1-A_1^{ii}+\frac{S_{k + 1}^{ii}}{\varLambda _1^{ii}}\right)\times \\ &\left(1-A_1^{ii}+\frac{A_1^{ii}S_{k + 1}^{ii}}{\varLambda _1^{ii}+S_{k + 1}^{ii}}\right) \end{split} $$ (37) 式中,
$ Q_{ii} $ 一定大于等于零. 若$ Q_{ii}<0 $ , 则有:a)
$1 + {{S_{k + 1}^{ii}}}/{{\varLambda _1^{ii}}} > A_1^{ii}$ 并且$1 + {{A_1^{ii}S_{k + 1}^{ii}}}/ (\varLambda _1^{ii}+ S_{k + 1}^{ii}) < A_1^{ii} .$ 由于$1 +{{A_1^{ii}S_{k + 1}^{ii}}}/({{\varLambda _1^{ii}+ S_{k + 1}^{ii}}}) < A_1^{ii}$ 等价于$1+{{S_{k + 1}^{ii}}}/{{\varLambda _1^{ii}}} < A_1^{ii},$ 因此矛盾, 故$ Q_{ii} \ge 0 .$ b)
$1 + {{S_{k + 1}^{ii}}}/{{\varLambda _1^{ii}}} < A_1^{ii}$ 并且$1 +{{A_1^{ii}S_{k + 1}^{ii}}}/(\varLambda _1^{ii} + S_{k + 1}^{ii}) > A_1^{ii} .$ 由于$1 + {{A_1^{ii}S_{k + 1}^{ii}}}/({{\varLambda _1^{ii}+ S_{k + 1}^{ii}}}) > A_1^{ii}$ 等价于$1+{{S_{k + 1}^{ii}}}/{{\varLambda _1^{ii}}} > A_1^{ii} ,$ 因此矛盾, 故$ Q_{ii}\ge 0 .$ 综上所述, 对于任意的正定对角矩阵
$\varLambda _1$ 和$\varLambda _2$ , 由式(27)计算得到的加权矩阵$ Q $ 总是对角半正定矩阵. □注1. 当系统本身是解耦的(或耦合性较弱)时, 可以选择矩阵
$ X $ 或者$ M $ 为零矩阵, 此时具有解耦性能的最优跟踪控制器退化为传统的LQT控制器.注2. 本文方法中, 矩阵
$P 、 \varLambda_1$ 和$\varLambda_2$ 的选择准则与传统的LQT方法中$P 、 R$ 和$ Q $ 的选择准则相同. 也就是说, 当固定$\varLambda_1$ 和$\varLambda_2$ 时,$ P $ 越大系统末态跟踪误差越小; 当固定$ P $ 和$\varLambda_1$ 时,$\varLambda_2$ 越大系统跟踪误差越小; 当固定$ P $ 和$\varLambda_2$ 时,$\varLambda_1$ 越大系统控制能量消耗越小.注3. 当矩阵
$ B $ 不是方阵时, 若对于离散时间线性多变量系统:$$ \begin{align} \left\{ \begin{array}{l} {\boldsymbol{x}}_{k + 1} = A{\boldsymbol{x}}_k + B{\boldsymbol{u}}_k \nonumber\\ {\boldsymbol{y}}_k = C{\boldsymbol{x}}_k \nonumber\\ \end{array} \right. \end{align} $$ 当矩阵
$ CC^{\rm T}$ 和$ CB $ 为可逆矩阵时, 则上述系统可以转化为:$$ {\boldsymbol{y}}_{k+1} = CAC^{\rm T}(CC^{\rm T})^{-1}{\boldsymbol{y}}_k+CB{\boldsymbol{u}}_k $$ (38) 此时, 该系统与式(1)具有相同的形式, 采用本文所提方法, 即可实现输入到输出之间的解耦.
注4. 本文所研究的对象是确定的, 当系统参数存在匹配和不匹配不确定性时, 一方面可以借鉴补偿控制的思想, 将参数不确定性造成的影响视为一种干扰, 通过干扰观测器, 神经网络或者模糊推理系统等对其进行观测或估计, 并在控制器中加入补偿项予以消除, 详见附录A; 另一方面可以借鉴保性能控制的思想, 设计具有解耦性能的保性能跟踪控制器.
算法1. 具有解耦性能的最优跟踪控制算法
步骤1. 选择加权矩阵
$ P $ 和$\varLambda _i(i = 1, 2)$ ;步骤2. 根据式(25)计算得到
$ S_k $ , 将结果代入(27)式得到对角加权矩阵$ Q $ ;步骤3. 根据式(26)计算
$ V_k $ ;步骤4. 将
$ S_k $ 和$ V_k $ 序列, 加权矩阵$ P $ 和$\varLambda _i(i = 1, 2)$ 代入式(24)和式(32), 得到系统的控制输入和状态.3. 仿真实验
为了验证本文方法的有效性和优越性, 本节分别采用本文方法和传统LQT方法进行对比仿真实验, 并对仿真结果进行了比较和分析. 在仿真过程中, 采用相同的评估函数来比较2种方法的最优性能,
考虑如下两输入−两状态的离散时间线性系统:
$$ {{\boldsymbol{x}}_{k + 1}} = A{{\boldsymbol{x}}_k} + B{{\boldsymbol{u}}_k}, \; \; \; \; {\boldsymbol{x}}_0 = [0, 2]^{\rm T} $$ (39) 式中,
${{\boldsymbol{x}}_k} = [x_1(k), x_2(k)]^{\rm T}$ 是系统状态向量,${{\boldsymbol{u}}_k} = [u_1(k),$ $u_2(k)]^{\rm T} $ 是控制输入向量, 对应的系数矩阵和控制矩阵分别为:$$ \begin{array}{*{20}{c}} {A = \left[ {\begin{array}{*{20}{c}} {1.2727} & { - 0.0904}\\ {0.8859} & {0.5676} \end{array}} \right],} & {B = \left[ {\begin{array}{*{20}{c}} {0.0209} & {0.0517}\\ {0.0401} & {0.1079} \end{array}} \right]} \end{array} $$ 易知该系统的相对增益矩阵为:
$$ {{{\rm{RGA}}}} = \left[ {\begin{array}{*{20}{c}} {9.7976}&{ - 8.7976}\\ { - 8.7976}&{9.7976} \end{array}} \right]$$ 根据Bristol-Shinskey衡量指标, 可以判断出该系统是一个强耦合系统.
本实验的目的是针对离散时间线性系统(39), 设计最优跟踪控制器, 使得最大跟踪误差不超过参考输入幅值的10%, 其中参考输入信号为
${\boldsymbol{x}}_{r, k} = $ $ [x_{r1}(k), x_{r2}(k)]^{\rm T} = {[2{\rm{sgn}}(\sin k), 2{\rm{sgn}}(\cos k)]^{\rm T}} $ .3.1 采用本文所提方法的仿真实验
为了实现控制目标, 首先选择加权矩阵:
$$ \begin{array}{*{20}{c}} {P = \left[ {\begin{array}{*{20}{c}} 1&0\\ 0&1 \end{array}} \right],}&{{\varLambda _1} = \left[ {\begin{array}{*{20}{c}} {10}&0\\ 0&{10} \end{array}} \right],}&{{\varLambda _2} = \left[ {\begin{array}{*{20}{c}} 5&0\\ 0&5 \end{array}} \right]} \end{array}$$ 将上述加权矩阵代入式(25)和式(27), 得到各时刻
$ S_k $ 和$ Q $ 的值, 然后将结果代入式(26)得到$ V_k $ , 最后将结果代入式(24)和式(32), 得到如图1和图2所示的状态和控制输入曲线. 从图1可以看出, 采用本文所提方法后, 在实现了控制目标的基础上, 不仅消除了不同控制回路之间的耦合影响, 还使得系统在稳态时能完全跟踪参考输入.3.2 采用LQT方法的仿真实验
为了验证本文所提方法的优越性, 采用传统LQT方法, 选择两组参数对式(39)进行仿真实验. 令加权矩阵:
$$ \begin{array}{*{20}{c}} {P = \left[ {\begin{array}{*{20}{c}} 1&0\\ 0&1 \end{array}} \right],}&{Q = \left[ {\begin{array}{*{20}{c}} {13}&0\\ 0&{13} \end{array}} \right]} \end{array} $$ 当加权矩阵
$ R = \bigl[\begin{smallmatrix} 10^{-5} & 0 \\ 0 & 10^{-5} \end{smallmatrix}\bigr] $ 时, 得到如图3和图4所示的状态和控制输入曲线. 结合图1 和图3可以看出, 采用这组参数下的传统LQT方法, 虽然实现了控制目标, 但是当某一参考输入发生变化时, 其他回路状态会受到较大的影响, 而且系统达到稳态后还会存在一定的跟踪误差. 由图2和图4可以看出, 传统LQT 方法与本文所提方法相比, 虽然控制输入变化规律相同, 但是在参考输入发生变化时, 明显需要更大的控制输入.当加权矩阵
$ R = \bigl[\begin{smallmatrix} 10^{-6} & 0 \\ 0 & 10^{-6} \end{smallmatrix}\bigr] $ 时, 得到如图5和图6所示的状态和控制输入曲线. 从图5可以看出, 采用这组参数下的传统LQT方法实现了控制目标, 当某一参考输入变化时, 其他回路状态不再受到影响, 但是从图4和图6可以看出, 在这组参数下的传统LQT控制器的控制输入明显增大.3.3 两种控制方法的整体性能比较
为了比较2种不同控制策略的最优性能, 定义如下评估函数:
$$ {J_{\sigma}(i)} = \frac{1}{2}\sum\limits_{k = i}^{N} {[{\boldsymbol{e}}_k^{\rm T}{{\boldsymbol{e}}_k}} + {\boldsymbol{u}}_k^{\rm T}{{\boldsymbol{u}}_k}] $$ (40) 式中,
$ \sigma = 1 $ 表示本文所提方法的最优性能,$ \sigma = 2 $ 表示传统LQT方法的最优性能, 之后绘制两种方法的评估函数曲线.当采用第1组参数下的传统LQT方法时, 得到如图7所示的最优性能曲线. 从图7可以看出, 本文所提方法的最优性能明显小于传统LQT方法的最优性能. 由图1 ~ 4 可以看出, 对于传统LQT方法即使付出了更大的控制输入, 当某一参考输入发生变化时, 其他回路状态还是会受到较大的影响, 系统达到稳态时也不能实现完全跟踪; 本文所提方法通过选择合适的加权矩阵, 在较小的控制输入下, 不仅消除了系统不同控制回路之间的耦合作用, 还使得系统状态在稳态时总能完全跟踪参考输入, 故具有解耦性能的最优跟踪方法会得到更小的最优性能.
当采用第2组参数下的传统LQT方法时, 得到如图8所示的最优性能曲线. 从图8可以看出, 本文方法的最优性能仍然小于传统LQT方法的最优性能. 由 图1和图5可以看出, 虽然两种控制策略的跟踪效果相同, 但由图2和图6可知, 此时传统LQT方法需要更大的控制输入, 导致最优性能变得更大.
4. 结束语
针对一类具有强耦合特性的离散时间线性多变量系统, 本文提出了一种具有解耦性能的最优跟踪控制方法. 该方法受到二人零和博弈思想的启发, 设计了新的性能指标, 并根据极小值原理最小化该性能指标, 得到最优跟踪控制律. 按照本文给出的加权矩阵选择办法, 消除了不同控制回路之间的耦合影响, 使得系统的状态输出可以跟踪任意期望轨迹. 仿真实验表明, 当离散时间线性多变量系统具有强耦合特性时, 该方法可以获得更小的控制输入和更小的最优性能, 并且系统达到稳态时, 系统输出总能完全跟踪参考输入. 在接下来的研究中, 将进一步考虑系统模型部分未知的情况, 将自适应动态规划算法与本文解耦控制方法相结合, 设计近似最优跟踪控制器, 进而实现具有模型不确定性和强耦合特性的线性多变量系统的最优跟踪控制.
附录A. 基于神经网络补偿的不确定系统最优跟踪控制方法简述
考虑如下具有匹配和不匹配参数不确定性的离散时间非线性系统[20]
$: $ $$ {{\boldsymbol{x}}_{k{\rm{ + 1}}}} = A{{\boldsymbol{x}}_k} + B{{\boldsymbol{u}}_k} + B{{\boldsymbol{d}}_m}({{\boldsymbol{x}}_k}, k) + {{\boldsymbol{C}}_u}({{\boldsymbol{x}}_k}, k) \tag{A1}$$ (A1) 式中, 向量
$ {\boldsymbol{x}}_k $ 和$ {\boldsymbol{u}}_k $ 以及矩阵$ A $ 和$ B $ 同式(1)所示;$ B{{\boldsymbol{d}}_m}({{\boldsymbol{x}}_k}, k)\in {\bf R}^n $ 表示系统中满足匹配条件的不确定性,$ {{\boldsymbol{C}}_u}({{\boldsymbol{x}}_k}, k)\in{\bf R}^n $ 表示不满足匹配条件的不确定性.首先, 根据式(A1)的线性标称系统(1)得到具有解耦性能的无干扰最优跟踪控制器, 即式(24), 并假设该控制器能保证与式(A1)组成的闭环系统的输入和状态信号有界. 令:
$$ \begin{align} {K_1} = {({S_{k + 1}}B + {\varLambda _1}B)^{ - 1}}( - {S_{k + 1}}A - {\varLambda _1}{A_2}) \end{align}\tag{A2} $$ (A2) $$ \begin{align} {K_2} = {({S_{k + 1}}B + {\varLambda _1}B)^{ - 1}} \end{align}\tag{A3} $$ (A3) 则式(24)简化为:
$$ \begin{align} {\boldsymbol{u}}_k^* = {K_1}{{\boldsymbol{x}}_k} + {K_2}{V_{k + 1}} \end{align}\tag{A4} $$ (A4) 其次, 将式(A1)中匹配不确定性项和不匹配不确定性项统一看做线性标称系统的不确定性项, 即令:
$$ \begin{align} {\boldsymbol{D}}({{\boldsymbol{x}}_k}, k) = B{{\boldsymbol{d}}_m}({{\boldsymbol{x}}_k}, k) + {{\boldsymbol{C}}_u}({{\boldsymbol{x}}_k}, k) \end{align}\tag{A5} $$ (A5) 则式(A1)简化为:
$$ \begin{align} {{\boldsymbol{x}}_{k{\rm{ + 1}}}} = A{{\boldsymbol{x}}_k} + B{{\boldsymbol{u}}_k} + {\boldsymbol{D}}({{\boldsymbol{x}}_k}, k) \end{align} \tag{A6}$$ (A6) 最后, 设计如下基于神经网络补偿的最优跟踪控制器:
$$ \begin{align} {\boldsymbol{u}}_k = {K_1}{{\boldsymbol{x}}_k} + {K_2}{V_{k + 1}} + {B^{ - 1}}\hat {{\boldsymbol{D}}}({{\boldsymbol{x}}_k}, k) \end{align} \tag{A7}$$ (A7) 式中,
$ \hat {{\boldsymbol{D}}}({{\boldsymbol{x}}_k}, k) $ 为$ {\boldsymbol{D}}({{\boldsymbol{x}}_k}, k) $ 的神经网络估计,$\hat {{\boldsymbol{D}}}({{\boldsymbol{x}}_k}, k) {\rm{ = }} $ $ NN[{{\hat {{\boldsymbol{W}}}}_k}, {{\boldsymbol{X}}_k}], NN[\cdot] $ 表示神经网络的结构,$ {\boldsymbol{X}}_k $ 为神经网络输入向量,$ {\hat {{\boldsymbol{W}}}}_k $ 为$ k $ 时刻理想权阵$ {{\boldsymbol{W}}}^{\rm{*}} $ 的估计.为验证所提控制器(A7)的有效性, 本文进行了仿真实验. 考虑如下存在匹配和不匹配参数不确定性的离散时间非线性系统:
$$ \left\{\begin{aligned}& {{\boldsymbol{x}}_{k{\rm{ + 1}}}} = A{{\boldsymbol{x}}_k} + B{{\boldsymbol{u}}_k} + B{{\boldsymbol{d}}_m}({{\boldsymbol{x}}_k}, k) + {{\boldsymbol{C}}_u}({{\boldsymbol{x}}_k}, k)\\ &{{\boldsymbol{x}}_0} = {[0, 2]^{\rm T}} \end{aligned}\right.\tag{A8} $$ (A8) 式中, 向量
$ {\boldsymbol{x}}_k $ 和$ {\boldsymbol{u}}_k $ 以及矩阵$ A $ 和$ B $ 同式(39)所示;$$ \begin{array}{*{20}{c}} {{{\boldsymbol{d}}_m} = \left[ {\begin{array}{*{20}{c}} {{\rm{sin}}(k)}\\ 0 \end{array}} \right],}&{{{\boldsymbol{C}}_u} = \left[ {\begin{array}{*{20}{c}} {0.03{x_1^2}{{(k)}}}\\ 0 \end{array}} \right]} \end{array}$$ 首先, 根据式(A2)和式(A3)计算
$ K_{\rm{1}} $ 和$ K_{\rm{2}} $ , 得到具有解耦性能的无干扰最优跟踪控制器式(A4), 将其作用到式(A8), 从而得到神经网络训练所需的输入数据和导师信号. 本次仿真实验中, 神经网络的输入数据${{\boldsymbol{X}}_k} = $ $[Z_1, Z_2, \cdots , Z_{2499}] ,$ 其中$ {{\boldsymbol{Z}}_i} = [{\boldsymbol{x}}_i^{\rm T}{\rm{ }}, i]^{\rm T} ; $ 导师信号$ {\boldsymbol{D}}_k = $ $ [{E_{\rm{1}}}, {E_{\rm{2}}}, \cdots , {E_{{\rm{2499}}}}] ,$ 其中${E_i} = {{\boldsymbol{x}}_{i + 1}} - A{{\boldsymbol{x}}_i} - B{{\boldsymbol{u}}_i}, i =$ 1, 2,$\cdots ,$ 2499. 然后, 选择分别具有45个和10个隐层节点的双隐层前馈神经网络对不确定项进行估计, 其中节点传递函数为双曲正切函数tansig, 权值更新算法为Polak-Ribiere修正算法. 图A1为采用所提出的基于神经网络补偿的最优跟踪控制方法的状态跟踪曲线, 由图A1可以看出, 该方法不仅消除不同控制回路之间的耦合影响, 而且消除了不确定项对闭环系统的影响, 使得闭环系统的状态能够完全跟踪参考输入的变化. -
[1] Tien L, Schaffer A. Robust adaptive tracking control based on state feedback controller with integrator terms for elastic joint robots with uncertain parameters. IEEE Transactions on Control Systems Technology, 2018, 26(6): 2259−2267 doi: 10.1109/TCST.2017.2749564 [2] Qiu B, Wang G, Fan Y, Mu D, Sun X. Robust adaptive trajectory linearization control for tracking control of surface vessels with modeling uncertainties under input saturation. IEEE Access, 2018, 7: 5057−5070 [3] Chai R, Savvaris A, Tsourdos A, Chai S, Xia Y. Optimal tracking guidance for aeroassisted spacecraft reconnaissance mission based on receding horizon control. IEEE Transactions on Aerospace and Electronic Systems, 2018, 54(4): 1575−1588 doi: 10.1109/TAES.2018.2798219 [4] Fujimoto H, Kawamura A. Perfect tracking digital motion control based on two-degree-of-freedom multi-rate feedforward control. In: Proceedings of the International Workshop on Advanced Motion Control. Coimbra, Portugal: IEEE, 1998. 322−327 [5] Fujimoto H, Hori Y, Kawamura A. Perfect tracking control based on multirate feedforward control with generalized sampling Periods. IEEE Transactions on Industrial Electronics, 2001, 48(3): 636−644 doi: 10.1109/41.925591 [6] Liu L, Huang J. Global robust output regulation of output feedback systems with unknown high-frequency gain sign. IEEE Transactions on Automatic Control, 2006, 51(4): 625−631 doi: 10.1109/TAC.2006.872752 [7] Li T, Wang D, Feng G, Tong S. A DSC approach to robust adaptive NN tracking control for strict−feedback nonlinear systems. IEEE Transactions on Systems, Man, and Cybernetics, 2010, 40(3): 915−927 doi: 10.1109/TSMCB.2009.2033563 [8] Liu Y, Wang W, Tong S, Liu Y. Robust adaptive tracking control for nonlinear systems based on bounds of fuzzy approximation parameters. IEEE Transactions on Systems, Man, and Cybernetics, 2010, 40(1): 170−184 doi: 10.1109/TSMCA.2009.2030164 [9] Wang N, Sun J, Er M. Tracking-error-based universal adaptive fuzzy control for output tracking of nonlinear systems with completely unknown dynamics. IEEE Transactions on Fuzzy Systems, 2018, 26(2): 869−883 doi: 10.1109/TFUZZ.2017.2697399 [10] Lewis F, Vrabie D, Syrmos V. Optimal Control, New Jersey: John Wiley & sons, Inc, 2012. 190−195 [11] Fu Y, Hong C, Li J. Optimal decoupling control method and its application to a ball mill coal−pulverizing system Acta Automatica Sinica, 2018, 5(6): 1035−1043 doi: 10.1109/JAS.2018.7511219 [12] Modares H, Lewis F. Linear quadratic tracking control of partially−unknown continuous−time systems using reinforcement learning. IEEE Transactions on Automatic Control, 2014, 59(11): 3051−3056 doi: 10.1109/TAC.2014.2317301 [13] Kiumarsi B, Lewis F, Bagher M, Sistani N, Karimpour A. Optimal tracking control of unknown discrete−time linear systems using input−output measured data. IEEE Transactions on Cybernetics, 2015, 45(12): 2770−2779 doi: 10.1109/TCYB.2014.2384016 [14] Park Y, Choi M, Lee K. An optimal tracking neuro controller for nonlinear dynamic systems. IEEE Transactions on Neural Networks, 1996, 7(5): 1099−1110 doi: 10.1109/72.536307 [15] Zhang H, Wei Q, Luo Y. A novel infinite−time optimal tracking control scheme for a class of discrete−time nonlinear systems via the greedy HDP iteration algorithm. IEEE Transactions on Systems, Man, and Cybernetics, 2008, 38(4): 937−942 doi: 10.1109/TSMCB.2008.920269 [16] Zhang H, Song R, Wei Q, Zhang T. Optimal tracking control for a class of nonlinear discrete−time systems with time delays based on heuristic dynamic programming. IEEE Transactions on Neural Networks, 2011, 22(12): 1851−1862 doi: 10.1109/TNN.2011.2172628 [17] Zhang H, Cui L, Zhang X, Luo Y. Data−driven robust approximate optimal tracking control for unknown general nonlinear systems using adaptive dynamic programming method. IEEE Transactions on Neural Networks, 2011, 22(12): 2226−2236 doi: 10.1109/TNN.2011.2168538 [18] 王康, 李晓理, 贾超, 宋桂芝. 基于自适应动态规划的矿渣微粉生产过程跟踪控制. 自动化学报, 2016, 42(10): 1542−1551Wang Kang, Li Xiao−Li, Jia Chao, Song Gui−Zhi. Optimal tracking vontrol for slag grinding process based on adaptive dynamic programming Acta Automatica Sinica, 2016, 42(10): 1542−1551 [19] 袁兆麟, 何润姿, 姚超, 李佳, 班晓娟, 李潇睿. 基于强化学习的浓密机底流浓度在线控制算法. 自动化学报, 2021, 47(7):1558-1571Yuan Zhao−Lin, He Run−Zi, Yao Chao, Li Jia, Ban Xiao−Juan, Li Xiao−Rui. An online concentration control algorithm for underflow of thickener based on reinforcement learning. Acta Automatica Sinica, 2021, 47(7):1558-1571 [20] 郭壁垒, 苏宏业, 柳向斌, 刘之涛. 带有非线性不确定奇异系统的积分滑模控制. 控制理论与应用, 2010, 27(7): 873−879GUO Bi−Lei, SU Hong−Ye, LIU Xiang−Bin, LIU Zhi−Tao. Integral sliding mode control for singular systems with nonlinear uncertainties. Control Theory & Applications, 27(7): 873−879 期刊类型引用(0)
其他类型引用(3)
-