Model Predict Control Method Based on Higher-order Observer and Disturbance Compensation Control
-
摘要: 针对状态不可测、外部干扰未知, 并且状态和输入受限的离散时间线性系统, 将高阶观测器、干扰补偿控制与标准模型预测控制(Model predictive control, MPC)相结合, 提出了一种新的MPC方法. 首先利用高阶观测器同步观测未知状态和干扰, 使得观测误差一致有界收敛;然后基于该干扰估计值设计新的干扰补偿控制方法, 并将该方法与基于状态估计的标准MPC相结合, 实现上述系统的优化控制. 所提出的MPC方法克服了利用现有MPC方法求解具有外部干扰和状态约束的优化控制问题时存在无可行解的局限, 能够保证系统状态在每一时刻都满足约束条件, 并且使系统的输出响应接近采用标准MPC方法控制线性标称系统时得到的输出响应. 最后, 将所提控制方法应用到船舶航向控制系统中, 仿真结果表明了所提方法的有效性和优越性.Abstract: By combining a higher-order observer with disturbance compensation control and standard model predictive control (MPC), a novel MPC method is proposed for a discrete-time linear system with unmeasurable states, unknown external disturbances and constraints of states and inputs. Firstly, a higher-order observer is used to simultaneously observe unknown states and disturbances, such that the observation errors are uniformly bounded. Then a new disturbance compensation control method is designed based on the disturbance estimation, and the proposed method is obtained by combining the disturbance compensation control with the standard MPC based on the state estimation. The proposed method overcomes the limitation that there is no feasible solution when using the existing MPC methods to solve the optimization control problem with external disturbances and state constraints, which can also assure the system states satisfying their constraint conditions at each time instant, and make the output responses of the system close to those of the linear nominal system controlled by the standard MPC method. Finally, the proposed control method is applied to a ship heading control system, and the simulation results show its effectiveness and superiority.
-
模型预测控制(Model predictive control, MPC)是20世纪70年代从工业过程领域发展起来的一种特殊的计算机控制策略. MPC又称为滚动时域控制, 其三要素是预测模型、反馈校正和滚动优化. 在每一采样时刻, 根据预测模型以及获得的测量信息, 在线求解一个有限时 域开环优化问题, 并将得到的控制序列的第一个元素作用于被控对象, 在下一个采样时刻, 重复上述过程, 从而实现反馈校正和滚动优化[1-3]. 在MPC中, 预测模型根据系统当前时刻的信息, 计算或预测系统起始于当前时刻“未来一段时间”内的输出时需要“未来一段时间”的控制输入, 其中的“未来一段时间”称为预测时域, 这些控制输入即是求解优化问题的决策变量.
MPC方法主要用于解决复杂工业过程中具有约束的控制问题, 在先进制造、能源、环境、航空航天、医疗等许多领域得到了广泛的应用[4]. 然而, 由于MPC方法依赖于被控对象的数学模型, 当系统模型不匹配或系统受到外部干扰影响时, 闭环系统的输出会产生震荡或者稳态误差. 为此, 文献[5-9]提出了典型的鲁棒MPC方法, 这些方法通常假设外部干扰是有界的, 并且被约束在一个紧集中. 由于这种假设忽略了干扰的动力学相关知识, 因此可能导致保守的结果[10]. 干扰补偿方法在控制器设计中通常用来提高系统的干扰抑制性能, 增强控制器对模型失配或者外部干扰的鲁棒性[11]. 文献[12]提出了一种干扰补偿MPC方法, 该方法采用干扰观测器来补偿由未知干扰产生的偏移误差; 文献[10]提出的干扰补偿MPC方法通过求解干扰补偿控制律, 实现对标准MPC的补偿; 文献[13]在文献[10]的基础上进行了改进, 使得系统受到扰动后能很快地通过调整控制器参数使系统输出跟踪给定的参考轨迹; 文献[14]针对船舶航向控制问题, 采用扩展状态观测器估计外部干扰, 并基于干扰补偿机制和分布式MPC策略, 提出了一种舵/鳍一体化控制方法; 文献[15]通过干扰观测器对外部干扰和不确定项进行观测补 偿, 同时结合MPC方法, 提出了一种复合大气进入轨迹的跟踪策略; 文献[16-17]为满足超临界机组的大范围负荷跟踪要求, 同时克服超临界机组中的未知干扰影响, 利用模糊调度、MPC和扩展状态观测器技术, 提出了一种基于扩展状态观测器的模 糊MPC 方法.
上述方法是在系统所受的干扰未知、状态可测的情况下提出的. 实际系统中状态变量有时是不可测的, 为实现状态不可测系统的MPC, 文献[18]提出了一种带状态观测器的MPC方法来提高系统的性能; 文献[19-20]提出了一种基于状态空间模型 和Kalman滤波器MPC方法; 文献[21]基于Kalman滤波器和MPC方法提出了一种运动控制系统, 其中Kalman滤波器不仅可以估计系统的运动状态还可以估计被控对象受到的干扰, 该MPC控制系统具有很强的鲁棒性和抑制扰动的性能.
MPC方法在某一采样时刻试图求解带约束的优化问题时, 可能无可行解, 即找不到满足约束的最优控制量[10]. 为解决上述问题, 文献[22]讨论了在MPC中使用硬状态约束可能出现的不可行性问题, 并提出了两种解决不可行性问题的控制律; 文献[23]研究了一类MPC算法中的约束软化方法, 所提出的方法依赖于精确的惩罚函数, 从而确保在原MPC问题可行的情况下, 问题的解与实际最优解一致, 或者在原MPC问题不可行的情况下, 存在最小的约束冲突; 文献[24]提出了一种新的软约束MPC跟踪方法, 该方法确保了MPC问题的可行性, 并能为不稳定系统提供稳定性保证.
上述文献从优化的角度来解决目标函数无可行解的问题. 文献[10]从控制器设计的角度, 提出了一种基于干扰补偿控制的MPC方法, 该方法将复杂的约束优化问题分解为多步简单的约束优化问题. 但由于在第一步的线性规划问题中引入了对干扰补偿控制量的约束, 使得该线性规划问题常常是无解的. 本文针对状态不可测并且干扰未知的离散时间线性系统, 提出了一种新的基于干扰补偿控制的MPC方法. 将文献[10]中第一步通过求解线性规划问题获得干扰补偿控制量的方法转化成通过等式求取解析的干扰补偿控制量的方法, 并采用高阶观测器同步观测未知的状态和干扰. 将所提方法应用到船舶航向控制系统中, 仿真结果表明了所提方法的有效性和优越性.
1. 问题描述
考虑如下具有未知外部干扰的离散时间线性系统
$$ {{x}}(k+1) = A{{x}}(k)+B{{u}}(k)+{{d}}(k) $$ (1) $$ {{y}}(k) = C{{x}}(k) \quad\quad\quad\quad\quad\quad\quad\quad\quad $$ (2) 其中,
$ {{x}}(k)\in {\bf{R}}^{n} $ 为系统的不可测状态向量, 满足约束$ C_{0}{{x}}(t)\leq D_{0} ;$ $ {{u}}\in {\bf{R}}^{m} $ 为系统的控制输入向量, 满足约束$ S{{u}}(t)\leq T $ ;$ C_{0} $ ,$ D_{0} $ ,$ S $ 和$ T $ 为已知的具有适当维数的常值矩阵;$ {{d}}(k)\in {\bf{R}}^{n} $ 为系统的平滑有界未知外部干扰,$ {{y}}\in {\bf{R}}^{p} $ 为系统的可测输出向量.$ A \in {\bf{R}}^{n \times n} $ ,$ B\in {\bf{R}}^{n\times m} $ 和$ C\in {\bf{R}}^{p\times n} $ 为系统的系数矩阵,$ (A,C) $ 可观.本文的目标为针对线性系统(1)和(2), 设计一种基于高阶观测器和干扰补偿控制的MPC方法. 该方法使得系统的状态在每一采样时刻都满足约束条件, 同时使系统的输出响应尽可能与标准MPC方法应用于标称系统(即干扰
$ {{d}}(k) = 0 $ 且状态$ {{x}}(k) $ 可 测的系统)时的输出响应相接近, 其中标准MPC考虑的优化问题$ J({{x}}(k)) $ 如下:$$ \begin{split} & \mathop {\min }\limits_{{{u}}(\cdot|k)} \sum\limits_{j = 1}^{N_{p}}[{{x}}^{\rm T}(k+j|k)Q{{x}}(k+j|k)+ \\ & \quad\quad{{u}}^{\rm T}(k+j-1|k)R_{0}{{u}}(k+j-1|k)] \end{split} $$ (3) 满足如下动力学方程及约束
$$ {{x}}(k+j+1|k) = A{{x}}(k+j|k)+B{{u}}(k+j|k) $$ (4) $$ {{x}}(k|k) = {{x}}(k) \quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad $$ (5) $$ C_{0} {{x}}(k+j+1|k) \leq D_{0} \quad \quad \quad \quad \quad \quad \quad \quad \quad $$ (6) $$ S{{u}}(k+j|k) \leq T \quad\quad\quad\quad \quad \quad \quad \quad \quad \quad \quad \quad $$ (7) 其中, 式(3)为求解系统最优控制序列的优化目标函数,
$ Q $ 和$ R_{0} $ 分别为优化问题中预测状态和输入对应的加权矩阵,$ j = 0,1, \cdots,N_{p}-1 $ ,$ N_{p} $ 为系统的预测时域. 式(4)为用于预测系统未来状态的动力学模型,$ {{x}}(k+j|k) $ 为在当前$ k $ 时刻对$ k+j $ 时刻的预测状态,$ {{u}}(k+j|k) $ 为在当前$ k $ 时刻对$ k+j $ 时刻的预测控制输入. 式(5)中$ {{x}}(k) $ 为系统在$ k $ 时刻的实测状态. 式(6)和式(7)为对系统预测状态和输入的约束, 该约束通过常值矩阵$ C_{0} $ ,$ D_{0} $ ,$ S $ 和$ T $ 来定义.在系统状态
$ {{x}}(k) $ 可测, 但干扰$ {{d}}(k) $ 未知的情况下, 文献[10]将求解具有未知干扰和约束的优化问题分为三步, 第1步采用前一拍的干扰测量值来估计当前时刻的干扰值, 通过求解关于干扰估计值的线性规划问题, 得出用于干扰补偿的控制量$ {{u}}^{'*}(k) $ ; 第2步将约束(7)转化为$ S{{u}}(k|k)\leq T-S{{u}}^{'*} $ 和$ S{{u}}(k+j|k)\leq T $ ,$ j = 1,\cdots,N_{p}-1 $ 两个约束, 求出标准MPC的最优解$ {{u}}^{*}(k|k) ;$ 第3步令${{u}}(k) = $ $ {{u}}^{*}(k|k)+ {{u}}^{'*}(k) $ , 从而得到上述优化问题的最优解. 上述所提方法存在两个问题: 1)在第1步的线性规划问题中, 由于引入了对干扰补偿控制量的约束, 使得该线性规划问题通常是无可行解的; 2)即使第1步中的线性规划问题存在可行解, 该可行解也依赖干扰观测误差的上界. 采用前一拍干扰测量值对未知干扰进行估计的方法[10], 所得观测误差的上界只能通过假设或经验获得. 本文针对系统(1)和(2), 采用高阶观测器对系统的未知状态和干扰进行同步观测, 并指出了观测误差与采样周期$ T_s $ 的关系, 为观测误差上界的取值提供了依据. 将该观测器与干扰补偿控制方法相结合, 提出了一种新的MPC方法.2. 高阶观测器
采用如下高阶观测器, 对系统(1)和(2)中未知状态和干扰进行同步观测:
$$\hat{{{x}}}(k+1) = A\hat{{{x}}}(k) + B{{u}}(k) + P_{0}[{{y}}(k) - \hat{{{y}}}(k)]+\hat{{{d}}}(k)$$ (8) $$\begin{split}\hat{{{d}}}(k+1) =\; & \hat{{{d}}}(k) + L_{0}[{{y}}(k) - \hat{{{y}}}(k)] + \triangle \hat{{{d}}}(k)+\quad\\ & L_{1}[\triangle {{y}}(k) - \triangle \hat{{{y}}}(k)] \end{split} \quad$$ (9) $$ \hat{{{y}}}(k) = C\hat{{{x}}}(k) \quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad \quad $$ (10) 其中,
$ \hat{{{x}}}(k) $ ,$ \hat{{{d}}}(k) $ 和$ \hat{{{y}}}(k) $ 分别为$ k $ 时刻系统的状态估计、干扰估计和输出估计,$ P_{0}\in {\bf{R}}^{n\times p} $ ,$ L_{j} \in {\bf{R}}^{n\times p} $ ,$ j = 0,1 $ 为常值矩阵, 且$ \bigtriangleup = 1-z^{-1} $ 为一阶差分算子,$ z^{-1} $ 为单位后移算子,$ \bigtriangleup\hat{{{d}}}(k) = \hat{{{d}}}(k)- $ $\hat{{{d}}}(k-1) $ 为$ k $ 时刻系统干扰估计与$ k-1 $ 时刻系统干扰估计的差,$ \triangle {{y}}(k) = $ $ {{y}}(k)-{{y}}(k-1) $ 为$ k $ 时刻系统输出与$ k-1 $ 时刻系统输出的差,$ \triangle \hat{{{y}}}(k) = \hat{{{y}}}(k)- $ $\hat{{{y}}}(k-1) $ 为$ k $ 时刻系统输出估计与$ k-1 $ 时刻系统输出估计的差.为给出观测误差与采样周期
$ T_{s} $ 的关系, 以及矩阵$ P_{0} $ ,$ L_{0} $ 和$ L_{1} $ 的选取准则, 引入如下定义.定义1[25]. 变量
$ v $ 的幅值满足$ v\in O(T_{s}^{N}) $ , 当且仅当存在常值$ C_{1}>0 $ , 使得对任意充分小的$ T_{s} $ , 以下不等式成立$$ |v| \leq C_{1}T_{s}^{N} $$ 其中,
$ N \in {\bf{Z}} $ ,$ {\bf{Z}} $ 为整数集.同时对系统的采样周期和干扰做出以下假设.
假设1[25-26]. 光滑有界的干扰
$ {{d}}(k) $ 在连续两个采样时刻内的变化满足$$ {{d}}(k+1)-{{d}}(k) \in O(T_{s}^{2}) $$ 注1. 干扰
$ {{d}}(k) $ 光滑有界, 因此一定是Lipsc-hitz连续的, 此时若采样周期$ T_{s} $ 充分小, 使得$ {{d}}(k) $ 在连续两个采样时刻内的变化不大, 则假设1成立.由定义1和假设1, 可以进一步引入如下引理.
引理1. 如果采样周期
$ T_{s} $ 充分小, 使光滑有界干扰满足假设1, 那么$ {{d}}(k) $ 的二阶差分的幅值满足$$ \triangle^{2}{{d}}(k) \in O(T_{s}^{3}) $$ 其中,
$ \triangle^{2} = (1-z^{-1})^{2} $ ,$\triangle^{2}{{d}}(k) = {{d}}(k)-2{{d}}(k-1)+ $ $ {{d}}(k-2) $ .证明. 参见文献[25]. □
综合前面已给出的条件, 给出定理1.
定理1. 如果假设1成立, 并且存在常值矩阵
$ P_{0} $ ,$ L_{0} $ 和$ L_{1} $ , 使得对任意的$ |z|\geq 1 $ , 以下不等式恒成立$$ \begin{split} & \det\{[1- z^{-1}G(z^{-1})][I_{n}-(A-P_{0}C)z^{-1}]+ \\ & \quad\quad z^{-2}Q(z^{-1})C\} \neq 0 \end{split} $$ (11) 则系统的状态观测误差和干扰观测误差满足
$$ \begin{aligned} & {{e}}(k) \in O(T_{s}^{3})\\ & {{q}}(k) \in O(T_{s}^{3}) \end{aligned} $$ 其中
$$ {{e}}(k) = {{x}}(k) - \hat{{{x}}}(k) \; $$ (12) $$ {{q}}(k) = {{d}}(k) - \hat{{{d}}}(k) \; $$ (13) $$ G(z^{-1}) = 1 + \triangle \quad\quad $$ (14) $$ Q(z^{-1}) = L_{0} + L_{1}\triangle $$ (15) 证明. 将式(1)与式(8)相减, 可得
$$ {{e}}(k+1) = A{{e}}(k)+{{q}}(k)-P_{0}C{{e}}(k) $$ 即
$$ {{q}}(k-1) = [I_{n}-(A-P_{0}C)z^{-1}]{{e}}(k) $$ (16) 由于任意的干扰
$ {{d}}(k) $ 可以写成如下形式:$$ \begin{split} {{d}}(k) & = {{d}}(k-1) + \triangle {{d}}(k-1) + \triangle^{2}{{d}}(k) =\\ & \quad (1 + \triangle){{d}}(k-1) + \triangle^{2}{{d}}(k) \end{split} $$ (17) 将式(17)与式(9)、式(13)相结合, 可得
$$ \begin{aligned} {{q}}(k) =\; & {{d}}(k) - \hat{{{d}}}(k)= \\ & (1 \!+\! \triangle){{d}}(k -1) \!+\! \triangle^2{{d}}(k)-(1 \!+\! \triangle)\hat{{{d}}}(k\!-\!1)\!-\\ & (L_{0} + L_{1}\triangle)[{{y}}(k-1) -\hat{{{y}}}(k-1)] =\\ & (1 + \triangle){{q}}(k -1) + \triangle^2{{d}}(k)-\\ & (L_{0} + L_{1}\triangle)[{{y}}(k-1) -\hat{{{y}}}(k-1)] \end{aligned} $$ 再由式(2)、式(10)及式(14)、式(15), 可得
$${{q}}(k) = G(z^{-1}){{q}}(k-1)- Q(z^{-1})C{{e}}(k-1) + \triangle^{2}{{d}}(k) $$ (18) 将式(16)代入式(18), 可得
$$ \begin{aligned} & \{[1-z^{-1}G(z^{-1})][I_{n}-(A-P_{0}C)z^{-1}] + \\ & \quad\quad z^{-2}Q(z^{-1})C\}{{e}}(k) = \triangle^{2}{{d}}(k-1) \end{aligned} $$ 由文献[27]中的关键技术引理及式(11)可知, 存在正常数
$ c_{1} $ 和$ c_{2} $ 满足$$ |{{e}}(k)| \leq c_{1}\mathop {\max }\limits_{0 \le \tau \le k} |\triangle^{2}{{d}}(\tau - 1)| + c_{2}, \quad \forall k > 0 $$ 因此, 由引理1及定义1可知, 状态观测误差的幅值满足
$ {{e}}(k)\in O(T_{s}^{3}) $ , 再根据式(16)可知, 干扰观测误差的幅值也满足$ {{q}}(k)\in O(T_{s}^{3}) $ . □注2. 由定理1可知, 高阶观测器的状态观测误差和干扰观测误差均一致有界收敛. 收敛域的大小取决于采样周期, 若采样周期足够小, 则收敛域也足够小.
3. 基于干扰补偿控制的MPC
针对系统(1)和(2), 结合上述所设计的高阶观测器, 提出了一种新的基于干扰补偿控制的MPC方法, 其设计步骤如下:
步骤1. 在
$ k $ 时刻通过高阶观测器(8)~(10)求出未知状态和干扰的观测值$ \hat{{{x}}}(k) $ 和$ \hat{{{d}}}(k) $ .步骤2. 求解干扰补偿控制量
$ {{u}}^{'\ast} $ , 使其满足$$ C_{0}B{{u}}^{'\ast}+C_{0}\hat{{{d}}}(k)+C_{0}{{{E}}_{\rm{0}}} = 0 $$ (19) 其中,
$ {{{E}}_{\rm{0}}} = \max\{A{{e}}(k)+{{q}}(k)\}\in {\bf{R}}^{n} $ .步骤3. 将状态观测值
$ \hat{{{x}}}(k) $ 及干扰补偿控制量$ {{u}}^{'\ast} $ 代入优化问题$ J({{x}}(k)) $ , 求解出如下关于$ \hat{{{x}}}(k) $ 和$ {{u}}^{'\ast} $ 的优化问题$ J^{'}(\hat{{{x}}}(k),{{u}}^{'\ast}) $ , 得到最优解$ {{u}}^{*}(k|k) $ .$$ \begin{split} & \min\limits_{{{u}}(\cdot|k)}\sum\limits_{j = 1}^{N_{p}}[{{x}}^{\rm T}(k+j|k)Q{{x}}(k+j|k)+\\ & \quad\quad\quad\; {{u}}^{\rm T}(k+j-1|k)R_{0}{{u}}(k+j-1|k)] \end{split} $$ (20) 满足如下动力学方程及约束
$$ {{x}}(k|k) = \hat{{{x}}}(k) \quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\; $$ (21) $$ {{x}}(k+j+1|k) = A{{x}}(k+j|k)+B{{u}}(k+j|k) \;$$ (22) $$ C_{0}{{x}}(k+j+1|k)\leq D_{0}, \; j = 0,\cdots,N_{p}-1\quad\;\, $$ (23) $$ S{{u}}(k|k) \leq T - S{{u}}^{'\ast} \quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad $$ (24) $$ S{{u}}(k+j|k) \leq T, \; j = 1,\cdots,N_{p}-1 \quad\quad\quad\quad\;\; $$ (25) 令最优解
$ {{u}}^{*}(k|k) $ 所对应的最优预测状态为$ {{x}}^{\ast}(k +1|k) $ .步骤4. 将最优控制律
$$ {{u}}(k) = {{u}}^{\ast}(k|k)+{{u}}^{'\ast} $$ (26) 施加到系统(1)和(2), 并令
$ k = k+1 $ , 返回至步骤1.易知, 当系统状态可测, 并且不受外部干扰影响, 即干扰
$ {{d}}(k) = 0 $ 时, 由于$ \hat{{{d}}}(k)+{{{E}}_{\rm{0}}} = 0 $ , 则有$ {{u}}^{'\ast} = 0 $ . 此时干扰补偿的MPC方法退化为标准MPC方法.引理2. 如果式(19)成立且式(20)的优化问题
$ J^{'}(\hat{{{x}}}(k),{{u}}^{'\ast}) $ 存在可行解, 那么当控制律(26)作用于系统(1)和(2)时, 系统的状态总是满足如下约束$$ C_{0}{{x}}(k+1) \leq D_{0} $$ 证明. 如果式(19)成立, 并且式(20)的优化问题
$ J^{'}(\hat{{{x}}}(k), {{u}}^{'\ast}) $ 存在可行解, 则以下各式成立$$ \begin{split} & C_{0}B{{u}}^{'\ast} + C_{0}\hat{{{d}}}(k) + C_{0}{{{E}}_{\rm{0}}} = 0 \\ & C_{0}{{x}}^{\ast}(k+1|k)\leq D_{0} \end{split} $$ (27) $$ S{{u}}^{\ast}(k|k)\leq T - S{{u}}^{'\ast} \quad\quad\quad\quad$$ (28) 由式(26)和式(28)可得
$$ \begin{aligned}S{{u}}(k) & = S({{u}}^{\ast}(k|k) + {{u}}^{'\ast})=\\ & \quad S{{u}}^{\ast}(k|k) + S{{u}}^{'\ast} \leq T\end{aligned} $$ 即最优控制输入满足约束
$ S{{u}}(k)\leq T $ .根据式(1), 式(12), 式(13)和式(26), 状态
$ {{x}}(k+1) $ 可以表示为$$ \begin{split}{{x}}&(k+1) = A{{x}}(k)+B{{u}}(k)+{{d}}(k) = \\ &A[\hat{{{x}}}(k)+{{e}}(k)]+B[{{u}}^{\ast}(k|k)+{{u}}^{'\ast}] + \hat{{{d}}}(k) + {{q}}(k) = \\ &A\hat{{{x}}}(k)+B{{u}}^{\ast}(k|k) + \hat{{{d}}}(k)+ B{{u}}^{'\ast}+ A{{e}}(k)\!+\! {{q}}(k) \!= \\ & {{x}}^{\ast}(k+1|k) + \hat{{{d}}}(k)+ B{{u}}^{'\ast} + A{{e}}(k)+ {{q}}(k) \end{split} $$ (29) 用
$ C_{0} $ 左乘式(29)等号左右两边, 并利用式(19)和式(27)得出$$ \begin{aligned} C_{0}{{x}}(k+1) = \;& C_{0}{{x}}^{\ast}(k+1|k) + C_{0}\hat{{{d}}}(k)+\\ &C_{0}B{{u}}^{'\ast} + C_{0}A{{e}}(k)+ C_{0}{{q}}(k)\leq \\ & C_{0}{{x}}^{\ast}(k+1|k) + C_{0}\hat{{{d}}}(k)+ \\ & C_{0}B{{u}}^{'\ast} + C_{0}{{{E}}_{\rm{0}}}=\\ & C_{0}{{x}}^{\ast}(k+1|k) \leq D_{0} \end{aligned} $$ □
注3. 文献[10]假设系统(1)和(2)的状态可测, 采用前一拍干扰测量值对当前时刻的干扰进行估计, 干扰补偿控制量
$ {{u}}^{'} $ 通过求解如下线性规划问题获得$$ \min\limits_{{{u}}^{'}\in {\bf{R}}^{ m}}\|C_{0}B{{u}}^{'}+C_{0}\hat{{{d}}}(k-1)\| $$ 满足如下约束
$$ C_{0}B{{u}}^{'} \leq -C_{0}\hat{{{d}}}(k-1) - {{ E}} $$ (30) $$ S{{u}}^{'} \leq T \quad\quad\quad\quad\quad\quad\quad\quad$$ (31) 其中,
$ {{ E}} = \max(C_{0}\varepsilon) $ ,$ \varepsilon $ 为干扰观测误差. 上述线性规划问题由于引入了对干扰补偿控制量$ {{u}}^{'} $ 的约束式(30)和式(31), 很多情况下是不可行的. 例如: 令$$ \hat{{{d}}}(k-1) = \left[ {\begin{array}{*{20}{c}} {{{\hat d}_1}}\\ {{{\hat d}_2}} \end{array}} \right], \quad {{E}} = \left[ {\begin{array}{*{20}{c}} {{e_0}}\\ {{e_0}} \end{array}} \right] $$ 若
$$ {C_0}B = \left[ {\begin{array}{*{20}{c}} 1\\ { - 1} \end{array}} \right] $$ 则约束(30)可转化为
$$ \left[ {\begin{array}{*{20}{c}} 1\\ { - 1} \end{array}} \right]u^{'} \leq \left[ {\begin{array}{*{20}{c}} { - {{\hat d}_1}}\\ {{{\hat d}_1}} \end{array}} \right]- \left[ {\begin{array}{*{20}{c}} {{e_0}}\\ {{e_0}} \end{array}} \right]$$ 即
$$ -\hat{d}_{1} +e_{0} \leq u^{'} \leq - \hat{d}_{1} - e_{0} $$ (32) 通常
$ e_{0} $ 为大于零的正数, 因此不存在满足约束式(32)的$ u^{'} $ , 即文献[10]中关于$ {{u}}^{'} $ 的线性规划问题无可行解. 从而文献[10]提出的干扰补偿MPC方法具有一定的局限性.4. 船舶航向控制仿真实验
为验证所提出的基于高阶观测器和干扰补偿控制的MPC方法的有效性和优越性, 以船舶航向控制为例, 进行仿真对比实验.
考虑如下自由度1的船舶动力系统[10]
$$ \dot{\gamma} = a_{11}\gamma + a_{12}\psi + b_{1}\delta + \phi $$ (33) $$ \dot{\psi} = \gamma \quad\quad\quad\quad\quad\quad\quad\quad\quad $$ (34) 其中,
$ \gamma $ 为船舶航向的角速度,$ \psi $ 为船舶的航向角,$ \delta $ 为方向舵偏角,$ \phi $ 为船舶受到的波浪场扰动. a11 =$ -0.1068 $ ,$ a_{12} = 0 $ ,$ b_{1} = 0.0028 $ . 令$ {{x}} = [\gamma, \psi]^{\rm T} $ ,$ {{d}} = [\phi, 0]^{\rm T} $ , 则式(33)和式(34)可改写为如下状态空间形式$$\dot{{{x}}} = A_{c}{{x}} + B_{c}\delta + {{d}} $$ (35) $$ {{y}} = C{{x}} \quad\quad\quad\quad\quad $$ (36) 其中
$$ \begin{array}{*{20}{l}} {{A_c} = \left[ {\begin{array}{*{20}{c}} { - 0.1068}&0\\ 1&0 \end{array}} \right],\quad {B_c} = \left[ {\begin{array}{*{20}{c}} {0.0028}\\ 0 \end{array}} \right]}\\ {C = \left[ {\begin{array}{*{20}{c}} 1&0\\ 0&1 \end{array}} \right]} \end{array}$$ 在实际的船舶动力系统中, 由于受到物理条件的限制, 方向舵偏角存在饱和约束. 另外为避免由于急转弯所产生的不必要的船舶运动, 在船舶航向控制设计过程中需要对船舶的角速度加以约束. 与文献[10]相同, 假设船舶的方向舵偏角约束为
$ |\delta|\leq 35^{\circ} $ , 角速度约束为$ |\gamma|\leq 0.006\; {\rm rad/s} $ , 即控制输入和状态分别满足如下不等式约束$$ \begin{array}{l} S\delta \leq T \\ C_{0}{{x}} \leq D_{0} \end{array} $$ 其中
$$ \begin{array}{l} \;\;S = \left[ {\begin{array}{*{20}{c}} 1\\ { - 1} \end{array}} \right],\;\;\;\;\quad\quad T = \left[ {\begin{array}{*{20}{c}} {35\dfrac {\pi}{180}}\\ {35\dfrac {\pi}{180}} \end{array}} \right]\\ {C_0} = \left[ {\begin{array}{*{20}{c}} 1&0\\ { - 1}&0 \end{array}} \right],\;\;\;\;{D_0} = \left[ {\begin{array}{*{20}{c}} {0.006}\\ {0.006} \end{array}} \right] \end{array}$$ 控制目标为当角速度
$ \gamma $ 、航向角$ \psi $ 不可测, 并且波浪场扰动$ \phi $ 未知时, 设计基于高阶观测器和干扰补偿控制的MPC方法, 在满足物理约束的条件下, 使船舶角速度$ \gamma $ 和航向角度$ \psi $ 收敛于期望值.为进行控制器设计, 选择采样周期
$ T_{s} = 0.5\;{\rm s} $ , 对上述连续时间状态空间方程(35)和(36)进行离散化处理, 得到如下离散时间状态空间模型$$ \begin{aligned} &{{x}}(k+1) = A{{x}}(k) + B\delta(k) + F{{d}}(k)\\ & {{y}}(k) = C{{x}}(k) \end{aligned} $$ 其中
$$ \begin{array}{l} \;A = \left[ {\begin{array}{*{20}{c}} {0.9480}&0\\ {0.4869}&1 \end{array}} \right],\;\;\;\;\;B = \left[ {\begin{array}{*{20}{c}} {0.0014}\\ {0.0003} \end{array}} \right]\\ C = \left[ {\begin{array}{*{20}{c}} 1&0\\ 0&1 \end{array}} \right],\;\;\;\;\;F = \left[ {\begin{array}{*{20}{c}} {0.4869}&0\\ {0.1228}&{0.500} \end{array}} \right] \end{array} $$ 根据式(11)选择高阶观测器中的常值矩阵如下
$$ P_{0} = \left[ {\begin{array}{*{20}{c}} {2.7980}&0\\ {0.4869}&2.8000 \end{array}} \right] $$ (37) $$ L_{0} = \left[ {\begin{array}{*{20}{c}} {0.8526}&0\\ {0}&{0.8100} \end{array}} \right] $$ (38) $$ L_{1} = \left[ {\begin{array}{*{20}{c}} {1.8500}&0\\ {0}&{1.800} \end{array}} \right] $$ (39) 在对所提MPC方法进行仿真验证之前, 先验证所设计的高阶观测器的有效性, 为此选择如下输入信号
$$ \delta(k) = \left\{\!\!\!{\begin{array}{*{20}{c}} {1,}&{k \geq 0}\\ {0,}&{k < 0} \end{array}} \right. $$ 外部干扰信号
$$ {{d}}(k)= \left[ {\begin{array}{*{20}{c}} {0.3{\rm sin}(0.1k)+0.5{\rm cos}(0.03k)}\\ {0.02{\rm cos}(0.1k)+0.05} \end{array}} \right] $$ 并选择初始向量
$$ {{x}}(0) =\left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right],\;\;\;\; \hat{{{x}}}(0) = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right] $$ $$ {{y}}(0) =\left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right],\;\;\;\; {{y}}(-1) = \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right] $$ $$\hat{{{y}}}(0) =\left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right],\;\;\;\; \hat{{{y}}}(-1)= \left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right] $$ $$\begin{array}{l} {{d}}(0) =\left[ {\begin{array}{*{20}{c}} {0.5}\\ {0.04} \end{array}} \right],\;\;\;\; \hat{{{d}}}(0)= \left[ {\begin{array}{*{20}{c}} {0.3}\\ {0.04} \end{array}} \right]\\ \hat{{{d}}}(-1)=\left[ {\begin{array}{*{20}{c}} {0.1}\\ {0.02} \end{array}} \right] \end{array}$$ 图1和图2分别为对船舶的角速度和航向角的观测, 图3和图4分别为对未知干扰的观测. 从图1和图2可以看出, 高阶观测器能较好地实现对角速度和航向角的估计, 观测误差基本可以忽略; 从图3和图4可以看出, 高阶观测器对干扰
$ d_{1} $ ,$ d_{2} $ 的观测在经过几步调节之后, 逐渐趋于稳定. 除在曲线拐点处有较小的误差外, 其余部分的观测误差几乎为零.下面验证本文提出的基于高阶观测器和干扰补偿的MPC方法的有效性和优越性. 为此, 选择初始状态向量
$$ {{x}}(0) = {\left[ {\begin{array}{*{20}{c}} 0&{0.27} \end{array}} \right]^{\rm{T}}}, \quad \hat{{{x}}}(0) = {\left[ {\begin{array}{*{20}{c}} 0&{0.3} \end{array}} \right]^{\rm{T}}} $$ 初始干扰向量
$$ {{d}}(0) ={\left[ {\begin{array}{*{20}{c}}0 & 0 \end{array}} \right]^{{\rm T}}}, \quad \hat{{{d}}}(0) = {\left[ {\begin{array}{*{20}{c}}0 & 0 \end{array}}\right]^{{\rm T}}} $$ $$ {{d}}(-1) ={\left[ {\begin{array}{*{20}{c}}0 & 0 \end{array}} \right]^{{\rm T}}}, \quad \hat{{{d}}}(-1) = {\left[ {\begin{array}{*{20}{c}}0 & 0 \end{array}}\right]^{{\rm T}}}$$ 观测器中常值矩阵的选择同式(37)~(39), 输入初始值选为
$ \delta(0) = 0 $ , 优化问题中的加权矩阵取为$$ Q = \left[ {\begin{array}{*{20}{c}} {1000}&0\\ 0&{300} \end{array}} \right],\quad {R_0} = 1$$ 预测时域选择为
$ N_{p} = 80 $ . 与文献[10]相同, 采用正弦函数$$ \phi(t) = 0.001\sin(0.08t) $$ 来模拟船舶受到的波浪场扰动, 同时令干扰观测误差的上界
$ {{E}}_{0} = [0.00005, 0.00005]^{{\rm T}} $ .图5给出了3种情形下的系统输出响应曲线, 分别为:
1)系统状态不可测且干扰未知时, 将所提出的基于高阶观测器和干扰补偿控制的MPC方法作用于系统;
2)系统状态可测且干扰已知时, 采用基于干扰补偿控制的MPC方法作用于系统;
3)系统状态可测且无干扰时, 采用标准MPC方法作用于系统.
图6给出了3种情形下系统的控制输入变化曲线.
从图5可以看出, 当系统存在干扰时, 无论系统的状态是否可测, 干扰是否已知, 采用干扰补偿的MPC方法得到的角速度和航向角, 与无干扰情况下采用标准MPC方法得到的结果相比, 角速度和航向角都有微小的波动, 但均满足实验的要求. 从图6中可以看出, 与标准MPC方法相比, 其他两种控制方法的方向舵偏角有很大的波动. 此外, 从图5和图6可以看出, 当系统的状态不可测并且干扰未知时, 采用上文所提出的MPC方法得到的角速度和航向角, 与状态和干扰均已知时得到的角速度和航向角很接近.
为进一步验证所提出的高阶观测器的优越性, 当系统状态已知时, 在本文所提出的干扰补偿MPC方法的架构下, 采用高阶观测器来观测未知干扰, 与采用前一拍干扰测量值来估计未知干扰所得到的控制性能进行仿真对比, 仿真结果如图7和图8所示.
从图7可以看出, 采用基于高阶干扰观测器的MPC方法时, 所得角速度和航向角的波动明显小于采用基于前一拍干扰估计的MPC方法时角速度和航向角的波动. 从图8可以看出, 在两种方法下, 系统的输入曲线变化不大.
5. 结论
标准的MPC方法是解决具有状态和输入约束的离散时间线性系统控制问题的有效方法, 但当系统状态不可测并且受到未知的外部干扰影响时, 该方法往往是不可行的; 现有的干扰补偿MPC方法由于需要求解一个线性规划问题, 通常也是不可行的. 为解决这一问题, 本文提出了一种新的MPC方法, 该方法由高阶观测器、干扰补偿控制和标准的MPC组成. 高阶观测器可以实现状态和干扰的同步观测, 干扰补偿控制量通过求解一个线性方程得到. 采用所提出的MPC方法不仅能保证方法的可行性, 同时能使系统的输出响应接近采用标准MPC方法控制线性标称系统时得到的输出响应. 与现有的MPC方法相比, 本文提出方法的计算量小, 降低了求解优化问题的复杂度, 同时所采用的高阶观测器能更好地对状态和干扰进行观测, 减小了观测误差. 但所提方法也存在一些不足, 如高阶观测器在初始时刻产生较大的观测误差, 这会对系统的暂态性能产生影响. 因此, 在接下来的工作中需要进一步研究如何通过改进高阶观测器来降低初始时刻的观测误差以及系统的暂态性能.
-
-
[1] Qin S J, Badgwell T A. A survey of industrial model predictive control technology. Control Engineering Practice, 2003, 11(7): 733−764 doi: 10.1016/S0967-0661(02)00186-7 [2] 陈虹. 模型预测控制. 北京: 科学出版社, 2013, 1–12Chen Hong. Model Predictive Control. Beijing: Science Press, 2013. 1–12 [3] Kouro S, Cortes P, Vargas R, Ammann U, Rodriguez J. Model predictive control — a simple and powerful method to control power converters. IEEE Transactions on Industrial Electronics, 2009, 56(6): 1826−1838 doi: 10.1109/TIE.2008.2008349 [4] 席裕庚, 李德伟, 林姝. 模型预测控制 — 现状与挑战. 自动化学报, 2013, 39(3): 222−236Xi Yu-Geng, Li De-Wei, Lin Shu. Model predictive control — status and challenges. Acta Automatica Sinica, 2013, 39(3): 222−236 [5] Mayne D Q, Seron M M, Rakovic S V. Robust model predictive control of constrained linear systems with bounded disturbances. Automatica, 2005, 41(2): 245−250 [6] 牛宏, 张向帅, 张思远. 连续搅拌釜的非线性模型预测控制方法. 控制工程, 2017, 24(4): 752−755Niu Hong, Zhang Xiang-Shuai, Zhang Si-Yuan. Nonlinear model predictive control method for continuous stirred tank reactor. Control Engineering, 2017, 24(4): 752−755 [7] Zeilinger M N, Raimondo D M, Domahidi A, Morari M, Jones C N. On real-time robust model predictive control. Automatica, 2014, 50(3): 683−694 doi: 10.1016/j.automatica.2013.11.019 [8] Huang H, Li D W, Xi Y G. The improved robust model predictive control with mixed H2/H∞ control approach. Acta Automatica Sinica, 2012, 38(6): 944−949 [9] Villanueva M E, Quirynen R, Diehl M, Chachuat B, Houska B. Robust MPC via min-max differential inequalities. Automatica, 2017, 77: 311−321 doi: 10.1016/j.automatica.2016.11.022 [10] Li Z, Sun J. Disturbance compensating model predictive control with application to ship heading control. IEEE Transactions on Control Systems Technology, 2012, 20(1): 257−265 [11] Chen W H, Yang J, Guo L, Li S H. Disturbance-observe-based control and related methods — an overview. IEEE Transactions on Industrial Electronics, 2016, 63(2): 1083−1095 doi: 10.1109/TIE.2015.2478397 [12] Kim S K, Park C R, Yoon T W, Lee Y II. Disturbance-observer-based model predictive control for output voltage regulation of three-phase inverter for unint-erruptible-power-supply applications. European Journal of Control, 2015, 23(3): 71−83 [13] Purnawan H, Asfihani T, Adzkiya D, Subchan. Disturbance compensating model predictive control for warship heading control in missile firing mission. Journal of Physics: Conference Series, 2018, 1108(1): 1−6 [14] Liang L H, Wen Y. Integrated rudder/fin control with disturbance compensation distributed model predictive control. IEEE Access, 2018, 44: 72925−72938 [15] Wu C, Yang Y, Li S H, Li Q, Guo L. Disturbance observer based model predictive control for accurate atmospheric entry of spacecraft. Advances in Space Research, 2018, 61(9): 2457−2471 doi: 10.1016/j.asr.2018.02.010 [16] Zhang F, Zhang Y, Wu X, Shen J, Lee K Y. Control of ultra-supercritical once-through boiler-turbine unit using MPC and ESO approaches. In: Proceedings of the 2017 IEEE Conference on Control Technology and Applications (CCTA). Mauna Lani, USA: IEEE, 2017. 994–999 [17] Zhang F, Wu X, Shen J. Extended state observer based fuzzy model predictive control for ultra-supercritical boiler-turbine unit. Applied Thermal Engineering, 2017, 118: 90−100 doi: 10.1016/j.applthermaleng.2017.01.111 [18] Li W H, Sun Y Q, Chen H Q, Wang G. Model predictive controller design for ship dynamic positioning system based on state-space equations. Journal of Marine Science and Technology, 2016, 22(3): 426−431 [19] Simkoff J M, Wang S Y, Baldea M, Chiang L H, Castillo I, Bindlish R, Stanley D B. Plant-model mismatch evaluation for unconstrained MPC with state estimation. In: Proceedings of the 56th IEEE Annual Conference on Decision and Control (CDC). Melbourne, Australia: IEEE, 2017. 6177–6188 [20] Simkoff J M, Wang S Y, Baldea M, Chiang L H, Castillo I, Bindlish R, Stanley D B. Plant-model mismatch estimation in unconstrained state-space MPC. In: Proceedings of the 2017 American Control Conference (ACC). Seattle, USA: IEEE, 2017. 3078–3083 [21] Ohhira T, Shimada A. Movement control based on model predictive control with disturbance suppression using kalman filter including disturbance estimation. IEEJ Journal of Industry Applications, 2018, 7(5): 387−395 doi: 10.1541/ieejjia.7.387 [22] Scokaert P O M, Rawlings J B. Feasibility issues in linear model predictive control. Aiche Journal, 2010, 8(45): 1649−1659 [23] Gautam A, Soh Y C. Soft-constrained model predictive control based on off-line-computed feasible sets. In: Proceedings of the 52nd IEEE Conference on Decision and Control. Florence, Italy: IEEE, 2013. 5777–5782 [24] Zeilinger M N, Morari M, Jones C N. Soft constrained model predictive control with robust stability guarantees. IEEE Transactions on Automatic Control, 2014, 59(5): 1190−1202 doi: 10.1109/TAC.2014.2304371 [25] Abidi K, Xu J X. Advanced Discrete-Time Control Designs and Applications: Discrete-Time Sliding Mode Control. Singapur-Verlag: Springer, 2015. [26] Chang J L. Applying discrete-time proportional integral observers for state and disturbance estimations. IEEE Transactions on Automatic Control, 2006, 51(5): 814−818 doi: 10.1109/TAC.2006.875019 [27] Goodwin G C, Ramadge P J, Caines P E. Discrete-time multivariable adaptive control. IEEE Transactions on Automatic Control, 1980, 25(3): 449−456 doi: 10.1109/TAC.1980.1102363 期刊类型引用(11)
1. 董颖慧,陈健,吕成兴,张子叶,余继恒. 基于扰动观测器的水面无人船自适应模糊控制器设计. 控制理论与应用. 2024(02): 261-272 . 百度学术
2. 葛静,张传林,董鑫,冒建亮,曹忠昆. 一类输出受限非线性系统的降维非递归预设性能控制策略. 控制理论与应用. 2024(07): 1225-1234 . 百度学术
3. 韩春松,曹冉,魏瑶. 基于模型预测的事件触发多智能体系统设计. 齐齐哈尔大学学报(自然科学版). 2024(04): 1-4 . 百度学术
4. 肖振飞,刘宁,张亚军,柴天佑. 基于参数优化和补偿信号的非线性广义预测控制方法. 中国科学:信息科学. 2024(09): 2240-2262 . 百度学术
5. 张振,郭一楠,巩敦卫,朱松,田滨. 基于改进扩展状态观测器的液压锚杆钻机滑模摆角控制. 自动化学报. 2023(06): 1256-1271 . 本站查看
6. 朱可嘉,周子天,王友清. 网络环境下无人艇定位系统的主动容错控制. 控制工程. 2023(06): 969-980 . 百度学术
7. 储瑞婷,刘志全. 基于FTESO和漂角补偿的船舶航向滑模控制. 中国舰船研究. 2022(01): 71-79 . 百度学术
8. 李亨博,何发胜. 基于观测器的线性重复控制系统干扰抑制. 现代工业经济和信息化. 2022(06): 50-53+59 . 百度学术
9. 章沪淦,卜仁祥,李宗宣. 带状态观测器的船舶路径跟踪预测滑模控制. 计算机仿真. 2021(09): 262-266+271 . 百度学术
10. 李繁飙,黄培铭,阳春华,廖力清,桂卫华. 基于非线性干扰观测器的飞机全电刹车系统滑模控制设计. 自动化学报. 2021(11): 2557-2569 . 本站查看
11. 吴陶然. 模型预测算法结合灰色预测的自适应巡航控制. 农业装备与车辆工程. 2020(12): 80-84 . 百度学术
其他类型引用(14)
-