2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

非线性预测控制终端约束集的优化

于树友 冯阳阳 KIMJung-Su 陈虹

于树友, 冯阳阳, Kim Jung-Su, 陈虹. 非线性预测控制终端约束集的优化. 自动化学报, 2022, 48(1): 144−151 doi: 10.16383/j.aas.c200911
引用本文: 于树友, 冯阳阳, Kim Jung-Su, 陈虹. 非线性预测控制终端约束集的优化. 自动化学报, 2022, 48(1): 144−151 doi: 10.16383/j.aas.c200911
Yu Shu-You, Feng Yang-Yang, Kim Jung-Su, Chen Hong. Computation of terminal set for nonlinear model predictive control. Acta Automatica Sinica, 2022, 48(1): 144−151 doi: 10.16383/j.aas.c200911
Citation: Yu Shu-You, Feng Yang-Yang, Kim Jung-Su, Chen Hong. Computation of terminal set for nonlinear model predictive control. Acta Automatica Sinica, 2022, 48(1): 144−151 doi: 10.16383/j.aas.c200911

非线性预测控制终端约束集的优化

doi: 10.16383/j.aas.c200911
基金项目: 国家自然科学基金(U1964202), 工业物联网与网络化控制教育部重点实验室开放基金(2019FF01), 江苏省新能源汽车动力系统重点实验室开放课题(JKLNEVPS201901)资助
详细信息
    作者简介:

    于树友:吉林大学控制科学与工程系教授. 2011年获得德国斯图加特大学工学博士学位. 主要研究方向为预测控制, 鲁棒控制及其在机电系统中的应用. 本文通信作者. E-mail: shuyou@jlu.edu.cn

    冯阳阳:吉林大学控制科学与工程系博士研究生. 主要研究方向为预测控制, 分布式预测控制和车辆队列控制. E-mail: yyfeng19@mails.jlu.edu.cn

    KIMJung-Su:首尔国立科技大学电子与信息工程系教授. 主要研究方向为模型预测控制, 鲁棒控制和多智能体系统. E-mail: jungsu@seoultech.ac.kr

    陈虹:同济大学特聘教授、吉林大学唐敖庆讲座教授. 1997 年获得德国斯图加特大学工学博士学位. 主要研究方向为预测控制, 鲁棒控制, 非线性控制和汽车控制. E-mail: chenhong2019@tongji.edu.cn

Computation of Terminal Set for Nonlinear Model Predictive Control

Funds: Supported by National Natural Science Foundation of China (U1964202), the Foundation of Key Laboratory of Industrial Internet of Things and Networked Control (2019FF01), and the New Energy Vehicle Power System Key Laboratory in Jiangsu Province (JKLNEVPS201901)
More Information
    Author Bio:

    YU Shu-You Professor in Department of Control Science and Engineering, Jilin University. He received his Ph. D. degree in engineering from the University of Stuttgart, Germany in 2011. His research interest covers model predictive control, robust control and its applications in mechatronic systems. Corresponding author of this paper

    FENG Yang-Yang Ph. D. candidate in Department of Control Science and Engineering, Jilin University. His research interest covers model predictive control, distributed model predictive control, and control of vehicle platoons

    KIM Jung-Su Professor in Department of Electrical and Information Engineering, Seoul National University of Science and Technology. His research interest covers model predictive control, robust control, and multi-agent systems

    CHEN Hong Professor at Tongji University, and Tangaoqing joint professor at Jilin University. She received her Ph. D. degree in engineering from the University of Stuttgart, Germany in 1997. Her research interest covers model predictive control, robust control, nonlinear control, and automotive control

  • 摘要: 为保证预测控制的稳定性, 经典的策略是在预测控制的优化问题中加入终端约束集和终端惩罚函数, 并保证终端约束集是一个在终端控制律作用下的正不变集, 终端惩罚函数是受控系统的局部控制Lyapunov函数. 本文提供了一种求解非线性系统终端约束集、终端控制律和终端惩罚函数的新策略. 通过在优化问题中引入新的变量来降低求解终端约束条件的保守性, 并且可以从理论上保证求解得到的终端约束集更大. 通常情况下, 较大的终端约束集将允许选取的预测时域较小, 因而可以降低预测控制的在线计算负担. 从形式上看, 新的变量的引入使得终端约束集和终端惩罚项实现了某种程度的解耦, 即终端约束集不再是终端惩罚函数的水平截集. 最后通过仿真算例验证了所提策略的有效性.
  • 预测控制是对工业控制工程具有重大影响的先进控制算法[1], 大量应用于化工、冶金制造等过程控制领域[2]. 预测控制要求在每一个采样时刻, 根据系统当前时刻的状态采样值, 最小化系统的目标函数(性能指标), 获得有限时域的开环控制序列或者无限时域的闭环反馈控制律. 但只把控制序列或者反馈控制律的第一个片段作用于系统, 在下一个采样时刻根据新的测量值重新求解优化问题. 由于采用了开环滚动优化、闭环反馈矫正的形式, 预测控制可以解决非线性、约束系统的最优控制问题[3-6]; 也由于在每一个采样时刻重新求解优化问题, 在线修正预测轨迹, 因而具有很强的抗干扰能力[7-8].

    Grüne 在假设系统可控和优化问题具有滚动可行性的基础上, 提出了保证非线性预测控制稳定性的策略[9]. 为了保证预测控制的稳定性, 另一种方法是在优化问题中加入终端约束集和终端惩罚函数[10-11]. Grüne 的方法被称为无(终端)约束预测控制; 与之相对应, Chen等[10]和Mayne等[11]的方法被称为具有终端约束条件的预测控制. 通过合理地选择终端惩罚函数和终端约束集, 在假设优化问题在初始时刻具有可行解的条件下, 具有终端约束条件的预测控制能够保证优化问题具有滚动可行性和受控系统的渐近稳定性. 文献[12]深入分析了在优化问题中引入终端约束集和终端惩罚函数的优点和缺点.

    终端惩罚函数、终端约束集和终端控制律构成了保证稳定性的非线性预测控制方法中优化问题的基本要素, 三者需要离线求解, 共同决定了在线计算负担和闭环系统的性能. 如果系统是局部Lipschitz连续的, 文献[10]给出了连续时间约束非线性系统终端约束集存在的充分条件. Mayne 等在总结预测控制已有成果的基础上, 给出保证受控系统渐近稳定的终端要素需要满足的“公理性”条件[11]. 文献[13-14]将文献[10]给出的终端约束集存在的充分条件推广至离散时间非线性系统. 由于预测控制中终端约束集的大小决定了预测时域的选择, 而后者又决定了系统的在线计算负担, 因而很多工作着眼于如何求得更大的终端约束集. 利用非线性系统的局部线性微分包含, 文献[15-16]分别给出了椭球体和多面体型的终端约束集的求解方法. 考虑线性时不变系统, 文献[17]提出了时变的终端惩罚函数和时变的终端约束集的求取方法, 其中终端约束集是一族终端约束集的凸包, 并且凸包的加权系数是时变的. 在文献[17]工作的基础上, 文献[18]进一步研究了终端约束集族的构造方法. 文献[19]讨论了有限步终端惩罚函数和有限步终端约束集的构造方法, 可以得到更大的可行域(吸引域); 当步数选为1时, 该方法就还原为经典的终端惩罚函数和终端约束集的构造方法. 文献[20]给出了非线性系统时变终端约束集和时变终端惩罚函数的计算方法, 其中终端控制律可以是线性的, 也可以是非线性的. 通过估计非线性系统的高阶非线性项, 文献[21-22]给出了两种求解非线性预测控制终端约束集的方法, 可以用来求解高维非线性系统的终端惩罚函数和终端约束集. 上述方法都将终端约束集选择为终端惩罚函数的水平截集.

    本文提出了一种非线性预测控制终端约束集、终端惩罚函数和终端控制律的优化方法. 与已有的方法相比, 终端约束集不再是终端惩罚函数的水平截集. 终端控制律将终端约束集和终端惩罚函数联系起来: 当系统状态位于终端约束集时, 在终端控制律的作用下, 系统状态保持在终端约束集中(正不变性); 系统的终端惩罚函数是系统无穷维阶段代价的上界. 终端惩罚项和终端约束集的“解耦”通过在优化问题中引入新的优化变量实现, 因而提供了新的自由度, 降低了求解的保守性.

    符号说明.$ {{\bf{R}}} $为实数域, $ {\bf{R}}^n $$ n $维欧几里得空间, $ {{\bf{Z}}} $为非负的整数, $ {{\bf{Z}}}_+ $为正整数, ${\bf{Z}}_{[1, N]}$是指区间[1, N]内的整数. 符号$ k+i|k $代表在$ k $时刻预测一个(无限或者有限维)序列时, 该序列在$ k+i $时刻的预测值. 记${{M}}$$ {n\times n} $维的实数矩阵, ${{M}}\succ 0$$M\succeq 0$分别表示矩阵${{M}} $是正定对称的、半正定对称的, ${{M}}\prec 0$${{M}}\preceq 0$分别表示矩阵${{M}}$是负定对称的、半负定对称的. 对于向量${\boldsymbol{v}}\in {\bf{R}}^n,\;$$\|{\boldsymbol{v}}\|_Q = $$ \sqrt{{\boldsymbol{v}}^{\rm{T}}Q{\boldsymbol{v}}} ,\;$其中矩阵$Q\in $$ {\bf{R}}^{n\times n},\;$$Q\succeq 0 . \;$矩阵${{I}}$代表具有适当维数的单位矩阵; 对称矩阵$ \left[ {\begin{array}{*{20}{c}}{{a_{11}}}& * \\{{a_{21}}}&{{a_{22}}} \end{array}} \right] $中的$ \ast $代表对称矩阵中按照对角线对称的对应元素; det(X)是指方阵X的行列式.

    考虑离散时间非线性系统

    $$ x_{k+1} = f(x_{k}, \;u_{k}) $$ (1)

    其中, $ x_k \in {\bf{R}}^{n_x} $$ u_k \in {\bf{R}}^{n_u} $分别为系统在$ k $时刻的状态和控制输入, $ n_x\in {\bf{Z}}_+ $$ n_u\in {\bf{Z}}_+ $为系统的状态和控制输入的维数.

    考虑系统的输入和状态约束

    $$ u_k\in {\cal{U}},\quad \forall k\geq 0 \tag{2a}$$
    $$ x_k\in {\cal{X}},\quad \forall k\geq 0 \tag{2b} $$

    其中, $ {\cal{X}} $$ {\cal{U}} $为包含原点的有界闭集.

    本文中假设系统的状态$ x_k $是实时可测量的, 并且不考虑外部扰动、模型不确定性和测量噪声对系统动态的影响.

    假设$ f:{\bf{ R}}^{n_x}\times {\bf{R}}^{n_u} \rightarrow {\bf{R}}^{n_x} $是二次连续的, $ (0,0) $是系统的唯一平衡点.

    定义$ k $时刻的控制输入序列

    $$ U_k: = \{u_{k|k},\; u_{k+1|k}, \cdots,\; u_{k+N-1|k}\} $$ (3)

    $ k $时刻预测控制的有限时域优化问题可以描述为:

    问题 1.

    $$ \begin{split} &\underset{U_k}{\text{minimize}}\quad J({x}_k,\;U_k) \\ &\text{s. t.} \\ &x_{k+i+1|k} = f(x_{k+i|k},\;u_{k+i|k}),\quad x_{k|k} = x_k \end{split}\tag{4a} $$
    $$ x_{k+i|k}\in {\cal{X}},\; \; \quad\quad\quad\quad\quad i\in{{{\bf{Z}}}}_{[1,\; N-1]} \tag{4b}$$
    $$ u_{k+i|k}\in {\cal{U}}, \quad\quad\quad\quad\quad \;\; i\in{\bf{Z}}_{[0,\; N-1]}\; \; \tag{4c}$$
    $$ x_{k+N|k}\in {\cal{X}}_f \quad\quad\qquad\qquad\qquad \qquad \;\; \tag{4d}$$

    其中, $ N $为预测时域; $N\in {\bf{Z}}_+;$ $ x_{k+i|k} $是在控制$ u_{k+i|k} $的作用下系统起始于$ x_{k|k} $的预测状态轨迹; $ l(\cdot,\cdot) $是阶段代价(Cost stage)函数, 目标函数

    $$ J(x_k,\;U_k) = \sum\limits_{i = 0}^{N-1} l(x_{k+i|k},\; u_{k+i|k}) + E(x_{k+N|k}) $$ (5)

    阶段代价$ l(x,u):{\cal{X}}\times {\cal{U}} \rightarrow {\cal{U}} $关于自变量$ x $$ u $均是连续的, 并且满足 $ l(0,0) = 0 $和对所有的 $(x,u)\in $$ {\cal{X}}\times {\cal{U}}\setminus \{0,0\},\;$$l(x,u) > 0.$

    终端约束集$ {\cal{X}}_f $是平衡点的一个邻域; 终端惩罚函数$ E(x) $是半正定的, 并且当且仅当 $ x = 0 $时, $E(x) = 0 . \;$$ \kappa_f(x) $为终端控制律, 通常终端控制仅用来求解终端约束集$ {\cal{X}}_f $和终端惩罚函数$E(x), \;$不会直接作用于系统.

    下面的引理给出了为保证受控系统渐近稳定, 终端控制律、终端约束集和终端惩罚函数需要满足的条件. 在文献[11]中Mayne 等将上述条件称为保证预测控制系统渐近稳定的“公理(Axioms)”.

    引理 1[11]. 如果优化问题1在初始时刻$ k = 0 $有可行解, 并且终端约束集$ {\cal{X}}_f $、终端控制律$ \kappa_f(x) $和终端惩罚函数$ E(x) $满足如下的条件:

    1) ${\cal{X}}_f\subseteq {{\cal{X}}},\;$$ {\cal{X}}_f $ 是一个闭集, $0\in{\cal{X}}_f ;\;$

    2) $\kappa_f(x)\in {{\cal{U}}},\;$ $\forall x\in{\cal{X}}_f ;\;$

    3) $f(x,\;\kappa_f(x))\in{\cal{X}}_f,\;$ $\forall x\in{\cal{X}}_f;\;$

    4) $E(x_{k\,+\,i\,+\,1|k})\,-\,E(x_{k\,+\,i|k})\,+\,l(x_{k\,+\,i|k},$

    $\kappa(x_{k+i|k}))\leq 0, $ $\forall x\in{\cal{X}}_f.$

    其中, 终端惩罚函数$ E(\cdot) $是非线性系统 (1)的一个局部的Lyapunov函数. 则

    $1)$ 优化问题1在任意时刻$ k\geq 0 $均有可行解;

    $2)$ 在预测控制的作用下, 系统渐近稳定.

    条件1)和2)表明在终端约束集中状态约束和控制约束均得到满足; 条件3)表明在终端控制律的作用下, 终端约束集是一个控制的不变集(即在终端控制律的作用下, 如果当前时刻系统的状态在终端约束集中, 则下一时刻系统的状态仍然在终端约束集中); 条件4) 表明在终端约束集内, 在终端控制律的作用下, 代价函数沿着系统轨迹单调递减.

    记系统(1)在平衡点$ (0,0) $的局部Lipschitz 线性化系统为

    $$ \bar{x}_{k+1} = A\bar{x}_{k}+B\bar{u}_{k} $$ (6)

    其中, $A: = \dfrac{\partial f}{\partial x}|_{(0,\;0)},\;$$B: =\dfrac {\partial f}{\partial u}|_{(0,\;0)}.$

    假设系统 (6)是可镇定的, 即存在一个线性反馈控制律$ Fx $使得$ A+BF $的特征根在单位圆内. 选择终端惩罚函数为系统局部的Lyapunov函数, 终端约束集为终端代价函数的水平截集. 针对连续时间非线性系统和离散时间非线性系统, 文献[10, 13]分别给出了终端约束集、终端控制律和终端惩罚函数存在的充分条件.

    如果选取终端约束集为终端代价函数的水平截集

    $$ \tilde{{\cal{X}}}_f: = \{x\in {\bf{R}}^{n_x} | E(x)\leq \alpha,\; \alpha>0\} $$

    则条件4)就内在地包含了条件3). 此时, 终端惩罚函数、终端约束集和终端控制律需要满足的4个条件就相应地简化为3个条件:

    1) $\tilde{{\cal{X}}}_f\subseteq {{\cal{X}}} ,\;$$ \tilde{{\cal{X}}}_f $ 是一个闭集, $0\in\tilde{{\cal{X}}}_f ;$

    2) $\kappa_f(x)\in {{\cal{U}}},\;$ $\forall x\in\tilde{{\cal{X}}}_f ;$

    3) $E(x_{k\,+\,i\,+\,1|k})\,-\,E(x_{k\,+\,i|k})\,+\,l(x_{k\,+\,i|k},$

    $\kappa(x_{k+i|k}))\leq 0 , $ $\forall x\in\tilde{{\cal{X}}}_f .$

    针对离散时间非线性系统, 本文讨论非线性预测控制终端约束集、终端控制律和终端惩罚项的优化方法. 本文的结果中, 终端惩罚函数和终端约束集内的局部Lyapunov函数是不同的, 终端约束集也可以不再是终端惩罚函数的水平截集.

    为简化, 考虑如下多面体形式的状态约束和控制输入约束

    $$ {{\cal{C}}}: = \left\{\begin{bmatrix}x\\ u\end{bmatrix}\in {\bf{R}}^{n_x+n_u}\mid c_jx+d_ju\leq 1,\; j = 1,\cdots,\;p\right\} $$ (7)

    其中, $ c_{j}\in {\bf{R}}^{1\times n_x} $$ d_j\in{\bf{ R}}^{n_u} $是常向量; 系统要求对任意的$ k\geq 0,$ $(x_k,\; u_k)\in {{\cal{C}}}.$

    选择二次阶段代价, 即$l(x,\;u) = \|x\|_Q^2+\|u\|_R^2,$其中$Q,\;R$为权重矩阵, $Q\in {\bf R} ^{{n_x}\times{n_x}},\; { R}\in {\bf R}^{{n_x}\times{n_x}},$ $Q\succeq 0$$R\succ 0 .$

    本节首先介绍非线性系统 (1)的多胞体线性微分包含[23-24], 在此基础上讨论非线性预测控制终端约束集和终端代价函数的求解方法. 非线性系统的线性微分包含本质上是一个由系统构成的集合, 非线性系统只是集合内的一个“元素”. 如果集合(非线性系统的线性微分包含)具有某种属性, 则作为集合中的一个特定元素的非线性系统也具有这一属性.

    假设

    $$ f(x,\; u)\in\Omega, \quad \forall (x,\; u)\in {{\cal{C}}} $$ (8)

    其中,

    $$ \Omega: = Co\left\{ [A_1 | B_1],\; [A_2 | B_2],\cdots,\; [A_L | B_L]\right\} $$

    $ Co $代表元素的凸组合, 即存在$ L $个非负的标量$\lambda_i ,\;$$i = 1, \;2, \cdots,\; L,\;$使得

    $$ \sum\limits_{i = 1}^{L}\lambda_i(k) = 1,\; f(x_k,\;u_k) = \sum\limits_{i = 1}^{L}\lambda_i(k)[A_i | B_i]$$ (9)

    注 1. 终端约束集是系统平衡点的某一个邻域, 因而在求取终端约束集时可以只关心平衡点某一邻域的微分包含. 具体地, 可以寻找$ {{\cal{C}}}_0\subset {{\cal{C}}} $使得

    $$ f(x,\; u)\in\Omega_0, \quad \forall (x,\; u)\in {{\cal{C}}}_0 $$

    其中, $ \Omega_0 $是平衡点邻域 $ {{\cal{C}}}_0 $的线性微分包含. 当然, 在求取了终端约束集$ {\cal{X}}_f $后还需要检查是否满足${\cal{X}}_f\subseteq \Omega_0 .$

    下面的定理给出了求取非线性系统 (1) 终端约束集、终端惩罚函数和终端控制律的方法.

    定理 1. 对非线性系统 (1), 假设系统的一个多胞体线性微分包含为式 (8). 如果存在矩阵$G ,\;$$ Y $和对称正定矩阵$X_1 ,\;$$X_2,\;$使得

    $$ \begin{array}{l} \begin{bmatrix} G+G^{\rm{T}}-X_1 & \ast & \ast & \ast \\ A_iG+B_iY & X_1 & \ast & \ast \\ Q^{\frac{1}{2}}G & 0 & I & \ast \\ R^{\frac{1}{2}}Y & 0 & 0 & I \end{bmatrix}\succeq 0\qquad\quad \end{array} $$ (10)
    $$ \begin{array}{l} \begin{bmatrix} G+G^{\rm{T}}-X_2 & \ast \\ A_iG+B_iY & X_2 \end{bmatrix}\succeq 0, \quad\forall i = 1,\; 2, \cdots,\; L \end{array} $$ (11)
    $$ \begin{array}{l} \begin{bmatrix} G+G^{\rm{T}}-X_2 & \ast \\ c_jG+d_jY & 1 \end{bmatrix}\succeq 0,\; \forall j = 1,\; 2, \cdots,\; p \end{array} $$ (12)

    则:

    $1)$ 线性反馈控制律$ u = Fx ,$ $ F = YG^{-1} $可以选作系统的终端控制律;

    $2)$ 椭圆域${\cal{X}}_f: = \left\{x\in {\bf{R}}^{n_x} | x^{\rm{T}}X_2^{-1}x\leq 1\right\}$可以选作系统的终端约束集;

    $3)$ $E(x): = x^{\rm{T}}X_1^{-1}x$可以选作系统的终端惩罚函数.

    证明. 下面将逐一证明按照这种方式选择的终端控制律、终端惩罚函数和终端约束集满足引理1列举的4个条件.

    1) 考虑线性反馈控制律$ u = Fx $和二次终端惩罚函数$E(x) = x^{\rm{T}}X_1^{-1}x, \;$条件

    $$ E(x_{k+i+1|k})-E(x_{k+i|k})+l(x_{k+i|k},\;Fx_{k+i|k})\leq 0 $$

    成立等价于

    $$ \begin{split} &{x^{\rm{T}}}_{k + i|k}\Big\{ {{{\left[ {{A_i} + {B_i}F} \right]}^{\rm{T}}}{X_1}^{ - 1}\left[ {{A_i} + {B_i}F} \right] - } \\ & {{X_1}^{ - 1} + Q + {F^{\rm{T}}}RF} \Big\}{x_{k + i|k}} < 0 \end{split} $$

    上式成立的充分条件[25-26]是对于任意的$i = 1, $$ 2, \cdots,\; L,\;$

    $$ \begin{array}{l} \begin{bmatrix} X_1 & \ast & \ast & \ast \\ (A_i+B_iF)X_1 & X_1 & \ast & \ast \\ Q^{\frac{1}{2}}X_1 & 0 & I & \ast \\ R^{\frac{1}{2}}FX_1 & 0 & 0 & I \end{bmatrix}\succeq 0 \end{array} $$ (13)

    式(10)中$\{2,\;2\}$项表明$X_1\succeq 0;\;$$\{1,\;1\}$项表明$G+G^{\rm{T}}\succeq X_1.\;$由于$ X_1\succeq 0 $$G+G^{\rm{T}}\succeq X_1 , \;$矩阵$ G $ 是非奇异的. 进一步地, 由于$ X_1\succeq 0 $$(G- X_1)^{\rm{T}}\times $$ X_1^{-1}(G-X_1)\succeq 0,\;$ 所以

    $$ 0\preceq G+G^{\rm{T}}-X_1\preceq G^{\rm{T}}X_1^{-1}G $$ (14)

    考虑到$F = YG^{-1}$$0\preceq G+G^{\rm{T}}-X_1\preceq G^{\rm{T}}X_1^{-1}G$, 式 (10) 表明

    $$ \begin{array}{l} \begin{bmatrix} G^{\rm{T}}X_1^{-1}G & \ast & \ast & \ast \\ (A_i+B_iF)G & X_1 & \ast & \ast \\ Q^{\frac{1}{2}}G & 0 & I & \ast \\ R^{\frac{1}{2}}FG & 0 & 0 & I \end{bmatrix}\succeq 0,\; \forall i = 1,\; 2, \cdots,\; L \end{array} $$ (15)

    对式 (15) 两端分别左乘${\rm{diag}}\{X_1G^{-{\rm{T}}},\; I,\; $$ I,\; I\}$和右乘${\rm{diag}}\{G^{-1}X_1,\; I,\; I,\; I\},\;$ 可以得到式 (13) 成立. 即在终端控制律的作用下, 沿着系统的状态轨迹优化问题的代价函数是最优的.

    2) 采用与上述相似的推理, 可以得到

    $$ 0\preceq G+G^{\rm{T}}-X_2\preceq G^{\rm{T}}X_2^{-1}G $$ (16)

    考虑到$F = YG^{-1}$$0\preceq G+G^{\rm{T}}-X_2\preceq G^{\rm{T}}X_2^{-1}G$, 式 (11) 表明

    $$ \begin{array}{l} \begin{bmatrix} G^{\rm{T}}X_2^{-1}G & \ast \\ (A_i+B_iF)G & X_2 \end{bmatrix}\succeq 0, \quad\forall i = 1,\; 2, \cdots,\; L \end{array} $$ (17)

    对式 (17) 两端分别左乘${\rm{diag}}\{X_2G^{-{\rm{T}}},\; I\}$和右乘${\rm{diag}}\{G^{-1}X_2,\; I\} ,\;$ 可以得到

    $$ \begin{array}{l} \begin{bmatrix} X_2^{-1} & \ast \\ (A_i+B_iF) & X_2 \end{bmatrix}\succeq 0, \quad\forall i = 1,\; 2, \cdots,\; L \end{array} $$ (18)

    利用Schur补定理[23], 有

    $$ X_2^{-1}-(A_i+B_iF)^{\rm{T}}X_2^{-1}(A_i+B_iF)\succeq 0 $$ (19)

    定义$V(x) = x^{\rm{T}}X_2^{-1}x$作为系统平衡点邻域的候选Lyapunov函数. 式(19)保证在线性反馈控制律$ u = Fx $ 的作用下

    $V(x_{k+i+1|k})-V(x_{k+i|k})+ l(x_{k+i+1|k}, \;Fx_{k+i+1|k})\leq 0\;$

    因此, $V(x) = x^{\rm{T}}X_2^{-1}x$ 沿着非线性系统 (1)的状态轨迹单调递减.

    如果在某一时刻$h_0 ,\;$$x_{h_0}\in {\cal{X}}_f, \;$则对于任意的$k\geq h_0 ,\;$$x_{k}\in {\cal{X}}_f. \;$即在状态反馈控制律$ u = Fx $的作用下, 椭圆域$ {\cal{X}}_f $是非线性系统 (1) 的不变集.

    3) 考虑到$F = YG^{-1}$$0\preceq G+G^{\rm{T}}-X_2\preceq G^{\rm{T}}\times $$ X_2^{-1}G,$ 式 (12) 表明

    $$ \begin{array}{l} \begin{bmatrix} G^{\rm{T}}X_2^{-1}G & \ast \\ (c_j+d_jF)G & 1 \end{bmatrix}\succeq 0,\; \forall j = 1,\; 2, \cdots,\; p \end{array} $$ (20)

    对式 (20) 两端分别左乘${\rm{diag}}\{X_2G^{-{\rm{T}}},\; I\}$和右乘${\rm{diag}}\{G^{-1}X_2,\; I\},$ 可以得到

    $$ \begin{array}{l} \begin{bmatrix} X_2^{-1} & \ast \\ (c_j+d_jF) & 1 \end{bmatrix}\succeq 0,\; \forall j = 1,\; 2, \cdots,\; p \end{array} $$ (21)

    利用Schur补定理, 上式等价于

    $$ X_2^{-1}\succeq (c_j+d_jF)^{\rm{T}}(c_j+d_jF) $$ (22)

    由于$1\geq x^{\rm{T}}X_2^{-1}x$$x^{\rm{T}}X_2^{-1}x\geq x^{\rm{T}}(c_j+d_jF)^{\rm{T}} $$ (c_j+d_jF)x,\;$可以得到在终端约束集中满足约束$(c_j+d_jF)x\leq 1 .$

    注 2. 从形式上看, 定理$ 1 $中终端约束集${\cal{X}}_f: = $$ \{x\in {\bf{R}}^{n_x} | x^{\rm{T}}X_2^{-1}x\leq 1\}$不再是终端惩罚函数$x^{\rm{T}}X_1^{-1}x$的水平截集.

    注 3. 终端控制律没有真正作用于系统; 终端控制律使得系统在终端约束集中是正不变的(系统状态进入终端约束集后将不再离开终端约束集); 在终端控制律的作用下, 在终端约束集中系统满足输出约束 (7); 终端控制律使得系统的动态轨迹具有某种最优性(最优代价).

    椭圆域${\cal{X}}_f: = \{x\in{\bf{R}}^{n_x}\mid x^{\rm{T}}X_2^{-1}x\leq 1\}$的容量(椭圆域包含点的个数)与$ \det(X_2) $成正比[23]. 目标函数$ \det(\cdot) $不是变量的凸函数, 但是可以通过对数变换[27] 或者求取特征值的几何均值[28] 将求取对称矩阵最大行列式的非凸优化问题转变为凸优化问题. 本文采用文献[28]介绍的求取特征值的几何均值方法.

    考虑如下的优化问题:

    问题 2.

    $$ \underset{X_1\succeq 0,\; X_2\succeq 0, \;G,\; Y}{\text{maximize}}\quad\left(\det \left(X_2\right)\right)^{\tfrac{1}{n_x}} \tag{23a}$$
    $$ \begin{split} &\text{s. t.} \\ &\qquad\begin{bmatrix} G+G^{\rm{T}}-X_1 & \ast & \ast & \ast \\ A_iG+B_iY & X_1 & \ast & \ast \\ Q^{\frac{1}{2}}G & 0 & I & \ast \\ R^{\frac{1}{2}}Y & 0 & 0 & I \end{bmatrix}\succeq 0 \end{split}\tag{23b} $$
    $$ \begin{array}{l} \begin{bmatrix} G+G^{\rm{T}}-X_2 & \ast \\ A_iG+B_iY & X_2 \end{bmatrix}\succeq 0, \quad\forall i = 1,\; 2, \cdots, \;L \end{array} \tag{23c}$$
    $$ \begin{array}{l} \begin{bmatrix} G+G^{\rm{T}}-X_2 & \ast \\ c_jG+d_jY & 1 \end{bmatrix}\succeq 0,\; \forall j = 1,\; 2, \cdots,\; p \end{array}\tag{23d} $$

    问题$ 2 $是一个凸优化问题[28]. 通过求解凸优化问题$ 2 $可以得到参数矩阵$X_1,\;X_2 ,\;$$ Y $$G .\;$ 在此基础上, 利用$ F = YG^{-1} $得到终端控制律$u = Fx ;\;$相应系统的终端惩罚项为$x^{\rm{T}}X_1^{-1}x ,\;$系统的终端约束集为${\cal{X}}_f: = \{x\in {\bf{R}}^{n_x}\mid x^{\rm{T}}X_2^{-1}x\leq 1\} .$

    离散系统终端约束集也可以通过求解下面的优化问题得到[29-30].

    问题 3.

    $$ \underset{X\succeq 0,\; Y}{\text{maximize}}\quad\left(\det \left(X\right)\right)^{\tfrac{1}{n_x}}\tag{24a} $$
    $$ \begin{split} &\text{s. t.} \\ & \begin{bmatrix} X & \ast & \ast & \ast \\ A_iX+B_iY & X & \ast & \ast \\ Q^{\frac{1}{2}}X & 0 & I & \ast \\ R^{\frac{1}{2}}Y & 0 & 0 & I \end{bmatrix}\succeq 0,\; \forall i = 1,\; 2, \cdots,\; L \end{split}\tag{24b} $$
    $$ \begin{array}{l} \begin{bmatrix} X & \ast \\ c_jX+d_jY & 1 \end{bmatrix}\succeq 0,\; \forall j = 1,\; 2, \cdots,\; p \end{array}\tag{24c} $$

    则系统的终端约束集为$\tilde{{\cal{X}}}_f = \{x\in {\bf{R}}^{n_x}| x^{\rm{T}}X^{-1}x\leq $$ 1\} ,$ 对应系统的终端控制律为$u = YX^{-1}x ,$ 系统的终端惩罚函数为$x^{\rm{T}}X^{-1}x .$

    在问题$ 2 $中, 如果选择$X_1 = X_2 = G , \;$ 则问题$ 2 $ 和问题$ 3 $等价, 从而$\tilde{{\cal{X}}}_f\subseteq {\cal{X}}_f .$ 由于在优化问题中引入了新的自由变量$ X_2 $$G ,\;$ 因而可以从理论上保证求取问题$ 2 $得到的终端约束集更大. 求取问题$ 2 $和问题$ 3 $得到的终端约束集均为椭圆集, 区别在于求取问题$ 3 $得到的终端约束集是终端惩罚函数的水平截集, 求取问题$ 2 $得到的终端约束集与增加的一个自由变量$ X_2 $相关, 是正定函数$x^{\rm{T}}X_2x$的水平截集. 进一步地, 由于均采用线性矩阵不等式求解优化问题, 并且求取过程是离线进行, 设计过程复杂性的有限提高仍然在可接受范围内.

    需要强调的是, 终端约束集变大有可能导致系统动态性能变差.

    考虑离散时间非线性系统

    $$ {x}_{k+1,\;1} = x_{k,\;1}+1.5x_{k,\;2}+u_k(0.5+0.1x_{k,\;1}) \tag{25a}$$
    $$ {x}_{k+1,\;2} = 0.5x_{k,\;1}+x_{k,\;2}+u_k(0.5-0.2x_{k,\;2}) \tag{25b}$$

    非线性系统(25)在平衡点$ (0, 0) $处Jacobi线性化得到的线性系统是开环不稳定的, 但是可控的.

    考虑控制约束

    $$ -1 \leq u_k \leq 1, \;\forall k\geq 0 $$ (26)

    阶段代价函数 $l(x,\;u) = x^{\rm{T}}Qx+u^{\rm{T}}Ru$ 中的权矩阵$ Q $$ R $分别为

    $$ Q = \begin{bmatrix} 0.5 & 0\\ 0 & 0.5 \end{bmatrix}, \quad R = 1 $$ (27)

    将系统(25)写成如下形式

    $$ \begin{array}{l} {x}_{k+1,\;1} = x_{k,\;1}+0.1\mu x_{k,\;1} +1.5x_{k,\;2}+0.5 u_k\\ {x}_{k+1,\;2} = 0.5x_{k,\;1}+x_{k,\;2}-0.2\mu x_{k,\;2} +0.5 u_k \end{array} $$

    其中, $ \mu = u_k $可以视为一个时变参数. 考虑到$u_k\in $$ [-1, 1] ,$ 则系统的一个多面体线性微分包含为

    $$ \Omega: = Co\left\{ [A_1 | B_1],\; [A_2 | B_2]\right\} $$

    其中,

    $$ \begin{array}{l} A_1 = \begin{bmatrix} 1.1 & 1.5\\ 0.5 & 0.8 \end{bmatrix},\; B_1 = \begin{bmatrix} 0.5 \\ 0.5 \end{bmatrix} \end{array} $$
    $$ \begin{array}{l} A_2 = \begin{bmatrix} 0.9 & 1.5\\ 0.5 & 1.2 \end{bmatrix}, \;B_2 = \begin{bmatrix} 0.5 \\ 0.5 \end{bmatrix} \end{array} $$

    分别采用文献[30]和本文介绍的方法求取系统的终端不变域, 相应的系统终端约束集如图1, 其中虚线对应的椭圆是采用文献[30]中介绍的方法(求解问题$ 3 $) 得到的, 实线对应的椭圆是采用本文介绍的方法得到的. 从图中可以看出, 采用本文介绍的方法扩大了系统的终端约束集.

    图 1  终端约束集
    Fig. 1  Terminal constraint set

    在本例中, 应用本文介绍的方法得到的终端惩罚函数为$x^{\rm{T}}X_1^{-1}x ,\;$ 其中$X_1 =\left[ \begin{aligned}\;\;\;0.4565 \;\; -0.1367\\ -\;0.1367 \;\; 0.1481\;\; \end{aligned}\right]$; 终端约束集为$\mathcal{X}_f: = \{x\in{\bf{ R}}^{n_x}\mid x^{\rm{T}}X_2^{-1}x\leq 1\} ,\;$ 其中$X_2 = \left[\begin{aligned}\;\;\;2.8514 \;\; -1.5436\\ -\;1.5436 \;\; 1.0824\;\; \end{aligned} \right];$ 终端控制律$u =[-1.1181 $$-1.9461]x. $

    应用文献[30]介绍的方法得到的终端惩罚函数为$x^{\rm{T}}X^{-1}x,\;$ 其中$X = \left[\begin{aligned}\;\;\;1.1589 \;\; -0.5817\\ -\;0.5817 \;\; 0.4508\;\; \end{aligned}\right];$ 终端约束集为$\tilde{\mathcal{X}}_f: = \{x\in {\bf{R}}^{n_x}\mid x^{\rm{T}}X^{-1}x\leq 1\} ,\;$ 终端控制律$u = [-1.0978\;\; $$ -1.8511]x.$

    图2 ~ 图4给出了初始状态为 $x_0 = \left[-1.5 \;\;1.5 \right]^{\rm{T}}$时系统的动态响应, 实线为采用本文方法求取的终端约束条件对应的系统动态, 虚线为采用文献[30]中介绍的方法求取的终端约束条件对应的系统动态. 从图中可以看出, 在满足控制输入约束的情况下系统动态轨迹渐近趋于平衡点; 并且采用本文介绍的方法并没有使得系统的动态性能变差. 上述仿真中, 预测时域和控制时域相等, 均为5.

    图 2  系统的动态响应: x1
    Fig. 2  Dynamic response of the system: x1
    图 3  系统的动态响应: x2
    Fig. 3  Dynamic response of the system: x2
    图 4  系统的动态响应: u
    Fig. 4  Dynamic response of the system: u

    需要指出的是, 在状态空间的某些点处, 在相同的预测时域和控制时域下, 本文介绍的方法有可行解, 而采用文献[30]中介绍的方法没有可行解.

    针对离散时间非线性系统, 本文提出了一种非线性预测控制终端约束集的优化方法. 从内容上看, 本文提出的优化方法比文献[29-30]中的经典优化算法多了自由变量, 因而可以从理论上保证所求得的终端约束集比该经典优化方法更大, 进而可以通过选择更短的预测时域来降低预测控制在线计算负担; 从形式上看, 本文提出的方法可以实现终端惩罚函数和终端约束集的某种解耦, 即终端约束集不再是终端惩罚函数的水平截集. 但终端约束集和终端惩罚函数仍然通过终端控制律联系起来: 终端约束集是受控系统在终端控制律作用下的不变集; 当系统状态在终端约束集时, 在终端控制律的作用下, 终端惩罚函数是系统的无穷时域阶段代价的上界. 最后通过仿真算例验证了所提方法的有效性.

  • 图  1  终端约束集

    Fig.  1  Terminal constraint set

    图  2  系统的动态响应: x1

    Fig.  2  Dynamic response of the system: x1

    图  3  系统的动态响应: x2

    Fig.  3  Dynamic response of the system: x2

    图  4  系统的动态响应: u

    Fig.  4  Dynamic response of the system: u

  • [1] Maciejowski J M. Predictive Control With Constraints. London: Prentice Hall, 2001.
    [2] Qin S J, Badgwell T A. A survey of industrial model predictive control technology. Control Engineering Practice, 2003, 11(7):733-764. doi: 10.1016/S0967-0661(02)00186-7
    [3] Grüne L, Pannek J. Nonlinear Model Predictive Control: Theory and Algorithms. New York: Springer, 2011.
    [4] 席玉庚. 预测控制. 北京: 国防工业出版社, 2013.

    Xi Yu-Geng. Predictive Control. Beijing: National Defense Industry Press, 2013.
    [5] 陈虹. 模型预测控制. 北京: 科学出版社, 2013.

    Chen Hong. Model Predictive Control. Beijing: China Science Press, 2013.
    [6] Rawlings J B, Mayne D Q, Diehl M. Model Predictive Control: Theory, Computation, and Design (2nd Edition). Madison, Wisconsin: Nob Hill Publishing, LLC, 2017.
    [7] Yu S, Reble M, Chen H, Allgower F. Inherent robustness properties of quasi-infinite horizon nonlinear model predictive control. Automatica, 2014, 50(9):2269-2280. doi: 10.1016/j.automatica.2014.07.014
    [8] Allan D A, Bates C N, Risbeck M J, Rawlings J B. On the inherent robustness of optimal and suboptimal nonlinear MPC. Systems & Control Letters, 2017, 106:68–78.
    [9] Grüne L. Analysis and design of unconstrained nonlinear MPC schemes for finite and infinite dimensional systems. SIAM Journal on Control and Optimization, 2010, 48: 1206–1228
    [10] Chen H, Allgower F. A quasi-infinite horizon nonlinear model predictive control scheme with guaranteed stability. Automatica, 1998, 34(10):1205–1217. doi: 10.1016/S0005-1098(98)00073-9
    [11] Mayne D Q, Rawlings J B. Constrained model predictive control: stability and optimality.Automatica, 2000, 36(6):789–814. doi: 10.1016/S0005-1098(99)00214-9
    [12] Mayne D Q. An apologia for stabilising terminal conditions in model predictive control. International Journal of Control, 2013, 86(11):2090–2095. doi: 10.1080/00207179.2013.813647
    [13] Yu S, Qu T, Xu F, Chen H. Stability of finite horizon model predictive control with incremental input constraints. Automatica, 2017, 79:265–272. doi: 10.1016/j.automatica.2017.01.040
    [14] Rajhans C, Patwardhan S C, Pillai H K. Discrete time formulation of quasi infinite horizon nonlinear model predictive control scheme with guaranteed stability. In IFAC-Papers OnLine, 2017, 50(1):7181–7186. doi: 10.1016/j.ifacol.2017.08.602
    [15] 于树友, 陈虹, 张鹏, 李学军. 一种基于LMI的非线性模型预测控制终端域优化方法.自动化学报, 2008, 34(7):798-804.

    Yu S, Chen H, Zhang P, Li X J. An LMI optimization approach for enlarging the terminal region of NMPC, Acta Automatica Sinca, 2008, 34, (7):798–804.
    [16] Cannon M, Deshmukh V, Kouvaritakis B. Nonlinear model predictive control with polytopic invariant sets. Automatica, 2003, 39:1487–1494. doi: 10.1016/S0005-1098(03)00128-6
    [17] Pluymers B, Roobrouck L, Buijs J, Suykens J, Moor B. Constrianed linear MPC with time-varying terminal cost unsing convex combinations. Automatica, 2005, 41(5):831-837. doi: 10.1016/j.automatica.2004.11.023
    [18] Fitri I R, Kim J S, Yu S, Lee Y I. Computation of feasible and invariant sets for interpolationbased MPC. International Journal of Control, Automation, and Systems,
    [19] Mircea L, Spinu V. Finite-step terminal ingredients for stabilizing model predictive control. In IFAC-Papers OnLine, 2015, 48(23):9-15. doi: 10.1016/j.ifacol.2015.11.256
    [20] Lazar M, Tetteroo M. Computataion of terminal sets and sets for discrete time nonlinear mpc. IFAC-Papers OnLine 2018, 51(20):141–146. doi: 10.1016/j.ifacol.2018.11.006
    [21] Rajhans C, Griffith D, Patwardhan S C, Biegler L T, Pillai H K. Two approaches for terminal region characterization in discrete time quasi-infinite horizon NMPC. In: Proceedings of the 6th IFAC Conference on Nonlinear Model Predictive Control. Madison, WL, USA: IFAC, 2018. 19−22
    [22] Rajhans C, Griffith D, Patwardhan S C, Biegler L T, Pillai H K. Terminal region characterization and stability anslysis of discrete time quasi-infinite horizon nonlinear model predictive control.Journal of Process Control, 2019, 83:30–52. doi: 10.1016/j.jprocont.2019.08.002
    [23] Boyd S, Ghaoui L E, Feron E, Balakishnan V. Linear Matrix Inequalities in System and Control Theory. Philadelphia: SIAM, 1994.
    [24] Kothare M V, Balakrishnan V, Morari M. Robust constrained model predictive control using linear matrix inequalities. Automatica, 1996, 32(10):1361–1379. doi: 10.1016/0005-1098(96)00063-5
    [25] Oliveira M, Bernussou J, Geromel J C. A new discrete-time robust stability condition. Systems & Control Letters, 1999, 37(4):261-265.
    [26] Cuzzola F, Geromel J C, Morari M. An improved approach for constrained robust model predictive control. Automatica, 2002, 38(7):1183–1189. doi: 10.1016/S0005-1098(02)00012-2
    [27] Vandenberghe L, Boyd S, Wu S P. Determinant Maximization with Linear Matrix Inequality Constraints. Siam Journal on Matrix Analysis & Applications, 1998, 19(2):499-533.
    [28] Nesterov Y, Nemirovsky A. Interior Point Polynomial Methods in Convex Programming. Philadelphia, USA: SIAM Publications, 1994.
    [29] Bohm C, Raff T, Findeisen R, Allgower F. Calculating the terminal region of NMPC for Lure systems via LMIs. In: Proceedings of the 2008 American Control Conference. Seattle, WA, USA: IEEE, 2008. 1127−1132
    [30] Bohm C, Yu S, Allgower F. Predictive control for constrained discrete-time periodic systems using a time-varying terminal region. IFAC Proceedings Volumes, 2009, 42(13):537-542. doi: 10.3182/20090819-3-PL-3002.00093
  • 期刊类型引用(3)

    1. 秦明星,王忠,李海龙,刘鑫. 基于分布式模型预测的无人机编队避障控制. 北京航空航天大学学报. 2024(06): 1969-1981 . 百度学术
    2. 郑德红,殷利平. 基于扰动观测器的输入饱和非线性系统运行优化控制. 科学技术与工程. 2024(35): 15082-15089 . 百度学术
    3. 张蕾,李义帅,王晓华,王文杰. 联合仿真下机械臂终端约束模型预测控制方法. 西安工程大学学报. 2022(04): 118-126 . 百度学术

    其他类型引用(4)

  • 加载中
图(4)
计量
  • 文章访问数:  1681
  • HTML全文浏览量:  409
  • PDF下载量:  383
  • 被引次数: 7
出版历程
  • 收稿日期:  2020-11-02
  • 录用日期:  2021-04-02
  • 网络出版日期:  2021-05-25
  • 刊出日期:  2022-01-25

目录

/

返回文章
返回