2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

无偏模型预测控制综述

王浩坤 徐祖华 赵均 江爱朋

王浩坤, 徐祖华, 赵均, 江爱朋. 无偏模型预测控制综述. 自动化学报, 2020, 46(5): 858-877. doi: 10.16383/j.aas.c180415
引用本文: 王浩坤, 徐祖华, 赵均, 江爱朋. 无偏模型预测控制综述. 自动化学报, 2020, 46(5): 858-877. doi: 10.16383/j.aas.c180415
WANG Hao-Kun, XU Zu-Hua, ZHAO Jun, JIANG Ai-Peng. A Survey on Ofiset-free Model Predictive Control. ACTA AUTOMATICA SINICA, 2020, 46(5): 858-877. doi: 10.16383/j.aas.c180415
Citation: WANG Hao-Kun, XU Zu-Hua, ZHAO Jun, JIANG Ai-Peng. A Survey on Ofiset-free Model Predictive Control. ACTA AUTOMATICA SINICA, 2020, 46(5): 858-877. doi: 10.16383/j.aas.c180415

无偏模型预测控制综述

doi: 10.16383/j.aas.c180415
基金项目: 

浙江省公益技术应用研究计划项目 2017C31065

NSFC-浙江两化融合联合基金 U1509209

国家重点研发计划 2017YFB0603703

国家自然科学基金 61374142

详细信息
    作者简介:

    徐祖华  浙江大学控制科学与工程学院副教授.主要研究方向为模型预测控制, 迭代学习控制和系统辨识.E-mail: zhxu@zju.edu.cn

    赵均  浙江大学控制科学与工程学院副教授.主要研究方向为模型预测控制, 工业大数据分析.E-mail: jzhao@iipc.zju.edu.cn

    江爱朋  杭州电子科技大学自动化学院教授.主要研究方向为大规模复杂过程系统的模拟, 控制与优化.E-mail: jiangaipeng@163.com

    通讯作者:

    王浩坤  杭州电子科技大学自动化学院讲师.主要研究方向为模型预测控制及其工业应用.本文通信作者.E-mail: hkwang@hdu.edu.cn

A Survey on Ofiset-free Model Predictive Control

Funds: 

the Public Projects of Zhejiang Province, China 2017C31065

NSFC-Zhejiang Joint Fund for the Integration of Industrialization and Informatization U1509209

National Key R & D Program of China 2017YFB0603703

the National Natural Science Foundation of China 61374142

More Information
    Author Bio:

    XU Zu-Hua Associate professor at the College of Control Science and Engineering, Zhejiang University. His research interest covers model predictive control, iterative learning control and system identification

    ZHAO Jun Associate professor at the College of Control Science and Engineering, Zhejiang University. His research interest covers model predictive control and industrial big data analysis

    JIANG Ai-Peng Professor at School of Automation, Hangzhou Dianzi University. His research interest covers the simulation, control, and optimization of large scale complex process systems

    Corresponding author: WANG Hao-Kun Lecturer at the School of Automation, Hangzhou Dianzi University. His research interest covers model predictive control and its application. Corresponding author of this paper
  • 摘要: 无偏(静差)模型预测控制(Model predictive control, MPC)的设计目标是使被控变量渐近地跟踪设定值, 这类控制方法直接关系到闭环系统的跟踪性能和抗扰性能.由于可以有效处理不可测扰动、模型失配等, 无偏MPC具有很强的工程应用价值, 但是在理论方面并没有得到充分重视.近30年来, 围绕无偏MPC的原理、分析和设计展开了一系列的研究工作, 并取得了系统性的研究成果.当前的一些研究结果大多分散在不同的参考文献中, 缺少全面的梳理和呈现.本文的主要工作包括回顾常见无偏控制方法, 综述当前无偏MPC的研究进展, 并探讨一些潜在的研究方向.
    Recommended by Associate Editor ZHU Bing
  • 模型预测控制(Model predictive control, MPC)是一类基于模型的控制算法, 其核心思想是利用模型在每个控制周期内预测系统在未来一段时间(预测时域)的动态特性, 进而寻求当前控制周期内的有限时域开环最优控制策略.由于可以直接处理多变量、约束等问题, 再加上标准化的实施流程, MPC成为最具代表性的先进控制算法, 在工业过程控制领域成功应用并取得巨大的经济效益.另外, 由于具有在不确定性环境下进行约束优化控制的共性机理, MPC的应用不断延伸到航空、机电、环境、交通、网络等众多应用领域[1].当前, 工业生产过程必须面对成本、产量、质量、市场、环境等方面日益严峻的挑战, 以MPC为代表的先进控制技术是应对这些挑战的有力工具.

    在当前的工业应用中, 除了可以提高系统运行的经济性和灵活性之外, 使用MPC的另一个主要目的是使系统工作于给定的操作工况, 同时还要克服模型失配的影响, 抑制可能存在的扰动.一般可以从两个方面考察MPC控制系统的性能:跟踪性能和抗扰性能, 这也是实际应用中MPC性能的直接体现.不论是从理论上还是实际应用上都希望MPC具有良好的跟踪性能, 主要是指跟踪给定参考信号的能力, 这一点在变工况过程中或者是运动控制领域非常重要.另一方面, 在一些生产过程中产品的规格、参数、质量、工艺等一般变化不大, 需要实施定值控制, 这时, 除跟踪性能外还要求MPC具有良好的抗扰能力[2].由于采用相似的目标函数, 再加上可以通过权重、优先级等参数进行调整, 各MPC策略的跟踪性能相差不大, 但是由于在扰动描述和反馈机制上的差异, 它们的抗扰性能却有较大区别.例如工业界广泛采用的DMC, 其抗扰性能却被诟病[2-4].

    假设被控对象可以用如下非线性离散状态空间描述:

    $$ \begin{equation}\label{PlantModel} \left\{ \begin{aligned} &x_{p, k+1}=f_p(x_{p, k}, u_k, d_{p, k})\\ &y_{k}=g_p(x_{p, k}, d_{p, k}) \end{aligned}\right. \end{equation} $$ (1)

    其中, $u\in{\bf R}^{n_u}$和$y\in{\bf R}^{n_y}$分别为控制输入和被控变量, $x_p$和$d_{p}$分别为状态和不可测扰动, 下标$k$表示采样时刻.函数$f_p$和$g_p$的结构、维数等信息并不一定完全清楚.控制系统设计目标是基于适当的模型, 如线性或非线性模型(2)设计MPC控制器.

    $$ \begin{equation}\label{InternalModel} \left\{ \begin{aligned} &x_{k+1}=f_m(x_{k}, u_k)\\ &y_{k}=g_m(x_{k}) \end{aligned}\right. \end{equation} $$ (2)

    函数$f_m$和$g_m$为已知线性或者非线性函数, 在满足如下约束条件的情况下

    $$ \begin{equation}\label{Constraints} \left\{ \begin{aligned} &x\in {\bf \Omega}_x\\ &u\in {\bf \Omega}_u \end{aligned}\right. \end{equation} $$ (3)

    使被控过程(1)的输出$y$渐近跟踪设定值$r$, 即跟踪误差渐近为0:

    $$ \begin{equation}\label{OffsetFreeGoal} \lim\limits_{k \to \infty} e_k = \lim\limits_{k \to \infty} (r_k-y_k)=0 \end{equation} $$ (4)

    这里需要对无偏控制(Offset-free control)的基本概念加以解释. Offset-Free通常理解为静差或偏差, 在常值跟踪问题中, 对于一个稳定对象和确定的设定值一般存在一个对应的稳定状态(Steady state), 控制的目标是没有静差或稳态误差.如果设定值是动态变化的, 系统将不能工作在某一稳定状态, 这样就不存在所谓的静态或稳态误差, 跟踪过程中的误差称为偏差更为合理, 因此本文将这一类控制方法统称为无偏控制方法.

    无偏MPC的研究目标直接同系统的跟踪性能和抗扰性能相对应.一方面, 保证被控变量渐近跟踪设定值是无偏MPC的首要目标, 也就是通常意义下的跟踪问题.可以根据设定值的特征将跟踪问题为两个子问题:常值跟踪问题和动态跟踪问题.另一方面, 在保证渐近跟踪性能的前提下通过系统的分析和设计提升系统的抗干扰能力, 也即所谓的扰动抑制问题.同跟踪问题一样, 扰动抑制问题也可以根据扰动的特征进行进一步的划分和讨论.可以看出, 研究无偏MPC对提高系统运行的安全性、经济性和灵活性等方面具有重要意义.

    现有无偏MPC的基本原理和设计方法分散于各类科技文献中, 缺少全面的梳理和呈现, 不利于对这类问题的认识.本文将对无偏MPC的相关理论和方法进行回顾, 然后综述当前研究现状, 最后探讨无偏MPC的一些潜在研究方向.在第1节主要回顾现有的无偏控制方法, 在MPC系统的设计中这些方法的许多设计思想仍然可以借鉴; 第2节着重讨论常值跟踪线性无偏MPC的设计问题, 介绍常见的三类方法并讨论它们的等价性; 第3节介绍动态跟踪线性无偏MPC的设计方法; 第4节将在分析现有无偏MPC方法的基础上, 指出当前存在的问题, 并探讨无偏MPC的一些潜在研究方向.

    实际应用中, 一般采用线性模型来描述系统局部或者全局的动态特性, 这将不可避免地引入模型失配.在基于模型的控制方法中, 由于模型失配和不可测扰动等因素的影响, 可能会使模型的输出和实际系统的输出之间存在偏差, 如果不进行适当的处理, 系统的输出将偏离设计目标, 出现稳态误差或动态偏差.为消除偏差, 在单回路控制器(如比例积分微分(Proportional integral derivative, PID)控制器)设计中一般引入积分环节, 通过对跟踪误差不断地累积实现对控制作用的修正, 只要误差存在其作用会持续加强或减弱, 直至稳态误差消除为止, 这也就是所谓的积分效应[5].

    积分效应是控制系统设计的目标之一, 目的就是消除稳态误差.除PID控制策略外, 还有其他一些控制策略具备这样的能力, 但实现方法有别.这一节主要回顾无偏控制的常见策略, 如内部模型控制(Internal model control, IMC)、线性二次型调节器(Linear quadratic regulator, LQR)/线性二次型高斯控制器(Linear quadratic Gaussian, LQG)、IDCOM/动态矩阵控制(Dynamic matrix control, DMC)、广义预测控制(Generalized predictive control, GPC)和基于状态空间方程的设计方法等.虽然这些策略都能实现无偏控制, 但是由于在扰动描述和反馈机制等方面存在差异, 它们的控制性能会有所区别, 了解这些方法的基本原理有助于无偏MPC的分析和设计.

    IMC的主要原理和方法在上世纪八十年代提出, 其主要结构如图 1所示.

    图 1  IMC系统结构
    Fig. 1  Structure of IMC system

    其中, $r$为设定值, $d$为外部扰动.假设$r$和$d$可以分解为$r(z)={N_r(z)}/{M_r(z)}$和$d(z)={N_d(z)}/{M_d(z)}$, 由图 1可得系统传递函数:

    $$ \begin{align} y=\, &\frac{G_rG_cG_p}{1+G_cG_f(G_p-G_m)}\frac{N_r}{M_r}+ \\ &\frac{1-G_cG_fG_m}{1+G_cG_f(G_p-G_m)}\frac{N_d}{M_d} \end{align} $$ (5)

    IMC算法的实质是依靠内置参考输入$r$和外部扰动$d$的共同不稳定模态($M_r(z)$和$M_d(z)$的不稳定模态), 实现同$r$和$d$中不稳定振型的精确对消, 以达到跟踪设定值和抑制扰动的目的[6-7].特别地, 当$G_f(z)=1$, 参考输入$r$和扰动$d$为阶跃信号时, 如$r(z)={r_0}/{(1-z^{-1})}, d(z)={d_0}/ {(1-z^{-1})}$, 由式(5)可知, 若选取控制器满足$G_c(1)=1/G_m(1)$, 由终值定理可得$\lim_{k \to \infty} y_k = \lim_{z \to 1} (1-z^{-1})y(z)=r_0$.这也就意味着不论模型是否失配, 只要闭环系统稳定, 系统可以实现无静差跟踪[8].

    在经典控制理论中一阶和二阶无静差控制系统的设计中, 要求控制器必须包含一阶和二阶积分环节, 这其实可以等价为在控制器中植入阶跃型和斜坡型参考输入的模态.另外, 在最小拍控制系统的设计中, 根据不同的设定值选取适当的误差传递函数, 实现无静差控制的目的, 也可以在IMC框架下进行讨论.在使用MPC跟踪特定的设定值时IMC的基本原理仍然可以借鉴[9].

    当存在模型失配或者存在外部扰动的情况下, 标准的LQR或者LQG算法通常将稳态误差归结为初始状态的偏移, 但是受限于滤波器的估计性能, 这些方法并不能保证无偏跟踪.因此, 借鉴积分效应的做法, 引入额外状态(跟踪误差的积分): , 并将新状态同原线性系统的状态合并[10-11], 可得如下扩展系统:

    $$ \begin{equation}\nonumber \left\{ \begin{aligned} &\begin{bmatrix} x_{k+1} \\ x_{I, k+1} \\ \end{bmatrix} = \begin{bmatrix} A & 0 \\ C & I \\ \end{bmatrix} \begin{bmatrix} x_{k} \\ x_{I, k} \\ \end{bmatrix} + \begin{bmatrix} B \\ 0 \\ \end{bmatrix} u_k + \begin{bmatrix} 0 \\ -I \\ \end{bmatrix} r_k\\ &y_k= \begin{bmatrix} C & I \\ \end{bmatrix} \begin{bmatrix} x_{k} \\ x_{I, k} \\ \end{bmatrix} \end{aligned}\right. \end{equation} $$

    通常可以采用极点配置算法进行控制器设计, 可采用控制律, 其中, $K_x$和$K_I$分别为控制律中原状态和新引入状态的系数, $K_r$为设定值增益.该类方法引入跟踪误差的积分作为系统状态的一部分, 将其纳入到性能指标的考虑范围, 采用极点配置方法设计控制律.

    除了可以引入跟踪误差, 还可以考虑引入常值状态扰动对系统进行状态估计[12-14], 在得到扰动的估计值后, 然后可以将控制律分为两部分, 其中$u_{x, k}$为状态调节部分, 为扰动补偿部分.通过合理的设计补偿部分的控制律, 在一定程度上可以减少扰动带来的影响.如果扰动为常值或渐近常值, 采用这种方法可以实现无偏跟踪.

    但是, 通过引入跟踪误差积分的方式会导致积分饱和现象, 这一点同PID的积分效应是类似的.因此, 针对其可能出现的积分饱和现象还需要相应的抗饱和策略.另外, 基于极点配置的方法有其固有的局限性, 比如极点配置方法在处理SISO系统时是比较简单和有效的, 在处理MIMO系统时会出现增益不唯一, 极点的位置如何合理选取等问题.

    由于可以采用不同种类的模型, 预测控制在其发展过程中有多种演化形式, 如IDCOM (脉冲响应模型)、DMC (阶跃响应模型)、GPC (随机模型)和基于状态空间的设计方法等.虽然这些方法并非为实现无偏控制的目标而设计, 但是它们都具有无偏控制的能力.下面对这几种常见的预测控制方法实现无偏控制的策略和机理进行简要介绍.

    1.3.1   IDCOM/DMC

    IDCOM和DMC是早期两种典型的MPC, 广泛地应用于工业领域, 它们实现无偏控制的方式主要通过引入常值输出误差来解决[8, 15-17]:

    其中, $e_k=y_k-\hat{y}_{k|k-1}$, $\hat{y}_{k+i|k}$为$k$时刻基于模型的预测值, $h_i$为反馈系数, 通常设置为单位阵.由于模型失配或者外部扰动的影响, 系统在$k$时刻的输出$y_k$并不一定按照预测模型所描述的方式演化.这样, $k$时刻的实际输出同基于$k-1$时刻对输出的预测值$y_{k|k-1}$之间不可避免地存在偏差.在IDCOM和DMC中, 考虑了$k$时刻的预测偏差对系统未来行为的影响, 进而产生相应的控制律来消除该偏差.这种方法无需了解模型失配或者外部干扰的具体影响, 直接从最终的输出着手进行预测补偿, 通常能够保证无偏控制, 使系统具有良好的鲁棒性, 直到目前, 在商用化的MPC软件中这种方法依然被广泛采用.

    但是, 这种策略往往只针对稳定对象, 在处理不稳定对象时一般需要特殊处理, 因为模型中的不稳定极点会导致闭环系统不稳定.即使应用于稳定对象, 其控制效果也不一定总令人满意.这主要是由于这种处理方式不考虑扰动对系统影响的动态演化过程, 仅从最终的输出偏差进行校正, 属于后验式补偿, 并不利于系统抗扰性能的改善, 往往导致系统抗扰能力较弱[2-4].

    1.3.2   GPC

    GPC是一类比较特殊的MPC, 源于最小方差控制.经典的GPC算法中引入了所谓的$T$多项式对模型失配和扰动进行描述[18]:

    $$ \begin{equation}\nonumber \begin{aligned} A(q^{-1})y_k=B(q^{-1})u_k+\frac{T(q^{-1})}{\Delta}\zeta_k \end{aligned} \end{equation} $$

    这里$A(q^{-1})$和$B(q^{-1})$为模型系数, $T(q^{-1})$为扰动模型, 可通过在线估计或者离线设计得到, $\Delta$为后项差分符号, $\zeta_k$为扰动项.这种描述方式允许使用者自由地选择扰动的动态特性及其对系统的影响, 有利于更好地描述扰动或者失配, 有助于增强系统的预测能力.相较于IDCOM和DMC在输出端进行常值补偿, GPC可以在更广的范围内实现对扰动的建模和补偿.如果扰动为常值或者渐近常值, 这种补偿方式可以实现无偏控制.另一方面, 在对系统动态进行预测时考虑到了扰动在预测时域内的变化及其对系统状态和输出的影响, 这显然要比输出端的常值补偿更为合理.

    1.3.3   基于状态空间方程的预测控制

    Marquis等介绍了基于状态空间模型的商业MPC—SMOC[19].众所周知, 状态空间模型是一类参数化的模型, 它有一系列的优势, 如描述模型范围广, 可以利用许多现有的系统分析和综合方法, 如LQR、IMC、Kalman滤波等.另外基于状态空间模型进行系统设计还可以同状态子空间辨识、故障诊断、控制器性能评估等技术无缝衔接[20].因此, 基于状态空间方程的MPC设计方法得到了广泛的研究和应用[21-22].

    借鉴传统最优控制的相关理论成果, 这类MPC的稳定性问题得到了广泛关注和充分讨论[23-24]. Muske等[25]详细讨论了基于线型状态空间模型的MPC的设计原理和方法. Lee等[26]讨论了基于状态空间模型MPC同IMC、DMC和GPC的关系, 指出它们之间的等价关系.除传统的建模方法获取状态空间模型之外还可以采用非最小实现方法[27].

    实际应用中如果存在持续的扰动作用于系统, 直接采用线性模型进行MPC设计不能保证满足设计要求[12].为此, 通常在线性模型中引入扰动项用以描述不可测扰动或者模型失配.然后基于扩展模型设计Kalman滤波器或者Luenberger观测器, 实现对系统状态和扰动的同时估计.这一策略也是当前基于状态空间方程设计MPC的通用策略. SMOC允许在状态空间框架下对扰动进行建模, 不仅支持通常的输入、输出、状态常值扰动, 还允许用户根据扰动特点进行针对性建模.

    这一部分讨论基于线性模型设计MPC实现对常值或分段常值目标的无偏跟踪.首先给出常值跟踪问题的基本描述, 然后介绍常见的三类基本设计方法.接下来给出双层结构MPC控制器的主要构成, 在此框架下讨论三类方法的等价性.由于扰动模型为用户自定义参数, 如何选取扰动模型是一个重要的问题, 这一部分还将讨论扰动模型的等价性, 即选取不同的扰动模型可以得到相同的闭环性能.最后, 总结出保证常值无偏跟踪的充分条件.

    对被控过程(1), 如果设定值$r$为常值或者分段常值, 利用线性模型(6)设计适当的控制律, 在满足约束条件(3)的情况下使式(4)成立.

    $$ \begin{equation}\label{LinearModel} \left\{ \begin{aligned} &x_{k+1}=Ax_{k}+Bu_k\\ &y_k=Cx_k \end{aligned}\right. \end{equation} $$ (6)

    其中, $x\in{\bf R}^{n_x}$, $u$和$y$的定义同式(1).通常假设$(A, B)$可控, $(A, C)$可检测, 且$C$满秩.

    目前, 基于线性模型(6)的无偏MPC设计方法可分为三大类:扰动模型加估计器、增量式扩展模型和基于开环估计补偿的策略, 以下分别加以介绍.

    2.2.1   第一类设计方法:扰动模型加估计器

    目前较为通用的无偏MPC实现方式是在原线性模型(6)的基础上引入不可测扰动对状态进行扩展, 然后利用估计器对状态和扰动进行估计, 实现对扰动的抑制.除借鉴IDCOM/DMC中使用输出扰动实现无偏控制的基本方法外, 还可以使用输入扩展模型或者状态扩展模型获得更好的抗扰能力[4].

    扰动模型的选取直接关系到系统闭环性能, 常见的扰动模型有输出扰动模型、输入扰动模型、状态扰动模型、输入输出扰动模型等, 以下分别介绍.

    1) 输出扰动模型

    输出扩展模型方法假设每个时刻系统的输出端存在一个常值扰动, 这种方式同商业应用MPC软件(如IDCOM/DMC)一致.这种描述方式比较直观, 易于理解, 可以描述模型失配、时变和外部扰动等工况, 具有广泛的代表性.这一思想也被自然地应用于控制系统的设计, 如伺服控制、MPC设计等.理论上, 在输出端总是存在一个扰动向量$d_{\infty}$使得稳态()成立.如果假设$d_k=y_k-Cx_k$, 其中$d_k$用来描述系统实际输出和预测输出的差值, 利用这一特性可以产生积分效应, 对实现无偏控制是有利的.但是, 这种描述方式属于后验补偿方式, 由于惯性、滞后等因素的存在, 扰动对系统的影响并不能及时地在输出端反映出来, 这种方式显然不利于及早发现扰动并采取前馈等补偿措施, 无助于系统的抗扰能力的提升, 这一问题也被许多学者指出[2-4, 28-29].

    2) 输入扰动模型

    除输出扰动的描述方式外, 还可以采用输入扰动的扩展方式.这种方法假设在系统的输入端存在未知的常值扰动.流程工业中许多扰动可以通过这种扩展方式来近似描述, 这些扰动一般源于执行器本身的非线性特征和工况的变化, 如上游的压力、液位、流量、产量、组分的变化等都通过系统的输入端(如调节阀等)对系统造成影响.因此, 相比于输出扰动模型, 输入扰动模型是一种更符合工程实际的扰动描述方式.在不考虑约束的情况下, Akesson等[30]指出这种扩展方式加上估计器的设计可以获得类似于PID中的积分效应.

    3) 状态扰动模型

    在对未知扰动进行描述时, 还可以借鉴LQR/LQG中的方法[21-14], 假设系统的状态端存在常值扰动.同输入扰动的描述方式相比, 这种描述不要求扰动个数一定同输入个数相等, 描述范围更广.状态扰动模型可以描述模型失配, 例如, 可以将非线性模型描述为$x_{k+1}=(A+\Delta A)x_k+(B+\Delta B)u_k$, 如果选择扰动项为$B_dd_k=\Delta Ax_k+\Delta Bu_k$, 由模型失配造成的不确定性可以采用状态扰动模型来描述.另外, 状态扰动模型还能够描述时变系统, 如考虑线性模型$x_{k+1}=A(\alpha)x_k+B(\alpha)u_k$, 其中, $\alpha$用以描述工况.在任一给定的工况$\alpha_0$, 将状态方程采用Taylor展开, 可得.显然, 如果选择, 这类时变系统也可以采用状态扰动模型来描述.很明显, 输入扩展方式也是一种特殊的状态扩展方式.

    4) 输入输出扰动模型

    另外, 还可以假设在系统的输入输出端分别存在不同的常值扰动[4]:

    $$ \begin{equation}\nonumber \left\{ \begin{aligned} &x_{k+1}=Ax_{k}+Bu_k+B_dd_k \\ &y_{k}=Cx_k+C_pp_k\\ &d_{k+1}=d_k\\ &p_{k+1}=p_k \end{aligned}\right. \end{equation} $$

    其中$p_k$和$d_k$一样, 为不可测扰动.但是人为加入过多数量的扰动无助于系统的分析与设计, 反而降低在线计算的实时性.这种扩展方法会增加系统的状态个数, 尤其在一些大规模系统的应用中会降低优化问题求解的实时性, 因为优化问题的计算量同状态个数呈近似的三次方关系[31].

    不失一般性, 可以考虑如下受扰系统

    $$ \begin{equation}\nonumber \left\{ \begin{aligned} &x_{k+1}=Ax_{k}+Bu_k+B_dd_k \\ &d_{k+1}=d_k\\ &y_{k}=Cx_k+C_dd_k \end{aligned}\right. \end{equation} $$

    值得注意的是$d\in{\bf R}^{n_d}$用以描述模型失配和外部扰动, 在设计无偏控制器时其真实特性并不需要完全了解, 一般可假设其有界.将$d_k$作为新的状态同原模型状态进行合并可得:

    $$ \begin{equation}\label{GeneralAugment} \left\{ \begin{aligned} &\bar{x}_{k+1}=\bar{A}\bar{x}_{k}+\bar{B} u_k\\ &y_{k}=\bar{C}\bar{x}_k \end{aligned}\right. \end{equation} $$ (7)

    其中,

    $$ \begin{equation}\nonumber \left\{ \begin{aligned} \bar{x}_{k} &= \begin{bmatrix} x_{k} \\ d_{k} \\ \end{bmatrix}, \bar{A} = \begin{bmatrix} A & B_{d} \\ 0 & I \\ \end{bmatrix}\\ \bar{B} &= \begin{bmatrix} B \\ 0 \\ \end{bmatrix}, \bar{C} = \begin{bmatrix} C & C_{d} \\ \end{bmatrix} \end{aligned}\right. \end{equation} $$

    模型(7)更具代表性, 实际上, 输入扰动模型和输出扰动模型可以视为模型(7)的两种特殊形式:对输出扰动模型有($B_d=0, C_d=I$); 对输入扰动模型有().因此在接下来的讨论中如无明确说明, 扩展模型均指模型(7)的形式.基于模型(7)可以设计估计器实现对状态和扰动的估计:

    $$ \begin{equation}\label{GeneralAugmentObserver} \left\{ \begin{aligned} &\hat{x}_{k|k-1}=A\hat{x}_{k-1}+Bu_{k-1}+B_d\hat{d}_{k-1}\\ &\hat{d}_{k|k-1}=\hat{d}_{k-1}\\ &\tilde{y}_{k|k-1}=y_k-C\hat{x}_{k|k-1}-C_d\hat{d}_{k|k-1}\\ &\hat{x}_{k}=\hat{x}_{k|k-1}+L_{x}\tilde{y}_{k|k-1}\\ &\hat{d}_{k}=\hat{d}_{k|k-1}+L_{d}\tilde{y}_{k|k-1} \end{aligned}\right. \end{equation} $$ (8)

    估计器(8)也可简化为$\hat{\bar{x}}_{k}=\bar{A}\hat{\bar{x}}_{k-1}+\bar{B}u_{k-1}+L\tilde{y}_{k|k-1}$, 其中.

    2.2.2   第二类设计方法:增量式扩展模型

    第一类方法采用扩展状态空间模型, 除此之外还可以采用增量模型实现无偏控制.这种方法的主要思路是通过引入额外状态变量对原模型进行扩展, 形成增量式的扩展模型作为预测模型.增量扩展模型有不少形式, 下面介绍常见的几种增量模型.

    1) 输出增量扩展模型

    在状态增量的基础上引入额外状态变量$y_k$可将线性模型(6)扩展为如下形式[27, 32]:

    $$ \begin{equation}\label{IncrementalAugmentOutput} \left\{ \begin{aligned} &\Delta\bar{x}_{y, k+1}=\breve{A}\Delta\bar{x}_{y, k}+\breve{B}\Delta u_k\\ &y_{k}=\breve{C}\bar{x}_{y, k} \end{aligned}\right. \end{equation} $$ (9)

    其中,

    $$ \begin{equation}\nonumber \left\{ \begin{aligned} &\Delta\bar{x}_{y, k} = \begin{bmatrix} \Delta x_{k} \\ y_{k} \\ \end{bmatrix}, \breve{A} = \begin{bmatrix} A & 0 \\ CA & I \\ \end{bmatrix} \\ &\breve{B}= \begin{bmatrix} B \\ CB \\ \end{bmatrix}, \breve{C} = \begin{bmatrix} 0 & I \\ \end{bmatrix} \\ &\Delta u_{k}=u_k-u_{k-1} \end{aligned}\right. \end{equation} $$

    2) 误差增量扩展模型

    借鉴LQR/LQG实现无偏控制的方法, 可以引入跟踪误差$e_{k}=r_k-y_k$作为新的状态, 可得如下新的增量模型[33]:

    $$ \begin{equation}\label{IncrementalAugmentError} \left\{ \begin{aligned} &\bar{x}_{\Delta, k+1}=\breve{A}\bar{x}_{\Delta, k}+\breve{B}\Delta u_k\\ &e_{k}=\breve{C}\bar{x}_{\Delta, k} \end{aligned}\right. \end{equation} $$ (10)

    其中, $\breve{A}$, $\breve{B}$和$\breve{C}$同式(9)一致.显然, 输出增量扩展模型(10)同误差扩展模型(9)是等价的.因此, 在接下来的介绍中统一使用式(10).

    3) 控制量扩展模型

    除上述两种常见的增量扩展模型外还有其他形式的增量模型, 如将$u_{k-1}$作为新的状态等[22, 33-36], 但实际应用中比较少见, 这里不再介绍.

    在实际使用上第二类设计方法在系统参数调整方面较第一类方法困难[35].虽然状态中扩展的部分是可测的, 但同样也需要设计估计器.针对扩展模型(10)可采用如下形式的观测器实现状态估计:

    $$ \begin{equation}\label{IncrementalAugmentObserver} \left\{ \begin{aligned} &\tilde{e}_{k}=e_k-\breve{C}(\breve{A}\hat{\bar{x}}_{\Delta, k-1}+\breve{B}\Delta u_{k-1}) \\ &\Delta \hat{x}_{k}=A\Delta \hat{x}_{k-1}+B\Delta u_{k-1}+L_{\Delta, x}\tilde{e}_{k} \\ &\hat{e}_{k}=\hat{e}_{k-1}+CA\Delta \hat{x}_{k-1}+\\ &\quad \quad CB\Delta u_{k-1}+L_{\Delta, e}\tilde{e}_{k} \end{aligned}\right. \end{equation} $$ (11)
    2.2.3   第三类设计方法:基于开环估计补偿的策略

    这类设计方法比较特殊, 因为它不需要对系统状态的扩展[37-38].具体而言, 它在系统的状态和输出端分别进行常值补偿:

    $$ \begin{equation}\label{OpenLoopAugment} \left\{ \begin{aligned} &\hat{x}_{k+1}=A\hat{x}_{k}+Bu_k+d_{x, k}\\ &y_{k}=C\hat{x}_k+d_{y, k} \end{aligned}\right. \end{equation} $$ (12)

    其中, $d_{x, k}$和$d_{y, k}$是$k$时刻人为加入的不可测扰动项. Tatjewski[37-38]给出了$d_{x, k}$和的在线计算方法:

    $$ \begin{equation}\label{OpenLoopAugmentConstant} \left\{ \begin{aligned} &d_{x, k}=\hat{x}_{k}-K_x(A\hat{x}_{k-1}+Bu_{k-1})\\ &d_{y, k}=y_{k}-C\hat{x}_{k} \end{aligned}\right. \end{equation} $$ (13)

    值得注意的是, 在项中$A\hat{x}_{k-1}+Bu_{k-1}$实际上是利用$k-1$时刻的状态和控制量对$k$时刻状态的开环估计值.如果选择$K_x$为单位阵, 实际上也就是$k$时刻的状态估计值同开环估计值的差值. 是实际值同预测值的差值, 相当于输出常值扰动.因此, 这类方法可以视为状态扰动模型和输出扰动模型的组合.

    当前MPC主要采用双层结构, 总体结构分为三个相互独立的部分:稳态目标优化(Steady-state target optimization, SSTO)计算、动态调节和状态估计[4, 25, 39-40], 结构如图 2所示.

    图 2  双层MPC结构示意图
    Fig. 2  Double-layered MPC

    其中, $r$和$u_t$分别为被控变量和控制量的设定值(可能来自于上层RTO); $x_s$和$u_s$是经过目标计算产生的目标状态和输入; $d$为不可测扰动; $\hat{x}$和$\hat{d}$分别为状态和扰动估计值.

    2.3.1   稳态目标计算

    SSTO环节的主要目的是将来自于上层的操作目标(包括操作界限、经济目标、控制目标、优先级等)转换为当前工况下可行的控制目标, 在稳态工作点附近进行自动寻优[41].总体而言它有三个主要目的: 1)上层(如RTO)提供的变量同MPC层变量不一致, 这时需要将设定值转换为控制目标; 2)上层提供的设定值数量同MPC层不一致, 这时需要SSTO提供合理的、优化的或折中的控制变量参考值(对胖系统), 或者减少优化问题的自由度(对瘦系统); 3)由于模型失配或者扰动的影响, 由工艺计算得到的设定值可能不可行, 这时需要SSTO环节提供可行的控制目标以尽可能地接近设定目标.

    对于方系统, 可以利用稳态增益矩阵(模型不包含积分或不稳定环节且增益矩阵非奇异)计算稳态目标.但是这种方法的弊端在于不能在线考虑扰动和系统状态实时调整跟踪目标, 进而导致系统不能经济地运行[42].对于非方系统, 或者含有不等式约束的方系统, 目标计算问题可以描述为相应的数学规划问题[4, 25, 43], 经过优化以后可以在一定程度上提高系统运行的经济性.

    如果设定值为常值或者分段常值时, 为保证稳态无偏, 通常需要根据当前的状态和扰动情况对系统的目标状态和输入进行估计, 该估计值将作为动态调节的目标.在线性MPC框架下基于扩展模型(7)通过求解如下QP问题可以得到$x_s$和$u_s$[25]:

    $$ \begin{equation}\label{TargetCalculation} \begin{aligned} &\min\limits_{x_s, u_s} \|u_s-u_t\|_{R_s}^2\\ &{\rm s.\, t.} \left\{ \begin{aligned} & \begin{bmatrix} I-A & -B \\ C & 0 \\ \end{bmatrix} \begin{bmatrix} x_s \\ u_s \\ \end{bmatrix} = \begin{bmatrix} B_d\hat{d}_k \\ r-C_d\hat{d}_k \\ \end{bmatrix} \\ &x_s\in {\bf \Omega}_x, u_s\in {\bf \Omega}_u \end{aligned}\right. \end{aligned} \end{equation} $$ (14)

    其中, 设定值$r$必须满足$y_{\min}\le r\le y_{\max}$, $y_{\max}$和$y_{\min}$分别为输出的上下限.如果上述QP问题没有足够的自由度, 可以通过下面的计算方式获取$x_s$和$u_s$的最小二乘解[25]:

    $$ \begin{equation}\nonumber \begin{aligned} &\min\limits_{x_s, u_s} \|(r-Cx_s-C_d\hat{d}_k)\|_{Q_s}^2\\ &{\rm s.t.} \left\{ \begin{aligned} & \begin{bmatrix} I-A & -B \\ \end{bmatrix} \begin{bmatrix} x_s \\ u_s \\ \end{bmatrix} = B_d\hat{d}_k \\ &x_s\in \Omega_x, u_s\in \Omega_u \end{aligned}\right. \end{aligned} \end{equation} $$

    值得注意的是上述目标计算虽然是通过优化计算得到, 但是这并不能保证在任何情况下这种计算方式都是最优的, 在非线性系统的跟踪问题和动态跟踪问题中可以采用其他的方法.

    2.3.2   动态调节

    动态调节的目的是将系统驱动至SSTO计算出的期望值$x_s$和$u_s$.在双层结构框架下, 由SSTO层负责稳态目标优化, 由动态调节层实现无偏跟踪, 相比于单层MPC更容易实现无偏控制[44].动态调节问题可通过求解如下QP问题实现[25, 45]:

    $$ \begin{equation}\label{DynamicRegulation} \begin{aligned} &\begin{aligned} \min\limits_{{\pmb u}_N} \sum\limits_{i=k}^{k+N-1} &(\|\hat{x}_i- x_s\|_{W_x}^2+\|u_i-u_s\|_{W_u}^2)+\\ &\|x_N-x_s\|_{W_{N}}^2 \\ \end{aligned}\\ &{\rm s.t.} \left\{ \begin{aligned} & \hat{x}_{i+1}=A\hat{x}_i+Bu_i+B_d\hat{d}_i \\ &x_i\in {\bf \Omega}_x, u_i\in {\bf \Omega}_u \end{aligned}\right. \end{aligned} \end{equation} $$ (15)

    其中, $W_x\ge 0$、$W_u\ge 0$和分别为状态、输入和终端状态的权重系数, .为简单起见, 控制时域和预测时域可以设置成相同的整数$N$.在实际使用中为保证系统运行的平稳性或者考虑执行机构的速率, 需要在目标函数中增加控制量增量项.动态调节部分同传统的单层MPC类似, 主要区别在于双层结构下动态调节的目的是跟踪经过优化后的状态和控制量目标, 而非传统单层结构下跟踪设定值.显然这种结构更容易处理设定值不合理的情形, 给出更好的调节效果.

    2.3.3   状态与输出估计

    1) 扩展系统的可观性

    如前所述, $d$是人为加入的不可测扰动, 如果希望克服它对系统造成的影响必须要实现对它的在线估计.因此, 一个重要的问题是扩展以后的模型是否可观或者可检测.下面的这个定理给出相关结果.

    定理1[46-48].扩展系统(7)是可观的, 当且仅当$(A, C)$可观, 且矩阵

    $$ \begin{equation}\label{ObservabilityCondition} \text{rank} \begin{bmatrix} A-I & B_d \\ C & C_d \end{bmatrix}=n_x+n_d \end{equation} $$ (16)

    证明.由PBH可观性判据可知, 扩展系统(7)是可观的, 必然满足对所有实数$\lambda$, 矩阵

    $$ \begin{equation}\label{PBHCondition1} \begin{bmatrix} A^\text{T}-\lambda I & 0 & C^\text{T} \\ B_d^\text{T} & I-\lambda I & C_d^\text{T} \\ \end{bmatrix} \end{equation} $$ (17)

    满秩.显然, 当且仅当原系统(6)可观, 矩阵(17)的上半部分$[A^{\rm T}-\lambda I ~~ 0 ~~ C^{\rm T}]$是线性独立的.保证矩阵(17)下半部分线性独立的一个可能的例外是$\lambda=1$, 因此只需要检查$\lambda=1$时矩阵下半部分是否线性独立.将$\lambda=1$代入可得式(16).

    条件(16)成立意味着$n_d \le n_y$.我们也可以从另外一个角度来理解条件(16).扩展系统在稳态时满足如下条件:

    $$ \begin{equation}\nonumber \begin{bmatrix} A - I & B_d \\ C & C_d \end{bmatrix} \begin{bmatrix} x_{\infty} \\ d_{\infty} \end{bmatrix} = \begin{bmatrix} 0 \\ y_{\infty} \end{bmatrix} - \begin{bmatrix} B \\ 0 \end{bmatrix} u_{\infty} \end{equation} $$

    条件(16)成立也就意味着对任意给定的$y_{\infty}$和$u_{\infty}$, $[x_{\infty}^{\rm T} ~~ d_{\infty}^{\rm T} ]^{\rm T}$有唯一解.

    在基于增量扩展模型的方法中同样使用估计器实现对状态的估计, 一个基本的问题是扩展后的模型是否可观或可检测, 这一特性由下面的定理给出.

    定理2.扩展系统(10)是可观的, 当且仅当可观.

    证明.由PBH可观性判据可知, 扩展系统(10)是可观的, 必然满足对所有实数$\lambda$, 矩阵(18)满秩.

    $$ \begin{equation}\label{PBHCondition2} \begin{bmatrix} A^\text{T}-\lambda I & A^\text{T}C^\text{T} & 0 \\ 0 & I-\lambda I & I_{(n_y \times n_y)} \\ \end{bmatrix}\text{} \end{equation} $$ (18)

    注意到$I_{(n_y \times n_y)}$和$A^\text{T}-\lambda I$满秩, 上式必然成立.

    2) 无偏输出估计

    这里考察状态扩展后估计器对系统输出的预测能否跟踪系统的实际输出$y_k$.这一特性是很重要的, 因为如果不能保证对输出的无偏跟踪往往也就意味着不能实现无偏控制.

    首先, 定义输出预测值$\hat{y}_{k}=C\hat{x}_{k}+C_d\hat{d}_k$, 有如下定理.

    定理3.假设$(A, C)$可观, 如果选取适当的估计器增益$L_{x}$和$L_{d}$使得$(A-L_{x}C)$和$(A-L_{d}C)$为Hurwitz矩阵, 估计值$\hat{y}_{k}$能够渐近跟踪实际值$y_k$.

    证明.定义状态估计偏差$\tilde{x}_{k|k-1}=x_k-\hat{x}_{k|k-1}$和$\tilde{d}_{k|k-1}=d_k-\hat{d}_{k|k-1}$, 估计器的动态特征可以描述为:

    $$ \begin{equation}\nonumber \left\{ \begin{aligned} &\tilde{x}_{k+1|k}=(A-L_{x}C)\tilde{x}_{k|k-1}\\ &\tilde{d}_{k+1|k}=(A-L_{d}C)\tilde{d}_{k|k-1} \end{aligned}\right. \end{equation} $$

    如果$(A-L_{x}C)$和$(A-L_{d}C)$为Hurwitz矩阵, 有和.因此有.这也就意味着$\lim_{k \to \infty} \hat{y}_{k}=y_k$.所以, 估计值$\hat{y}_{k}$能够渐近跟踪实际值$y_k$.

    在前面的讨论中给出了三类无偏MPC设计方法, 三类方法各有特点, 但是三类设计方法之间的联系并不清楚, 这一部分主要讨论三类方法的等价性.

    2.4.1   第一类和第二类设计方法的等价性

    在第一类设计方法中扰动模型和估计器的设计是相互独立的, 这一点可以给设计者很大的自由度去设计满意的控制系统.第二类方法较为固定, 且两种常见的增量扩展模式是等价的.这一部分主要讨论第一类和第二类无偏MPC设计方法的等价性.其实, 第二类方法是第一类设计方法的一个特例, 具体结论由下面的定理给出.

    定理4[49].考虑第一类设计方法(式(7)和(8))和第二类方法(式(10)和(11)), 在设定值为常值情况下, 如果满足条件:

    $$ \begin{equation}\label{EquivalenceCondition12} \left\{ \begin{aligned} B_{d}&=L_{x}=-L_{\Delta, x}\\ L_{d}&=L_{\Delta, e}=I\\ C_{d}&=I-L_xC \end{aligned}\right. \end{equation} $$ (19)

    两类方法是等价的.

    证明.由式(8)可得:

    $$ \begin{equation}\nonumber \begin{aligned} \hat{x}_{k}=\, &(I-L_xC)A\hat{x}_{k-1}+(I-L_xC)Bu_{k-1}+\\ &L_xy_k+(B_d-L_xCB_d-L_xC_d)\hat{d}_{k-1} \end{aligned} \end{equation} $$

    同第二类方法一样, 定义状态增量、控制量增量$\Delta u_{k}=u_k-u_{k-1}$和输出增量$\Delta y_{k}=y_k-y_{k-1}$, 上式的增量形式可以表示为:

    $$ \begin{align}\label{deltaxhat_General} \Delta\hat{x}_{k}=\, &(I-L_xC)A\Delta\hat{x}_{k-1}+L_x\Delta y_k+\nonumber\\ &(I-L_xC)B\Delta u_{k-1}+\nonumber\\ &(B_d-L_xCB_d-L_xC_d)\Delta\hat{d}_{k-1} \end{align} $$ (20)

    另一方面, 由式(11)可以得到.将其代入式(11)可得:

    $$ \begin{equation}\label{deltaxhat_Incremental} \begin{cases} \Delta \hat{x}_{k}=(I-L_{\Delta, x}C)A\Delta \hat{x}_{k-1}+\\ \quad\qquad(I-L_{\Delta, x}C)B\Delta u_{k-1}+\\ \quad\qquad L_{\Delta, x}(e_k-\hat{e}_{k-1})\\ \hat{e}_{k}=\hat{e}_{k-1}+(I-L_{\Delta, e})CA\Delta \hat{x}_{k-1}+\\ \qquad(I-L_{\Delta, e})CB\Delta u_{k-1}+\\ \qquad L_{\Delta, e}(e_k-\hat{e}_{k-1}) \end{cases} \end{equation} $$ (21)

    注意到$\hat{e}_{k}=e_k$, 且在设定值为常值时$e_k-e_{k-1}=r-y_k-(r-y_{k-1})=-\Delta y_k$.显然, 如果满足式(19), 比较式(20)和式(21)可知两类方法是等价的.

    在满足条件(19)时, 注意式(20)中最后一项$(B_d-L_xCB_d-L_xC_d)\Delta\hat{d}_{k-1}=0$, 这也就意味着$k$时刻的状态估计值$\hat{x}_{k}$同扰动的估计值$\hat{d}_{k}$无关, 这也就意味着状态和扰动的估计是完全解耦的.

    通过上述分析可知在满足条件(19)的情况下两类设计方法等价.但是需要注意的是, 由于估计器设计、参数调节等原因, 在实际应用中并不意味着两种方法的效果是相同的.因为在第一类设计方法中扰动模型的选取和估计器的设计是分开独立进行的, 而第二类方法是较为固定的形式(可以视为第一类方法的一种特例, 满足条件(19)).

    2.4.2   第一类和第三类设计方法的等价性

    第三类方法较为特殊, 因为没有采用类似前两类方法的状态扩展.但实际上第三类方法也是第一类方法的一种特例, 接下来将给出相关结论.

    定理5[49].考虑第一类设计方法(式(7)和(8))和第三类方法(式(12)和(13)), 在设定值为常值情况下, 如果满足条件:

    $$ \begin{equation}\label{EquivalenceCondition13} \left\{ \begin{aligned} B_{d}&=L_{x}=K_x\\ L_{d}&=I\\ C_{d}&=I-L_xC \end{aligned}\right. \end{equation} $$ (22)

    两类方法是等价的.

    证明.在第一类设计方法中, 估计器(8)可以写成如下形式:

    $$ \begin{equation}\nonumber \left\{ \begin{aligned} \hat{x}_{k}=\, &A\hat{x}_{k-1}+Bu_{k-1}+\\ &L_x(y_k-CA\hat{x}_{k-1}+CBu_{k-1})+\\ &B_d(I-L_xC)\hat{d}_{k-1}-L_xC_d\hat{d}_{k-1}\\ \hat{d}_{k}=\, &(I-L_dC_d-L_dCB_d)\hat{d}_{k-1}+\\ &L_{d}(y_k-C(A\hat{x}_{k-1}+Bu_{k-1})) \end{aligned}\right. \end{equation} $$

    显然, 如果满足条件(22), 估计器(8)可以进一步表示为:

    $$ \begin{align}\nonumber \begin{cases} \hat{x}_{k}=A\hat{x}_{k-1}+Bu_{k-1}+d_{x, k}\\ d_{x, k}=L_{x}(y_k-C(A\hat{x}_{k-1}+Bu_{k-1}))\\ d_{y, k}=y_k-C\hat{x}_{k}=\\ \quad\qquad y_k-C(A\hat{x}_{k-1}+Bu_{k-1})-Cd_{x, k}\\ \hat{d}_{k}=y_k-C(A\hat{x}_{k-1}+Bu_{k-1})=\\ \qquad d_{y, k}+Cd_{x, k} \end{cases} \end{align} $$

    将上式同式(13)比较, 可以看出两种方法在满足条件(22)的情况下是等价的.

    2.4.3   第二类和第三类设计方法的等价性

    前面分别介绍了第一、二类设计方法和第一、三类设计方法的等价性, 可以看出第二类和第三类方法是第一类方法的特例.也就是说第二类和第三类设计方法都可以在第一类设计方法的框架下实现.借助于前面两个定理很自然地可以得知第二类和第三类方法也存在等价关系, 这一等价关系由下面的定理给出.

    定理6.考虑第二类方法(式(10)和(11))和第三类方法(式(12)和(13)), 在设定值为常值情况下, 如果满足条件:

    $$ \begin{equation}\label{EquivalenceCondition23} \left\{ \begin{aligned} L_{\Delta, x}=\, &-K_x\\ L_{\Delta, e}=\, &I\\ \end{aligned}\right. \end{equation} $$ (23)

    两类方法是等价的.

    证明.在满足条件(23)的情况下, 由前面两个定理知道, 第二类和第三类设计方法同第一类设计方法是等价的:

    $$ \begin{equation}\nonumber \left\{ \begin{aligned} B_{d}&=L_{x}=L_{\Delta, x}=-K_x\\ L_{d}&=I\\ C_{d}&=I-L_xC \end{aligned}\right. \end{equation} $$

    从而间接证明两类方法的等价性.

    在前面的讨论中我们讨论了三类设计方法及其等价性, 可见第二、三类设计方法可以在第一类设计方法的框架中统一解决.需要注意的是第一类设计方法需要用户自定义扰动模型参数和估计器增益$(L_{x}, L_{d})$.由于估计器可以独立设计, 使用随机模型时可以选用Kalman滤波器, 其增益可以自动计算, 所以在无偏MPC设计中比较重要的一点是如何选取扰动模型参数.选取不同的扰动模型, MPC的性能, 特别是抗扰性能也会有所区别.为展示扰动模型参数对MPC性能的影响, 这里考虑一个简单的无约束SISO系统$G(s)={1}/{(s+1)}$.选择输出扰动模型$(B_d=0, C_d=I)$, 输入扰动模型和输入输出扰动模型进行测试[45, 50], 在测试中均采用稳态Kalman滤波器控制周期为1秒, 控制器参数$Q_k=10^{-6}$, $R_k=10^{-6}$, $S_k=10^{-6}$.当在输入端施加幅值为1的扰动时, 在三种扰动模型下使用稳态Kalman滤波器进行状态和扰动的估计, 基于估计出来的状态分别对输出进行开环预测, 预测结果如图 3所示.

    图 3  不同扰动模型下对应的输出预测
    Fig. 3  Predictive outputs with different disturbance models

    图 3中可以看出, 选取不同的扰动模型对应的开环预测输出有着明显的不同, 这就使得系统相应的闭环性能有显著区别.实际上, 用户可以自由地选取扰动模型, 如输入扰动模型或者输出扰动模型, 这样自然带来一个问题, 那就是如何选取扰动模型才能得到最好的控制性能?这一部分针对这个问题进行讨论.

    2.5.1   扰动的动态模型

    在使用确定性模型时通常假设扰动为常值, 如果使用随机模型可以假设不可测扰动为如下形式的随机噪声:

    $$ \begin{equation}\label{IntegratedNoise} d_{k+1}=d_k+\xi_k \end{equation} $$

    其中, $\xi_k$为零均值的白噪声, 噪声方差为.这类噪声也称为一阶自回归过程、随机游走、Wiener过程或Brown噪声[51-52].选择积分白噪声这一类型的扰动主要受Davison等工作以及IMC理论的启发[53-56], 通过对系统模型的扩展以消除常值扰动、渐近常值扰动以及非零扰动的影响[13-14].更具一般性的扰动动态特性描述可以采用如下形式:

    $$ \begin{equation}\label{NoiseModel} \left\{ \begin{aligned} &x_{d, k+1}=\Phi_d x_{d, k}+w_{d, k}\\ &d_{k}=\Gamma_d x_{d, k} \end{aligned}\right. \end{equation} $$ (25)

    其中, $\Phi_d$和$\Gamma_d$为扰动模型的参数, 为零均值白噪声.利用随机过程相关的建模与预测技术可以实现对随机序列的建模[57-60], 提高对噪声特性的估计水平, 这对控制系统的性能显然是有利的.如果()并且$w_{d, k}$的方差为0, 上述模型退化为常值扰动; 如果($\Phi_d=I, \Gamma_d=I$), 那么上述模型同积分白噪声模型(24)是一致的.

    从概率的角度来看, 可以将确定性扰动视为随机扰动的一种特殊情况(发生的概率接近于1), 这样可以在随机控制的框架下来统一考虑滤波器的设计问题.通常情况下将不可测扰动描述为式(24)是比较方便的, 只需要确定噪声的协方差即可.但是需要注意的是$S_k$为用户自定义参数, 它同系统闭环性能直接相关.这里仍然考虑上述无约束SISO系统$G(s)={1}/{(s+1)}$.选择输出扰动模型$(B_d=0, C_d=I)$和输入扰动模型进行测试.基于两种扰动模型的方法在设定值跟踪方面没有明显区别, 这里仅考虑抗扰性能.

    图 4图 5可以看出, 不管采用输入扰动模型还是输出扰动模型, 也不论扰动是从输入端进入系统还是从输出端进入, 人为引入扰动的动态特性$S_k$对系统抗扰性能有着直接的影响.

    图 4  $S$对系统抗扰能力的影响(输出扰动模型+输出扰动)
    Fig. 4  Disturbance rejection performance with different $S$ (output disturbance model + output disturbance)
    图 5  $S$对系统抗扰能力的影响(输入扰动模型+输入扰动)
    Fig. 5  Disturbance rejection performance with different $S$ (input disturbance model + input disturbance)

    通常假设$\xi_k$, $w_k$和$v_k$为统计特性未知的白噪声, 但是其统计特性可以从实际运行的稳态数据中获取[45, 61-63].值得注意的是, 无论采用积分白噪声模型(24)或是更通用的扰动模型(25), 实际工业过程中的噪声不可能按照模型所描述的那样进行演化.这样基于积分白噪声的假设进行系统设计(如滤波器设计等)所获取的闭环性能未必是最优的.为进一步挖掘系统的抗扰能力, 在MPC的设计中可以引入无偏最小方差(Minimum-variance unbiased, MVU)估计器对扰动进行估计[50, 64].这种方法的突出优势在于不需要对噪声的统计特征进行假设, 能够在更大范围内应对不同特征的噪声, 同MPC结合后可以在一定程度上提高系统的扰动抑制能力.

    2.5.2   Kalman滤波器

    采用随机模型时一般采用Kalman滤波器实现对状态和扰动的估计.将扰动作为状态的一部分, 可得如下扩展的随机线性模型:

    $$ \begin{equation}\nonumber \begin{cases} \begin{bmatrix} x_{k+1} \\ d_{k+1} \\ \end{bmatrix} = \bar{A} \begin{bmatrix} x_{k} \\ d_{k} \\ \end{bmatrix} + \bar{B} u_k + \begin{bmatrix} w_k \\ \xi_k \\ \end{bmatrix}\\ y_k= \bar{C} \begin{bmatrix} x_{k} \\ d_{k} \\ \end{bmatrix} +v_k \end{cases} \end{equation} $$

    其中, $\bar{A}$, $\bar{B}$和$\bar{C}$的定义同式(7)一致.可以采用如下Kalman滤波器进行状态估计:

    $$ \begin{equation}\nonumber \left\{ \begin{aligned} &\hat{x}_{k+1|k}=A\hat{x}_{k|k}+Bu_k+B_d\hat{d}_{k|k}\\ &\hat{d}_{k+1|k}=\hat{d}_{k|k}\\ &\tilde{y}_{k|k-1}=y_k-C\hat{x}_{k|k-1}-C_d\hat{d}_{k|k-1}\\ &\hat{x}_k=\hat{x}_{k|k-1}+L_x\tilde{y}_{k|k-1}\\ &\hat{d}_k=\hat{d}_{k|k-1}+L_d\tilde{y}_{k|k-1}\\ &P=\bar{A}P\bar{A}^\text{T}-\bar{A}P\bar{C}(\bar{C}P\bar{C}^\text{T}+R_k)^{-1}\bar{C}P\bar{A}^\text{T}+\bar{Q}_k \\ &[L^\text{T}_x \text{ } L^\text{T}_d]=P\bar{C}(\bar{C}P\bar{C}^\text{T}+R_k)^{-1}\\ \end{aligned}\right. \end{equation} $$

    其中, , $\tilde{y}_{k|k-1}$为新息.理论上也可采用稳态Kalman滤波器, 增益离线计算, 其主要问题是不能根据实际噪声特性的变化实现最优滤波性能[28].

    2.5.3   扰动模型的等价性

    为揭示不同扰动模型之间的关系, 针对同一线性模型(6)选取两组扰动模型和$(B_{d2}, C_{d2})$, 得到两组扩展模型:

    $$ \begin{equation}\nonumber \begin{cases} \begin{bmatrix} x_{1, k+1} \\ d_{1, k+1} \\ \end{bmatrix} = \underset{\bar{A}_1}{\underbrace{ \begin{bmatrix} A & B_{d1} \\ 0 & I \\ \end{bmatrix}}} \begin{bmatrix} x_{1, k} \\ d_{1, k} \\ \end{bmatrix} + \underset{\bar{B}}{\underbrace{ \begin{bmatrix} B \\ 0 \\ \end{bmatrix}}} u_k +\\ \qquad G_1 \begin{bmatrix} w_k \\ \xi_k \\ \end{bmatrix}\\ y_k= \underset{\bar{C}_1}{\underbrace{ \begin{bmatrix} C & C_{d1} \\ \end{bmatrix}}} \begin{bmatrix} x_{1, k} \\ d_{1, k} \\ \end{bmatrix} + v_k \end{cases} \\ \begin{cases} \begin{bmatrix} x_{2, k+1} \\ d_{2, k+1} \\ \end{bmatrix} = \underset{\bar{A}_2}{\underbrace{ \begin{bmatrix} A & B_{d2} \\ 0 & I \\ \end{bmatrix}}} \begin{bmatrix} x_{2, k} \\ d_{2, k} \\ \end{bmatrix} + \underset{\bar{B}}{\underbrace{ \begin{bmatrix} B \\ 0 \\ \end{bmatrix}}} u_k +\\ \qquad G_2 \begin{bmatrix} w_k \\ \xi_k \\ \end{bmatrix}\\ y_k= \underset{\bar{C}_2}{\underbrace{ \begin{bmatrix} C & C_{d2} \\ \end{bmatrix}}} \begin{bmatrix} x_{2, k} \\ d_{2, k} \\ \end{bmatrix} + v_k \end{cases} \end{equation} $$

    由于上述两个扩展模型描述了相同的输入输出关系, 根据线性系统理论, 必然存在着一个相似变换矩阵, 比如$T$, 使得下式成立[45]:

    $$ \begin{equation}\nonumber \left\{ \begin{aligned} &T\bar{A}_1T^{-1}=\bar{A}_2\\ &\bar{C}_1T^{-1}=\bar{C}_2\\ &T\bar{B}=\bar{B}\\ &TG_1=G_2 \end{aligned}\right. \end{equation} $$

    可将$T$分解为, 有如下关系成立:

    $$ \begin{equation}\nonumber \left\{ \begin{aligned} &T_{11}=I \\ &T_{21}=0 \\ &\begin{bmatrix} A-I & B_{d2} \\ C & C_{d2} \end{bmatrix} \begin{bmatrix} T_{12} \\ T_{22} \\ \end{bmatrix} = \begin{bmatrix} B_{d1} \\ C_{d1} \\ \end{bmatrix} \end{aligned}\right. \end{equation} $$

    特别地, 输入扰动模型和输出扰动模型间存在着等价关系, 其相似变换矩阵为:

    $$ \begin{equation}\nonumber T= \begin{bmatrix} I & (A-I)^{-1}B \\ 0 & -C(A-I)^{-1}B \\ \end{bmatrix} \end{equation} $$

    如果均采用Kalman滤波器, 由于存在上述等价关系, 根据系统实现理论, 对给定的控制序列$(u_1, \cdots, u_{k-1})$和噪声序列, $(w_1, \cdots, \xi_{k-1})$和, 系统的输出序列$(y_1, \cdots, y_{k})$必然相同.这也就意味着Kalman滤波器中的新息序列也是一致的.根据上述等价关系, 基于两个扩展模型设计的Kalman估计器增益之间存在着$L_2=TL_1$.这也就意味着系统闭环性能同扰动模型的选取没有关系, 而与滤波器增益直接相关.由于滤波器的增益同噪声的统计特性直接相关, 如果能通过数据对扰动的噪声特性进行估计, 即使选取不正确扰动模型也能得到闭环性能的补偿. Rajamani等[45]展示了只要能够在线地对噪声统计特性进行估计, 即使选择错误的扰动模型也依然能够得到接近最优的抗扰性能.

    无偏跟踪并不能仅仅依靠双层结构设计、扰动估计、极小化目标函数就能实现, 还跟设定值是否合理、估计器性能、模型失配大小、扰动强弱等因素密切相关.在实际应用中, 设计者往往需要了解保证无偏跟踪的充分条件, 接下来就这一问题进行简单的讨论.

    假设滤波器稳定, $n_d=n_y$, 滤波器稳态值满足:

    $$ \begin{equation}\label{SteadyStates_AKF} \begin{bmatrix} I-A & -B_d \\ C & C_d \\ \end{bmatrix} \begin{bmatrix} \hat{x}_{\infty} \\ u_{\infty} \\ \end{bmatrix} = \begin{bmatrix} -B_d\hat{d}_{\infty} \\ y_{m, \infty}-C_d\hat{d}_{\infty} \\ \end{bmatrix} \end{equation} $$ (26)

    这里给出基于线性MPC保证常值无偏控制的充分条件[4, 47, 65]:

    1) 闭环系统能够达到某一稳态;

    2) 闭环系统渐近稳定;

    3) 被控对象模型可控可观;

    4) 扰动个数等于被控变量个数;

    5) 扩展模型可检测;

    6) 稳态时无起作用的不等式约束.

    在实际应用中, 除了跟踪常值信号外也有可能需要跟踪变化的信号, 这类问题也即伺服控制问题.伺服控制问题可以自然地延伸到包含持续扰动和模型失配的情形, 形成所谓的鲁棒伺服问题[66].这里将伺服问题和鲁棒伺服问题统称为动态跟踪问题, 其主要特点是设定值和扰动为非常值信号, 一般具有动态性和周期性等特征.目前, 大部分研究成果集中在设定值或者扰动特性已知且具有周期性等特点的系统.这类系统有着广泛的应用背景, 如飞机飞行振动控制系统(机翼承受的风剪应力的谐振分量是正弦形式)、海洋平台振动实时控制系统(风力或海浪力的谐振分量也是正弦信号)和磁盘驱动系统(周期扰动)等.动态跟踪问题在伺服控制系统设计中比较常见, 主要目标是使系统能够快速跟踪设定值的变化, 保证被控变量(如角速度、线速度等)的跟踪精度.

    动态跟踪问题可以描述为:对被控过程(1), 假设设定值为动态变化的信号:

    $$ \begin{equation}\label{RefModel} \left\{ \begin{aligned} &x_{r, k+1}=A_rx_{r, k}\\ &r_{k}=C_rx_{r, k} \end{aligned}\right. \end{equation} $$ (27)

    设计适当的控制律, 在满足约束条件(3)的情况下使式(4)成立.

    上面的设定值模型也可表示为$r_{k}=C_rA_rx_{r, k-1}$.由于设定值是动态变化的, 如果仍然采用常值跟踪的模式会导致跟踪滞后(Lag), 如图 6所示.如未能考虑到设定值的动态变化, 在控制周期$k$内控制器试图将被控变量$y$驱动至设定值$r_k$, 由于系统本身的惯性或者滞后会导致这一驱动动作在未来一段时间内才能完成这一目标, 然而设定值在接下来的时间里总是变化的, 这就导致被控变量一直不能跟踪设定值, 形成滞后的效果, 如图 6中$y_1$所示.通过其他一些手段可以使系统响应速度提升, 如参考轨迹等, 但是如果参数选择不合理又会导致系统速度过快, 形成超前的滞后效果, 如图 6中$y_2$所示.如果跟踪的设定值是正弦形式的信号, 容易形成整体的相位滞后, 如图 6中$y$所示.

    图 6  动态跟踪问题中的各种滞后
    Fig. 6  Lags in the tracking control problem

    上世纪七十年代, 无约束动态跟踪问题被广泛讨论, 形成了一系列的控制系统综合方法[13, 53, 66-71], 这些理论成果逐渐成为内模控制的理论基础[6, 55].这类方法的设计原理同LQR/LQG解决无偏控制问题的思路是类似的, 将跟踪误差直接反馈至包含系统模型、设定值模型和扰动模型的伺服补偿模块, 该模块的补偿机理类似于PID控制器中的积分环节.由于误差的积分(伺服补偿模块)同控制器设计是相互独立的, 容易导致积分饱和, 一般需要抗饱和策略的支持.但是需要指出的是, 由于约束、积分饱和等因素的存在, 上述方法有其局限性, 并不能直接应用于MPC的设计.为实现无偏动态跟踪, 需要将设定值和扰动在预测周期里的演化规律纳入到预测时域中, 结合内模控制原理, 设计合适的扰动模型和控制率[4, 9, 47-48, 72-73].这种方法能够有效处理约束, 避免积分饱和问题.

    为实现动态无偏跟踪的目标, 需要人为引入扰动变量作用于系统, 形成如下扩展模型:

    $$ \begin{equation}\label{DynamicTracking_AugModel} \begin{cases} \begin{bmatrix} x_{k+1} \\ d_{k+1} \\ \end{bmatrix} = \begin{bmatrix} A & B_d \\ 0 & A_d \\ \end{bmatrix} \begin{bmatrix} x_{k} \\ d_k \\ \end{bmatrix} + \begin{bmatrix} B \\ 0 \\ \end{bmatrix} u_k\\ y_k= \begin{bmatrix} C & C_d \\ \end{bmatrix} \begin{bmatrix} x_{k} \\ d_k \\ \end{bmatrix} \end{cases} \end{equation} $$ (28)

    在常值跟踪问题中我们假设扰动为常值, 在动态跟踪问题中不能再采用这一策略, 需要对扰动模型进行重新设计.为实现动态设定值的跟踪, 扰动模型$A_d$在设计时应同时满足如下内模条件[9]:

    1) $A_d$中包含$A_r$所有不同的特征值;

    2) $A_d$中每个特征值的几何重数为$n_y$;

    3) $A_d$和$A_r$中相同特征值对应的约旦块大小相同.

    除上述内模条件外, 扰动模型还需要满足如下适定性(Well-posedness)条件才能保证跟踪控制器的存在[66]:

    $$ \begin{equation}\label{Rank_Posedness} \text{rank} \begin{bmatrix} A-\lambda_iI & B \\ C & 0 \\ \end{bmatrix} =n_x+n_y, \forall \lambda_i \in \sigma(A_d) \end{equation} $$ (29)

    其中, $\sigma(\cdot)$表示矩阵的特征值集合.需要注意的是如果上述条件成立也即意味着$n_u \ge n_y$.

    $A_d$可以通过以下方式进行设计.首先, 定义$J_{\lambda}$为相应于特征值$\lambda_i$的约旦块, 且$J_{\lambda}$可进一步地表示为$\alpha_i$个约旦小块组成的对角线分块矩阵, 每个约旦小块$J_{\lambda, p}$定义为模态$\lambda$的$p$阶约旦块:

    $$ \begin{equation}\nonumber J_{\lambda, p}= \begin{bmatrix} \lambda & 1 & 0 & \cdots & 0 \\ 0 & \lambda & 1 & \cdots & 0 \\ 0 & 0 & \lambda & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & \lambda \\ \end{bmatrix}_{p \times p} \end{equation} $$

    然后, 假设$A_r$的特征集由两两相异的特征值构成, $p_i$为$A_r$中第$i$个特征值对应的几何重数.定义, $A_d$可选为

    $$ \begin{equation}\nonumber A_d= \begin{bmatrix} \bar{A}_d & 0 & \cdots & 0 \\ 0 & \bar{A}_d & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \bar{A}_d \\ \end{bmatrix}_{n_y \times n_y} \end{equation} $$

    在常值跟踪问题的稳态目标计算中, 状态目标$x_s$控制量目标$u_s$等变量都可以视为根据常值设定值得到的稳态目标, 这大大简化了系统的分析和计算.但是当设定值为其他类型, 如斜坡、正弦等信号时, 如果仅仅根据当前设定值进行目标计算会使计算出的跟踪目标滞后于实际设定值的变化, 导致设定值同被控量间将出现如图 6所示的各种滞后.为改善这一状况, 可以根据设定值在未来一段时间内的演化规律计算系统状态和设定目标的轨迹.为便于下面的叙述, 给出如下定义[9]:

    1) 目标轨迹:定义$t$时刻目标轨迹为.

    2) 状态轨迹:通过设定值、系统当前状态和扰动计算出的一定时间范围(如预测时域)内的状态序列, 记为$\bar{x}_N$.

    3) 输入轨迹:通过设定值、系统当前状态和扰动计算出的一定时间范围(如预测时域)内的控制量序列, 记为$\bar{u}_N$.

    显然, 在由扩展模型(28)所描述的系统中, 状态和输入轨迹必然满足:

    $$ \begin{equation}\label{Trajectories} \begin{bmatrix} \bar{x}_{i+1} \\ \bar{r}_i \\ \end{bmatrix} = \begin{bmatrix} A & B \\ C & 0 \\ \end{bmatrix} \begin{bmatrix} \bar{x}_{i} \\ \bar{u}_i \\ \end{bmatrix} + \begin{bmatrix} B_d \\ C_d \\ \end{bmatrix}d_i \end{equation} $$ (30)

    其中, $d_{i}=A_dd_{i-1}$, $\bar{r}_{i}=\Gamma_r\Phi_r\hat{x}_{r, i-1}$, .接下来定义动态跟踪问题目标轨迹计算中的目标函数:

    $$ \begin{equation}\nonumber J_t = \sum\limits_{i=k}^{k+N-1}\|r_i-C\bar{x}_i-C_d\bar{d}_i\|_{W_{t}}^2 \\ \begin{aligned} &\min\limits_{\bar{{\pmb x}}_N, \bar{{\pmb u}}_N} \quad J_t \\ &{\rm s.t.} \left\{ \begin{aligned} & \begin{bmatrix} \bar{x}_{i+1} \\ \bar{r}_i \\ \end{bmatrix} = \begin{bmatrix} A & B \\ C & 0 \\ \end{bmatrix} \begin{bmatrix} \bar{x}_{i} \\ \bar{u}_i \\ \end{bmatrix} + \begin{bmatrix} B_d \\ C_d \\ \end{bmatrix}\bar{d}_i\\ & \bar{x}_{i}\in {\bf \Omega}_x\\ & \bar{u}_{i}\in {\bf \Omega}_u\\ &\bar{d}_{i}=\Gamma_d\Phi_d\hat{x}_{d, i-1}\\ &\bar{r}_{i}=\Gamma_r\Phi_r\hat{x}_{r, i-1}\\ &k \le i \le k+N-1 \end{aligned}\right. \end{aligned} \end{equation} $$ (31)

    其中, , .

    由上面的定义可以看出, 同常值跟踪问题相比, 动态跟踪问题的目标计算更为复杂, 这主要表现在不能再用常值稳态目标作为动态调节部分的目标, 取而代之的是目标轨迹.目标轨迹可以认为是常值目标的扩展, 也即用动态的目标轨迹取代常值目标, 这显然更有利于系统的调节, 达到动态跟踪的目的.

    在选定$A_d$后采用预测模型(28)进行动态调节器的设计:

    $$ \begin{align}\label{DynamicRegulation_DynamicTracking} & \min\limits_{{\pmb u}_N} \sum\limits_{i=k}^{k+N-1} (\|x_{t, i}- \bar{x}_{t, i}\|_{W_x}^2+\|u_{t, i}-\bar{u}_{t, i}\|_{W_u}^2)+\nonumber\\ &\qquad\|x_{t, N}-\bar{x}_{t, N}\|_{W_{N}}^2 \\ \nonumber&{\rm s.\, t.} \left\{ \begin{aligned} & x_{t, i+1}=Ax_{t, i}+Bu_{t, i}+B_d\bar{d}_{t, i} \\ &x_{t, i}\in {\bf \Omega}_x, u_{t, i}\in {\bf \Omega}_u \end{aligned}\right. \end{align} $$ (32)

    其中, $W_x\ge 0$、$W_u\ge 0$和分别为状态、输入和输入增量的权重系数.为简单起见, 控制时域和预测时域可以设置成相同的整数$N$.在实际使用中为保证系统运行的平稳性或者考虑执行机构的速率, 需要在目标函数中增加控制量增量项.

    滤波器是实现反馈校正的必要手段, 针对扩展模型(28), 可以采用设计如下状态观测器

    $$ \begin{align}\label{DynamicTrackingObserver} \begin{bmatrix} \hat{x}_{k+1} \\ \hat{d}_{k+1} \\ \end{bmatrix} =\, & \begin{bmatrix} A & B_d \\ 0 & A_d \\ \end{bmatrix} \begin{bmatrix} \hat{x}_{k} \\ \hat{d}_{k} \\ \end{bmatrix} + \begin{bmatrix} B \\ 0 \\ \end{bmatrix}u_k+\nonumber\\ & \begin{bmatrix} L_{x} \\ L_{d} \\ \end{bmatrix} (y_k-C\hat{x}_{k}-C_d\hat{d}_{k}) \end{align} $$ (33)

    同常值跟踪问题类似, 这里的观测器增益$L_x$和$L_d$必须保证观测器是稳定的.如果采用随机模型, 可以使用Kalman滤波实现状态和扰动的在线估计.

    这里简单的总结一下采用线性MPC实现动态无偏跟踪的主要步骤[9]:

    1) 确定设定值模型参数($A_r, C_r$);

    2) 确定扰动模型参数($A_d, B_d, C_d$), 其中$A_d$中必须包括$A_r$中的所有模态, $B_d$和$C_d$的选择必须保证扩展模型是可检测的;

    3) 计算增益$L_x$和$L_d$, 并保证观测器(33)稳定;

    4) 根据式(31)计算目标轨迹$\bar{{\pmb x}}_N$和;

    5) 由式(32)动态计算控制序列${\pmb u}_N$;

    6) 每个控制周期重复第3$\, \sim\, $5步.

    通过对当前无偏MPC设计方法的综述可以看出, 当前的几类设计方法可以统一在扰动模型加估计器的框架下设计, 这样有助于接下来进一步的研究.虽然现有方法可以解决不少实际问题, 但是也存在着较大的局限性, 在诸如扰动建模与抑制、稳态目标计算、非线性无偏MPC、滤波器设计、基础理论问题、提高系统运行经济性方面还有广阔的空间.

    工业现场运行的控制系统不可避免地存在各种各样的扰动, 许多扰动不仅严重而且机理复杂.不仅如此, 大多数干扰无法直接测量, 又不易消除.在基于模型的控制算法中, 实现对扰动抑制的主要方法是通过对扰动进行建模, 利用扰动模型预测其对系统的影响, 进而选择合适的控制策略进行抑制.

    总体而言, 扰动建模可分成三个步骤[74]:分析扰动源, 假设扰动动态特性和确定扰动模型参数.

    1) 分析扰动源

    由于工业现场扰动的复杂性, 确切的扰动源往往难以确定[75].在不能准确定位扰动源的情况下, 可以人为假设扰动源.扰动源的选择对系统闭环性能有着直接的影响, 选取不同的扰动源往往对应着不同的闭环性能, 可以参考图 3.

    2) 假设扰动动态特性

    在确定扰动源后, 需要对扰动的动态特性作出假设, 如扰动动态特性较慢可以假设其为常值扰动, 在随机框架下可以假设扰动为积分白噪声(24), 也可以用户自定义其他的扰动形式.如果使用MVU估计器, 可以不对噪声特性进行假设[50, 65].

    3) 确定扰动模型参数

    扰动模型参数可以通过经验确定, 如定位扰动在系统的输入端, 扰动模型同原系统的模型一致($B_d=B, C_d=0$), 如果扰动源位于输出端, 则可以直接假设扰动模型为一可变常值().扰动模型参数也可以通过辨识方法确定, 由于不能像操作变量那样施加激励信号, 扰动模型的辨识一般利用在线数据进行闭环辨识[76].由于噪声特征的复杂性, 这类在线算法的收敛性值得更深入的研究.此外, 还可以结合鲁棒控制的思想设计扰动模型[77].

    MPC虽然可以在一定程度上实现对扰动的抑制, 但是它不可能从根本上消除这一问题, 因此, 掌握其他的扰动抑制方法对MPC系统的设计是非常有帮助的.如抑制扰动源, 增加局部控制器, 前馈补偿, 扰动建模与预测, 扰动估计与补偿, 多变量控制等[78], 掌握这些方法有助于设计更好的MPC控制系统.设计无偏MPC的一个核心的问题就是如何对扰动进行建模和预测.扰动模型的选择直接关系到MPC的性能, 特别是抗扰性能.面对工程实践中的各类复杂噪声和扰动, 工业噪声和扰动的建模应该成为一个关注的问题[79].因此, 在扰动的建模与抑制方面还需要新的理论和方法, 以获得更好的扰动预测能力.

    在双层结构MPC中, 稳态目标计算问题(14)可以实时地将扰动纳入到控制目标的计算中, 可以有效地应对诸如模型失配、不可测扰动等因素的影响, 提高系统运行的经济性[40].需要注意的是虽然当前的大部分研究是在双层结构MPC的框架下进行的, 但是并不意味着双层结构能够保证无偏跟踪, 无偏跟踪目标的实现还同跟设定值是否合理、估计器性能、模型失配大小、扰动强弱等因素密切相关.为了简化问题, 一般假设SSTO可以将设定目标转化为期望的可行稳态目标$(x_s, u_s)$[25, 43].基于这一假设MPC只需关注在满足约束的情况下将系统驱动至期望稳态目标即可.但是在工程实践中这一假设条件往往难以满足[56, 80-81].即使在特定条件下可以得到可行的$(x_s, u_s)$, 但是在扰动、模型失配等因素的作用下, 该稳态控制目标并不能保证系统的输出$y$尽可能地接近设定值$r$[65, 81].这一问题并不能仅仅通过积分效应来消除, 还需要其他方法和策略.如在跟踪目标中增加可容许的稳态目标偏差项[82], 在SSTO无可行解时修改MPC跟踪的目标函数[81]等.这些方法可以在提升动态过程响应速度的同时, 尽可能地减少稳态偏差, 提高系统运行的经济性.

    SSTO面临的主要挑战来自于在不确定性环境下(如工况变化、不可测扰动、模型失配等), 如何将上层的稳态经济目标(包括操作界限、经济目标、控制目标、优先级等)转换为合理的动态控制目标, 以减少系统在动态运行中的经济损失?针对这一问题仍需要更多的关注和讨论.

    由于非线性模型能够描述的动态更为丰富, 非线性预测控制具有很大的吸引力.现有的少数非线性无偏MPC设计方法仍然采用同线性无偏MPC类似的策略, 即在原有模型的基础上增加扰动项用以描述模型失配或者外部扰动, 进而设计估计器对系统状态和扰动进行估计[29].如引入扰动变量$d$在原非线性模型(1)的基础上进行扩展:

    $$ \begin{equation}\nonumber \left\{ \begin{aligned} &x_{k+1}=f(x_k, u_k, d_k)\\ &y_k=g(x_k, d_k) \\ &d_{k+1}=d_k \end{aligned} \right. \end{equation} $$

    其中, $f$和$g$为扩展后模型的非线性函数.这种方法通过每个周期在线求解一QP问题得到稳态目标$x_s$和$u_s$.这一策略对于线性系统证明是有效的, 如果考虑非线性系统, 也可以采用类似的策略对稳态目标进行优化.除此之外, 还可采用RTO或者DRTO的策略对稳态值进行优化, 这样可以提高系统运行的经济性.另外, 设定值管理是另一种对设定值进行优化的方法, 这种方法同设定值滤波器的作用类似, 旨在为控制器提供可跟踪的设定值, 为控制器的设计提供了更多的自由度, 以提升系统跟踪性能和管理约束的能力[83-85].

    除微分代数方程这类非线性模型外, 还可以采用一些特殊类型的非线性模型, 如Hammerstein模型、Wiener模型等.其中, Hammerstein模型不仅可以描述非线性系统的动态特征, 还可以用于描述执行器非线性、执行器故障等场景, 因此应用较为广泛.通过模型转换可以将Hammerstein模型转化为带未知输入的线性模型加以处理, 利用估计器对未知输入进行估计, 这样不仅可以处理执行器的未知静态非线性特征也可以用作执行器故障的监测和容错控制[86-87].对比线性无偏MPC设计方法, 关于这类非线性系统的无偏MPC设计问题在许多方面仍需要进一步深入研究.

    非线性模型, 如机理模型等, 虽然理论上其精确度较线性模型更高, 但仍不可避免地存在失配, 只是失配程度有别.因此在非线性MPC的设计中仍需要考虑模型失配和外部扰动, 否则不能保证无偏控制.目前非线性无偏MPC的研究并不多见, 相关研究还处于刚刚起步的阶段, 现有的方法也仅能处理方系统的常值跟踪问题, 对于非方系统以及动态跟踪问题的无偏性讨论目前还没有进展.考虑到非线性系统及其约束优化问题不能用参数化的形式统一表达, 围绕着如何处理非线性和降低在线计算量, 无论是理论研究还是实际应用都有着很大的空间[1].

    在基于状态空间方程的MPC中主要通过滤波器(观测器或估计器)实现反馈校正.滤波器的设计一般基于分离定理, 即确定性等价原理.但是这一基本原理仅适用于理想的线性系统, 在面对诸如非线性、模型失配、未知扰动等情况时这一原理并不成立.另外一方面, 在当前的许多理论研究中均假设状态完全可测, 但是从成本、安全、物理可实现性等实际情况分析, 这一假设也难以成立.如果没有必要的方法能够实现对状态的准确估计, 将造成理论研究和实际应用脱节[28].因此, 滤波器方面的研究和应用能够有效衔接理论和实践, 是理论研究和工程应用之间的一座桥梁.

    具有良好滤波性能的滤波器可以提供被控对象当前的状态, 然后通过模型进行预测, 进而规划对象未来的走向, 这是获得良好控制性能的必要条件[28].在线性MPC中一般使用Kalman滤波器来实时估计系统的状态和扰动, 使系统的预测建立在"真实值"的基础之上.由前面讨论的扰动模型的等价性可知, 即使选取不同的扰动模型(正确性未知)也能够得到相同的闭环性能.因此, 问题的关键在于如何获取扰动的统计特性.目前这一问题可以利用历史数据通过在线求解优化问题得到解决[61, 63, 88-89].围绕着对输出的无偏渐近跟踪和更好的滤波性能, 现有的其他滤波方法如比例自适应滤波[90-92]、积分滤波器[93]、MVU滤波器[50-51]、MHE[56]、粒子群滤波[56]、鲁棒滤波[57]等在一定场合下都能获得一定的应用效果.

    非线性滤波器的设计是非线性预测控制系统设计中必不可少的环节, 也是是非线性预测控制走向实际的一个关键问题之一.常见的非线性滤波器主要以EKF为主, 针对EKF的缺点也有不少改进算法, 如UKF、EnKF等, 从噪声的概率密度函数、非线性函数的近似等方面进行改进[56].正如Rawlings所指出的那样, 上述估计方法在一定程度上存在着"短视症"[56], 比较常见的解决办法是采用滚动时域估计(Moving horizon estimation, MHE)方法[56, 94].能够有效处理约束也是MHE区别于其他滤波方法的一大特点, 然而其发展的主要障碍在于不能快速地得到最优解, 快速、可靠的非线性数值求解算法是当前MHE研究中亟待解决的问题.虽然EKF、UKF、EnKF、MHE、鲁棒滤波等在一定程度上可以解决非线性系统的状态估计问题, 然而仍然需要考虑模型失配和外部干扰对系统造成的影响.因此, 如何在不确定性环境下对非线性系统的状态和扰动进行估计仍需要深入研究.另外一方面, 在基于滤波器的设计中, 实际状态被估计状态所取代, 由于估计误差具有不确定性, 因此带估计器系统的鲁棒性问题并未完全解决[73, 95-96].

    从前面的讨论可以看出, 当前双层结构无偏MPC需要在假设系统稳定、优化可行等条件的基础上, 才能得到严格的理论结果, 因此系统稳定性、可行性等基础理论问题是接下来应该重视的一个方向.从理论上确保系统稳定并且每个时刻优化问题的可行性是MPC理论研究的基础问题之一.现有双层结构MPC的可行性问题并不能直接借鉴原有单层MPC的方法.双层结构无偏MPC需要假设目标优化问题和动态优化问题在每个时刻都是可行的, 然而由于扰动和模型失配等因素的存在, 这一假设并不能保证成立.在假设SSTO问题可行的前提下, 借鉴单层MPC可行性分析的方法目前对双层无偏MPC的可行性和闭环稳定性有了初步的讨论[97-98].需要注意的是, 实际应用中SSTO并不能保证可行, 因此, 当前的讨论结果的适用条件仍然比较苛刻.如果再考虑到模型不确定性对系统闭环稳定性带来的影响, 这一问题将会更加复杂, 是一开放性的难题.

    当前, 先进过程控制系统一般采用两层结构, 实时优化层和动态控制层[43, 99-100].虽然基于传统的RTO + MPC双层结构取得了巨大的成功[101-102], 但同时也存在着一些不足之处, 主要表现在两层所用模型不一致导致的需独立实施、增益不一致、时标不统一等[103].另外, 对一些受干扰较严重的对象, 实施稳态优化是不现实的.因此, 有必要对优化控制系统的结构进行重新整合, 这其中包括优化控制一体化[104-106]、分布式MPC、动态RTO (Dynamic RTO, DRTO)、以及DRTO同控制层结合的策略等[103, 107].在新的优化控制系统结构中, 由于在控制层人为增加经济目标, 使得优化问题变为不易求解的多目标优化问题, 难以保证优化问题总是可行的, 不利于工程实施与系统维护[104, 106], 因此到目前为止仅有少数应用实例[103].

    正如Morari等指出的那样, 控制系统结构的综合问题本质上是如何将经济目标转化为过程控制目标的过程[108].不论采用哪种系统结构, 最后都需要将经济指标转化为可行的控制目标, 这都需要控制层能够实现无偏控制, 克服不确定性的影响, 如模型失配、扰动等, 使系统工作于期望的操作工况.围绕着如何将经济目标和控制目标更好地结合, 可以考虑结合经济预测控制和无偏预测控制的特点, 实施所谓的经济无偏MPC[109].

    如何将生产过程与计划调度结合起来, 把经营目标转化成生产过程中的操作目标, 根据环境变化、市场波动和设备状况自动地确定最优操作条件, 从而实现企业经营目标与生产操作有机关联, 到目前为止仍有许多亟待解决的问题.

    席裕庚教授在文献[1]里指出"预测控制的研究应该努力克服理论与应用的脱节, 针对各应用领域的需求, 发展既有理论保证、又能满足应用环境和实时性要求的高效算法, 为各行各业解决约束优化问题提供理论依据充分、实用性强、兼顾优化与稳定等性能要求的系统理论和算法, 并以此推动预测控制理论的进一步发展, 这是预测控制研究始终追求的目标, 也是预测控制未来发展的方向", 这也为我们接下来的研究确立了方向.

    无偏MPC围绕着如何提高系统的跟踪性能和抗扰性能展开研究, 是一类面向实际应用的控制方法.在MPC框架下主要通过增加扰动项来描述模型失配和外部扰动, 然后设计估计器或滤波器对状态和扰动进行在线估计, 通过对扰动的前馈补偿实现无偏控制的目标.目前, 无偏MPC得到了工业界广泛关注, 如AspenTech的新产品APC State-Space Controller和壳牌石油公司的SMOC产品中允许用户自定义扰动模型和参数, ABB的产品Optimize$^\text{IT}$ Predict & Control中也有类似的功能.但是这类方法的许多基础理论性问题, 诸如可行性、鲁棒性、闭环稳定性等仍未得到理论界的充分重视.由于对不确定性(噪声、扰动、模型失配等)认识和描述方式的多样性, 无偏MPC理论和方法的研究仍然是开放的.相信随着MPC理论的进一步发展和应用领域的不断扩展, "既有理论保证、又能满足应用环境和实时性要求的高效算法"能够不断涌现.


  • 本文责任编委 诸兵
  • 图  1  IMC系统结构

    Fig.  1  Structure of IMC system

    图  2  双层MPC结构示意图

    Fig.  2  Double-layered MPC

    图  3  不同扰动模型下对应的输出预测

    Fig.  3  Predictive outputs with different disturbance models

    图  4  $S$对系统抗扰能力的影响(输出扰动模型+输出扰动)

    Fig.  4  Disturbance rejection performance with different $S$ (output disturbance model + output disturbance)

    图  5  $S$对系统抗扰能力的影响(输入扰动模型+输入扰动)

    Fig.  5  Disturbance rejection performance with different $S$ (input disturbance model + input disturbance)

    图  6  动态跟踪问题中的各种滞后

    Fig.  6  Lags in the tracking control problem

  • [1] 席裕庚, 李德伟, 林姝.模型预测控制—现状与挑战.自动化学报, 2013, 39(3): 222-236 doi: 10.3724/SP.J.1004.2013.00222

    Xi Yu-Geng, Li De-Wei, Lin Shu. Model predictive control—status and challenges. Acta Automatica Sinica, 2013, 39(3): 222-236 doi: 10.3724/SP.J.1004.2013.00222
    [2] Shinskey F G. Feedback Controllers for the Process Industries. New York: McGraw-Hill Professional, 1994. 117-119
    [3] Lundström P, Lee J H, Morari M, Skogestad S. Limitations of dynamic matrix control. Computers & Chemical Engineering, 1995, 19(4): 409-421 http://cn.bing.com/academic/profile?id=f784b1919df2f28bf79ef45d9c4c572f&encoded=0&v=paper_preview&mkt=zh-cn
    [4] Muske K R, Badgwell T A. Disturbance modeling for offset-free linear model predictive control. Journal of Process Control, 2002, 12(5): 617-632 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=a53bce47218139e3782ace29d6d5a1bf
    [5] Aström K J, Hägglund T. PID Controllers: Theory, Design and Tuning (Second edition). USA: Instrument Society of America, 1995. 80-92
    [6] Garcia C E, Morari M. Internal model control. A unifying review and some new results. Industrial & Engineering Chemistry Process Design & Development, 1982, 21(2): 308-323 doi: 10.1021-i200017a016/
    [7] Morari M, Zafiriou E. Robust Process Control. Englewood Cliffs, NJ: Prentice-Hall, 1989.
    [8] 席裕庚.预测控制.第2版.北京:国防工业出版社, 2013

    Xi Yu-Geng. Predictive Control (Second edition). Beijing: National Defense Industry Press, 2013.
    [9] Maeder U, Morari M. Offset-free reference tracking with model predictive control. Automatica, 2010, 46(9): 1469-1476 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=82a599115d96619621990f520aa8e59a
    [10] Young P C, Willems J C. An approach to the linear multivariable servomechanism problem. International Journal of Control, 1972, 15(5): 961-979 doi: 10.1080/00207177208932211
    [11] Franklin G F, Powell J D, Workman M L. Digital Control of Dynamic Systems (Third edition). Menlo Park, CA: Addison Wesley Longman Publishing Co., Inc., 1998. 322-336
    [12] Johnson C D. Accomodation of external disturbances in linear regulator and servomechanism problems. IEEE Transactions on Automatic Control, 1971, 16(6): 635-644 doi: 10.1109/TAC.1971.1099830
    [13] Davison E J, Smith H W. Pole assignment in linear time-invariant multivariable systems with constant disturbances. Automatica, 1971, 7(4): 489-498 doi: 10.1016/0005-1098(71)90099-9
    [14] Kwakernaak H, Sivan R. Linear Optimal Control Systems. New York: John Wiley & Sons, Inc., 1972. 278-279
    [15] Richalet J, Rault A, Testud J L, Papon J. Model predictive heuristic control: applications to industrial processes. Automatica, 1978, 14(5): 413-428 doi: 10.1016-0005-1098(78)90001-8/
    [16] Cutler C R, Ramaker B L. Dynamic matrix control: a computer control algorithm. In: Proceedings of the 1980 Joint Automatic Control Conference. San Francisco, USA, 1980.
    [17] Garcia C E, Morshedi A M. Quadratic programming solution of dynamic matrix control (QDMC). Chemical Engineering Communications, 1986, 46(1-3): 73-87 doi: 10.1080/00986448608911397
    [18] Clarke D W, Mohtadi C. Properties of generalized predictive control. Automatica, 1989, 25(6): 859-875 doi: 10.1016/0005-1098(89)90053-8
    [19] Marquis P, Broustail J. SMOC, a bridge between state space and model predictive controllers: application to the automation of a hydrotreating unit. IFAC Proceedings Volumes, 1988, 21(4): 37-45 doi: 10.1016/B978-0-08-035735-5.50010-3
    [20] Rawlings J B. Tutorial overview of model predictive control. IEEE Control Systems, 2000, 20(3): 38-52 http://cn.bing.com/academic/profile?id=80dc0712a8ee58d18b9749b8224d9743&encoded=0&v=paper_preview&mkt=zh-cn
    [21] Li S F, Lim K Y, Fisher D G. A state space formulation for model predictive control. AIChE Journal, 1989, 35(2): 241-249 doi: 10.1002/aic.690350208
    [22] Ricker N L. Model predictive control with state estimation. Industrial & Engineering Chemistry Research, 1990, 29(3): 374-382 http://d.old.wanfangdata.com.cn/OAPaper/oai_doaj-articles_af2ad960e2e7be4856a2fd53c7dba86d
    [23] Kwon W H, Byun D G. Receding horizon tracking control as a predictive control and its stability properties. International Journal of Control, 1989, 50(5): 1807-1824 doi: 10.1080/00207178908953467
    [24] Rawlings J B, Muske K R. The stability of constrained receding horizon control. IEEE Transactions on Automatic Control, 1993, 38(10): 1512-1516 doi: 10.1109/9.241565
    [25] Muske K R, Rawlings J B. Model predictive control with linear models. AIChE Journal, 1993, 39(2): 262-287 doi: 10.1002/aic.690390208
    [26] Lee J H, Morari M, Garcia C E. State-space interpretation of model predictive control. Automatica, 1994, 30(4): 707-717 doi: 10.1016/0005-1098(94)90159-7
    [27] Wang L P. A tutorial on model predictive control: using a linear velocity-form model. Developments in Chemical Engineering & Mineral Processing, 2004, 12(5-6): 573-614 http://cn.bing.com/academic/profile?id=57d01df231d6ee94633e98e901047a90&encoded=0&v=paper_preview&mkt=zh-cn
    [28] Froisy J B. Model predictive control—building a bridge between theory and practice. Computers & Chemical Engineering, 2006, 30(10-12): 1426-1435 https://academic.oup.com/her/article/15/2/125/550414
    [29] Morari M, Maeder U. Nonlinear offset-free model predictive control. Automatica, 2012, 48(9): 2059-2067 doi: 10.1016/j.automatica.2012.06.038
    [30] Akesson J, Hagander P. Integral action — a disturbance observer approach. In: Proceedings of the 2003 European Control Conference (ECC). Cambridge, UK: IEEE, 2015. 2577-2582
    [31] Rao C V, Wright S J, Rawlings J B. Application of interior-point methods to model predictive control. Journal of Optimization Theory & Applications, 1998, 99(3): 723-757 http://cn.bing.com/academic/profile?id=37dc2572a182e4eb56569ba6ef573176&encoded=0&v=paper_preview&mkt=zh-cn
    [32] Prett D M, García C E. Fundamental Process Control. Stoneham, MA: Butterworths, 1988
    [33] Betti G, Farina M, Scattolini R. A robust MPC algorithm for offset-free tracking of constant reference signals. IEEE Transactions on Automatic Control, 2013, 58(9): 2394-2400 doi: 10.1109/TAC.2013.2254011
    [34] Maciejowski J M. Predictive Control with Constraints. Englewood Cliffs: Prentice-Hall, 2002
    [35] González A H, Adam E J, Marchetti J L. Conditions for offset elimination in state space receding horizon controllers: a tutorial analysis. Chemical Engineering & Processing: Process Intensification, 2008, 47(12): 2184-2194 http://cn.bing.com/academic/profile?id=b39d1d783d51ed52a7998aacb43bc963&encoded=0&v=paper_preview&mkt=zh-cn
    [36] Betti G, Farina M, Scattolini R. An MPC algorithm for offset-free tracking of constant reference signals. In: Proceedings of the 51st IEEE Conference on Decision and Control. Maui, HI, USA: IEEE, 2012. 5182-5187
    [37] Tatjewski P. Advanced Control of Industrial Processes. London: Springer Verlag, 2007. 176-197
    [38] Tatjewski P. Disturbance modeling and state estimation for offset-free predictive control with state-space process models. International Journal of Applied Mathematics & Computer Science, 2014, 24(2): 313-323 http://cn.bing.com/academic/profile?id=6e8857562a4802d30d390cba6f9aed9c&encoded=0&v=paper_preview&mkt=zh-cn
    [39] Zou T. Offset-free strategy by double-layered linear model predictive control. Journal of Applied Mathematics, 2012, 2012: Article ID 808327
    [40] 吴明光, 钱积新.基于多目标分层的预测控制定态优化技术.化工学报, 2005, 56(1): 105-109 doi: 10.3321/j.issn:0438-1157.2005.01.019

    Wu Ming-Guang, Qian Ji-Xin. Multi-objective and layered steady-state optimization method of model predictive control. Journal of Chemical Industry and Engineering, 2005, 56(1): 105-109 doi: 10.3321/j.issn:0438-1157.2005.01.019
    [41] 邹涛, 丁宝苍, 张瑞.模型预测控制工程应用导论.北京:化学工业出版社, 2010.

    Zou Tao, Ding Bao-Cang, Zhang Rui. MPC: an Introduction to Industrial Applications. Beijing: Chemical Industry Press, 2010.
    [42] Rawlings J B, Amrit R. Optimizing process economic performance using model predictive control. In: Proceedings of the 2009 Nonlinear Model Predictive Control. Lecture Notes in Control & Information Sciences. Berlin, Heidelberg: Springer, 2009, 384: 119-138
    [43] Rao C V, Rawlings J B. Steady states and constraints in model predictive control. AIChE Journal, 1999, 45(6): 1266-1278 doi: 10.1002/aic.690450612
    [44] 丁宝苍.工业预测控制.北京:机械工业出版社, 2016.

    Ding Bao-Cang. Industrial Predictive Control. Beijing: China Machine Press, 2016.
    [45] Rajamani M R, Rawlings J B, Qin S J. Achieving state estimation equivalence for misassigned disturbances in offset-free model predictive control. AIChE Journal, 2009, 55(2): 396-407 doi: 10.1002/aic.11673
    [46] Badgwell T A, Muske K R. Disturbance model design for linear model predictive control. In: Proceedings of the 2002 American Control Conference. Anchorage, USA: IEEE, 2002. 1621-1625
    [47] Pannocchia G, Rawlings J B. Disturbance models for offset-free model predictive control. AIChE Journal, 2003, 49(2): 426-437 doi: 10.1002/aic.690490213
    [48] Maeder U, Borrelli F, Morari M. Linear offset-free model predictive control. Automatica, 2009, 45(10): 2214-2222 doi: 10.1016/j.automatica.2009.06.005
    [49] Pannocchia G. Offset-free tracking MPC: a tutorial review and comparison of different formulations. In: Proceedings of the 2015 European Control Conference. Linz, Austria: IEEE, 2015. 527-532
    [50] Wang H K, Xu Z H, Zhao J, Jiang A P. An optimal filter based MPC for systems with arbitrary disturbances. Chinese Journal of Chemical Engineering, 2017, 25(5): 632-640 doi: 10.1016/j.cjche.2016.09.011
    [51] Wang H K, Zhao J, Xu Z H, Shao Z J. Input and state estimation for linear systems with a rank-deficient direct feedthrough matrix. ISA Transactions, 2015, 57: 57-62 doi: 10.1016/j.isatra.2015.02.005
    [52] Aström K J. Introduction to Stochastic Control Theory. London: Academic Press, 1970.
    [53] Davison E J. The output control of linear time-invariant multivariable systems with unmeasurable arbitrary disturbances. IEEE Transactions on Automatic Control, 1972, 17(5): 621-630 doi: 10.1109/TAC.1972.1100084
    [54] Davison E J, Smith H W. A note on the design of industrial regulators: integral feedback and feedforward controllers. Automatica, 1974, 10(3): 329-332 doi: 10.1016/0005-1098(74)90044-2
    [55] Francis B A, Wonham W M. The internal model principle of control theory. Automatica, 1976, 12(5): 457-465 doi: 10.1016/0005-1098(76)90006-6
    [56] Rawlings J B, Mayne D Q. Model Predictive Control: Theory and Design. Boston, MA, USA: Addison-Wesley Longman Publishing Co., Inc., 2006.
    [57] Geromel J C, Bernussou J, Garcia G. $H_2$ and $H{_\infty}$ robust filtering for discrete-time linear systems. SIAM Journal on Control & Optimization, 2000, 38(5): 1353-1368
    [58] Speyer J L, Chung W H. Stochastic Processes, Estimation, and Control. Philadelphia: Society for Industrial and Applied Mathematics, 2008
    [59] Box G P, Jenkins G M. Time Series Analysis: Forecasting and Control. San Francisco, CA, USA: Holden-Day, 1970
    [60] Brockwell P J, Davis R A. Time Series: Theory and Methods. New York, USA: Springer-Verlag, 1987
    [61] Odelson B J, Rajamani M R, Rawlings J B. A new autocovariance least-squares method for estimating noise covariances. Automatica, 2006, 42(2): 303-308 doi: 10.1016/j.automatica.2005.09.006
    [62] Lima F V, Rajamani M R, Soderstrom T A, et al. Covariance and state estimation of weakly observable systems: application to polymerization processes. IEEE Transactions on Control Systems Technology, 2013, 42(4): 1249-1257. http://cn.bing.com/academic/profile?id=53a79c0373636eafc52382190236fc75&encoded=0&v=paper_preview&mkt=zh-cn
    [63] Rajamani M R, Rawlings J B. Estimation of the disturbance structure from data using semidefinite programming and optimal weighting. Automatica, 2009, 45(1): 142-148 doi: 10.1016/j.automatica.2008.05.032
    [64] Wang H K, Zhao J, Xu Z H, Shao Z J. Linear offset-free model predictive control: a minimum-variance unbiased filter based approach. In: Proceedings of the 52nd IEEE Conference on Decision and Control. Florence, Italy: IEEE, 2013. 782-786
    [65] Shead L R E, Muske K R, Rossiter J A. Conditions for which linear MPC converges to the correct target. Journal of Process Control, 2010, 20(10): 1243-1251 doi: 10.1016/j.jprocont.2010.09.001
    [66] Davison E J. The robust control of a servomechanism problem for linear time-invariant multivariable systems. IEEE Transactions on Automatic Control, 1976, 21(1): 25-34 doi: 10.1109/TAC.1976.1101137
    [67] Johnson C. Further study of the linear regulator with disturbances—the case of vector disturbances satisfying a linear differential equation. IEEE Transactions on Automatic Control, 1970, 15(2): 222-228 doi: 10.1109/TAC.1970.1099406
    [68] Wonham W M. Tracking and regulation in linear multivariable systems. SIAM Journal on Control, 1973, 11(3): 424-437 doi: 10.1137/0311035
    [69] Wonham W M, Pearson J B. Regulation and internal stabilization in linear multivariable systems. SIAM Journal on Control, 1974, 12(1): 5-18 doi: 10.1137/0312002
    [70] Pearson J, Shields R, Staats P. Robust solutions to linear multivariable control problems. IEEE Transactions on Automatic Control, 1974, 19(5): 508-517 doi: 10.1109/TAC.1974.1100679
    [71] Francis B, Sebakhy O A, Wonham W M. Synthesis of multivariable regulators: the internal model principle. Applied Mathematics and Optimization, 1974, 1(1): 64-86 http://cn.bing.com/academic/profile?id=58970e1b229940be8283923ba7e068cf&encoded=0&v=paper_preview&mkt=zh-cn
    [72] Qin S J, Badgwell T A. A survey of industrial model predictive control technology. Control Engineering Practice, 2003, 11(7): 733-764 doi: 10.1016/S0967-0661(02)00186-7
    [73] Pannocchia G, Bemporad A. Combined design of disturbance model and observer for offset-free model predictive control. IEEE Transactions on Automatic Control, 2007, 52(6): 1048-1053 doi: 10.1109/TAC.2007.899096
    [74] 王浩坤.无偏模型预测控制的若干理论和方法研究[博士学位论文], 浙江大学, 中国, 2015 http://cdmd.cnki.com.cn/Article/CDMD-10335-1015305300.htm

    Wang Hao-Kun. Theories and Methods for Offset-Free Model Predictive Control [Ph. D. dissertation], Zhejiang University, China, 2015 http://cdmd.cnki.com.cn/Article/CDMD-10335-1015305300.htm
    [75] 钱积新, 赵均, 徐祖华.预测控制.北京:化学工业出版社, 2007.

    Qian Ji-Xin, Zhao Jun, Xu Zu-Hua. Predictive Control. Beijing: Chemical Industry Press, 2007.
    [76] Sun Z J, Zhao Y, Qin S J. Improving industrial MPC performance with data-driven disturbance modeling. In: Proceedings of the 50th IEEE Conference on Decision and Control and European Control Conference. Orlando, USA: IEEE, 2011. 1922-1927
    [77] Pannocchia G. Robust model predictive control with guaranteed setpoint tracking. Journal of Process Control, 2004, 14(8): 927-937 doi: 10.1016/j.jprocont.2004.03.001
    [78] Äström K J, Wittenmark B. Computer-Controlled Systems: Theory and Design, (Third edition). Englewood Cliffs, N.J.: Prentice Hall, 1996.
    [79] 钱积新.控制理论研究中的几个挑战性的问题.控制工程, 2005, 12(3): 193-195 doi: 10.3969/j.issn.1671-7848.2005.03.001

    Qian Ji-Xin. Some challenging problems in research on control theory. Control Engineering of China, 2005, 12(3): 193-195 doi: 10.3969/j.issn.1671-7848.2005.03.001
    [80] Hovd M. Improved target calculation for model predictive control. Modeling, Identification and Control, 2007, 28(3): 81-86 doi: 10.4173/mic.2007.3.3
    [81] Rawlings J B, Bonne D, Jorgensen J B, Venkat A N, Jorgensen S B. Unreachable setpoints in model predictive control. IEEE Transactions on Automatic Control, 2008, 53(9): 2209-2215 doi: 10.1109/TAC.2008.928125
    [82] Limon D, Alvarado I, Alamo T, Camacho E F. MPC for tracking piecewise constant references for constrained linear systems. Automatica, 2008, 44(9): 2382-2387 doi: 10.1016/j.automatica.2008.01.023
    [83] Gilbert E G, Kolmanovsky I, Tan K T. Discrete-time reference governors and the nonlinear control of systems with state and control constraints. International Journal of Robust and Nonlinear Control, 1995, 5(5): 487-504 doi: 10.1002/rnc.4590050508
    [84] Rossiter J A, Kouvaritakis B, Gossner J R. Feasibility and stability results for constrained stable generalized predictive control. Automatica, 1995, 31(6): 863-877 doi: 10.1016/0005-1098(94)00166-G
    [85] Bemporad A, Casavola A, Mosca E. Nonlinear control of constrained linear systems via predictive reference management. IEEE Transactions on Automatic Control, 1997, 42(3): 340-349 doi: 10.1109/9.557577
    [86] Wang H K, Zhao J, Xu Z H, Shao Z J. Model predictive control for Hammerstein systems with unknown input nonlinearities. Industrial & Engineering Chemistry Research, 2014, 53(18): 7714-7722 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=f7559988503aab59e5d0d19aabf9e767
    [87] Wang H K, Jiang A P. An active fault-tolerant MPC for systems with partial actuator failures. In: Proceedings of the 11th Asian Control Conference. Gold Coast, Australia: IEEE, 2017. 1614-1619
    [88] Lima F V, Rawlings J B. Nonlinear stochastic modeling to improve state estimation in process monitoring and control. AIChE Journal, 2011, 57(4): 996-1007 doi: 10.1002/aic.12308
    [89] Zagrobelny M A, Rawlings J B. Practical improvements to autocovariance least-squares. AIChE Journal, 2015, 61(6): 1840-1855 doi: 10.1002/aic.14771
    [90] Mehra R. Approaches to adaptive filtering. IEEE Transactions on Automatic Control, 1972, 17(5): 693-698 doi: 10.1109/TAC.1972.1100100
    [91] Mehra R. On the identification of variances and adaptive Kalman filtering. IEEE Transactions on Automatic Control, 1970, 15(2): 175-184 doi: 10.1109/TAC.1970.1099422
    [92] Myers K, Tapley B. Adaptive sequential estimation with unknown noise statistics. IEEE Transactions on Automatic Control, 1976, 21(4): 520-523 doi: 10.1109/TAC.1976.1101260
    [93] Bodizs L, Srinivasan B, Bonvin D. On the design of integral observers for unbiased output estimation in the presence of uncertainty. Journal of Process Control, 2011, 21(3): 379-390 doi: 10.1016/j.jprocont.2010.11.015
    [94] 陈虹.模型预测控制.北京:科学出版社, 2013.

    Chen Hong. Model Predictive Control. Beijing: Science Press, 2013.
    [95] Mohammadkhani M, Bayat F, Jalali A A. Two-stage observer based offset-free MPC. ISA Transactions, 2015, 57: 136-143 doi: 10.1016/j.isatra.2015.02.015
    [96] Mayne D Q. Model predictive control: recent developments and future promise. Automatica, 2014, 50(12): 2967-2986 doi: 10.1016/j.automatica.2014.10.128
    [97] Pannocchia G, Kerrigan E C. Offset-free receding horizon control of constrained linear systems. AIChE Journal, 2005, 51(12): 3134-3146 doi: 10.1002/aic.10626
    [98] Ding B C, Zou T, Pan H G. A discussion on stability of offset-free linear model predictive control. In: Proceedings of the 24th Chinese Control and Decision Conference. Taiyuan, China: IEEE, 2012. 80-85
    [99] Kassmann D E, Badgwell T A, Hawkins R B. Robust steady-state target calculation for model predictive control. AIChE Journal, 2000, 46(5): 1007-1024 doi: 10.1002/aic.690460513
    [100] Seborg D E, Edgar T F, Mellichamp D A. Process Dynamics and Control (Second edition). New York: John Wiley & Sons, Inc., 2004.
    [101] Tatjewski P. Advanced control and on-line process optimization in multilayer structures. Annual Reviews in Control, 2008, 32(1): 71-85 doi: 10.1016/j.arcontrol.2008.03.003
    [102] Darby M L, Nikolaou M, Jones J, Nicholson D. RTO: an overview and assessment of current practice. Journal of Process Control, 2011, 21(6): 874-884 doi: 10.1016/j.jprocont.2011.03.009
    [103] Würth L, Hannemann R, Marquardt W. A two-layer architecture for economically optimal process control and operation. Journal of Process Control, 2011, 21(3): 311-321 doi: 10.1016/j.jprocont.2010.12.008
    [104] Zanin A C, Tvrzská de Gouvêa M, Odloak D. Integrating real-time optimization into the model predictive controller of the FCC system. Control Engineering Practice, 2002, 10(8): 819-831 doi: 10.1016/S0967-0661(02)00033-3
    [105] Adetola V, Guay M. Integration of real-time optimization and model predictive control. Journal of Process Control, 2010, 20(2): 125-133 doi: 10.1016/j.jprocont.2009.09.001
    [106] Alvarez L A, Odloak D. Robust integration of real time optimization with linear model predictive control. Computers & Chemical Engineering, 2010, 34(12): 1937-1944 doi: 10.1016-j.compchemeng.2010.06.017/
    [107] Helbig A, Abel O, Marquardt W. Structural concepts for optimization based control of transient processes. In: Nonlinear Model Predictive Control. Progress in Systems and Control Theory. Basel: Birkhäuser Verlag, 2000. 295-311
    [108] Morari M, Arkun Y, Stephanopoulos G. Studies in the synthesis of control structures for chemical processes: Part Ⅰ: Formulation of the problem. Process decomposition and the classification of the control tasks. Analysis of the optimizing control structures. AIChE Journal, 1980, 26(2): 220-232 doi: 10.1002/aic.690260205
    [109] Pannocchia G, Gabiccini M, Artoni A. Offset-free MPC explained: novelties, subtleties, and applications. IFAC-PapersOnLine, 2015, 48(23): 342-351 doi: 10.1016/j.ifacol.2015.11.304
  • 加载中
  • 图(6)
    计量
    • 文章访问数:  3037
    • HTML全文浏览量:  1388
    • PDF下载量:  950
    • 被引次数: 0
    出版历程
    • 收稿日期:  2018-06-12
    • 录用日期:  2018-09-17
    • 刊出日期:  2020-06-01

    目录

    /

    返回文章
    返回