A High Efficiency Iterative Learning Predictive Functional Control for Nonlinear Fast Batch Processes
-
摘要: 迭代学习模型预测控制(Iterative learning model predictive control, ILMPC)具备较强的批次学习能力及突出的时域跟踪性能, 在批次过程控制中发挥了重要作用. 然而对于具有强非线性的快动态批次过程, 传统的迭代学习模型预测控制很难实现计算效率与跟踪精度之间的平衡, 这给其应用带来了挑战. 对此本文提出一种高效迭代学习预测函数控制策略, 将原非线性系统沿参考轨迹线性化得到二维跟踪误差预测模型, 并在控制器设计中补偿所产生的线性化误差, 构造优化目标函数为真实跟踪误差的上界. 为加强优化计算效率, 在时域上结合预测函数控制以降低待优化变量维数, 从而有效降低计算负担. 结合终端约束集理论, 分析了迭代学习预测函数控制的时域稳定性及迭代收敛性. 通过对无人车和典型快速间歇反应器的仿真实验验证所提出算法的有效性.Abstract: Iterative learning model predictive control (ILMPC) is quite popular in controlling the batch process, since it possesses not only the learning ability along batches, but also the strong time domain tracking properties. However, for a fast batch process with strong nonlinear dynamics, the application of the ILMPC is quite challengeable due to the difficulty in balancing the computational efficiency and tracking accuracy. In this paper, an efficient iterative learning predictive functional control is proposed. The original nonlinear system is linearized along reference trajectory to formulate two-dimensional tracking-error based predictive model. The linearization error is compensated to formulate the objective function as the norm bound of the real tracking error. For enhancing control efficiency, predictive functional control is incorporated to reduce the dimension of optimized variable so as to cut down computation burden effectively. The stability and convergence of this iterative learning predictive functional control with terminal constraint are analyzed. The simulations of unmanned ground vehicle and typical fast batch reactor verify the effectiveness of the proposed control algorithm.
-
随着现代工业中产品种类的增多和市场需求变化的加快, 批次生产过程占据越来越重要的地位[1]. 这类生产过程通常需要按照一定顺序对原料进行加工, 并进行重复操作来获得成批同类产品[2]. 批次过程具有“多重时变”的特点[1], 其控制任务通常为重复地以高精度跟踪参考轨迹. 经典控制理论多基于连续生产过程中的调节问题, 难以在批次过程中取得理想的控制效果. 因此, 发展适应批次过程特点的特殊控制算法具有重要理论意义和应用价值.
迭代学习控制(Iterative learning control, ILC)作为一种智能控制方法, 可以通过迭代功能不断调整控制输入以提高跟踪性能, 这与批次过程的结构十分契合, 因此被广泛应用于批次过程控制[3-4]. 然而, ILC是典型的开环控制, 难以保证时域鲁棒性和闭环稳定性, 限制了其在实际工业中的应用. 模型预测控制(Model predictive control, MPC)作为一项成熟的先进控制技术[5], 具有较强的闭环性能, 在工业应用中取得了令人瞩目的成果[6]. 结合ILC和MPC的优点, 构造迭代学习模型预测控制(Iterative learning model predictive control, ILMPC)成为解决批次过程控制问题的有效方法[7]. 在过去十几年间, ILMPC理论得到了长足的发展. 控制模型由易于推导的输入输出模型[8-9], 推广到二维状态空间模型[10-11], 学习机制也得到了诸多改善[12], 衍生了许多解决不确定性、随机扰动、变参考轨迹等具体问题的ILMPC算法[13-15].
在实际生产中, 存在许多具有快动态的批次过程, 如工业机器人[16]、 运载工具[17]以及部分化学反应器[18]. 这些批次过程的采样时间通常为秒级甚至毫秒级, 对控制器的计算效率提出了较高要求. 由于实际批次过程具有较强的非线性, 传统的ILMPC需要在每个采样时刻求解复杂的非凸序列二次规划(Sequence quadratic programming, SQP)[19]问题, 导致在线计算负担较大, 寻优时间较长. 通过线性化方法获得更为简单的线性模型, 可以有效提高优化求解的速度. 轨迹线性化方法将非线性系统沿参考轨迹在每个采样点上进行线性化, 得到相应的线性时变(Linear time varying, LTV)模型, 将轨迹跟踪问题转化为跟踪误差调节问题[20]. 其线性化误差可以通过李普希兹条件转化为预测状态误差, 从而可获得真实跟踪误差的上界. 将此上界作为优化目标函数, 就能够在提高控制效率的同时保证系统的跟踪精度.
传统MPC结构中, 在每个采样时刻需要求解整个控制时域内的输入变量序列, 其优化问题的自由度为控制输入维数与控制时域长度的乘积. 复杂工业过程中, 被控系统通常是多输入系统, 且需要选取较长的控制时域以保证跟踪性能, 所以传统MPC的在线优化问题自由度较大, 计算负担较重. 相比较而言, 预测函数控制(Predictive functional control, PFC)[21]作为第三代模型预测控制技术, 在提高计算效率方面具有突出优势. 它将控制输入表示为几个基函数的加权和, 从而将复杂的输入序列求解问题转化为更为简单的权重系数求解问题, 有效降低待优化变量的维数, 减小计算负担. 在时域上结合PFC算法, 构建一类特殊结构的迭代学习模型预测控制, 即迭代学习预测函数控制(Iterative learning predictive functional control, ILPFC), 可以实现对快速批次过程的高效控制[22]. 但是, 随着计算效率的提高, 采用PFC算法同时也会带来可行域缩减的问题, 可能会导致控制输入最优性的下降, 进而影响系统的跟踪精度. 针对此问题, 可以通过选择合适的基函数结构, 使最优解包含于ILPFC的可行域内, 来确保ILPFC的跟踪精度. 从而实现计算效率和跟踪精度间的平衡.
除了保证控制系统高效性与准确性, 如何在时域和迭代域上都实现良好的闭环性能也是ILMPC设计中的一个关键问题. ILMPC具有典型的二维控制结构, 其中MPC沿时间轴实施滚动时域优化, ILC沿批次轴通过学习过程数据提高跟踪精度. 因此需要同时保证时域稳定性以及迭代收敛性. 本文所构建的ILMPC针对线性化误差问题, 构造真实跟踪误差的上界为优化目标函数. 该目标函数可以代表实际非线性系统的跟踪误差能量, 在稳定性分析中充当Lyapunov函数. 进而, 本文所设计的ILMPC非线性控制系统的稳定性可以通过引入终端约束集[23]来保证. 但由于LTV预测模型的采用, 经典终端约束集理论中的稳定性条件需要相应地扩展为时变的形式. 基于ILMPC的二维结构, 可以从时域稳定性推导出迭代收敛性.
本文首先针对非线性批次过程, 基于轨迹线性化模型构建一种具有终端约束的ILMPC策略, 采用真实跟踪误差的范数上界作为优化目标函数. 在此基础上, 通过引入特殊结构的MPC, 即PFC算法, 建立一种高效稳定的ILPFC策略, 实现对非线性批次过程的快速、精确的轨迹跟踪控制. 在二维框架下, 基于Lyapunov稳定性理论定性分析所设计的ILMPC/ILPFC算法的稳定性和收敛性问题. 通过无人车及典型快速间歇反应器的仿真验证了所提出ILPFC策略的有效性.
1. 二维模型
1.1 非线性系统轨迹线性化
批次过程可描述为以下非线性离散状态空间模型
$$ x\left( {t + 1} \right) = f\left( {x\left( t \right),u\left( t \right)} \right) $$ (1) 其中,
$ u \in {\boldsymbol{U}} $ 为${{ n_u}} \times 1$ 维的控制输入,$x \in {\boldsymbol{X}}$ 为${{n_x}} \times 1$ 维的状态向量. 且对于任意$x \in {\boldsymbol{X}}$ 和$u \in {\boldsymbol{U}},$ $ f\left( {x\left( t \right),u\left( t \right)} \right) $ 满足局部李普希兹连续性条件, 其李普希兹常数为${L_u} ,$ $t \in \left[ {0,N} \right] ,$ $ N $ 为批次长度.假设状态参考轨迹为
$ {x_r} ,$ $ {u_r} $ 为$ {x_r} $ 对应的参考输入轨迹, 满足$$ {x_r}\left( {t + {\rm{1}}} \right) = f\left( {{x_r}\left( t \right),{u_r}\left( t \right)} \right) $$ (2) 定义状态误差
$ {x_e}\left( t \right) $ , 输入误差$ {u_e}\left( t \right) $ 为$$ \begin{split} & {x_e}\left( t \right) = x\left( t \right) - {x_r}\left( t \right) \\ & {u_e}\left( t \right) = u\left( t \right) - {u_r}\left( t \right) \end{split}$$ (3) 将式(3)代入式(1), 可得
$$ \begin{split} {x_e}\left( {t + 1} \right) =\; & f\left( {{x_e}\left( t \right) + {x_r}\left( t \right),{u_e}\left( t \right) + {u_r}\left( t \right)} \right) - \\ &f\left( {{x_r}\left( t \right),{u_r}\left( t \right)} \right) \end{split}$$ (4) 非线性系统(1)的轨迹跟踪问题可转化为系统(4)的零点调节问题. 利用泰勒展开法将非线性系统(4)沿参考轨迹线性化, 即在
$ \left( {{x_e},{u_e}} \right) = {\rm{0}} $ 点处线性化, 可得$$ \begin{split} {x_e}\left( {t + 1} \right) =\; &A\left( t \right){x_e}\left( t \right) + B\left( t \right){u_e}\left( t \right) + \\ & \ell \left( {{x_e}\left( t \right),{u_e}\left( t \right)} \right) \end{split} $$ (5) 其中,
$ \ell({x_e}(t),{u_e}(t)) $ 代表线性化产生的高阶项.将式(4)代入式(5), 可得
$$ \begin{split} \ell \left( {{x_e}\left( t \right),{u_e}\left( t \right)} \right) =\; &f\left( {{x_e}\left( t \right) + {x_r}\left( t \right),{u_e}\left( t \right) + {u_r}\left( t \right)} \right) -\\ &{x_r}\left( {t + 1} \right) - A\left( t \right){x_e}\left( t \right) -\\ & B\left( t \right){u_e}\left( t \right)\\[-10pt] \end{split}$$ (6) 由于
$ f\left( {x\left( t \right),u\left( t \right)} \right) $ 满足利普希兹连续条件, 所以$\ell({x_e}(t), $ $ {u_e}(t))$ 满足$$ \left\| {\ell \left( {{x_e}\left( t \right),{u_e}\left( t \right)} \right)} \right\|_{2}^{2} \leq {\mu ^{2}}{\left[ {\begin{array}{*{20}{c}} {{x_e}\left( t \right)} \\ {{u_e}\left( t \right)} \end{array}} \right]^{\rm{T}}}\left[ {\begin{array}{*{20}{c}} {{x_e}\left( t \right)} \\ {{u_e}\left( t \right)} \end{array}} \right] $$ (7) 1.2 二维预测模型
假设
$ k $ 代表过程批次, 将式(5)在批次$ k $ 和批次$ k+1 $ 间做差, 可得到如下沿迭代轴的增量模型:$$ \begin{split} \bar x_e^k\left( {t + 1} \right) =\; & A\left( t \right)\bar x_e^k\left( t \right) + B\left( t \right)\bar u_e^k\left( t \right) +\\ & \bar \ell \left( {x_e^k\left( t \right),u_e^k\left( t \right)} \right) \end{split} $$ (8) 其中,
$$ \begin{split} &\bar x_e^k\left( t \right) = x_e^k\left( t \right) - x_e^{k{{ - }}1}\left( t \right) \\ &\bar u_e^k\left( t \right) = u_e^k\left( t \right) - u_e^{k{{ - }}1}\left( t \right) \\ & \bar \ell \left( {x_e^k\left( t \right),u_e^k\left( t \right)} \right) = \ell \left( {x_e^k\left( t \right),u_e^k\left( t \right)} \right) -\\ & \quad\quad \quad\quad\ell \left( {x_e^{k - 1}\left( t \right),u_e^{k - 1}\left( t \right)} \right) \end{split} $$ 当系统状态
$ x\left( t \right) $ 无限接近参考轨迹$ {x_r}\left( t \right) $ 时,$ \ell \left( {{x_e}\left( t \right),{u_e}\left( t \right)} \right) $ 为无穷小量. 也就是说, 在每个采样点周围存在图1所示的小邻域, 在这些邻域中非线性系统(8)的动态特性可由线性时变系统$$ {x_e}\left( {t{\rm{ + 1}}} \right) = A\left( t \right){x_e}\left( t \right) + B\left( t \right){u_e}\left( t \right) $$ (9) 描述.
根据线性时变系统(9)构建线性预测模型
$$ {\hat{\bar{x}}}{_e^k}(t + 1) = A\left( t \right){\hat{\bar{x}}}{_e^k}\left( t \right) + B\left( t \right)\bar u_e^k\left( t \right)\\ $$ (10) 其中,
$ \hat{\bar{x}}_e^k\left( {t + 1} \right) $ 为下一时刻的预测状态. 设预测时域和控制时域均为$ m $ , 推导$ t+1 $ 时刻到$ t+m- 1 $ 时刻的预测方程为$$ \hat{\bar{\boldsymbol{x}}}_e^k| {_{t + 1}^{t + m}} \ = {\boldsymbol{F}}\hat{\bar{x}}_e^k( {t|t}) + {\boldsymbol{\Phi}} {\bar{\boldsymbol{u}}}_e^k| {_t^{t + m - 1}} $$ (11) 其中,
$${\hat{\bar{x}}_e^k}(t|t)=x_e^k(t)-{x_e^{k-1}}(t) $$ $$ {\hat{\bar{\boldsymbol{x}}}_e^k}\left| {_{t + 1}^{t + m}} \right. = \left[ {\begin{array}{*{20}{c}} {\hat {\bar x}_e^k\left( {t + 1\left| t \right.} \right)} \\ {\hat {\bar x}_e^k\left( {t + 2\left| t \right.} \right)} \\ {\hat {\bar x}_e^k\left( {t + 3\left| t \right.} \right)} \\ \vdots \\ {\hat {\bar x}_e^k\left( {t + m\left| t \right.} \right)} \end{array}} \right] $$ $$ {\bar{\boldsymbol{u}}_e^k}|{_t^{t + m - 1}} = \left[ {\begin{array}{*{20}{c}} {\bar u_e^k\left( t \right)} \\ {\bar u_e^k\left( {t + 1} \right)} \\ {\bar u_e^k\left( {t + 2} \right)} \\ \vdots \\ {\bar u_e^k\left( {t + m - 1} \right)} \end{array}} \right] $$ $$ {\boldsymbol{F}} = \left[ {\begin{array}{*{20}{c}} {A\left( t \right)}\\ {A\left( {t + 1} \right)A\left( t \right)}\\ {A\left( {t + 2} \right)A\left( {t + 1} \right)A\left( t \right)}\\ \vdots \\ {A\left( {t + m - 1} \right)A\left( {t + m - 2} \right)\times \cdots \times}\\ {A\left( {t + 1} \right)A\left( t \right)} \end{array}} \right] $$ $$ \begin{split} &{\boldsymbol{\Phi }} =\\ &\left[ {\begin{array}{*{20}{c}} {B\left( t \right)}&0\\ {A\left( {t + 1} \right)B\left( t \right)}&{B\left( {t + 1} \right)}\\ \vdots & \vdots \\ \begin{array}{l} A\left( {t + m - 1} \right)A\left( {t + m - 2} \right) \\ \times \; \cdots\times A\left( {t + 1} \right)B\left( t \right) \end{array}&\begin{array}{l} A\left( {t + m - 1} \right)A\left( {t + m - 2} \right) \\ \times \; \cdots\times A\left( {t + 2} \right)B\left( {t + 1} \right) \end{array} \end{array}} \right.\\ &\qquad\qquad\qquad\qquad\qquad\qquad\left. {\;\;\;\;\begin{array}{*{20}{c}} \cdots &0\\ \cdots &0\\ \ddots & \vdots \\ \cdots &{B\left( {t + m - 1} \right)} \end{array}} \right] \end{split} $$ 2. 稳定ILMPC策略
2.1 ILMPC问题描述
在实际动态控制过程中, 由于常常存在状态偏差, 导致
$ x\left( t \right) $ 不可能在整个过程中都无限趋近于$ {x_r}\left( t \right) $ , 即小范围偏离图1所示的邻域. 此时, 高阶项$ \bar \ell \left( {x_e^k\left( t \right),u_e^k\left( t \right)} \right) $ 不能被视为无穷小. 也就是说, 预测状态$ {\hat{ \bar x}}_e^k\left( {t + 1} \right) $ 与真实状态$ \bar x_e^k\left( {t + 1} \right) $ 间存在一定误差. 由于批次过程对跟踪精度的要求较高, 在构建ILMPC优化问题时, 需要对此预测误差加以补偿. 定义状态预测误差为$$ {\boldsymbol{x}}_{ed}^k\left| {_{t + 1}^{t + m}} \right. = {\hat {\boldsymbol{x}}}_e^k\left| {_{t + 1}^{t + m}} \right. - {\boldsymbol{x}}_e^k\left| {_{t + 1}^{t + m}} \right. $$ (12) 结合式(12), 式(11)和式(5), 可推导得到
$$ {\boldsymbol{x}}_{ed}^k\left| {_{t + 1}^{t + m}} \right. = - {\boldsymbol{H}}_t^k $$ (13) 其中,
${\boldsymbol{H}}_t^k=[({\bar \ell (x_e^k(\,t),\;u_e^k(\,t)\,))}^{\rm{T}}\;\cdots\; ({\bar \ell }{( {x_e^k( {t + m - 1}} } , $ $ {u_e^k( {t + m - 1} ))} )^{\rm{T}}]^{\rm{T}}$ 为包含未来$ m $ 步高阶项的预测误差向量.由式(12)和式(13), 可推出
$$ {\left\| {{\boldsymbol{x}}_e^k\left| {_{t + 1}^{t + m}} \right.} \right\|_2} \leq {\left\| {{\hat {\boldsymbol{x}}}_e^k\left| {_{t + 1}^{t + m}} \right.} \right\|_2} + {\left\| {{\boldsymbol{H}}_t^k} \right\|_2} $$ (14) 根据式(7), 容易得到
${\boldsymbol{H}}_t^k$ 仍满足利普希兹条件$$ {\left\| {{\boldsymbol{H}}_t^k} \right\|_2} \leq {\wp _t}\left( {{{\left\| {\bar x_e^k\left( t \right)} \right\|}_{2}} + {{\left\| {{\bar {\boldsymbol{u}}}_e^k\left| {_{t}^{t + m - 1}} \right.} \right\|}_{2}}} \right) $$ (15) 其中, 李普希兹权重
${\wp _t} \in [ {\wp _t^ * },+\infty)$ .采用文献[11]的递推分析法, 李普希兹权重下界
$\wp _t^*$ 可以由下式计算$$ {\wp _t}^ * {\rm{ = }}\sqrt {\rm{m}} \mathop {\max }\limits_r \sum\limits_{j = r + 1}^m {{\kappa _{j,r + 1}},} \;r \in \left\{ {0,1, \cdots ,m - 1} \right\} $$ (16) 其中, 参数
$ \kappa $ 可由以下递推公式获得$$ \begin{split} & {\kappa _{j,0}} = \prod\limits_{p = 1}^{j - 1} {\rho \left( {t + j - p} \right){l_1}\left( t \right)}\; + \\ &\quad\qquad \sum\limits_{i = 2}^j {\left( {\prod\limits_{p = 1}^{j - i} {\rho \left( {t + j - p} \right)} } \right) \times } \\ &\quad\qquad\left( {{\kappa _{i - 1,0}} + \prod\limits_{p = 1}^{i - 1} {\rho \left( {t + i - p - 1} \right)} } \right){l_1}\left( {t + i - 1} \right) \\ & {\kappa _{j,r + 1}} = \sum\limits_{i = r + 2}^j {\left( {\prod\limits_{p = 1}^{j - i} {\rho \left( {t + j - p} \right)} } \right)} \;\times \\ &\quad\qquad \left( {\left( {\prod\limits_{p = 1}^{i - r - 2} {\rho \left( {t + j - 1 - p} \right)} } \right)\phi \left( {t + r} \right) + {\kappa _{i - 1,r + 1}}} \right) \times \;\\ &\quad\qquad {l_1}\left( {t + i - 1} \right) + \left( {\prod\limits_{p = 1}^{j - r - 1} {\rho \left( {t + j - p} \right)} } \right){l_2}\left( {t + r} \right) \end{split}$$ (17) 其中,
${\kappa _{{{1,0}}}} = {l_1}\left( t \right),\;{\kappa _{{{1,1}}}} = {l_2}\left( t \right),$ 对于$ i = \left[ {0,m - 1} \right] ,$ $ \rho \left( {t + i} \right) = {\left\| {A\left( {t + i} \right)} \right\|_2},\;\phi \left( {t + i} \right) = {\left\| {B\left( {t + i} \right)} \right\|_2}, $ ${l_1}( t + $ $ i ) = {L_u} + \rho \left( {t + i} \right),\;{l_2}\left( {t + i} \right) = {L_u} + \phi \left( {t + i} \right).$ 联立式(14)及式(15), 可得
$$ \begin{split} {\left\| {{\boldsymbol{x}}_e^k\left| {_{t + 1}^{t + m}} \right.} \right\|_2} \leq\; & {\left\| {{\hat {\boldsymbol{x}}}_e^k\left| {_{t + 1}^{t + m}} \right.} \right\|_2} \; + \\&{\wp _t}\left( {{{\left\| {\bar x_e^k\left( t \right)} \right\|_2} +{\left\|{{\bar {\boldsymbol{u}}}_e^k\left| {_{t}^{t + m - 1}} \right.} \right\|} _{2}} } \right) \end{split}$$ (18) 由式(18)可得, 最小化跟踪误差
${\left\| {{\boldsymbol{x}}_e^k\left| {_{t + 1}^{t + m}} \right.} \right\|_2}$ 的优化问题可由最小化其上界${\left\| {{\hat {\boldsymbol{x}}}_e^k\left| {_{t + 1}^{t + m}} \right.} \right\|_2} + {\wp _t}\left( {{\left\| {\bar x_e^k\left( t \right)} \right\|}_{2}} +\right. $ $ \left. {{\left\| {{\bar {\boldsymbol{u}}}_e^k\left| {_{t}^{t + m - 1}} \right.} \right\|}_{2}} \right)$ 来实现. 由于在当前时刻$ t, $ $ {\left\| {\bar x_e^k\left( t \right)} \right\|_{2}} $ 为已知常数ILMPC的优化目标函数可整理为${\left\| {{\hat {\boldsymbol{x}}}_e^k\left| {_{t + 1}^{t + m}} \right.} \right\|_2} + {\wp _t}{\left\|{{\bar {\boldsymbol{u}}}_e^k\left| {_{t}^{t + m - 1}} \right.} \right\|} _{2},$ 则ILMPC优化问题描述如下:P1:
$$ \begin{split} \mathop {\min }\limits_{{\bar {\boldsymbol{u}}}_e^k\left( t \right)} {J_{{\rm{ILMPC}}}}_t^k = &\left\| {{\hat {\boldsymbol{x}}}_e^k\left| {_{t}^{t + m - 1}} \right.} \right\|_2^2 + {\wp _t}^{\rm{2}}\left\| {{\bar {\boldsymbol{u}}}_e^k\left| {_{t}^{t + m - 1}} \right.} \right\|_2^2\;+\\ & {V_f}\left( {x_e^k\left( {t + m} \right)} \right) \end{split}\tag{19a}$$ 满足
$$ \begin{split} \widehat{\boldsymbol{x}}_{e}^{k}\left| _{t+1}^{t+m} \right.=&\widehat{\boldsymbol{x}}_{e}^{k-1}\left| _{t+1}^{t+m} \right.+\\ &{\boldsymbol{F}}\hat{\bar{x}}_{e}^{k}\left( t\left| t \right. \right)+{\boldsymbol{\Phi }}\overline{\boldsymbol{u}}_{e}^{k}\left| _{t}^{t+m-1} \right. \end{split}\tag{19b}$$ $$ x \in {\boldsymbol{X}},u \in {\boldsymbol{U}}\tag{19c}$$ $$ x_e^k\left( {t + m} \right) \in {\Omega _{t + m}}\tag{19d} $$ 其中,
${V_f}\left( {x_e^k\left( {t + m} \right)} \right) =( x_e^k{\left( {t + m}) \right){^{\rm{T}}}}{P_{t + m}}x_e^k\left( {t + m} \right)\;$ 为 终端惩罚项,$ {P_{t + m}} $ 为正定矩阵,$ x_e^k\left( {t + m} \right) \in {\Omega _{t + m}} $ 为终端不等式约束.${\Omega _t}= \{ x_e^k \in {\bf{R}}^{n_x}:x{{_e^k}^{\rm{T}}} {P_t}x_e^k \leq \alpha\}\;(\alpha $ $ > 0)$ 为终端不变集. 在终端不变集内采取时变状态反馈控制律$$ \bar u_e^k\left( t \right) = K\left( t \right)x_e^k\left( t \right) $$ (20) 在通常意义上, MPC系统的稳定性意味着状态进入终端域后跟踪误差随时间收敛. 由于目标函数
${J_{{\rm{ILMPC}}}}_t^k$ 代表真实跟踪误差的上界, 这种稳定性可以具体表述为${J_{{\rm{ILMPC}}}}_t^k$ 随时间收敛[23]. 基于经典MPC稳定性理论, 保证ILMPC系统的稳定性关键在于获取能够使${J_{{\rm{ILMPC}}}}_t^k$ 随时间递减的${P_{t + m}} ,$ $ K\left( t \right) $ 和$ \alpha $ . 在ILMPC模型构建中, 非线性系统(1)通过沿参考轨迹线性化形成了时变预测模型(11), 导致终端不变集$ {\Omega _t} $ 也为时变区域. 因此, 不同于经典MPC稳定性分析方法, ILMPC需要满足附加时变条件来保证时域稳定性.引理 1. 假设优化问题P1在初始时刻可行, 若满足时变条件:
a)
$ {\bf{0}} \in {\Omega _t} $ ;b)
${V_f}\left( 0 \right) = 0,{V_f} \geq 0$ ;c)
$\forall x_e^k\left( t \right) \in {\Omega _t},\;K\left( t \right)x_e^k\left( t \right) + {u^{k - 1}}\left( t \right) \in {\boldsymbol{U}}$ ;d)
$ \forall x_e^k\left( t \right) \in {\Omega _t},x_e^k\left( {t + 1} \right) \in {\Omega _{t + 1}} $ ;e)
${V_f}( {x_e^k( {t \;+\; 1} )} ) - {V_f}( {x_e^k( t )} ) < - (x_e^k{( t ))^{\rm{T}}}x_e^k( t )-$ ${\wp _{t - m + 1}}^{2}(x_e^k{\left( t \right))^{\rm{T}}}(K{\left( t \right))^{\rm{T}}}K\left( t \right)x_e^k\left( t \right)$ 则
1) 优化问题P1在任意未来时刻可行;
2) ILMPC闭环系统渐近稳定.
证明. (为书写简洁, 以下用
$ J_t^k $ 代替${J_{{\rm{ILMPC}}}}_t^k$ )假设第$ k $ 批次$ t $ 时刻的最优控制输入为${{\boldsymbol{u}}{_t^k }}^* = [( u_t^k( t ))^{\rm{T}} $ $ \;\;(u_t^k( {t + 1} ))^{\rm{T}} \cdots(u_t^k( {t + m - 1} ))^{\rm{T}} ]^{\rm{T}}$ , 对应最优目标函数值为$J{_t^k}^ *.$ 易知在同批次$ t + 1 $ 时刻, 控制输入${\tilde {\boldsymbol{u}}}_{t + 1}^k=$ $[ (u_t^k( {t + 1} ))^{\rm{T}} ( u_t^k( {t + 2} ))^{\rm{T}} \cdots K ( t )(x_e^k( {t + m} ))^{\rm{T}}+(u_t^{k - 1}( t +$ $ m ) )^{\rm{T}}]^{\rm{T}}$ 为一组可行解. 以此类推, 可行性得证.设在可行解
${\tilde {\boldsymbol{u}}}_{t + 1}^k$ 输入下个$ t + 1 $ 时刻的目标函数值为$ \tilde J_{t + 1}^k ,$ 在最优解${\boldsymbol{u}}{_{t + 1}^{k^ *}}$ 输入下时刻的最优目标函数值为$J{_{t + 1}^{k^ *}} .$ 那么一定有$$ J{_{t + 1}^{k^*} } \leq \tilde J_{t + 1}^k $$ (21) 展开
$ \tilde J_{t + 1}^k $ 和$ J{_t^k }^ * $ , 可得$$ \begin{split} &\tilde J_{t + 1}^k - J{_t^k }^ * = (x_e^k{( {t + m} ))^{\rm{T}}}x_e^k( {t + m} ) + \\ &\quad{\wp _{t + 1}}^{2}{( {K( {t + m} )x_e^k( {t + m} )} )^{\rm{T}}}K( {t + m} )x_e^k( {t + m} ) +\\ &\quad (x_e^k{( {t + m + 1} ))^{\rm{T}}}{P_{t + m + 1}}x_e^k( {t + m + 1} ) - \\ &\quad (x_e^k{( {t + m} ))^{\rm{T}}}{P_{t + m}}x_e^k( {t + m} ) -\\ &\quad (x_e^k{( {t} ))^{\rm{T}}}x_e^k( {t} ) - \\ &\quad{\wp _t}^{2}\bar (u_e^k{( {t} ))^{\rm{T}}}\bar u_e^k( {t} ) \\[-12pt] \end{split}$$ (22) 由条件e)可知
$$ \begin{split} &{V_f}\left( {x_e^k\left( {t + m + 1} \right)} \right) - {V_f}\left( {x_e^k\left( {t + m} \right)} \right) \leq \\&\quad -(x_e^k{\left( {t + m}) \right)^{\rm{T}}}x_e^k\left( {t + m} \right) - \\ & \quad{\wp _{t + 1}}^{2}{\left( {K\left( t + m \right)x_e^k\left( {t + m} \right)} \right)^{\rm{T}}}K\left( t + m \right)x_e^k\left( {t + m} \right) \end{split} $$ (23) 联立式(22)和式(23)可得
$$ \tilde J_{t + 1}^k \leq J{_t^k }^ * $$ (24) 结合式(21)及式(24), 相邻采样时间最优目标函数值具有以下关系
$$ J{_{t + 1}^{k^*} } \leq J{_t^{k^*} } $$ (25) 即目标函数沿时间轴递减, 稳定性得证. □
为求解满足引理1中条件a) ~ e)的
${P_{t + m}},$ $ K\left( t \right) $ 和$ \alpha $ , 需要将这些条件转化为线性矩阵不等式(Linear matrix inequality, LMI)的形式. 首先, 为将条件c)转化为LMI的形式, 将其写成仅关于状态量$ x_e^k\left( t \right) $ 的约束, 那么约束$x_e^k( t ) + {x^{k - 1}}( t ) \in {\boldsymbol{X}}$ 及$K\left( t \right)x_e^k\left( t \right) + $ $ {u^{k - 1}}\left( t \right) \in {\boldsymbol{U}}$ 可以构成以下约束可行域:$$ \begin{split} {\Im _t} = &\left\{ {x_e^k\left( t \right) \in {{\bf{R}}^{n_x}}:} \right. \\ &\left. {\left( {{c_p} + {d_p}K\left( t \right)} \right)x_e^k\left( t \right) \leq 1,\;p = 1, \cdots ,{p_n}} \right\} \end{split} $$ 其中,
$ {c_p},{d_p} $ 的取值与具体约束量有关,$ {p_n} $ 为约束个数.根据文献[24], 当且仅当对于
$ \forall p = 1, \cdots ,{p_n} $ $$ \left( {{c_p} + {d_p}K\left( t \right)} \right)\alpha P_t^{ - 1}{\left( {{c_p} + {d_p}K\left( t \right)} \right)^{\rm{T}}} \leq 1 $$ 时, 不变集
${\Omega _t}\;= \{ {x_e^k \in {{\bf{R}}^{n_x}}:x{{_e^k}^{\rm{T}}}{P_t}x_e^k \leq \alpha } \}$ 被约束可行域$ {\Im _t} $ 包含. 也就是说,$ \Omega _t $ 内的所有状态满足终端约束与物理约束. 然后,$ {P_t},\alpha $ 和$ K\left( t \right) $ 的取值可由定理1确定.定理 1. 如果存在
$0 < {X_t} = {X_t}^{\rm{T}} \in {{\bf{R}}^{n_x \times n_x}} ,$ ${Y_t}^{\rm{T}} \in $ $ {{\bf{R}}^{n_u \times n_x}}$ 及常数$\alpha ,$ 对$p = 1, \cdots ,{p_n},\; t = m, \cdots , N + $ $ m - 1$ 满足以下线性矩阵不等式条件, 稳定性条件a) ~ e)能够得到满足.$$\begin{split} &\left[ {\begin{array}{*{20}{c}} { - {X_t}}&*&* \\ 0&{ - \alpha I}&* \\ {A\left( t \right){X_t} + B\left( t \right)Y}&{\alpha I}&{ - {X_{t + 1}}} \\ {{{\left( {{\wp _{t - m + 1}}^{2} + {\mu ^2}} \right)}^{\frac{1}{2}}}{Y_t}}&0&0 \\ {{X_t}}&0&0 \\ {\mu \alpha }&0&0 \end{array}} \right. \\&\;\;\;\quad\qquad\qquad\qquad \qquad\qquad \left. {\begin{array}{*{20}{c}} * & * & * \\ * & * & * \\ * & * & * \\ { - \alpha I}&* & * \\ 0 & { - \alpha I}& * \\ 0 & 0&{ - \alpha I} \end{array}} \right] \leq 0 \end{split}$$ (26) $$ \left[ {\begin{array}{*{20}{c}} 1&{{c_p}{X_t} + {d_p}{Y_t}} \\ {{X_t}{c_p}^{\rm{T}} + {Y_t}^{\rm{T}}{d_p}^{\rm{T}}}&{{X_t}} \end{array}} \right] \geq 0 $$ (27) 证明. 该定理证明见附录A. □
通过求解线性矩阵不等式 (26)和(27), 可由
$ {P_t} = {X_t}^{ - 1}\alpha, $ $ K\left( t \right) = {Y_t}{X_t}^{ - 1} $ 计算得到$ P $ 和$ K\left( t \right). $ 注 1. 线性矩阵不等式 (26)和(27)可在批次过程开始前离线求解, 因而满足快动态系统高效控制的要求.
2.2 ILMPC约束处理
ILMPC系统中存在着物理约束及终端约束. 为采用SQP方法对优化问题P1求解, 需要将所有约束转化为标准形式. 其中, 状态约束处理需要先通过利普希兹条件建立系统真实状态与当前控制输入的关系.
2.2.1 控制输入约束
在批次过程中, 控制输入的约束可描述为
$$ \begin{split} & {u_{{\rm{low}}}} \leq u \leq {u_{{\rm{high}}}}\; \\ &{{\bar u}_{{\rm{low}}}} \leq \bar u \leq {{\bar u}_{{\rm{high}}}}\; \\ &\delta {u_{{\rm{low}}}} \leq \delta u \leq \delta {u_{{\rm{high}}}} \end{split} $$ (28) 其中,
$ \bar u = {u_k} - {u_{k - 1}}, $ $\delta u = u( {t + 1} ) - u( t ).$ ${u_{{\rm{low}}}},$ ${\bar u_{{\rm{low}}}}$ 和$\delta {u_{{\rm{low}}}}$ 分别代表$ u ,$ $ \bar u $ 和$ \delta u $ 的约束下界;${u_{{\rm{high}}}},$ ${\bar u_{{\rm{high}}}}$ 和$\delta {u_{{\rm{high}}}}$ 分别代表$u ,$ ${\bar u}$ 和$\delta {u}$ 的约束上界.根据式(3)和式(8), 有
$$ {{\boldsymbol{u}}^k}\left| {_t^{t + m - 1}} \right. = {\boldsymbol{u}}_e^{k - 1}\left| {_t^{t + m - 1}} \right. + {\boldsymbol{u}}_r^{}\left| {_t^{t + m - 1}} \right. + {\bar{\boldsymbol{ u}}}_e^k\left| {_t^{t + m - 1}} \right. $$ (29) 结合式(29), 式(28)可写为
$$ {\boldsymbol{\Gamma}} {\bar{\boldsymbol{ u}}}_e^k\left| {_t^{t + m - 1}} \right. \leq {{{\boldsymbol{N}}}}\\ $$ (30) 其中,
$$ \begin{split} & {\boldsymbol{\Gamma }} = \left[ {\begin{array}{*{20}{c}} {{I_{n_u \times m}}} \\ { - {I_{n_u \times m}}} \\ {{I_{n_u \times m}}} \\ { - {I_{n_u \times m}}} \\ \Lambda \\ { - \Lambda } \end{array}} \right], \;\;{\boldsymbol{Z}} = {\left[ {\begin{array}{*{20}{c}} {{u^k}\left( {t - 1} \right)} \\ 0 \\ 0 \\ \vdots \\ 0 \end{array}} \right]_{ {n_u m} \times 1}}\\ & {\boldsymbol{N}} = \left[ {\begin{array}{*{20}{l}} \;\;\;\;{{\boldsymbol{u}}_{{\rm{high}}}}\left| {_t^{t + m - 1}} \right. - {\boldsymbol{u}}_e^{k - 1}\left| {_t^{t + m - 1}} \right. - \\ \;\;\;\; {\boldsymbol{u}}_r^{}\left| {_t^{t + m - 1}} \right. \\ \;\;\;\; - {{\boldsymbol{u}}_{{\rm{low}}}}\left| {_t^{t + m - 1}} \right. + {\boldsymbol{u}}_e^{k - 1}\left| {_t^{t + m - 1}} \right. + \\ \;\;\;\; {\boldsymbol{u}}_r^{}\left| {_t^{t + m - 1}} \right. \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{{{{\bar{\boldsymbol{ u}}}}_{{\rm{high}}}}\left| {_t^{t + m - 1}} \right.} \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; { - {{{\bar{\boldsymbol{ u}}}}_{{\rm{low}}}}\left| {_t^{t + m - 1}} \right.} \\ \delta {{\boldsymbol{u}}_{{\rm{high}}}}\left| {_t^{t + m - 1}} \right. - \\ \Lambda \left( {{\boldsymbol{u}}_e^{k - 1}\left| {_t^{t + m - 1}} \right. + {\boldsymbol{u}}_r^{}\left| {_t^{t + m - 1}} \right.} \right) + {{{\boldsymbol{Z}} }} \\ - \delta {{\boldsymbol{u}}_{{\rm{low}}}}\left| {_t^{t + m - 1}} \right. + \\ \Lambda \left( {{\boldsymbol{u}}_e^{k - 1}\left| {_t^{t + m - 1}} \right. + {\boldsymbol{u}}_r^{}\left| {_t^{t + m - 1}} \right.} \right) - {{{\boldsymbol{Z}} }} \end{array}} \right]\end{split} $$ $$\Lambda = {\left[ {\begin{array}{*{20}{c}} {{I_{n_u}}}&0&0&0&0 \\ { - {I_{n_u}}}&{{I_{n_u}}}&0&0&0 \\ 0&{ - {I_{n_u}}}&{{I_{n_u}}}&0&0 \\ \vdots & \vdots & \vdots & \ddots &\vdots \\ 0&0&0&{ - {I_{n_u}}}&{{I_{n_u}}} \end{array}} \right]}_{ {n_u m}\times {n_u m} } $$ 通过将输入约束转化为式(30)的标准形式, 优化问题(19)可以利用MATLAB软件中的SQP方法直接求解.
2.2.2 状态约束
假设在
$ t $ 时刻对于$ i = 1,2, \cdots ,m $ 存在以下状态约束$$ {\left\| {{\boldsymbol{H}_j}x_e^k\left( {t + i} \right)} \right\|_2} \leq {\beta _j} $$ (31) 其中,
${{\boldsymbol{H}}_j}$ 为用于选择$ x_e^k\left( {t + i} \right) $ 中第$ j $ 个元素的向量.$ {\beta _j} $ 代表约束上界.根据式(13)有
$$ \begin{split} x_e^k\left( {t + i} \right) =\; & \hat x_e^k\left( {t + i\left| t \right.} \right) - x_{ed}^k\left( {t + i} \right) = \\ &\hat x_e^k\left( {t + i\left| t \right.} \right) + \\ & \bar \ell \left( {x_e^k\left( {t + i - 1} \right), u_e^k\left( {t + i - 1} \right)} \right) \end{split} $$ (32) 根据文献[15], 存在
$ \wp _t^i $ 使下式成立:$$ \begin{split} & {\left\| {\bar \ell \left( {x_e^k\left( {t + i - 1} \right),u_e^k\left( {t + i - 1} \right)} \right)} \right\|_2} \leq \\ &\qquad \wp _t^i\left( {{{\left\| {\bar x_e^k(t)} \right\|}_2} + {{\left\| {{\bar{\boldsymbol{ u}}}_e^k\left| {_t^{t + m - 1}} \right.} \right\|}_2}} \right) \end{split} $$ (33) 其中,
$ \wp _t^i \in \left[ {\wp {{_t^i} }^ *,\infty } \right) $ ,$\wp {_t^i }^ * = \sqrt i \mathop {\max }\nolimits_r{\kappa _{i,r + 1}}, \;\;r \in \{ 0, $ $ 1, \cdots , i - 1 \}$ .从式(12), (31)和式(33)可以推出
$$ \begin{split} & {\left\| {{\boldsymbol{H}_j}x_e^k\left( {t + i} \right)} \right\|_2} \leq {\left\| {{\boldsymbol{H}_j}\hat x_e^k\left( {t + i\left| t \right.} \right)} \right\|_2}\; + \\ &\qquad{\left\| {{\boldsymbol{H}_j}\bar \ell \left( {x_e^k\left( {t + i - 1} \right),u_e^k\left( {t + i - 1} \right)} \right)} \right\|_2}\;\; \leq \\ &\qquad{\left\| {{\boldsymbol{H}_j}\hat x_e^k\left( {t + i\left| t \right.} \right)} \right\|_2} + \wp _t^i{\left\| {{\boldsymbol{H}_j}} \right\|_{2}} \;\times \\ &\qquad\left( {{{\left\| {{\bar {x}}_e^k(t)} \right\|}_2} + {{\left\| {{\bar{\boldsymbol{ u}}}_e^k\left| {_t^{t + m - 1}} \right.} \right\|}_2}} \right) \end{split}$$ (34) 结合式(31)和式(34), 可得
$$ \begin{split} & {\left\| {{\boldsymbol{H}_j}\hat x_e^k\left( {t + i\left| t \right.} \right)} \right\|_2} \;+ \\ &\qquad \wp _t^i{\left\| {{\boldsymbol{H}_j}} \right\|_{2}}\left( {{{\left\| {\bar x_e^k(t)} \right\|}_2} + {{\left\| {{\bar{\boldsymbol{ u}}}_e^k\left| {_t^{t + m - 1}} \right.} \right\|}_2}} \right) \leq {\beta _i} \end{split} $$ (35) 则状态约束(31)被转化为关于优化变量
${\bar{\boldsymbol{ u}}}_e^k\left( t \right)$ 的非线性约束. 在ILMPC中, 终端约束(19d)即可利用以上步骤进行处理.3. 高效ILPFC策略
3.1 ILPFC问题描述
实际工业过程通常为复杂多输入多输出系统, 需要选取较长的控制时域来保证控制性能, 这导致了每个采样时刻的待优化变量维数很大, 加重了ILMPC的计算负担, 使其无法达到快速批次过程对计算效率的要求. 预测函数控制(PFC)是一类具有特殊控制输入结构的MPC策略. 它将控制量设定为一组视系统特性及参考轨迹形式而定的基函数的线性组合[21]. 系统输出预报值通过基函数的已知响应合成, 因而, 只需通过优化计算求出基函数的线性加权系数即可获得控制输入量. 鉴于其计算量小、控制精度高的优点, PFC已广泛应用于液压机器人[25]、 导弹控制系统[26]等快速工业过程. 在ILMPC的时域控制中采用PFC构建高效的ILPFC算法, 能够在保持跟踪精度的前提下, 进一步提高控制效率.
构造PFC控制律的核心问题是将式(11)中的输入向量
${\bar{\boldsymbol{ u}}}_e^k\left| {_t^{t + m - 1}} \right.$ 定义为一组基函数的线性组合$$ {\bar{\boldsymbol{u}}}_e^k\left| {_t^{t + m - 1}} \right. = \boldsymbol{{{\eta}} {{\theta}}} $$ (36) 其中,
${\boldsymbol{\eta }} = \left[{\eta_1}\quad {\eta_2}\quad \cdots \quad {\eta _b}\right]_{ {n_u m} \times b}$ 为由$b$ 个基函数构成的矩阵,$\boldsymbol{\theta} = {\left[ {{\theta _{\rm{1}}}}\quad {{\theta _{\rm{2}}}}\quad \cdots \quad {{\theta _b}}\right]^{\rm{T}}_{1 \times b}}$ 为各个基函数权重系数组成的向量.注 2. 经典预测函数控制中基函数的选取通常依赖于目标参考轨迹形式及系统内部动态特性. 针对批次过程轨迹跟踪问题, 本文提出一种新的基函数构造方法. 首先根据目标参考轨迹及前一批次的信息反馈, 选取随时间和批次变化的基函数
$ {\eta _1}= $ $-[ ({u_e^{k - 1}{{ ( t))}{^{\rm{T}}}}}(u_e^{k - 1}{( {t + 1}) )^{\rm{T}}} \cdots { {(u_e^{k - 1}{{( {t + m - 1} ))}{^{\rm{T}}}}} ]{^{\rm{T}}}}$ 起主要调节作用; 然后再针对系统偏差情况及扰动形式, 结合系统动态特性确定其他基函数$ {\eta _{2}}, \cdots ,{\eta _b} $ 起补偿作用. 由于基函数${\eta _1} =-$ $[ ({u_e^{k - 1}{{( t ))}{^{\rm{T}}}}}(u_e^{k - 1}{\left( {t + 1} \right)){^{\rm{T}}}} \cdots$ ${( {u_e^{k - 1}{{\left( {t + m - 1} \right))}{^{\rm{T}}}}} ]^{\rm{T}}}$ 为上一批次的控制输入偏差, 若系统不存在外界扰动或状态偏差, 选取$\boldsymbol{\theta} = [ I\;\;\; 0\;\;\; $ $ 0\;\;\; 0 ]^{\rm{T}}_{1 \times b}$ 即可实现高精度跟踪. 当系统存在状态偏差时, 可以通过选取冲激信号和阶跃信号作为基函数在$ {\eta _1} $ 的基础上进行调整[26], 补偿状态偏差, 达到高精度跟踪; 当系统存在外界扰动时, 为在系统最后输出中去除该扰动的影响, 应根据扰动类型及系统内部特性, 反推出能够抑制该种扰动的基函数类型, 进行扰动补偿. 例如, 若外部扰动为正弦形式, 系统具有线性动态, 为消除扰动影响, 应选择正弦形式的基函数以补偿扰动, 保证跟踪精度.进而, ILPFC的优化问题可描述为
P2:
$$ \begin{split} {\mathop {\min }\limits_\theta }{J_{{\rm{ILPFC}}}}_t^k =\; & \left\| {{\hat {\boldsymbol{x}}}_e^k\left| {_{t}^{t + m-1}} \right.} \right\|_2^2 + {\wp _t}^{\rm{2}}\left\| \boldsymbol{\eta \theta} \right\|_2^2\;+\\& {V_f}\left( {x_e^k\left( {t + m} \right)} \right) \end{split} \tag{37a}$$ 满足
$$ \widehat{\overline{\boldsymbol{x}}}_{e}^{k}\left| _{t+1}^{t+m} \right.={\boldsymbol{F}}\hat{\bar{x}}_{e}^{k}\left( t\left| t \right. \right)+{\boldsymbol{\Phi }}\overline{\boldsymbol{u}}_{e}^{k}\left| _{t}^{t+m-1} \right.\tag{37b}$$ $$ x \in {\boldsymbol{X}},u \in {\boldsymbol{U}} \tag{37c} $$ $$ x_e^k\left( {t + m} \right) \in {\Omega _{t + m}} \tag{37d} $$ 为书写简便, 下文由
$ {}^FJ_t^k $ 代表${J_{{\rm{ILPFC}}}}_t^k.$ 通过求解优化问题P2可得到最优的权重系数向量
$\boldsymbol{{{\theta }}},$ 即最终的控制输入向量${\bar{\boldsymbol{ u}}}_e^k\left| {_t^{t + m - 1}} \right.$ 表示为所有基函数的最优线性组合. 这可以理解为基函数$ {\eta _1} $ 所表示的一类控制输入以最大限度跟踪参考轨迹, 在此基础上叠加最优的具有偏差针对性或扰动针对性的特殊类型信号, 补偿状态偏差或外界扰动的影响.注 3. ILPFC的约束处理方法可由ILMPC拓展得到, 定义
${\tilde {\boldsymbol{\Gamma }}} = {\boldsymbol{\Gamma \eta }}$ , 则ILPFC的输入约束可表示为$$ {\tilde {\boldsymbol{\Gamma }}}{\boldsymbol{\theta}} \le {{{ {\boldsymbol{N}}}}}$$ (38) 将
${\bar {\boldsymbol{u}}}_e^k\left| {_t^{t + m - 1}} \right. = \boldsymbol{\eta \theta}$ 代入式(35), ILPFC的状态约束可表示为$$ \begin{split} &{\left\| {{\boldsymbol{H}_j}\hat x_e^k\left( {t + i\left| t \right.} \right)} \right\|_2} \;+ \\& \qquad\wp _t^i{\left\| {{\boldsymbol{H}_j}} \right\|_{\rm{2}}}\left( {{{\left\| {x_e^k(t)} \right\|}_2} + {{\left\| \boldsymbol{{\eta \theta }} \right\|}_2}} \right)\; \le {\beta _i} \end{split} $$ (39) ILPFC控制算法整体可分为以下离线和在线两个部分, 其控制结构如图2所示.
1) 离线部分
步骤 1. 沿参考轨迹线性化被控非线性系统得到
$ A\left( t \right){\text{和}}B\left( t \right) $ ($ t = 0, \cdots ,N - 1 $ );步骤 2. 根据式(16)计算得到
$ {\wp _t} $ ;步骤 3. 求解线性矩阵不等式(26)和(27) 得到
$ K\left( t\right) $ ,$ {P_t}\;{\text{和}}\;\alpha $ .2) 在线部分
步骤 1. 设置
$ k = 1,\;t = 0 $ ;步骤 2. 在第k 批次t 时刻, 求解优化问题P2;
步骤 3. 通过式(29)和式(36)计算得到控制输入
$ {u_k}\left( t \right) $ 并施加给原非线性系统(1). 若$ t = N - 1 ,$ 开始第$ k + 1 $ 批次并重新设置$ t = 0 ;$ 否则移至$ t + 1 $ 时刻. 转至步骤 2.3.2 ILPFC性能分析
从本质上讲, 在利用SQP求解带约束优化问题时, 其计算复杂度与优化问题的自由度紧密相关[19], 这可以通过SQP求解的迭代寻优过程进行具体说明.
当使用SQP求解ILPFC优化问题P2时, 需建立对应的拉格朗日函数
$$ \begin{split} &L\left( \boldsymbol{{\theta ,\lambda ,\gamma }} \right) = {}^FJ_t^k + \sum\limits_{i = 1}^{{n_e}} {{\lambda _i}{w_i}\left( \boldsymbol{\theta} \right)} + \sum\limits_{s = 1}^{{n_{iex}}} {{\gamma _s}{g_s}} \left( \boldsymbol{\theta} \right) {\rm{ + }}\\ &\qquad\sum\limits_{s = {n_{iex}} + {\rm{1}}}^{{n_{iex}} + {n_{ieu}}} {{\gamma _s}{h_{s - {n_{iex}}}}} \left( \boldsymbol{\theta} \right) + {\gamma _{{n_{ieu}} + {n_{iex}} + 1}}v\left( \boldsymbol{\theta} \right)\\[-20pt] \end{split} $$ (40) 其中,
$$\begin{split} &{w_i}\left( \boldsymbol{\theta} \right) = {\boldsymbol{H}_i}\left( {{\widehat {\overline {\boldsymbol{x}} }_e^k}\left| {_{t + 1}^{t + m}} \right. - {\boldsymbol{F}}{\hat{\bar{x}}_e^k}\left( {t\left| t \right.} \right) + {\boldsymbol{\Phi }{\boldsymbol{\eta}} {\boldsymbol{\theta}} }} \right) \\ &{g_j}\left( {\boldsymbol{\theta} } \right){ = }\left\| {{\boldsymbol{H}_j}\hat x_e^k\left( {t + i\left| t \right.} \right)} \right\|{_2} +\\ &\quad \quad \quad \wp _t^i{\left\| {{\boldsymbol{H}_j}} \right\|_{2}} \left( {{{\left\| {x_e^k(t)} \right\|}_2} + {{\left\| \boldsymbol{{{\eta \theta }}} \right\|}_2}} \right) - {\beta _j} \\ &{h_{s - {n_{iex}}}}\left( \boldsymbol{{\theta }} \right){ = }{L_{s - {n_{iex}}}}({{\tilde{\boldsymbol{\Gamma}}} \boldsymbol{\theta}} - {{{{\boldsymbol{N}} }}})\\ &v\left( {\boldsymbol{\theta} } \right) = (x_e^k{\left( {t + m} \right)){^{\rm{T}}}}{P_{t + m}}x_e^k\left( {t + m} \right) - \alpha \end{split} $$ $\lambda _i\;(i=1,2,\cdots,n_e ),$ ${{\gamma }_{j}}\left( j=1,2,\cdots , {{n}_{ieu}}+{{n}_{iex}}+1 \right)$ 为拉格朗日乘子,$ {n_e}, $ $ {n_{iex}} $ 和$ {n_{ieu}} $ 分别代表等式约束、 状态不等式约束和控制输入不等式约束的数量.$ {L_{s - {n_{iex}}}} $ 为提取${\tilde {\boldsymbol{\Gamma }}}\boldsymbol{\theta} - {{\boldsymbol{ N}}}$ 中第$ s - {n_{iex}} $ 行的选择向量.为搜索最优解, 需将
$\left\{{{\boldsymbol{\theta} ,{\boldsymbol{\lambda}} ,{\boldsymbol{\gamma}} }} \right\}$ 沿下式优化得到的寻优方向进行迭代$$ {\mathop {\min }\limits_d }\;\; {\frac{1}{2}}{d{^{\rm{T}}}}{H_{{{\rm{ess}}}}}d + \nabla {}{^F}J_t^kd $$ (41) 其中,
${H_{\rm{ess}}} = \nabla _{{\boldsymbol{\theta \theta}}}^2L\left( {{\boldsymbol{\theta} ,{\boldsymbol{\lambda}} ,{\boldsymbol{\gamma}} }} \right)$ 为拉格朗日函数$L\left( {{\boldsymbol{\theta} ,{\boldsymbol{\lambda}} ,{\boldsymbol{\gamma}} }} \right)$ 在当前迭代点的Hessian矩阵. 结合式(41)可以看出, Hessian矩阵的维数对SQP的运算量有很大影响.易知ILPFC优化问题P2中, Hessian矩阵的维数为
$ b \times b $ . 而未采用PFC的ILMPC优化问题P1中, Hessian矩阵为$${H'_{{\rm{ess}}}} = \nabla _{{{\bar {\boldsymbol{u}}}_e^k\left| {_{t}^{t + m - 1}} \right.}{{\bar {\boldsymbol{u}}}_e^k\left| {_{t}^{t + m - 1}} \right.}}^2L \left( {{\bar {\boldsymbol{u}}}_e^k\left| {_{t}^{t + m - 1}} \right.},{\boldsymbol{\lambda}} , {\boldsymbol{\gamma }} \right)$$ 其维数为
${n_u m} \times {n_u m}$ . 在实际应用中, 被控对象通常为多输入多输出系统, 且控制时域$ m $ 较大, 导致$n_u m$ 通常量级较大. 相比较而言, ILPFC中只需根据参考轨迹及系统特性选择少数几个基函数来达成控制目标, 即$ b $ 的量级通常较小. 所以P2的Hessian矩阵的维数会远远小于P1, 也就是说ILPFC滚动优化求解的计算量远小于ILMPC.尽管ILPFC通过应用PFC结构提高了计算效率, 但也相应地带来了可行域减小的问题. ILMPC的原可行域为所有满足约束的控制向量构成的区域, 可描述为
${\Theta _{{\rm{ILMPC}}}} = \{ {{\bar {\boldsymbol{u}}}_e^k\left| {_{t}^{t + m - 1}} \right.}| x \in {\boldsymbol{X}}, u \in{\boldsymbol{U}}, x_e^k( t + $ $ m ) \in {\Omega _{t + m}},\left. {{\bar {\boldsymbol{u}}}_e^k\left| {_{t}^{t + m - 1}} \right.} \in {{\bf{R}}^{n_u m}} \right\}.$ 而在ILPFC中由于控制输入由基函数的加权和代替, 其可行域缩减为${\Theta _{{\rm{ILMPC}}}}$ 内一个$ b $ 维的区域, 可表示为${\Theta _{\rm{ILPFC}}}= $ $ \{ \boldsymbol{\eta \theta} | x \in {\boldsymbol{X}},\,u \in {\boldsymbol{U}},\, x_e^k ( {t + m} ) \in {\Omega _{t + m}},\,{\boldsymbol{ \theta }}\in {{\bf{R}}^b}\}$ 中的全局最优解不包含于缩减后的可行域${\Theta _{\rm{ILPFC}}},$ 那么ILPFC的优化解只是局部最优解, 进而会对ILPFC的跟踪精度带来负面影响.为了实现计算效率和跟踪精度的平衡, 在ILPFC设计中选择合适的基函数使其可行域
${\Theta _{\rm{ILPFC}}}$ 仍能覆盖全局最优解尤为关键. 针对这个问题, 选取一种随时间和批次变化的基函数结构: 首先根据上一批次的控制经验选取基函数${\eta _1}=-[ ({u_e^{k - 1}{{\left( t \right))}{^{\rm{T}}}}}$ $(u_e^{k - 1}{\left( {t + 1}) \right){^{\rm{T}}}} \; \cdots \;$ ${ ({u_e^{k - 1}{{\left( {t + m - 1}) \right)}{^{\rm{T}}}}} ]^{\rm{T}}} ,$ 使ILPFC可行域靠近最优解; 再根据系统中的状态偏移或者扰动形式选择典型信号作为其他基函数进行补偿调整, 使得以所有基函数为基的空间覆盖最优解. 为形象描述这个过程, 以单输入、控制时域为3、基函数个数为2的ILPFC系统为例进行说明, 其可行域形成过程示于图3. 其中三维椭球区域为ILMPC的可行域${\Theta _{{\rm{ILMPC}}}}$ , 则ILPFC的可行域${\Theta _{{\rm{ILPFC}}}}$ 为基函数构成的二维平面与该椭球的相交面.由于基函数
$ {\eta _1} $ 是根据参考轨迹及系统动态选择的随时间和批次变化的基函数, 它会形成一条与全局最优解十分接近的直线. 通过选择另一典型信号基函数对此直线的移动方向进行简单调整, 即可使$ {\eta _1} $ 与$ {\eta _{2}} $ 构成的平面区域包含全局最优解(图中圆点), 那么该平面与椭球的相交面, 即ILPFC可行域${\Theta _{{\rm{ILPFC}}}}$ 必定能包含全局最优解.结合第3节中的ILMPC稳定性结论, 可由图3总结出:
1) 若合理选择基函数使其构成的区域与ILMPC的可行域相交, 那么ILPFC优化问题在任意未来时刻可行;
2) 若在ILPFC的可行域内存在控制输入
${\breve {\boldsymbol{u}}}^k_{t + 1}$ , 使其对应的目标函数值${\breve J } _{t + 1}^k$ 满足${\breve J } _{t + 1}^k \leq \tilde J_{t + 1}^k ,$ 那么ILPFC闭环系统稳定. 特别地, 若 ILPFC的可行域包含最优解${{\boldsymbol{u}}{_{t + 1}^{k*}} }$ , 则ILPFC控制系统必定稳定.4. ILPFC/ILMPC收敛性分析
收敛性是衡量ILMPC算法性能及维护控制系统安全的重要性质[8-11]. ILMPC算法的收敛性通常定义为跟踪误差
${x_e^k}\left( t \right)$ 沿迭代次序$ k $ 收敛. 现有的ILMPC算法大多未考虑控制系统时域稳定问题, 所以通常需要满足一些较为苛刻的条件以保证迭代收敛性[8, 10]. 本文所提出的ILPFC算法将真实跟踪误差的二范数上界作为优化目标函数, 并加入终端约束来保证系统时域稳定性. 结合第3节中引理1的稳定性结论, ILPFC的收敛性可以在合理假设$\mathop {\lim }\nolimits_{k \to \infty } {\left\| {\bar x_e^k\left( 0 \right)} \right\|_2} = 0$ 下通过“三步推导”证得. 首先根据闭环稳定性可推出跟踪误差有界性; 然后, 通过反证法可以得到初始控制输入的收敛性. 最后重复利用利普希兹条件, 证得系统跟踪误差沿迭代轴收敛.定理 2. 若初始状态满足
$\mathop {\lim }\nolimits_{k \to \infty } {\left\| {\bar x_e^k\left( 0 \right)} \right\|_2} = {0} ,$ 则ILPFC(ILMPC)系统的跟踪误差沿迭代轴收敛.证明. 1)证明跟踪误差的有界性, 由式(37)可知, ILPFC中第k批次初始时刻的目标函数为
$$ {}^FJ{_0^k }^ * = {\left\| {{\hat {\boldsymbol{x}}}_e^k\left| {_1^m} \right.} \right\|_2^2} + {\wp _0}^{\rm{2}}{\left\| {\boldsymbol{\eta \theta} {{_0^k}^ * }} \right\|_2^2} + {V_f}\left( {x_e^k\left( m \right)} \right) $$ (42) 设其对应的最优控制输入为
${\boldsymbol{u}}{_0^k }^ * , $ 权重系数矩阵为$$ \boldsymbol{\theta} {_0^k }^ * = {\left[ {\begin{array}{*{20}{c}} {\theta _0^k\left( 1 \right)}&{\theta _0^k\left( 2 \right)}& \cdots &{\theta _0^k\left( b \right)} \end{array}} \right]{^{\rm{T}}}} $$ (43) 易知当
$\tilde {\boldsymbol\theta} _0^{k + 1} = {\bf{0}}$ 时,${\tilde {\boldsymbol{u}}}_0^{k + 1} = {\boldsymbol{{u}}{_0^k}^ *}$ 为第$ k+1 $ 批次初始时刻的可行解. 设${\tilde {\boldsymbol{u}}}_0^{k + 1}$ 输入下的目标函数为${}^F\tilde J_0^{k + 1},$ 最优目标函数值为$ {}^FJ{_0^{k + 1}}^ * .$ 那么可以得到$$ {}^FJ{_0^{k + 1} }^ * \leq {}^F\tilde J_0^{k + 1} $$ (44) 由于
${\tilde {\boldsymbol{u}}}_0^{k + 1} = {\boldsymbol{u}}{_0^k }^ *,$ 可得$$ {}^FJ{_0^k }^ * = {}^F\tilde J_0^{k + 1} $$ (45) 联立式(44)和式(45), 可得
$$ {}^FJ{_0^{k + 1}}^ * \leq {}^FJ{_0^k}^ * $$ (46) 通过递推式(25), 可得
$$ {}^FJ{_0^k}^ * \geq {}^FJ{_1^k }^ * \geq {}^FJ{_2^k}^ * \geq \cdots \geq {}^FJ{_{N - 1}^{k^*} } $$ (47) 联立式(46)及式(47), 可以得出结论:
$ {}^FJ{_0^k}^ * \left( {k \in \left[ {1,\infty } \right)} \right) $ 有上界$ ^FJ{_0^1}^ * $ ,$ {}^FJ{_t^k }^ *( t \in [ {0,N - 1}]) $ 有上界$ {}^FJ{_0^k}^ * . $ 由于$\,{}^FJ{_t^k }^ * $ 为跟踪误差2-范数$ {\left\| {{e_k}\left( t \right)} \right\|_2} $ 的上界, 所以ILPFC的跟踪误差是有界的(此结论同样适用于ILMPC).2) 证明初始控制输入的收敛性. 假设控制输入
${\boldsymbol{u}}_e^k\left( 0 \right)$ 沿迭代轴发散, 即存在正实数$ \varepsilon $ 使$$ {\left\| {{\bar{\boldsymbol{ u}}}_e^k\left( 0 \right)} \right\|_2} \geq \varepsilon $$ (48) 对任意
$ k \in \left[ {{{1,}}\;\infty } \right) $ 成立.根据式(14)和式(15), 可以推出
$$ \begin{split} &{{\left\| {\boldsymbol{x}}_{e}^{k}\left| _{1}^{m} \right. \right\|}_{2}}\leq {{\left\| {\boldsymbol{x}}_{e}^{k-1}\left| _{1}^{m} \right.+{\boldsymbol{F}}\hat{\bar{x}}_{e}^{k}\left( 0 \right)+{\boldsymbol{\Phi }}\overline{\boldsymbol{u}}_{e}^{k}\left| _{0}^{m-1} \right. \right\|}_{2}}\;+ \\ &\qquad \wp _{0}^{*}\left( {{\left\| \bar{x}_{e}^{k}\left( 0 \right) \right\|}_{2}}+{{\left\| \overline{\boldsymbol{u}}_{e}^{k}\left( 0 \right) \right\|}_{2}} \right) \\[-10pt] \end{split}$$ (49) 假设
$ \wp _0^{} = \wp _0^ * + \wp _0^s $ , 那么$$ \begin{split} &{\left\| {{\boldsymbol{x}}_e^k\left| {_1^m} \right.} \right\|_2} + \wp _0^s\varepsilon \leq{\left\| {{\boldsymbol{x}}_e^{k - 1}\left| {_1^m} \right. + {\boldsymbol{F}}\widehat {\overline x }_e^k\left( 0 \right)} \right\|_2} \;+ \\ &\qquad \wp _0{\left\| {\bar x_e^k\left( 0 \right)} \right\|_2} \leq {\left\| {{\boldsymbol{x}}_e^k\left| {_1^m} \right.} \right\|_2} \;+ \\ &\qquad\left( {{{\left\| {\boldsymbol{F}} \right\|}_2} + \wp _0} \right){\left\| {\overline x _e^k\left( 0 \right)} \right\|_2} \end{split} $$ (50) 定义
${E_m} = \mathop {\max }\nolimits_{k} {\left\| {{\boldsymbol{x}}_e^k\left( 1 \right)} \right\|_2}$ , 选取$\vartheta = ( {1 - \frac{{\wp _0^s\varepsilon }}{{{E_m}}}} ) \in $ $ \left( {0,1} \right)$ , 式(50)可转化为$$ {\left\| {{\boldsymbol{x}}_e^k\left| {_1^m} \right.} \right\|_2} \leq \vartheta {\left\| {{\boldsymbol{x}}_e^{k - 1}\left| {_1^m} \right.} \right\|_2} + \left( {{{\left\| {\boldsymbol{F}} \right\|}_2} + \wp _0^{}} \right) {\left\| {\bar x_e^k\left( 0 \right)} \right\|_{2}} $$ (51) 由于初始状态满足
$\mathop {\lim }\nolimits_{k \to \infty } {\left\| {\bar x_e^k\left( 0 \right)} \right\|_2} = 0,$ 可由式(51)推导出$\mathop {\lim }\nolimits_{k \to \infty } {\left\| {{\boldsymbol{x}}_e^k\left| {_1^m} \right.} \right\|_2} = 0,$ 因此$ J_0^k \to 0, $ ${\bar{\boldsymbol{ u}}}_e^k\left( 0 \right) \to 0 ,$ 即$ \bar u_e^k\left( 0 \right) \to 0 ,$ 这与式(48)的假设相悖. 所以可以得出:$\mathop {\lim }\nolimits_{k \to \infty } {\left\| {{\bar{\boldsymbol{ u}}}_e^k\left( 0 \right)} \right\|_2} = 0$ 成立, 即$\mathop {\lim }\nolimits_{k \to \infty } {\left\| {\bar u_e^k\left( 0 \right)} \right\|_2} = 0 .$ 3) 由利普希兹条件可知
$$ {\left\| {\bar x_e^k\left( 1 \right)} \right\|_2} \leq {\wp _0}\left( {{{\left\| {\bar x_e^k\left( 0 \right)} \right\|}_2} + {{\left\| {\bar u_e^k\left( 0 \right)} \right\|}_2}} \right) $$ (52) 由式(52)可知
$\mathop {\lim }\nolimits_{k \to \infty } {\left\| {\bar x_e^k\left( 1 \right)} \right\|_2} = 0 .$ 通过反复进行以上步骤, 可以总结出: 对于任意$t \in [ {0,N - 1}]$ , 当$k \to \infty$ 时,$\mathop {\lim }\nolimits_{k \to \infty } {\| {\bar u_e^k( t )} \|_2} = 0$ 且$\mathop {\lim }\nolimits_{k \to \infty } {\| {\bar x_e^k( t )} \|_2} = $ $ 0,$ 即ILPFC (ILMPC)系统的跟踪误差沿迭代轴收敛. □5. 仿真研究
5.1 无人地面车辆
无人地面车辆(Unmanned ground vehicle, UGV)是广泛应用于农业、物流业、采矿业、军事的移动式人工智能车辆. 在执行巡逻、运输及农耕任务时, 其控制目标可看作自动重复跟踪给定的运动轨迹, 是一类典型的快速批次过程, 采样间隔较短. 其非线性动态特性可由以下微分方程描述[27]
$$ \begin{split} & {{\dot x}_c} = {v_c}\cos {\theta _c}\;\; \\ & {{\dot y}_c} = {v_c}\sin {\theta _c}\;\; \\ & {{\dot \theta }_c} = \frac{{{v_c}}}{L}\tan {\sigma _c} \end{split}$$ (53) 其中,
$ {x_c} $ 和$ {y_c} $ 为车辆在笛卡尔坐标系下的位置坐标,$ {\theta _c} $ 表示车辆轴线中心的方向,$L\;{{ = 1}}{{.2}}\;{\rm{m}}$ 为车轮的轴距,$ {v_c} $ 代表车辆速度,$ {\sigma _c} $ 代表车辆转向输入.${\left[ {{x_c}}\quad{{y_c}}\quad{{\theta _c}} \right]{^{\rm{T}}}}$ 为车辆控制系统的状态变量,${\left[ {{v_c}}\quad{{\sigma _c}} \right]{^{\rm{T}}}}$ 为控制系统的输入变量. 车辆参考轨迹为$$ \begin{split} {x_r}\left( t \right) =& 11 + 0.7\sin \left( {\frac{{2\pi t}}{{35}}} \right) \\ {y_r}\left( t \right) =& 9 + 0.7\sin \left( {\frac{{4\pi t}}{{35}}} \right) \\ {{\dot \theta }_r}\left( t \right) = &\arctan \left(\frac {{{\dot y}_r}\left( t \right)}{{{\dot x}_r}\left( t \right)} \right) \end{split} $$ (54) 采样时间选为0.2 s. 车辆初始状态为
$[10.3\;\; 9.5\;\; $ $ 1]{^{\rm{T}}}$ , 与参考轨迹相比存在初始状态偏移. 每一批次的初始状态保持一致, 即满足定理2中的收敛条件$\mathop {\lim }\nolimits_{k \to \infty } {\left\| {\bar x_e^k\left( 0 \right)} \right\|_2} = 0 ,$ 选取初始批次控制输入为已知的参考输入轨迹$ {v_r} $ 和${\sigma _r} .$ 控制输入约束及状态约束设为
$$ \begin{split} & 0.08 \leq v \leq 0.5, \;- 0.5 \leq \Delta v \leq 0.5 \\ & \hspace{1pt} -0.6 \leq \delta v \leq 0.6 ,\;\;- 1.6 \leq \sigma \leq 1.6\\ & -\leq \Delta \sigma \leq 3, \;\;- 0.6 \leq \delta \sigma \leq 0.6 \\ & \| {{x_e}} \|_2 \leq 1,\;{\left\| {{y_e}} \right\|_2} \leq 1,\;{\left\| {{\theta _e}} \right\|_2} \leq 1 \end{split} $$ (55) 其中,
$ {x_e} = {x_c} - {x_r},\;{y_e} = {y_c} - {y_r},\;{\theta _e} = {\theta _c} - {\theta _r}. $ 离散化非线性系统(53), 并沿参考轨迹(54)实施线性化, 建立如式(5)的线性化误差模型
$$ \begin{split} {{\boldsymbol{x}}_e}\left( {t + 1} \right) =& \;A\left( t \right){{\boldsymbol{x}}_e}\left( t \right) + B\left( t \right){{\boldsymbol{u}}_e}\left( t \right) + \\ & \ell \left( {{x_e}\left( t \right),{u_e}\left( t \right)} \right) \end{split}$$ (56) 其中,
$$\begin{split} &{{\boldsymbol{x}}_{\boldsymbol{e}}} = {\left[ {{x_c}\;\;\;{y_c}\;\;\;{\theta _c}} \right]{^{\rm{T}}}} - {\left[ {{x_r}\;\;\;{y_r}\;\;\;{\theta _r}} \right]{^{\rm{T}}}}\\ & A\left( t \right) = \left[ {\begin{array}{*{20}{c}} 1&0&{ - 0.2{v_r}\left( t \right)\sin {\theta _r}\left( t \right)} \\ 0&1&{0.2{v_r}\left( t \right)\cos {\theta _r}\left( t \right)} \\ 0&0&1 \end{array}} \right]\\ & B\left( t \right) = \left[ {\begin{array}{*{20}{c}} {0.2\cos {\theta _r}\left( t \right)}&0 \\ {0.2\sin {\theta _r}\left( t \right)}&0 \\ {\dfrac{{0.2}}{L}\tan {\delta _r}\left( t \right)}&{\dfrac{{0.2}}{L}{v_r}\left( t \right){{\sec }^2}{\delta _r}\left( t \right)} \end{array}} \right] \end{split} $$ $ \ell \left( {{x_e}\left( t \right),{u_e}\left( t \right)} \right)$ 代表泰勒展开的高阶项.基于式(5)~(11), 由线性化模型(56)形成二维预测模型, 其中预测时域与控制时域都选为20. 利用李普希兹条件, 得到真实跟踪误差的上界
${\left\| {{\hat {\boldsymbol{x}}}_e^k\left| {_{t + 1}^{t + m}} \right.} \right\|_2} + {\wp _t}\left( {{{\left\| {\bar x_e^k\left( t \right)} \right\|}_{2}} + {{\left\| {{\bar {\boldsymbol{u}}}_e^k\left| {_{t}^{t + m - 1}} \right.} \right\|}_{2}}} \right)$ , 其中时变李普希兹权重$ {\wp _t} $ 可以通过式(16)离线计算得到. 将此上界作为优化目标函数, 结合终端约束, 构造ILMPC优化问题P1, 其中,${P_{t + m}} ,$ $ K\left( t \right) $ 和$ \alpha $ 由式(26)和式(27)表示的线性矩阵不等式计算得到. 求解得到的跟踪误差时变终端不变集${\Omega _t} = \{{\boldsymbol{x}}_e^k \in {\bf{R}^{{3}}}: $ $ {\boldsymbol{x}}{{_e^k}^{\rm{T}}}{P_t}{\boldsymbol{x}}_e^k \leq \bigg. $ $ \bigg. \alpha \}$ , 如图4所示.在ILPFC中, 选取基函数
$$\begin{split} {\eta _{\rm{1}}} =\;&-\Big[ \nu _e^{k - 1}(t) \;\;\;\sigma _e^{k - 1}(t)\;\; \cdots\;\;\nu _e^{k - 1}(t + m - 1)\\ &\sigma _e^{k - 1}( t + m - 1)\Big]^{\rm{T}} \end{split} $$ ${\eta _{2}} $ 为单位阶跃信号. 将控制输入变量表示成基函数$ {\eta _{\rm{1}}} $ 和$ {\eta _{2}} $ 的加权和, 构成ILPFC优化问题P2. 在每个采样时刻, 控制输入的求解空间为${n_u} \times m$ ($ {2} \times 20 $ )维, 随时间和批次变化的基函数$ {\eta _1} $ 于其中形成一条接近最优解的曲线, 通过单位阶跃基函数$ {\eta _{2}} $ 的调整,$ {\eta _1} $ 和$ {\eta _{2}} $ 构成与ILMPC可行域${\Theta _{\rm{ILMPC}}}$ 相交的二维区域, 保证LPFC优化问题的可行. 其相交区域, 即ILPFC的可行域${\Theta _{\rm{ILPFC}}}$ 包含令${}^F{\breve J } _{t + 1}^k \leq $ $ \tilde J_{t + 1}^k$ 的控制输入${\breve {\boldsymbol{u}} }_{t + 1}^k$ , 以保证ILPFC控制系统稳定. 仿真得到的状态及控制输入曲线分别如图5和图6所示, 表明ILPFC能够以较高精度跟踪参考轨迹. 图7(a)显示了第2批次中基函数权重系数($ {\theta _1} $ ,$ {\theta _{2}} $ )随时间变化的轨迹, 表明ILPFC优化问题在所有采样时刻可行. 图7(b)为跟踪误差均方差(Main square error, MSE)随批次的变化曲线, 验证了ILPFC系统跟踪误差的收敛性.多点ILMPC (Multi-point ILMPC, mp-ILMPC)[11]是一种在解决非线性问题上具有突出优势的算法, 已在国际学术界获得广泛认可. 它采用工作点线性化得到的线性定常预测模型, 利用多点信息进行加权预测, 同样以真实跟踪误差的上界作为目标函数
$$ \begin{split} &\mathop {\min }\limits_{{{\boldsymbol{u}}^k}\left| {_t^{t + m - 1}} \right.} \;{J_{\rm{mp - {\rm{ILMPC}}}}}_t^k = \| {{{\hat {\boldsymbol{x}}}^{'}}{_e^k}\left| {_{t + 1}^{t + m}} \right.}\|_2\; + \\ &\qquad\wp \sum\limits_{i = 1}^{{t_e} - {t_s} + 1} {{{{-}\lambda} _i}} \times \bigg( {{{\left\| {{x_k}\left( t \right) - {x_{k - 1}}\left( {{t_s} + i - 1} \right)} \right\|}_2} \;+ } \\ &\qquad {{{\left\| {{{\boldsymbol{u}}^k}\left| {_t^{t + m - 1}} \right. - {{\boldsymbol{u}}^{k - 1}}\left| {_{{t_s} + i - 1}^{{t_s} + i + m - 2}} \right.} \right\|}_2}} \bigg) \\[-15pt] \end{split} $$ (57) 其中,
$ {{{\hat {\boldsymbol{x}}}^{'}}{_e^k}\left| {_{t + 1}^{t + m}} \right.} $ 为由线性定常模型预测得到的预测状态序列[11].$ \wp $ 为定常李普希兹权重, 根据文献[11]的递推公式计算为0.5.${t_s} = \max \{t - {{l_{{-}\lambda}}},1\}$ ,${t_e} = $ $ \min \left\{ {t - {l_{{-}\lambda} },N} \right\}$ , 其中$l_{{-}\lambda}$ 为使用的预测点个数, 根据批次长度设置为10.${{{-}\lambda} _i}$ 为每个点预测结果的权重系数. 为求解非凸优化问题(57), 采取交替凸搜索法进行寻优[11].为了验证ILPFC算法的有效性, 将其与ILMPC (P1)以及mp-ILMPC从计算效率和跟踪精度两个角度进行仿真实验对比. 图8描述了三种控制策略下第9批次的无人车运动曲线, 表明ILPFC在跟踪精度上与ILMPC和mp-ILMPC相当. 设置预测/控制时域分别为10, 15和20, 重复进行仿真实验, 从平均计算时间和平均跟踪误差均方差两个方面对三种控制器进行性能分析, 相关结果如表1所示. 随预测/控制时域增加, 三种方法的平均MSE都呈下降趋势, 使得跟踪精度提高. 但是与此同时, ILMPC和mp-ILMPC的平均计算时间均有显著增长, 并在控制时域达到20时超过了采样间隔. 而ILPFC的在线计算负担几乎保持不变, 始终维持较高的控制效率. 这是由于ILPFC与其他两种方法相比优化复杂度更低. 当控制时域变长时, 由于采用特殊的控制输入结构, ILPFC优化问题(P1)的Hessian矩阵维数保持为
$ {2} \times {2} $ , 使在线计算负担较低. 而ILMPC的Hessian矩阵维数迅速增长, 计算负担也随之加重. 在mp-ILMPC中, 在每个采样时刻需要求解非凸优化问题, 使得其计算时间相对较长, 并随控制时域增加而增长. 综上, 与其他两种策略相比较, ILPFC能更好地实现计算效率与控制最优性间的平衡.表 1 ILPFC、ILMPC及mp-ILMPC计算量和跟踪误差比较Table 1 The comparison of computation time and tracking errors between ILPFC, ILMPC and mp-ILMPC控制时域 ILPFC平均计算时间 (s)
(Hessian矩阵维数)ILMPC平均计算时间 (s)
(Hessian矩阵维数)mp-ILMPC平均
计算时间 (s)ILPFC
平均 MSEILMPC
平均 MSEmp-ILMPC
平均 MSE10 0.083 (2 × 2) 0.158 (20 × 20) 0.162 3.051 2.878 3.053 15 0.041 (2 × 2) 0.185 (30 × 30) 0.191 2.988 2.734 2.984 20 0.064 (2 × 2) 0.211 (40 × 40) 0.216 2.845 2.627 2.840 5.2 非线性间歇反应器
化学工业中存在很多快速反应过程[18], 要求在较短的采样时间内计算出控制输入, 这对此类间歇反应器的实时控制提出了很高的要求. 本组仿真实验通过对快速间歇反应器的温度控制, 验证ILPFC在提高优化效率方面的作用. 反应器中进行由反应物A生成反应物B的二级放热反应[28], 其控制任务为通过调节冷却套温度来重复跟踪给定的反应温度曲线. 反应过程的非线性动态可由以下微分方程描述
$$ \begin{split} &\dot T = - \frac{{UA}}{{M{C_p}}}\left( {T - {T_j}} \right) + \frac{{\left( { - \Delta H} \right)V}}{{M{C_p}}}{k_0}{{\rm{e}}^{ - \frac{E}{RT}}}{C_A^2} \\ &{{\dot C}_A} = - {k_0}{{\rm{e}}^{ - \frac{E}{RT}}}{C_A^2} \end{split} $$ (58) 其中,
$ T $ 为反应温度,$ {C_A} $ 为反应物A浓度,$ {T_j} $ 为冷却剂温度, 其他参数物理意义可参见文献[28]. 各参数取值为$$\begin{split} &\frac{UA}{M{C_p}} = 0.09\left( {{1 / {\min }}} \right) \\ &\frac{\left( { - \Delta H} \right)V } {M{C_p} }= 1.64\left({ {\rm{K{l}}}}/{ {{\rm{mol}}}} \right) \\ &{k_0} = 2.53 \times {10^{19}}\left( {{{\rm{l}} / ({{\rm{mol}}\cdot\min }}}) \right) \\& {\frac{E}{ R}} = 13\,550\left( {\rm{K}} \right) \end{split} $$ 采样时间为0.02 min. 参考轨迹采用文献[28]的典型生产过程反应温度曲线. 反应器系统存在初始状态偏移, 实际初始状态在所有批次保持为
${\left[ {{C_{A0}}\;,{T_0}} \right]{^{\rm{T}}}} = \left[ {0.9\left( {{{{{\rm{mol}}} / {\rm{l}}}} }\right),29{{6}}.15\left(\rm{ K} \right)} \right]$ , 满足定理2中的收敛条件$\mathop {\lim }\nolimits_{k \to \infty } {\left\| {\bar x_e^k\left( 0 \right)} \right\|_2} = 0 .$ 选取初始批次控制输入为已知的参考输入轨迹${u_r} ,$ 系统约束为$$ \begin{split} &295\;{\rm{K}} \leq T \leq 310{\;\rm{K}},\;0 \leq {C_A} \leq 1{{\;{\rm{{mol}} / {{\rm{l}}}}}} \\ &2{{88}}{{.15}}{\;\rm{K}} \leq {T_j} \leq 3{{13}}{{.15}}{\;\rm{K}} \\ &- 10{\;\rm{K}} \leq {{\bar T}_j} \leq 10{\;\rm{K}},\; - 2{\;\rm{K}} \leq \delta {T_j} \leq 2{\;\rm{K}} \end{split}$$ (59) 针对非线性系统(58)实施离散化, 并沿参考轨迹进行线性化, 得到如式(11)的二维预测模型, 其中预测/控制时域选为20. 由此带来的线性化误差通过时变李普希兹权重
$ {\wp _t} $ 在优化目标函数中加以补偿. 再结合终端约束, 构建ILMPC优化问题P1, 其中时变终端不变集由式(26)和式(27)表示的线性矩阵不等式计算得到, 如图9所示.在ILPFC优化问题P2中, 选取基函数
${\eta _1} = $ $ - {[ {{T_j}_e^{k - 1}( t )\;\;{T_j}_e^{k - 1}( {t + 1} )\; \cdots \;{T_j}_e^{k - 1}( {t + m - 1} )} ]{^{\rm{T}}}},$ ${\eta _{2}} $ 为单位阶跃信号,$ {\eta _{{3}}} $ 为单位斜坡信号. 这3个基函数构成的区域可与ILMPC的可行域相交并覆盖最优解, 以此保证ILPFC的递归可行性及闭环稳定性. ILMPC控制下的仿真结果如图10 ~ 12所示, 表明ILPFC能够以较高精度跟踪设定的反应器温度参考轨迹. 图13(a)显示了第20批次基函数权重系数${\theta _1},$ $ {\theta _{2}} $ 和$ {\theta _{{3}}} $ 沿时间的变化轨迹, 证明ILPFC优化问题P2的可行性. 图13(b)为跟踪误差MSE沿批次的变化轨迹, 表明ILPFC系统的跟踪误差沿迭代收敛.为了验证ILPFC的跟踪性能, 对ILPFC、ILMPC以及mp-ILMPC控制下的反应温度跟踪曲线进行比较, 如图14所示. 其中, mp-ILMPC中的参数设置为
${l_{{-}\lambda}} = {{20}},$ $\wp = 0{{.7}}.$ 对比结果表明ILPFC的跟踪精度与ILMPC相差无几. 选取预测/控制时域分别为10, 15和20重复进行仿真实验, 从平均计算时间及平均跟踪误差MSE两个角度比较三种方法, 其结果如表2所示. 很明显, 随着预测/控制时域增大, 三种控制方法的跟踪精度均提高. 但是, 只有ILPFC保持了较高的求解效率, 其他两种方法的计算效率均呈现下降趋势.表 2 ILPFC、ILMPC及mp-ILMPC计算量和跟踪误差比较Table 2 The comparison of computation time and tracking errors between ILPFC, ILMPC and mp-ILMPC控制时域 ILPFC平均计算时间 (s)
(Hessian 矩阵维数)ILMPC平均计算时间 (s)
(Hessian 矩阵维数)mp-ILMPC平均
计算时间 (s)ILPFC
平均 MSEILMPC
平均 MSEmp-ILMPC
平均 MSE10 0.067 (3 × 3) 0.108 (10 × 10) 0.197 5.974 5.602 5.992 15 0.052 (3 × 3) 0.255 (15 × 15) 0.361 5.568 5.227 5.603 20 0.061 (3 × 3) 0.412 (20 × 20) 0.502 5.113 4.895 5.121 在进行非线性批次过程轨迹线性化时, 参考输入轨迹
$ {u_r} $ 是已知的. 在系统存在初始状态偏差的情况下,$ {u_r} $ 较为接近目标控制输入轨迹. 因此将$ {u_r} $ 作为初始批次的控制输入是最优的选择. 图15描述了初始批次输入轨迹为303 K幅值阶跃信号时的跟踪曲线. 可以看出, 在初始控制输入轨迹严重偏离目标输入轨迹时, ILPFC仍能在10个批次内实现高精度跟踪, 验证了ILPFC对初始批次输入的鲁棒性.综上, ILPFC实现了高精度跟踪与高效优化求解之间的平衡, 这对提高快速间歇反应器的产品质量和生产效率都具有显著的实际意义.
6. 结束语
本文基于二维ILMPC框架, 在时域控制中结合PFC算法来降低优化计算负担, 由此带来的可行域缩减问题在一定程度上会影响ILPFC的跟踪精度. 通过选择一种随时间和批次变化的特殊基函数结构, 可使在缩减的可行域内仍能获得最优解, 达到了控制效率与跟踪精度间的平衡. 针对UGV系统和快速间歇反应器的仿真实验验证了ILPFC算法的有效性.
通过对ILPFC算法结构的剖析, 可以发现其控制性能与所选择的基函数品质密切相关. 因此, 如何获得系统的最优基函数是未来研究的一个重要方向. 基于批次过程大数据, 可以发展一种沿迭代轴进行基函数自学习的控制框架, 这将有利于进一步提高ILPFC系统的学习能力及闭环性能.
附录A. 定理1的证明
证明. 将式(5)代入引理1的条件e)中, 可得
$$\begin{split} &{\left[ {\begin{array}{*{20}{c}} {x_e^k\left( t \right)} \\ {\ell \left( {x_e^k\left( t \right),u_e^k\left( t \right)} \right)} \end{array}} \right]^{\rm{T}}} \times \\ & \qquad\Bigggr[{20} {\begin{array}{*{20}{c}} {\left( {A\left( t \right) + B\left( t \right)K\left( t \right)} \right){^{\rm{T}}}}{P_{t + 1}}\left( {A\left( t \right) + B\left( t \right)K\left( t \right)} \right)- \\ {P_k} + I + {\wp _{t - m + 1}}(K{\left( t \right)){^{\rm{T}}}}K\left( t \right) \\ {{P_{t + 1}}\left( {A\left( t \right) + B\left( t \right)K\left( t \right)} \right)} \end{array}} \\ & \quad\qquad\qquad {\begin{array}{*{20}{c}} {{{\left( {A\left( t \right) + B\left( t \right)K\left( t \right)} \right)}{^{\rm{T}}}}{P_{t + 1}}} \\ {{P_{t + 1}}} \end{array}} \Bigggr]{20}\times \\ & \qquad\left[ {\begin{array}{*{20}{c}} {x_e^k\left( t \right)} \\ {\ell \left( {x_e^k\left( t \right),u_e^k\left( t \right)} \right)} \end{array}} \right] \leq 0 \\[-10pt] \end{split} \tag{A1}$$ 式(7)等价于
$$ \begin{split} & {\left[ {\begin{array}{*{20}{c}} {x_e^k\left( t \right)} \\ {\ell \left( {x_e^k\left( t \right),u_e^k\left( t \right)} \right)} \end{array}} \right]^{\rm{T}}}\left[ {\begin{array}{*{20}{c}} { - \left( {{(K(t))^{\rm{T}}}{\mu ^2}K(t) + {\mu ^2}I} \right)}&0 \\ 0&I \end{array}} \right] \times \\ & \qquad\left[ {\begin{array}{*{20}{c}} {x_e^k\left( t \right)} \\ {\ell \left( {x_e^k\left( t \right),u_e^k\left( t \right)} \right)} \end{array}} \right] \leq 0 \end{split}\tag{A2}$$ 通过S-过程, 式(A1)和式(A2)等价于
$$ \begin{split} &\Bigggr[{22} {\begin{array}{*{20}{l}} {\left( {A\left( t \right) + B\left( t \right)K\left( t \right)} \right)^{\rm{T}}}{P_{t + 1}}\left( {A\left( t \right) + B\left( t \right)K\left( t \right)} \right) - \\ \quad {P_k} + I + {\wp _{t - m + 1}}(K{\left( t \right))^{\rm{T}}}K\left( t \right) + \\ \quad\tau \left( {{(K(t))^{\rm{T}}}{\mu ^2}K(t) + {\mu ^2}I} \right) \\ \quad\quad\quad{{P_{t + 1}}\left( {A\left( t \right) + B\left( t \right)K\left( t \right)} \right)} \end{array}} \\ &\qquad\qquad\qquad\qquad\qquad{\begin{array}{*{20}{c}} {{{\left( {A\left( t \right) + B\left( t \right)K\left( t \right)} \right)}^{\rm{T}}}{P_{t + 1}}} \\ {{P_{t + 1}} - \tau I} \end{array}} \Bigggr]{22} \leq0 \end{split}\tag{A3} $$ 应用Schur补定理, 可得式(A3)等价于式(26), 这意味着如果在每一时刻满足式 (26), 则有
$$ ( x_e^k{\left( {t + 1}) \right)^{\rm{T}}}{P_{t + 1}}x_e^k\left( {t + 1} \right) \leq( x_e^k{\left( t \right))^{\rm{T}}}{P_t}x_e^k\left( t \right) \tag{A4}$$ 所以若在任意时刻
$ t ,$ 状态$ x_e^k\left( t \right) $ 满足${\Omega _t} =\{ {x_e^k \in {{\bf{R}}^n}:}\; x{{_e^k}^{\rm{T}}}{P_t}x_e^k $ $ \leq \alpha \}$ , 那么一定有$$ (x_e^k{\left( {t + 1} \right))^{\rm{T}}}{P_{t + 1}}x_e^k\left( {t + 1} \right) \leq \alpha \tag{A5} $$ 即
$ x_e^k\left( {t + 1} \right) $ 属于不变集${\Omega _{t+1}} =\{ {x_e^k \in {{\bf{R}}^n}:} x{{_e^k}^{\rm{T}}}{P_{t+1}}x_e^k \leq \alpha \}$ , 因此条件d)满足. 根据$ x_e^k\left( t \right) $ 的定义, 条件a)和b)能够满足. 借助Schur补定理, 条件c)可通过线性矩阵不等式 (27)满足. □ -
表 1 ILPFC、ILMPC及mp-ILMPC计算量和跟踪误差比较
Table 1 The comparison of computation time and tracking errors between ILPFC, ILMPC and mp-ILMPC
控制时域 ILPFC平均计算时间 (s)
(Hessian矩阵维数)ILMPC平均计算时间 (s)
(Hessian矩阵维数)mp-ILMPC平均
计算时间 (s)ILPFC
平均 MSEILMPC
平均 MSEmp-ILMPC
平均 MSE10 0.083 (2 × 2) 0.158 (20 × 20) 0.162 3.051 2.878 3.053 15 0.041 (2 × 2) 0.185 (30 × 30) 0.191 2.988 2.734 2.984 20 0.064 (2 × 2) 0.211 (40 × 40) 0.216 2.845 2.627 2.840 表 2 ILPFC、ILMPC及mp-ILMPC计算量和跟踪误差比较
Table 2 The comparison of computation time and tracking errors between ILPFC, ILMPC and mp-ILMPC
控制时域 ILPFC平均计算时间 (s)
(Hessian 矩阵维数)ILMPC平均计算时间 (s)
(Hessian 矩阵维数)mp-ILMPC平均
计算时间 (s)ILPFC
平均 MSEILMPC
平均 MSEmp-ILMPC
平均 MSE10 0.067 (3 × 3) 0.108 (10 × 10) 0.197 5.974 5.602 5.992 15 0.052 (3 × 3) 0.255 (15 × 15) 0.361 5.568 5.227 5.603 20 0.061 (3 × 3) 0.412 (20 × 20) 0.502 5.113 4.895 5.121 -
[1] 卢静宜, 曹志兴, 高福荣. 批次过程控制-回顾与展望. 自动化学报, 2017, 43(6): 933-943Lu Jing-Yi, Cao Zhi-Xing, Gao Fu-Rong. Batch process control-overview and outlook. Acta Automatic Sinica, 2017, 43(6): 933-943 [2] 赵春晖, 王福利, 姚远, 高福荣. 基于时段的间歇过程统计建模、在线监测及质量预报. 自动化学报, 2010, 36(3): 366-374 doi: 10.3724/SP.J.1004.2010.00366Zhao Chun-Hui, Wang Fu-Li, Yao Yuan, Gao Fu-Rong. Phase-based statistical modeling, online monitoring and quality prediction for batch processes. Acta Automatic Sinica, 2010, 36(3): 366-374 doi: 10.3724/SP.J.1004.2010.00366 [3] 池荣虎, 侯忠生, 黄彪. 间歇过程最优迭代学习控制的发展:从基于模型到数据驱动. 自动化学报, 2017, 43(6): 917-932Chi Rong-Hu, Hou Zhong-Sheng, Huang Biao. Optimal iterative learning control of batch processes: from model-based to data-driven. Acta Automatica Sinica, 2017, 43(6): 917-932 [4] Li M, Zhou P, Wang H, Chai T. Geometric analysis based double closed-loop iterative learning control of output PDF shaping of fiber length distribution in refining process. IEEE Transactions on Industrial Electronics, 2019, 66(9): 7229-7238 doi: 10.1109/TIE.2018.2879293 [5] 席裕庚, 李德伟, 林姝. 模型预测控制-现状与挑战. 自动化学报, 2013, 39(3): 221-236Xi Yu-Geng, Li De-Wei, Lin-Shu. Model predictive control-status and challenges. Acta Automatic Sinica, 2013, 39(3): 221-236 [6] 柴天佑, 李少远, 王宏. 网络信息模式下复杂工业过程建模与控制. 自动化学报, 2013, 39(3): 221-236Chai Tian-You, Li Shao-Yuan, Wang Hong. Networked cooperative modeling and control for complex industrial process. Acta Automatic Sinica, 2013, 39(5): 469-470 [7] Lee K S, Chin I S, Lee H J, J. H. Lee. Model predictive control technique combined with iterative learning for batch processes. Aiche Journal, 1999, 45(10): 2175-2187 doi: 10.1002/aic.690451016 [8] Shi J, Zhou H, Cao Z, Jiang Q. A design method for indirect iterative learning control based on two-dimensional generalized predictive control algorithm. Journal of Process Control, 2014, 24(10): 1527-1537 doi: 10.1016/j.jprocont.2014.07.004 [9] Liu X, Kong X. Nonlinear fuzzy model predictive iterative learning control for drum-type boiler-turbine system. Journal of Process Control, 2013, 23(8): 1023-1040 doi: 10.1016/j.jprocont.2013.06.004 [10] Oh S K, Lee J M. Iterative learning model predictive control for constrained multivariable control of batch processes. Computers & Chemical Engineering, 2016, 93(4): 284-292 [11] Lu J, Cao Z, Gao F. Multi-point iterative learning model predictive control. IEEE Transactions on Industrial Electronics, 2019, 66(8): 6230-6240 doi: 10.1109/TIE.2018.2873133 [12] Chu B, Owens D H, Freeman C T. Iterative learning control with predictive trial information: convergence, robustness, and experimental verification. IEEE Transactions on Control Systems Technology, 2016, 24(3): 1101-1108 doi: 10.1109/TCST.2015.2476779 [13] Lu J, Cao Z, Wang Z, Gao F. A two-stage design of two-dimensional model predictive iterative learning control for non-repetitive disturbance attenuation. Industrial & Engineering Chemistry Research, 2015, 54(21): 5683-5689 [14] Wu S, Jin Q, Zhang R, Zhang J, Gao F. Improved design of constrained model predictive tracking control for batch processes against unknown uncertainties. ISA Transactions, 2017, 69: 273-280 doi: 10.1016/j.isatra.2017.04.006 [15] 马乐乐, 刘向杰. 针对变参考轨迹的鲁棒迭代学习模型预测控制算法. 自动化学报, 2019, 45(10): 1933-1945Ma Le-Le, Liu Xiang-Jie. Robust model predictive iterative learning control with iteration-varying reference trajectory. Acta Automatic Sinica, 2019, 45(10): 1933-1945 [16] Bigras P, Lambert M, Perron C. Robust force controller for industrial robots: optimal design and real-Time implementation on a KUKA robot. IEEE Transactions on Control System Technoogy, 2012, 20(2): 473-479 doi: 10.1109/TCST.2011.2112661 [17] Hwang C L, Hung J Y. Stratified adaptive finite-time tracking control for nonlinear uncertain generalized vehicle systems and its application. IEEE Transactions on Control System Technoogy, 2019, 27(3): 1308-1316 doi: 10.1109/TCST.2018.2810851 [18] Sahu J N, Gangadharan P, Patwardhan A V. Catalytic hydrolysis of urea with fly ash for generation of ammonia in a batch reactor for flue gas conditioning and NOx reduction. Industrial & Engineering Chemistry Research, 2009, 48(2): 727-734 [19] Boggs P T, Tolle J W. Sequential quadratic programming for large-scale nonlinear optimization. Journal of Computational & Applied Mathematics, 2000, 124(1): 123-137 [20] Chen Y, Li Z, Kong H, Ke F. Model predictive tracking control of nonholonomic mobile robots with coupled input constraints and unknown dynamics. IEEE Transactions on Industrial Informatics, 2019, 15(6): 3196-3205 doi: 10.1109/TII.2018.2874182 [21] 周洪煜, 张坚, 游立科, 张峰. 基于混合神经网络的非线性预测函数控制. 控制理论与应用, 2005, 22(1): 110-113 doi: 10.3969/j.issn.1000-8152.2005.01.022Zhou Hong-Yu, Zhang Jian, You Li-Ke, Zhang Feng. Nonlinear predictive function control based on hybrid neural network. Control Theory & Applications, 2005, 22(1): 110-113 doi: 10.3969/j.issn.1000-8152.2005.01.022 [22] Zhang R, Wu S and Tao J. A new design of predictive functional control strategy for batch processes in the two-dimensional framework. IEEE Transactions on Industrial Informatics, 2019, 15(5): 2905-2914 doi: 10.1109/TII.2018.2874711 [23] Michalska H, Mayne D Q. Robust receding horizon control of constrained nonlinear systems. IEEE Transactions on Automatic Control, 1993, 38(11): 1623-1633 doi: 10.1109/9.262032 [24] Böhm C, Yu S Y, Allgöwer F. Predictive control for constrained discrete-time periodic systems using a time-varying terminal region. In: Proceedings of the 14th IFAC Conference on Methods and Models in Automation and Robotics, Poland: Elsevier, 2009. 537−542 [25] 张智焕, 王树青, 王宁. 液压机器人的预测函数控制. 控制与决策, 2002, 17(1): 120-122 doi: 10.3321/j.issn:1001-0920.2002.01.031Zhang Zhi-Huan, Wang Shu-Qing, Wang Ning. Predictive function control of hydraulic robot. Control and Decision, 2002, 17(1): 120-122 doi: 10.3321/j.issn:1001-0920.2002.01.031 [26] 潘红华, 苏宏业, 胡剑波, 褚健. 预测函数控制及其在导弹控制系统中的应用. 火力与指挥控制, 2000, 25(2): 56-60 doi: 10.3969/j.issn.1002-0640.2000.02.015Pan Hong-Hua, Su Hong-Ye, Hu Jian-Bo, Chu Jian. Predictive functional control and its application in missile control system. Fire Control & Command Control, 2000, 25(2): 56-60 doi: 10.3969/j.issn.1002-0640.2000.02.015 [27] Bahadorian M, Savkovic B, Eaton R, Hesketh T. Robust model predictive control for automated trajectory tracking of an unmanned ground vehicle. In: Proceedings of the 2012 American Control Conference, Montreal, QC, Canada: IEEE, 2012. 4251−4256 [28] Lee J H, Lee K S, Kim W C. Model-based iterative learning control with a quadratic criterion for time-varying linear systems. Automatica, 2000, 36(5): 641-657 doi: 10.1016/S0005-1098(99)00194-6 期刊类型引用(6)
1. 马乐乐,刘向杰,高福荣. 基于知识迁移的数据驱动迭代学习模型预测控制. 中国科学:信息科学. 2024(07): 1752-1774 . 百度学术
2. 王凤娟,王语睿,卫兰,范存群,徐晓斌. 基于自适应线性模型的环境数据预测算法. 山东大学学报(工学版). 2024(04): 86-94 . 百度学术
3. 侯强,易李力. 基于改进预测函数的乳化液泵用伺服电机控制策略研究. 煤炭技术. 2024(10): 264-268 . 百度学术
4. 牛小兵,齐乃森,胡晓明,周鑫. 基于复合自适应无位置观测器的PMSM改进预测函数控制. 大连海事大学学报. 2024(03): 39-48 . 百度学术
5. 杨云霞,彭丽华. 小时间尺度网络中断故障识别数学建模仿真. 计算机仿真. 2023(11): 384-387+414 . 百度学术
6. 马乐乐,刘向杰,高福荣. 迭代学习模型预测控制研究现状与挑战. 自动化学报. 2022(06): 1385-1401 . 本站查看
其他类型引用(6)
-