2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

微电网的电流均衡/电压恢复自适应动态规划策略研究

王睿 孙秋野 张化光

何德峰, 韩平, 王青松. 有界扰动下约束非线性系统鲁棒经济模型预测控制. 自动化学报, 2022, 48(2): 572−581 doi: 10.16383/j.aas.c190879
引用本文: 王睿, 孙秋野, 张化光. 微电网的电流均衡/电压恢复自适应动态规划策略研究. 自动化学报, 2022, 48(2): 479−491 doi: 10.16383/j.aas.c210015
He De-Feng, Han Ping, Wang Qing-Song. Robust economic MPC of constrained nonlinear systems with bounded disturbances. Acta Automatica Sinica, 2022, 48(2): 572−581 doi: 10.16383/j.aas.c190879
Citation: Wang Rui, Sun Qiu-Ye, Zhang Hua-Guang. Research on current sharing/voltage recovery based adaptive dynamic programming control strategy of microgrids. Acta Automatica Sinica, 2022, 48(2): 479−491 doi: 10.16383/j.aas.c210015

微电网的电流均衡/电压恢复自适应动态规划策略研究

doi: 10.16383/j.aas.c210015
基金项目: 国家自然科学基金(U20A20190, 62073065), 国家重点研发计划(2018YFA0702200)资助
详细信息
    作者简介:

    王睿:东北大学信息科学与工程学院讲师. 主要研究方向为能源互联网中分布式电源的协同优化及其电磁时间尺度稳定性分析. E-mail: wangrui@mail.neu.edu.cn

    孙秋野:东北大学信息科学与工程学院教授. 主要研究方向为网络控制技术, 分布式控制技术, 分布式优化分析及其在能源互联网, 微网, 配电网等领域相关应用. 本文通信作者. E-mail: sunqiuye@mail.neu.edu.cn

    张化光:东北大学信息科学与工程学院教授. 主要研究方向为自适应动态规划, 模糊控制, 网络控制, 混沌控制. E-mail: zhanghuaguang@mail.neu.edu.cn

Research on Current Sharing/Voltage Recovery Based Adaptive Dynamic Programming Control Strategy of Microgrids

Funds: Supported by National Natural Science Foundation of China (U20A20190, 62073065), and National Key Research and Development Program of China (2018YFA0702200)
More Information
    Author Bio:

    WANG Rui Lecturer at the School of Information Science and Engineering, Northeastern University. His research interest covers collaborative optimization of distributed generation and its stability analysis of electromagnetic timescale in energy internet

    SUN Qiu-Ye Professor at the School of Information Science and Engineering, Northeastern University. His research interest covers network control technology, distributed control technology, distributed optimization analysis and various applications in energy internet, microgrid, power distribution network. Corresponding author of this paper

    ZHANG Hua-Guang Professor at the School of Information Science and Engineering, Northeastern University. His research interest covers adaptive dynamic programming, fuzzy control, network control, and chaos control

  • 摘要: 含多类型分布式电源的微电网已经成为了未来电力系统的重要发展方向, 其中风能和光能在降低化石能源消耗和二氧化碳排放等方面有着极大优势, 考虑二者之间强互补性的协同调度已被广泛研究. 但风/光协同调度的微电网多关注分钟级的调度或优化问题而非风/光波动下秒级的实时电流按容量比例精准分担, 简称电流均衡, 而精准电流均衡有助于可再生能源的高比例消纳. 因此, 本文提出了基于自适应动态规划的微电网电流均衡和电压恢复控制策略. 首先, 构建包含风电整流型电能变换器和光电升压型电能变换器的广义风光拓扑同胚升压变换器模型, 其提供了后续控制器设计的模型基础. 其次, 本文将电流均衡和电压恢复问题转化为最优控制问题, 基于此, 每个能源主体的目标函数转化为获取最优控制变量和最小电压/电流控制偏差, 进而转化为求解哈密顿−雅克比−贝尔曼(Hamilton-Jacobi-Bellman, HJB)方程问题. 基于此, 提出了基于贝尔曼准则的分布式自适应动态规划控制策略以求取HJB方程的数值解, 最终实现电流均衡和电压恢复. 最后仿真结果验证了所提分布式自适应动态规划控制策略的有效性.
  • 近年来, 经济模型预测控制(Economic model predictive control, EMPC)在工业界和学术界引起了广泛关注[1-2]. 作为一种新近发展的先进控制技术, EMPC有望成为解决复杂系统节能、降耗和增效优化控制问题的重要手段, 目前已应用于能源、造纸、车辆等系统的能效优化控制[3-9]. 除具有常规模型预测控制 (Model predictive control, MPC)的显式处理约束和多变量控制的优点外, EMPC还能优化“经济”类目标函数, 通常这类函数不是设定值跟踪偏差的正定函数, 而是系统状态和控制变量的非凸或非正定函数[1-9]. 因此, 把以设定值跟踪偏差的正定函数为优化目标的常规MPC称为目标跟踪MPC, 而不以跟踪偏差的正定函数为优化目标的MPC统称为经济MPC[2]. 现有研究表明: 经济最优性目标与闭环系统的稳定性目标具有一定的冲突性[1-2], 因此近年来EMPC的稳定性综合策略得到了广泛研究.

    为建立EMPC关于经济平衡点的稳定性, 一种主要方法是构造基于经济优化目标函数的Lyapunov函数[5, 10-17]. 例如, 使用终端等式约束和强对偶性假设, 定义经济目标函数的旋转代价函数并将其作为闭环系统的一个Lyapunov函数[10], 而引入广义终端等式约束[15], 建立了经济性能变化下的递推可行性与闭环系统的有界稳定性[11]. 进一步, 采用严格耗散性条件、终端不等式约束和终端代价函数代替, 降低了EMPC稳定性综合策略的保守性[12-13]. 在无终端约束EMPC策略中, 闭环轨迹在足够长的预测时域情况下收敛到平衡点的邻域[16-17]. 虽然无终端约束增大了闭环系统的吸引域, 但长时域预测将大大增加了在线优化的计算负担. 进一步, EMPC稳定性和经济性是一对存在冲突的控制目标[18-19], 且稳定性和经济性目标无法统一度量, 难以通过权重标定. 对此, 从多目标优化控制角度, 考虑非线性系统强对偶性或耗散性条件难以满足情况, 文献[20-21]通过构造稳定性收缩约束, 建立闭环系统关于最优经济平衡点的渐近稳定性.

    实际系统总是存在不确定扰动, 现有EMPC策略通常难以保证受扰系统的可行性和稳定性. 对于目标跟踪MPC, 目前已有较多鲁棒稳定性结果[22-32], 主要包括本质鲁棒MPC[22]、Tube鲁棒MPC[24-25]以及min-max MPC[26-32]等, 其中min-max MPC采用微分对策原理, 在使最坏扰动输入情况下系统的性能指标上界达到最小. 相比于本质鲁棒MPC和Tube鲁棒MPC, min-max MPC能大大降低鲁棒MPC的保守性, 但会增加优化问题的在线计算量[1]. 为降低min-max MPC的在线计算量, 文献[30]采用仿射输入结构, 使MPC含有抑制扰动的闭环成分和易于求解的开环优化. 另一方面, 输入到状态稳定性(Input-to-state stability, ISS)成为分析不确定系统鲁棒稳定性的一个有效工具[23, 27-32], 并应用到了EMPC鲁棒性研究, 如文献[33-34]采用强对偶性假设和约束紧缩方法, 证明了周期性扰动下线性系统EMPC闭环收敛性, 文献[35]获得了非线性系统EMPC的有界稳定性结果, 提高了经济性能优化的灵活性, 文献[36]将稳定性目标和经济性目标相加, 证明EMPC线性系统关于经济目标的最大值是ISS的, 文献[37]施加保证鲁棒稳定性的显式收缩约束, 提出两种非线性系统鲁棒EMPC算法, 文献[38]提出Lipschitz连续非线性系统的隐式收缩鲁棒EMPC策略, 提高了系统的平均经济性能.

    本文针对含有未知有界扰动的不确定非线性系统, 提出一种新的具有递推可行性以及ISS保证的鲁棒EMPC策略. 该策略明确考虑经济最优性和鲁棒稳定性控制目标的矛盾特点, 采用微分对策原理在线滚动优化计算这对冲突目标的min-max问题. 离线计算最优经济平衡点, 并利用状态与该平衡点的偏差定义鲁棒稳定性目标函数, 而经济目标函数则由系统的经济性能给定. 通过特殊设计EMPC优化问题的隐式收缩约束, 并在鲁棒稳定性目标优化问题中引入一个新约束, 保证EMPC优化的递推可行性和闭环系统关于不确定扰动输入的ISS. 相比现有鲁棒EMPC策略, 本文首先建立了约束非线性系统具有ISS的鲁棒EMPC策略; 其次, EMPC递推可行性和鲁棒稳定性无需强对偶性或耗散性假设条件, 从而扩大了鲁棒 EMPC的应用范围; 最后, 采用微分对策原理得到了保守性更低的容许扰动上界. 采用一个受扰非线性连续搅拌釜反应器(Continuous stirred tank reactor, CSTR)的仿真实例, 验证本文提出策略的有效性与优越性.

    符号说明: ${{{\bf{Z}}} ^ + }$表示非负整数集, ${{{\bf{I}}} _{a:b}}$表示集合$\{ i \in {{\mathbf{Z}}^ + }:a \leq i \leq b,\;a \in {{\mathbf{Z}}^ + },\;b \in {{\mathbf{Z}}^ + }\}$, ${{{\bf{I\,}}} _{ \geq j}}$表示集合$\{ i \in {{\mathbf{Z}}^ + }:i \geq j,\;j \in {{\mathbf{Z}}^ + }\}$. ${{{\boldsymbol{x}}} ^ + }$表示${{\boldsymbol{x}}}$的下一时刻状态, $\left| {{\boldsymbol{x}}} \right|$表示${{\boldsymbol{x}}}$的欧几里得范数, $\left\| {{\boldsymbol{x}}} \right\| = {{{\rm{sup}}\{ }}\left| {{{\boldsymbol{x}}} \left( k \right)} \right|{{,}}\; $$ k \in {{\mathbf{Z}}^ + }{{\} }}$, ${{\boldsymbol{x}}} \left( {i|k} \right)$表示在第$ k $时刻对未来第$ k + i $时刻的预测变量. 连续函数$ {h_1}:{{\mathbf{R}}^ + } \to {{\mathbf{R}}^ + } $称为$ K $类函数系指该函数单调递增, 且$ {h_1}\left( 0 \right) = 0 $; 函数${h_2}:{{\mathbf{R}}^ + } \to $$ {{\mathbf{R}}^ + }$称为$ {K_\infty } $类函数系指该函数是$ K $类函数, 且当 $s \to $$ \infty$时, 有$ h\left( s \right) \to \infty $; 函数${h_3}:{{\mathbf{R}}^ + } \times {{\mathbf{R}}^ + } \to $$ {{\mathbf{R}}^ + }$称为$ KL $函数系指对于任意固定的$ t \geq 0 $, $ {h_3}\left( { \cdot ,t} \right) $$ K $类函数, 而对于任意固定的$ s > 0 $, $ {h_3}\left( {s, \cdot } \right) $ 是单调递减, 且当$ t \to \infty $时, $ {h_3}\left( {s,t} \right) \to 0 $.

    考虑不确定离散时间非线性系统

    $$ \left\{ {\begin{aligned} & {{\boldsymbol{x}}(k + 1) = {f_1}({\boldsymbol{x}}(k)) + {f_2}({\boldsymbol{x}}(k)){\boldsymbol{u}}(k) + {f_3}({\boldsymbol{x}}(k)){\boldsymbol{w}}(k)} \\ & {{\boldsymbol{z}}(k) = \left[ {\begin{array}{*{20}{c}} {g{{(}}{\boldsymbol{x}}(k))} \\ {{\boldsymbol{u}}(k)} \end{array}} \right],{{ }}\quad \quad k \in {{\mathbf{{\rm {\bf{Z}}}}}^ + }} \end{aligned}} \right. $$ (1)

    其中, ${{\boldsymbol{x}}} \left( k \right) \in {{\mathbf{R}}^n}$, ${{\boldsymbol{u}}} \left( k \right) \in {{\mathbf{R}}^m}$, ${{\boldsymbol{w}}} \left( k \right) \in {{\mathbf{R}}^q}$${{\boldsymbol{z}}} \left( k \right) \in $$ {{\mathbf{R}}^s}$分别表示系统在k时刻的状态、控制输入、扰动输入和辅助输出. 假设$ {f_1}\left( \cdot \right) $, $ {f_2}\left( \cdot \right) $, $ {f_3}\left( \cdot \right) $$ g\left( \cdot \right) $分别为定义在$ {{\mathbf{R}}^n} $上的光滑函数, 满足$ {f_1}\left( 0 \right) = 0 $, ${f_2}\left( 0 \right) = $$ 0$, $ {f_3}\left( 0 \right) = 0 $以及$ g\left( 0 \right) = 0 $. 系统(1)在$ k $时刻的状态${\boldsymbol{x}}\left( {{k}} \right) = \varphi \left( {{{k}};{{\boldsymbol{x}}_0},{\boldsymbol{u}},{\boldsymbol{w}}} \right)$由初始状态$ {{\boldsymbol{x}}_0}, $ 控制序列${\boldsymbol{u}} = \{ {\boldsymbol{u}}\left( 0 \right),{\boldsymbol{u}}\left( 1 \right), \cdots \}$和扰动序列 ${{\boldsymbol{w}}} = \{ {\boldsymbol{w}}\left( 0 \right), $$ {\boldsymbol{w}}\left( 1 \right), \cdots \}$表示. 假设系统(1)的状态完全可测, 且系统状态和控制输入满足约束

    $${\boldsymbol{x}}(k) \in X,\;{\rm{ }}{\boldsymbol{u}} (k) \in U,\;{\rm{ }}k \in {{\bf{Z}}^ + }$$ (2)

    其中, 集合$ X \subset {{\mathbf{R}}^n} $$ U \subset {{\mathbf{R}}^m} $均为凸的紧集, 且它们内部包含某些平衡点$ \left( {{{\boldsymbol{x}}_e},\;{{\boldsymbol{u}}_{e} }} \right) $.

    假设 1. 扰动输入$ {\boldsymbol{w}} $满足如下约束

    $${\boldsymbol{w}}(k) \in W,\;\;{\rm{ }}k \in {{\bf{Z}}^ + }$$ (3)

    其中, $ W $为包含平衡点$\left( {{{\boldsymbol{x}}_e},\;{{\boldsymbol{u}}_{e} }} \right)$的紧集. 满足约束(3)的扰动称为容许扰动. 注意$ {\boldsymbol{w}} $表示参数不确定性、模型失配以及持续外部扰动等多种有界不确定性[29], 其上界表示为$\left\| {\boldsymbol{w}} \right\| = {{\sup\{ }}\left| {{{\boldsymbol{w}}_{t} }} \right|{{:}}{{\boldsymbol{w}}_{t} } \in {{\boldsymbol{W}}} {{,}}\;{t} \in $$ {{\mathbf{Z}}^ + }{{\} }}$.

    考虑系统(1)的经济性能函数$ {{L} _e}{{:}}{X} \times {U} \to {\mathbf{R}} ,$ 基于系统(1)的名义模型${{\boldsymbol{x}}^ + } = {{{f}}_1}\left( {\boldsymbol{x}} \right) + {{{f}}_2}\left( {\boldsymbol{x}} \right){\boldsymbol{u}}$离线计算如下最优经济平衡点

    $$\begin{split} & ({\boldsymbol{x}}_e^ * ,{\boldsymbol{u}}_e^ * ) = \arg \mathop {\min }\limits_{x,u} {L_e}({\boldsymbol{x}},{\boldsymbol{u}}) \\ &{\rm{s}}{\rm{.t}}{\rm{. }}\;\;\;\;{\boldsymbol{x}} = {f_1}{\rm{(}}{\boldsymbol{x}}) + {f_2}{\rm{(}}{\boldsymbol{x}}{\rm{)}}{\boldsymbol{u}} \\ &\,{\rm{ }}\quad \quad \;{\boldsymbol{x}} \in X, {\boldsymbol{u}} \in U \\ \end{split} $$ (4)

    不失一般性, 后文假设系统(1)的最优经济平衡点为原点.

    下面介绍输入到状态稳定(ISS)相关理论, 首先回顾鲁棒不变集的概念. 考虑一般离散不确定非线性系统$ {{\boldsymbol{x}}^ + } = {{f}}\left( {{\boldsymbol{x}},{\boldsymbol{w}}} \right) $.

    定义 1[27]. 考虑系统${{\boldsymbol{x}}^ + } = {{f}}\left( {{\boldsymbol{x}},{\boldsymbol{w}}} \right)$和集${{{\boldsymbol{\Theta }}}} \subseteq {{{\bf{R}}} ^n}$, 如果对于任意${{\boldsymbol{x}}} \in {{{\boldsymbol{\Theta }}}}$${\boldsymbol{w }}\in {W}$, 该系统满足${{\boldsymbol{x}}^ + } = $$ {{f}}\left( {{\boldsymbol{x}},{\boldsymbol{w}}} \right) \in {{{\boldsymbol{\Theta}} }}$, 则称${{{\boldsymbol{\Theta}} }}$为该系统的一个鲁棒不变集.

    定义 2[27]. 考虑系统${{\boldsymbol{x}}^ + } = {{f}}\left( {{\boldsymbol{x}},{\boldsymbol{w}}} \right)$及其内含原点的鲁棒不变集${{{\boldsymbol{\Theta}} }} \subseteq X$, 如果对于任意初始状态${{{\boldsymbol{x}}} _{{0}}} \in {{{\boldsymbol{\Theta}} }}$${\boldsymbol{w}} \in {W}$, 存在$ {K_\infty } $类函数$ \alpha $$ KL $类函数$ \beta $使系统满足

    $$|\varphi (k;{{\boldsymbol{x}}_0},{\boldsymbol{w}})| \le \beta (|{{\boldsymbol{x}}_0}|,k) + \alpha (||{\boldsymbol{w}}||), {\rm{ }}\;\;\forall k \in {{\bf{Z}}^ + }$$ (5)

    则该系统在$ {{{\boldsymbol{\Theta}} }} $内是ISS的.

    引理 1[29]. 考虑系统${{\boldsymbol{x}}^ + } = {{f}}\left( {{\boldsymbol{x}},{\boldsymbol{w}}} \right)$及其内含原点的鲁棒不变集${{{\boldsymbol{\Theta }}}} \subseteq X$, 如果对于任意${{\boldsymbol{x}}} \in {{\boldsymbol{{\Theta}} }}$${\boldsymbol{ w}} \in {W}$, 存在连续函数$ V:{{\mathbf{R}}^n} \to {{\mathbf{R}}^ + } $满足

    $$ \begin{split} &{{\xi _1}(|{\boldsymbol{x}}|) \le V({\boldsymbol{x}}) \le {\xi _2}(|{\boldsymbol{x}}|) + {\rho _1}(||{\boldsymbol{w}}||)} \\ & {V({{\boldsymbol{x}}^ + }) - V({\boldsymbol{x}}) \le - {\xi _3}(|{\boldsymbol{x}}|) + {\rho _2}(|{\boldsymbol{w}}|)} \end{split} $$ (6)

    其中, ${\xi _1} $, ${\xi _2} $${\xi _3} $K类函数, ${\rho _1} $${\rho _2} $K类函数, 则该系统在${{{\boldsymbol{\Theta }}}} $内ISS, 称V为该系统的ISS-Lyapunov函数.

    注 1. 由定义2可知, 当系统不受扰动或仅受衰减扰动作用时, 系统最终在原点处渐近稳定; 当受持续有界扰动作用时, 系统有界稳定, 且状态轨迹最终收敛的范围与持续扰动的上界有关.

    本文目标是针对不确定非线性系统(1), 通过极小化经济性能函数在线计算鲁棒EMPC控制器, 要求相应闭环系统满足约束条件(2), 且闭环系统的最优经济平衡点相对于容许扰动(3)具有ISS.

    考虑有限预测步长$N \in {{{\bf{I}}} _{ \geq 1}}$, 定义$k \in {{\bf{Z}}^ + }$时刻的$ N $步控制序列${{\boldsymbol{u}}} ( {{k}} ) = \{{\boldsymbol{u}}( {0|{{k}}} ),{\boldsymbol{u}}( {1|{{k}}} ), \cdots , {\boldsymbol{u}}( {{{N}} - 1|{{k}}} )\}$、扰动序列${{\boldsymbol{w}}} ( {{k}} ) = \{{\boldsymbol{w}}( {0|{{k}}} ),\;{\boldsymbol{w}}( {1|{{k}}} ), \cdots ,\;{\boldsymbol{w}}( {{{N}} - 1|{{k}}} )\}$以及对应的预测状态序列${{\boldsymbol{x}}} ( {{k}} ) = {{\{ }}{\boldsymbol{x}}( {1|{{k}}} ){{,}}\; {\boldsymbol{x}}( {2|{{k}}} ){{,}} \cdots {{,}} $$ \;{\boldsymbol{x}}( {{{N}}|{{k}}} ){{\} }}$, 并且${\boldsymbol{x}}( {{{i|k}}} ) = \varphi ( {{{i}};{\boldsymbol{x}}( {{k}} ),{{{\boldsymbol{u}}}}( {{k}} ),{{{\boldsymbol{w}}}}( {{k}} )} )$, 其中${\boldsymbol{x}}( {{k}} )$为当前时刻系统状态. 考虑系统(1)的经济性能函数$ {{L} _e} $, 定义$ N $步经济目标函数

    $${J_e}({\boldsymbol{x}}(k),{\boldsymbol{u}}(k)) = \sum\limits_{i = 0}^{N - 1} {{L_e}({\boldsymbol{x}}(i|k),{\boldsymbol{u}}(i|k))} \tag{7}$$

    其中, ${\boldsymbol{x}}\left( {0{{|k}}} \right) = {\boldsymbol{x}}\left( {{k}} \right)$

    为计算鲁棒EMPC控制器, 在每个时刻优化经济目标函数(7). 由于扰动的存在, 在鲁棒EMPC中求解如下min-max经济最优控制问题:

    $$\tag{8a}({{\boldsymbol{u}}^ * }(k),{{\boldsymbol{w}}^ * }(k)) = \arg \mathop {\min }\limits_{{\boldsymbol{u}}(k)} \mathop {\max }\limits_{{\boldsymbol{w}}(k)} {J_e}({\boldsymbol{x}}(k),{\boldsymbol{u}}(k))\;\;$$
    $$\tag{8b}\begin{split} {\rm{s}}{\rm{.t}}{\rm{. }}\;\;{\boldsymbol{x}}(i + 1|k) =\;& {f_1}({\boldsymbol{x}}(i|k))\; + {f_2}({\boldsymbol{x}}(i|k)){\boldsymbol{u}}(i|k) \;+ \\ & {f_3}({\boldsymbol{x}}(i|k)){\boldsymbol{w}}(i|k) \\[-10pt] \end{split} $$
    $$\tag{8c}{\boldsymbol{x}}(i|k) \in X,\quad {\boldsymbol{u}}(i|k) \in U,\quad {\boldsymbol{w}}(i|k) \in W\,\;\;\;\quad$$
    $$\tag{8d}{\boldsymbol{x}}(0|k) = {\boldsymbol{x}}(k),\quad {\boldsymbol{x}}(N|k) \in {\boldsymbol{\Omega}} ,\;{\rm{ }}\forall i \in {{\bf{I}}_{0:N - 1}}\quad$$
    $$\tag{8e}{V_R}(x(k),{\boldsymbol{u}}(k),{\boldsymbol{w}}(k)) \le \eta ({\boldsymbol{x}}(k),\lambda )\;\,\quad\quad\quad\quad$$

    其中, $\left( {{{\boldsymbol{u}}^*}\left( {{k}} \right),{{\boldsymbol{w}}^*}\left( {{k}} \right)} \right)$$ k $时刻的经济最优解, 对应最优预测状态序列${{\boldsymbol{x}}^*}\left( {{k}} \right)$; ${\boldsymbol{x}}\left( {0{{|k}}} \right) = {\boldsymbol{x}}\left( {{k}} \right)$为初始条件; ${\boldsymbol{x}}\left( {{{N|k}}} \right) \in {{{{{\boldsymbol{\Omega}}}} }}$为终端状态约束, 终端约束集${{{{\boldsymbol{\Omega}} }}} \subset $$ {{X}}$且内含原点; (8e)为待设计的鲁棒稳定性收缩约束, $ \lambda \in \left[ {0,1} \right) $为收缩因子. 进一步定义如下关于最优经济平衡点的鲁棒稳定性目标函数:

    $$\begin{split} &{V_R}({\boldsymbol{x}}(k),{\boldsymbol{u}}(k),{\boldsymbol{w}}(k)) = {\rm{ }}E({\boldsymbol{x}}(N|k))\; +\\ &\qquad \sum\limits_{i = 0}^{N - 1} {\{ L({\boldsymbol{x}}(i|k),{\boldsymbol{u}}(i|k)) - {L_w}({\boldsymbol{w}}(i|k))\} } \end{split} $$ (9)

    其中, 函数$ {L} {{:}}{X} \times {U} \to {{\mathbf{R}}^ + } $, ${{L} _{{w}}}{{:W}} \to {{\mathbf{R}}^ + }$${E} {{:}}{X} \to $$ {{\mathbf{R}}^ + }$为连续有界函数. 为书写简洁, 令 ${{V} _R}\left( {\boldsymbol{x}} \right) = {{V} _R}( {\boldsymbol{x}}, $$ {\boldsymbol{u}},{\boldsymbol{w}})$.

    假设 2. 存在$ {K_\infty } $类函数$ {\alpha _l}, $ $ {\alpha _w} $$ {\beta _w} ,$ 使鲁棒稳定性目标函数${{V} _R}\left( {\boldsymbol{x}} \right)$满足: ${L} \left( {{\boldsymbol{x}},{\boldsymbol{u}}} \right) \geq {\alpha _l}\left( {|{\boldsymbol{x}}|} \right),\; \forall {\boldsymbol{x}} \in $$ {X} ,\;\forall {\boldsymbol{u}} \in {U} ;$ ${\alpha _w}\left( {|{\boldsymbol{w}}|} \right) \leq {{L} _w}\left( {\boldsymbol{w}} \right) \leq {\beta _w}\left( {|{\boldsymbol{w}}|} \right),\;\forall {\boldsymbol{w}} \in {W}.$

    假设 3. 在终端约束集${{{{{\boldsymbol{\Omega}}}} }}$内存在局部反馈控制律${\boldsymbol{u}} = {\boldsymbol{\pi}} \left( {\boldsymbol{x}} \right)$使得${\boldsymbol{\pi}} \left( {\boldsymbol{x}} \right) \in {U},\;\forall {\boldsymbol{x}} \in {X}$和如下不等式成立:

    $$\begin{split} E({{\boldsymbol{x}}^ + }) - E({\boldsymbol{x}}) \le \;& - L({\boldsymbol{x}},{\boldsymbol{\pi}} ({\boldsymbol{x}})) + {L_w}({\boldsymbol{w}}){\rm{ }} \\ &\forall {\boldsymbol{x}} \in {\boldsymbol{\Omega}} ,\;{\boldsymbol{w}} \in W \end{split} $$ (10)

    其中, ${\alpha _f}\left( {|{\boldsymbol{x}}|} \right) \leq {E} \left( {\boldsymbol{x}} \right) \leq {\beta _{f} }\left( {|{\boldsymbol{x}}|} \right)$, $ {\alpha _f} $$ {\beta _f} $$ {K_\infty } $类函数.

    注意, 局部控制律${\boldsymbol{u}} = {\boldsymbol{\pi}} \left( {\boldsymbol{x}} \right)$可采用如$ {H_\infty } $控制方法求解[26, 30]. 为此, 定义对称矩阵

    $${\boldsymbol{R}}({\boldsymbol{x}}) = \left[ {\begin{array}{*{20}{c}} {f_2^{\rm{T}}{{({\boldsymbol{x}})}}{\boldsymbol{P}}{f_2}({\boldsymbol{x}}) + {\boldsymbol{I}}}&{f_2^{\rm{T}}{{({\boldsymbol{x}})}}{\boldsymbol{P}}{f_3}({\boldsymbol{x}})} \\ {f_3^{\rm{T}}{{({\boldsymbol{x}})}}{\boldsymbol{P}}{f_2}({\boldsymbol{x}})}&{f_3^{\rm{T}}{{({\boldsymbol{x}})}}{\boldsymbol{P}}{f_3}({\boldsymbol{x}}) - {\gamma ^2}{\boldsymbol{I}}} \end{array}} \right]$$

    其中,${{\boldsymbol{P}}}$为对称正定矩阵, ${{\boldsymbol{I}}}$为单位矩阵. 令${{\boldsymbol{R}}} = $$ {\boldsymbol{R}}\left( 0 \right)$. 不失一般性, 令扰动抑制水平$ \gamma = 1 $.

    引理 2[30]. 假设矩阵P满足Riccati不等式方程

    $$\left\{ {\begin{aligned} &{{\boldsymbol{F}}_1}^{\rm{T}}{\boldsymbol{P}}{{\boldsymbol{F}}_1}-{\boldsymbol{P}}+{{\boldsymbol{G}}^{\rm{T}}}{\boldsymbol{G}}-\\ &{{\boldsymbol{A}}^{\rm{T}}}{\boldsymbol{P}}[{{F}_2},{{{F}}_3}]{{\boldsymbol{R}}^{ - 1}}{{[{{{F}}_2},{{{F}}_3}]}^{\rm{T}}}{\boldsymbol{P}}{{\boldsymbol{F}}_1} < 0 \\ &{{{\boldsymbol{G}}^{\rm{T}}}{\boldsymbol{P}}{\boldsymbol{G}} - {\boldsymbol{I}}<0} \end{aligned}} \right.$$ (11)

    其中, ${{\boldsymbol{F}}} _1 = \dfrac{\partial {{f} _1}} {\partial {\boldsymbol{x}}}| _{{\boldsymbol{x}} \,= \,0}$, $ {{F} _2} = {{f} _2}\left( 0 \right) $, $ {{F} _3} = {{f} _3}\left( 0 \right) $${{\boldsymbol{G}}} = $$ {\dfrac{\partial {g} }{\partial{\boldsymbol{x}}}{ \left| {_{{\boldsymbol{x}} \,=\, 0}} \right.}}$. 则存在集合${{{\boldsymbol{\Omega}} }} = {{\{ }}{\boldsymbol{x}} \in {{\mathbf{R}}^{n} }{{:}}{E} \left( {\boldsymbol{x}} \right) = {{\boldsymbol{x}}^{{{\rm{T}}}}}{{\boldsymbol{P}}} {\boldsymbol{x}} \leq $$ {c} , \;{c} > 0{{\} }}$和局部控制律${\boldsymbol{u}} = {{{\boldsymbol{\pi}}}} \left( {\boldsymbol{x}} \right)$

    $$\left[ {\begin{array}{*{20}{c}} {{\boldsymbol{\pi}} ({\boldsymbol{x}})} \\ {{\boldsymbol{w}}({\boldsymbol{x}})} \end{array}} \right] = - {\boldsymbol{R}}^{ - 1}{({\boldsymbol{x}})}{[{f_2}({\boldsymbol{x}}),{f_3}({\boldsymbol{x}})]^{\rm{T}}}{\boldsymbol{P}}{f_1}\left( {\boldsymbol{x}} \right)$$ (12)

    使得${\boldsymbol{\pi}} \left( {\boldsymbol{x }}\right) \in {U} ,\;\forall {\boldsymbol{x}} \in {{{\boldsymbol{\Omega }}}}$成立, 且局部闭环系统

    $${{\boldsymbol{x}}^ + } = {f_1}({\boldsymbol{x}}) + {f_2}({\boldsymbol{x}}){\boldsymbol{\pi}} ({\boldsymbol{x}}) + {f_3}({\boldsymbol{x}}){\boldsymbol{w}}$$ (13)

    满足

    $$E({{\boldsymbol{x}}^ + }) - E({\boldsymbol{x}}) \le |{\boldsymbol{w}}{|^2} - |{\boldsymbol{z}}{|^2},\quad \forall {\boldsymbol{x}} \in {\boldsymbol{\Omega}} ,\;\;{\boldsymbol{w}} \in W$$ (14)

    注 2. 如果假设3成立, 则对于任意$ {\boldsymbol{w}} \in W $, ${{{{{\boldsymbol{\Omega}}}} }}$为闭环系统(13)的一个鲁棒不变集, 同时$E({\boldsymbol{x}})$为该系统在${{{{{\boldsymbol{\Omega}}}} }}$内的一个ISS-Lyapunov函数. 文献[30]给出了保证${{{{{\boldsymbol{\Omega}}}} }}$鲁棒不变性的一个充分条件, 即容许扰动${\boldsymbol{w}}$的上界

    $$||{\boldsymbol{w}}|| \le \frac{{\sqrt {{\lambda _{\min }}} - \sqrt {{\lambda _{\max }}} {l_x}}}{{{l_w}}}\sqrt {\frac{c}{{{\lambda _{\max }}{\lambda _{\min }}}}} $$ (15)

    其中, $ {l_x} $$ {l_w} $分别为闭环系统(13)关于${\boldsymbol{ x}}$${\boldsymbol{w }}$的局部Lipschitz常数, $ {\lambda _{\max }} $$ {\lambda _{\min }} $分别为矩阵${{\boldsymbol{P}}}$的最大和最小特征值. 如扰动${\boldsymbol{w}}$满足式(15), 则${{{{{\boldsymbol{\Omega}}}} }}$为闭环系统(13)的鲁棒不变集, 且${\boldsymbol{\pi}} \left( {\boldsymbol{x}} \right) \in {U} ,\;\forall {\boldsymbol{x}} \in {{{\boldsymbol{\Omega}} }}$.

    下面构造收缩约束函数$\eta $. 令x(k)为当前时刻系统状态, 求解如下有限时域鲁棒性最优控制问题

    $$\tag{16a}({{\boldsymbol{u}}^0}(k),{{\boldsymbol{w}}^0}(k)) = \arg \mathop {\min }\limits_{{\boldsymbol{u}}(k)} \mathop {\max }\limits_{{\boldsymbol{w}}(k)} {V_R}({\boldsymbol{x}}(k))\;\;\;\;\;\;$$
    $$\tag{16b}\begin{split} {\rm{s}}{\rm{.t}}{\rm{. }}\;\;{\boldsymbol{x}}(i + 1|k) =\;& {f_1}({\boldsymbol{x}}(i|k)) + {f_2}({\boldsymbol{x}}(i|k)){\boldsymbol{u}}(i|k) + \\ & {f_3}({\boldsymbol{x}}(i|k)){\boldsymbol{w}}(i|k) \\[-10pt] \end{split} $$
    $$\tag{16c}{\boldsymbol{x}}(i|k) \in X,\quad {\boldsymbol{u}}(i|k) \in U,\quad {\boldsymbol{w}}(i|k) \in W\;\;\;$$
    $$\tag{16d}{\boldsymbol{x}}(0|k) = {\boldsymbol{x}}(k),\quad {\boldsymbol{x}}(N|k) \in {\boldsymbol{\Omega}} ,{\rm{ }}\forall i \in {{\bf{I}}_{0:N - 1}}$$
    $$\tag{16e}{V_R}({\boldsymbol{x}}(k)) \le V_R^1({\boldsymbol{x}}(k)) + {\lambda _1}{L_w}(||{\boldsymbol{w}}||)\qquad\;$$

    其中, $\left( {{{\boldsymbol{u}}^0}\left( {{k}} \right),{{\boldsymbol{w}}^0}\left( {{k}} \right)} \right)$$ k $时刻的鲁棒最优解; 系数$ {\lambda _1} \geq 1 $; ${V} _R^1( {{\boldsymbol{x}}( {k} )} ) = {{V} _R}( {{\boldsymbol{x}}( {k} ),\;{{\boldsymbol{u}}^1}( {k} ),\;{{\boldsymbol{w}}^1}( {k} )} )$, $( {{\boldsymbol{u}}^1}( {k} ), $$ \;{{\boldsymbol{w}}^1}( {k} ) )$$ k $时刻的一组序列对

    $$\begin{split} & ({{\boldsymbol{u}}^1}(k),{{\boldsymbol{w}}^1}(k)) = \\ &\quad\left\{ {\begin{array}{*{20}{l}} & ({{\boldsymbol{u}}^ * }(i + 1|k - 1),{{\boldsymbol{w}}^ * }(i + 1|k - 1)),&i \in {{\bf{I}}_{0:N - 2}} \\ & ({\boldsymbol{\pi}} ({{\boldsymbol{x}}^ * }(N|k)),{{\boldsymbol{w}}^1}(N - 1|k),&i = N - 1 \end{array}} \right. \end{split} $$ (17)

    其中, $ ( {{{\boldsymbol{u}}^*}( {{{i|k}} - 1} ),{{\boldsymbol{w}}^*}( {{{i|k}} - 1} )} ) $是优化问题(8)在$ k - $$ 1 $时刻最优解$( {{\boldsymbol{u}}^*}( {{k}} - $$ 1 ),{{\boldsymbol{w}}^*}( {{{k}} - 1} ) )$的分量. 将$( {{\boldsymbol{u}}^*}( {{k}} - $$ 1 ),{{\boldsymbol{w}}^*}( {{{k}} - 1} ) )$$( {{{\boldsymbol{u}}^0}( {{k}} ),{{\boldsymbol{w}}^0}( {{k}} )} )$分别代入${{V} _R}( {\boldsymbol{x}} )$, 据此定义函数

    $$\begin{split} \eta ({\boldsymbol{x}}(k){\rm{,}}\lambda ) =\;& V_R^0({\boldsymbol{x}}(k)) + \lambda [V_R^*({\boldsymbol{x}}(k - 1)) - \\ &V_R^0({\boldsymbol{x}}(k)) + (1 + {\lambda _1}){L_w}(||{\boldsymbol{w}}||)] \end{split} $$ (18)

    其中, 值函数${V} _R^*( {{\boldsymbol{x}}( {{k} - 1} )} ) = {{V} _R}( {\boldsymbol{x}}( {{k} - 1} ), {{\boldsymbol{u}}^*}( {k} - 1 ), $$ {{\boldsymbol{w}}^*}( {{k} - 1} ) )$${V} _R^0( {{\boldsymbol{x}}( {k} )} ) = {{V} _R}( {{\boldsymbol{x}}( {k} ),{{\boldsymbol{u}}^0}( {k} ),{{\boldsymbol{w}}^0}( {k} )} )$.

    如果优化问题(8)在k时刻可行, 则根据滚动时域控制原理, 将 ${{\boldsymbol{u}}^*}\left( {{k}} \right)$的第1个分量定义为鲁棒EMPC控制律, 即${\boldsymbol{u}}( {{k}} ) = {{\boldsymbol{u}}^{{\rm{mpc}}}}( {{\boldsymbol{x}}( {{k}} )} ) = {{\boldsymbol{u}}^*}( {0|{{k}}} )$, 对应闭环系统为

    $$\begin{array}{l} {\boldsymbol{x}}(k + 1) =\\ \qquad{f_1}({\boldsymbol{x}}(k)) + {f_2}({\boldsymbol{x}}(k)){u^{{\rm{mpc}}}}({\boldsymbol{x}}(k)) + {f_3}({\boldsymbol{x}}(k)){\boldsymbol{w}}(k) \end{array} $$ (19)

    计算鲁棒EMPC控制器的算法总结如下:

    算法 1. 鲁棒EMPC算法

    步骤 1. 初始化. 设定$N \in {{{\bf{I}}} _{ \geq 1}},$ $ \lambda \in \left[ {0,1} \right) ,$ $ {\lambda _1} \geq 1 ,$ ${{{L}}_{{e}}}\left( {{\boldsymbol{x}},{\boldsymbol{u}}} \right),$${{L}}\left( {x,u} \right),$${{{L}}_{{w}}}\left( {\boldsymbol{w}} \right)$${{E}}\left( {\boldsymbol{x}} \right)$; 离线计算${\boldsymbol{\pi}} \left( {\boldsymbol{x}} \right)$以及${{{\boldsymbol{\Omega}} }}$; 令$ k = 0 $, 考虑初始状态${{\boldsymbol{x}}_0}$, 令$ \eta $充分大; 求解优化问题(8), 得到经济最优解$\left( {{{\boldsymbol{u}}^*}\left( 0 \right),{{\boldsymbol{w}}^*}\left( 0 \right)} \right)$, 并将${{\boldsymbol{u}}^*}\left( 0 \right)$的首个分量${{\boldsymbol{u}}^*}\left( {0|0} \right)$作用于系统(1).

    步骤 2. 在$ k $时刻, 利用$ k - 1 $时刻经济最优解$\left( {{\boldsymbol{u}}^*}\left( {{{k}} - 1} \right), {{\boldsymbol{w}}^*}\left( {{{k}} - 1} \right) \right)$构造$\left( {{{\boldsymbol{u}}^1}\left( {{k}} \right),{{\boldsymbol{w}}^1}\left( {{k}} \right)} \right)$, 更新 (16e); 求解优化问题(16), 得到当前时刻鲁棒最优解$( {\boldsymbol{u}}^0( {k}),{{\boldsymbol{w}}^0}( {{k}} ) )$.

    步骤 3. 计算${V} _R^0\left( {{\boldsymbol{x}}\left( {k} \right)} \right)$${V} _R^*\left( {{\boldsymbol{x}}\left( {{k} - 1} \right)} \right)$, 更新$ \eta $; 求解优化问题(8), 得到当前时刻经济最优解$\left( {{{\boldsymbol{u}}^*}\left( {{k}} \right),{{\boldsymbol{w}}^*}\left( {t{k}} \right)} \right)$.

    步骤 4. 将${{\boldsymbol{u}}^*}\left( {{k}} \right)$的首个分量${{\boldsymbol{u}}^*}\left( {0|{{k}}} \right)$作用于系统(1).

    步骤 5. 令$ k = k + 1 $, 测量系统(1)的状态; 返回步骤2.

    为更清晰地描述算法1的运行过程, 图1给出了每个时刻两个优化问题的求解顺序.

    由算法1和图1可知, 在初始时刻$ k = 0 $, 由于约束(8e)不起作用, 故在初始时刻无需求解优化问题(16), 并可令$\eta {{(}}{{{\boldsymbol{x}}} _0},\;\lambda {{)}} \to \infty$.

    闭环系统(19)具有ISS性质的前提是需要保证算法1具有递推可行性, 即两个优化问题在每个时刻都至少存在一组可行解(不一定最优), 使得对于任意容许扰动, 经济优化问题(8)和鲁棒性优化问题(16)的所有约束均满足. 注意, (8b)~(8d)与(16b)~(16d)具有相同约束.

    考虑约束不确定系统(1)~(3)和状态$\tau = $$ {\boldsymbol{x}}\left( {0{{|k}}} \right) \in {{X}}$. 对于优化问题(8), 定义$ N $步可行控制序列集为

    $${U_N}({\boldsymbol{\tau}} ) = \left\{ {{\boldsymbol{u}}\;\left| {\begin{array}{*{20}{l}} {\;{\boldsymbol{u}}(i) \in U,{\rm{ }}\varphi (i;{\boldsymbol{\tau}} ,{\boldsymbol{u}},{\boldsymbol{w}}) \in X} \\ {\;\varphi (N;{\boldsymbol{\tau}} ,{\boldsymbol{u}},{\boldsymbol{w}}) \in \Omega } \\ {\;{V_R}({\boldsymbol{\tau}} ,{\boldsymbol{u}},{\boldsymbol{w}}) \le \eta (\tau ,\lambda )} \\ {\;\forall i \in {{\bf{I}}_{0:N - 1}},{\rm{ }}\forall {\boldsymbol{w}} \in {W^N}} \end{array}} \right.} \right\}$$

    其中, $ N $步扰动约束集$ {W^N} = W \times W \times \cdots \times W $.

    图 1  鲁棒EMPC算法运行过程示意图
    Fig. 1  A schematic diagram of the robust EMPC algorithm

    定义 3. 考虑系统(1)和状态$\tau = {\boldsymbol{x}}\left( {0{{|k}}} \right) \in {{X}}$, 如果可行控制序列集$ {{{U}}_{{N}}}\left( \tau \right) $非空, 则称$ \tau $为该系统的初始可行状态. 所有初始可行状态$ \tau $的集合称为系统的初始可行状态集$ {{{X}}_{{N}}} $.

    定理 1. 如果假设1~3成立, 且容许扰动满足式(15), 则优化问题(16)具有递推可行性.

    证明. 考虑序列对$( {{{\boldsymbol{u}}^1}( {{k}} ),{{\boldsymbol{w}}^1}( {{k}} )} )$并代入系统(1)得到状态序列${{{\boldsymbol{x}}} ^1}( {{k}} ) = {{\{ }}{{\boldsymbol{x}}^*}( {1|{{k}} - 1} ){{,}} \cdots {{,}} {{\boldsymbol{x}}^*}( {{N}}|{{k}} - 1 ){{,}} $$ {{\boldsymbol{x}}^1}( {{{N}}|{{k}}} ){{\} }}$, 其中${{\boldsymbol{x}}^*}( {{{N|k}} - 1} ) \in {{{\boldsymbol{\Omega}} }}$是对应于${{\boldsymbol{u}}^*}( {{{k}} - 1} )$的终端预测状态. 由假设3和注2可知, ${{{\boldsymbol{\Omega}} }}$是闭环系统(13)的鲁棒不变集, 故对于任意${{\boldsymbol{w}}^1}( {{{N}} - 1{{|k}}} ) \in $$ {{W}}$, ${{\boldsymbol{u}}^1}( {{{N}} - 1{{|k}}} ) = {\boldsymbol{\pi}} ( {{{\boldsymbol{x}}^*}( {{{N|k}} - 1} )} ) \in {{U}}$${{\boldsymbol{x}}^1}( {{{N|k}}} ) = $$ \varphi ( {{{N}};{{\boldsymbol{x}}^*}( {{{N}}|{{k}} - 1} ),{{\boldsymbol{u}}^1}( {{{N}} - 1|{{k}}} ),{{\boldsymbol{w}}^1}( {{{N}} - 1|{{k}}} )} ) \in {{{\boldsymbol{\Omega}} }}$成立. 利用序列对$( {{{\boldsymbol{u}}^1}( {{k}} ),{{\boldsymbol{w}}^1}( {{k}} )} )$构造优化问题(16)在$ k $时刻的备选解

    $$\begin{split} &({{\boldsymbol{u}}^2}(k),{{\boldsymbol{w}}^2}(k)) =\\ &\quad \left\{ {\begin{array}{*{20}{l}} &({{\boldsymbol{u}}^1}(i + 1|k),{{\boldsymbol{w}}^1}(i + 1|k)),&i \in {{\bf{I}}_{0:N - 2}} \\ &({\boldsymbol{\pi}} ({{\boldsymbol{x}}^1}(N|k)),{{\boldsymbol{w}}^2}(N - 1|k),&i = N - 1 \end{array}} \right. \end{split}$$ (20)

    其对应状态序列${{{\boldsymbol{x}}} ^2}( {{k}} ) \;=\; {{\{ }}{{\boldsymbol{x}}^1}( {1|{{k}}} ){{,}} \cdots {{,}}\;\;{{\boldsymbol{x}}^1}( {{{N}}|{{k}}} ){{,}} $$ {{\boldsymbol{x}}^2}( {{{N}}|{{k}}} ){{\} }}$, 其中 ${{\boldsymbol{x}}^1}( {{{N|k}}} ) \in {{{\boldsymbol{\Omega}} }}.$${{{\boldsymbol{\Omega }}}}$是鲁棒不变的, 则对于任意${{\boldsymbol{w}}^2}( {{{N}} - 1{{|k}}} ) \in {{W}},$ ${{\boldsymbol{u}}^2}( {{{N}} - 1{{|k}}} ) = $$ {\boldsymbol{\pi}} ( {{{\boldsymbol{x}}^1}( {{{N|k}}} )} ) \in {{U}}$${{\boldsymbol{x}}^2}( {{{N|k}}} ) = \varphi ( {{N}};{x^1}( {{{N}}|{{k}}} ),{{\boldsymbol{u}}^2}( {{N}} - $$ 1|{{k}} ), {{\boldsymbol{w}}^2}({{N}} - 1|{{k}} ) ) \in {{{\boldsymbol{\Omega}} }}$成立, 因此约束(16b)~(16d)满足.

    再分别将$\left( {{{\boldsymbol{u}}^1}\left( {{k}} \right),{{\boldsymbol{w}}^1}\left( {{k}} \right)} \right)$$\left( {{{\boldsymbol{u}}^2}\left( {{k}} \right),{{\boldsymbol{w}}^2}\left( {{k}} \right)} \right)$代入函数$ {{V} _R}\left( x \right) $中, 计算得

    $$\begin{split} & V_R^2({\boldsymbol{x}}(k)) - V_R^1({\boldsymbol{x}}(k)) - {\lambda _1}{L_w}(||{\boldsymbol{w}}||) = \\ & \qquad E({{\boldsymbol{x}}^2}(N|k)) - E({{\boldsymbol{x}}^1}(N|k)) \;+ \\ & \qquad{\rm{ }}L({{\boldsymbol{x}}^1}(N|k),{\boldsymbol{\pi}} ({{\boldsymbol{x}}^1}(N|k))) - {L_w}({{\boldsymbol{w}}^1}(N - 1|k))\; - \\ & \qquad L({{\boldsymbol{x}}^1}(0|k),{{\boldsymbol{u}}^1}(0|k))+{L_w}({{\boldsymbol{w}}^1}(0|k))- {\lambda _1}{L_w}(||{\boldsymbol{w}}||) \end{split} $$ (21)

    其中, ${V} _R^2\left( {{\boldsymbol{x}}\left( {k} \right)} \right) = {{V} _R}\left( {{\boldsymbol{x}}\left( {k} \right),{{{{\boldsymbol{u}}}}^2}\left( {k} \right),{{{{\boldsymbol{w}}}}^2}\left( {k} \right)} \right)$. 再次应用假设3, 将式(10)代入式(21), 则对于任意$ {\lambda _1} \geq 1 $, 有

    $$V_R^2({\boldsymbol{x}}(k)) \le V_R^1({\boldsymbol{x}}(k)) + {\lambda _1}{L_w}(||{\boldsymbol{w}}||)$$ (22)

    故约束(16e)满足, 从而$\left( {{{\boldsymbol{u}}^2}\left( {{k}} \right),{{\boldsymbol{w}}^2}\left( {{k}} \right)} \right)$为问题(16)在$ k $时刻的可行解, 即优化问题(16)具有递推可行性. □

    定理 2. 如果假设1~3成立, 且容许扰动满足式(15), 则优化问题(8)具有递推可行性.

    证明. 令$( {{{\boldsymbol{u}}^0}( {{k}} ),{{\boldsymbol{w}}^0}( {{k}} )} )$为优化问题(16)在$ k $时刻的最优解, 由定理1可知${V} _R^0( {{\boldsymbol{x}}( {k} )} ) \leq {V} _R^1( {{\boldsymbol{x}}( {k} )} ) + $$ {\lambda _1}{{L} _{w} }( {\| {\boldsymbol{w}} \|} )$. 对${V} _R^0( {{\boldsymbol{x}}( {k} )} )$${V} _R^*( {{\boldsymbol{x}}( {{k} - 1} )} )$做如下运算:

    $$\begin{split} & V_R^0({\boldsymbol{x}}(k)) - V_R^ * ({\boldsymbol{x}}(k - 1)) \le \\ &\qquad{\rm{ }}V_R^1({\boldsymbol{x}}(k)) + {\lambda _1}{L_{\boldsymbol{w}}}(||w||) - V_R^ * ({\boldsymbol{x}}(k - 1)) = \\ & \qquad{\rm{ }}E({{\boldsymbol{x}}^1}(N|k)) - E({{\boldsymbol{x}}^*}(N|k - 1))\; + \\ & \qquad\,L({{\boldsymbol{x}}^*}(N|k - 1),{\boldsymbol{\pi}} ({{\boldsymbol{x}}^*}(N|k - 1))) \;- \\ & \qquad{L_w}({{\boldsymbol{w}}^1}(N - 1|k))-L({{\boldsymbol{x}}^*}(0|k-1),{{\boldsymbol{u}}^*}(0|k-1))\; + \\ & \qquad\,{L_w}({{\boldsymbol{w}}^*}(0|k - 1)) + {\lambda _1}{L_w}(||{\boldsymbol{w}}||) \\[-10pt] \end{split} $$ (23)

    应用假设2和假设3, 式(23)改写为

    $$\begin{split} &V_R^ * ({\boldsymbol{x}}(k - 1)) - V_R^0({\boldsymbol{x}}(k)) + (1 + {\lambda _1}){L_w}(||{\boldsymbol{w}}||) \ge \\ &\qquad L({\boldsymbol{x}}(k - 1),{\boldsymbol{u}}(k - 1)) \\[-10pt] \end{split} $$ (24)

    将式(24)代入函数$ \eta $, 则对于任意$ \lambda \in \left[ {0,1} \right) $, 有

    $$V_R^0({\boldsymbol{x}}(k)) \le \eta ({\boldsymbol{x}}(k){\rm{,}}\lambda )$$ (25)

    故约束(8e)成立. 由定理1可知, $\left( {{{\boldsymbol{u}}^0}\left( {{k}} \right),{{\boldsymbol{w}}^0}\left( {{k}} \right)} \right)$作为优化问题(16)在$ k $时刻的最优解满足约束(8b)~(8d). 因此, 在$ k $时刻总存在可行控制序列$ {{\boldsymbol{u}}^0}\left( {{k}} \right) $满足优化问题(8)的所有约束, 从而优化问题(8)具有递推可行性. □

    根据定理1和定理2, 本文鲁棒EMPC策略中的双目标优化问题皆具有递推可行性. 下面将基于定理1和定理2给出闭环系统(19)的ISS结果.

    定理 3. 如果假设1~3成立, 且容许扰动满足式(15), 则当优化问题(8)在初始时刻存在可行解时, 闭环系统(19)在鲁棒不变集XN内相对于扰动具有ISS.

    证明. 由定理1和定理2可知, 当优化问题(8)在初始时刻存在可行解时, 该优化问题在任意k时刻都是可行的, 则对任意${\boldsymbol{x}}\left( {{k}} \right) \in {{{X}}_{{N}}}$${\boldsymbol{w}}\left( {{k}} \right) \in {{W}},$闭环系统(19)满足${\boldsymbol{x}}\left( {{{k + }}1} \right) \in {{{X}}_{{N}}}.$ 由定义3可知, $ {{{X}}_{{N}}} $为闭环系统(19)的一个鲁棒不变集.

    ${{V} _{N} }\left( {{\boldsymbol{x}}\left( {k} \right)} \right) = {V} _R^*\left( {{\boldsymbol{x}}\left( {k} \right)} \right) + {N} {{L} _{w} }\left( {\left\| {\boldsymbol{w}} \right\|} \right)$, 并选择${{V} _{N} }\left( {{\boldsymbol{x}}\left( {k} \right)} \right)$作为闭环系统(19)的备选ISS-Lyapunov函数. 考虑假设2, 对于任意${\boldsymbol{x}}\left( {{k}} \right) \in {{{X}}_{{N}}},$

    $$\begin{split} &{V_N}({\boldsymbol{x}}(k)) = V_R^ * ({\boldsymbol{x}}(k)) + N{L_w}(||{\boldsymbol{w}}||) \ge \\ &\qquad L({\boldsymbol{x}}(k),{\boldsymbol{u}}(k)) \ge{\alpha _1}(|{\boldsymbol{x}}(k)|) \end{split} $$ (26)

    其中, $ {\alpha _1} = {\alpha _l} $$ {K_\infty } $类函数.

    假设函数${V} _R^{}\left( {{\boldsymbol{x}}\left( {k} \right)} \right)$存在上界${{v}} < + \infty ,$$ {{v}} $为一个足够大的常数. 定义内部包含原点且半径为$ {{r}} $的球形区域${{{B}}_{{r}}} = \{ {\boldsymbol{x}} \in {{\mathbf{R}}^{{n}}}:\left| {\boldsymbol{x}} \right| \leq {{r}}\} \subseteq {\boldsymbol{\Omega}}.$设常数$ \varepsilon = \max \{ 1,{{v}}/{\beta _{{f}}}\left( {{r}} \right)\} \geq 1, $ 令函数${\alpha _2} = \varepsilon {\beta _f}.$下面考虑两种情况:

    1) 当${\boldsymbol{x}}\left( {{k}} \right) \in {{{\boldsymbol{\Omega}} }}$时, 由假设3可知,

    $$\begin{split} &E({\boldsymbol{x}}(i + 1|k)) - E({\boldsymbol{x}}(i|k)) \le \\ &\qquad {L_w}({\boldsymbol{w}}(i|k)) - L({\boldsymbol{x}}(i|k),{\boldsymbol{\pi}} ({\boldsymbol{x}}(i|k))),\;\;{\rm{ }}i \in {{\bf{I}}_{0:N - 1}} \end{split} $$ (27)

    其中, ${\boldsymbol{x}}( i + 1{{|k}} ) = \varphi ( {i + 1;{\boldsymbol{x}}( {{{i}}|{{k}}} ),{\boldsymbol{\pi}} ( {{\boldsymbol{x}}( {{{i}}|{{k}}} )} ),{\boldsymbol{w}}( {{{i}}|{{k}}} )} )$${\boldsymbol{x}}( {{{i|k}}} ) \in {{{\boldsymbol{\Omega}} }}$. 由于${{{\boldsymbol{\Omega}} }}$是鲁棒不变集, 故对于任意容许扰动${\boldsymbol{w}}( {{{i|k}}} )$, 满足${\boldsymbol{\pi}} ( {{\boldsymbol{x}}( {{{i|k}}} )} ) \in {{U}}$${\boldsymbol{x}}( {i + 1{{|k}}} ) \in {{{\boldsymbol{\Omega}} }}$. 从${{i}} = 0,$$ {{N}} - 1 $, 将不等式(27)累加得

    $$\begin{split} E({\boldsymbol{x}}(k)) \le \;&\sum\limits_{i = 0}^{N - 1} {(L({\boldsymbol{x}}(i|k),{\boldsymbol{u}}(i|k)) - {L_w}({\boldsymbol{w}}(i|k)))} {\rm{ + }} \\ &E({\boldsymbol{x}}(N|k))\\[-10pt] \end{split} $$ (28)

    结合假设2, 存在$ {K_\infty } $类函数$ {\beta _f} $$ {\alpha _2} $满足

    $$V_R^ * ({\boldsymbol{x}}(k)) \le E({\boldsymbol{x}}(k)) \le {\beta _f}(|{\boldsymbol{x}}(k)|) \le {\alpha _2}(|{\boldsymbol{x}}(k)|)$$ (29)

    2) 当${\boldsymbol{x}}\left( {{k}} \right) \notin {{{\boldsymbol{\Omega}} }}$时, $ {\boldsymbol{x}}\left( {{k}} \right) \notin {{{B}}_{{r}}} $, 则${\beta _{{f}}}\left( {|{\boldsymbol{x}}\left( {{k}} \right)|} \right) \geq $$ {\beta _{{f}}}\left( {{r}} \right)$, 得

    $$\begin{split} V_R^ * ({\boldsymbol{x}}(k)) \le\;& v \le v \times \dfrac{{{\beta _f}(|{\boldsymbol{x}}(k)|)}}{{{\beta _f}(r)}} \le \\ &\varepsilon {\beta _f}(|{\boldsymbol{x}}(k)|) = {\alpha _2}(|{\boldsymbol{x}}(k)|) \end{split} $$ (30)

    联立上述两种情况, 整理得

    $$V_R^ * ({\boldsymbol{x}}(k)) \le {\alpha _2}(|{\boldsymbol{x}}(k)|),\;\;{\rm{ }}\forall {\boldsymbol{x}}(k) \in {X_N}$$ (31)

    则对于任意容许扰动${\boldsymbol{w}}\left( {{k}} \right)$, 值函数${{V} _{N} }\left( {{\boldsymbol{x}}\left( {k} \right)} \right)$满足

    $${V_N}({\boldsymbol{x}}(k)) \le {\alpha _2}(|{\boldsymbol{x}}(k)|) + {\delta _1}(||{\boldsymbol{w}}||),\;\;{\rm{ }}\forall {\boldsymbol{x}}(k) \in {X_N}$$ (32)

    其中, $ {\delta _1} $$ K $类函数.

    $\left( {{{\boldsymbol{u}}^*}\left( {{{k}} - 1} \right),{{\boldsymbol{w}}^*}\left( {{{k}} - 1} \right)} \right)$$\left( {{{\boldsymbol{u}}^*}\left( {{k}} \right),{{\boldsymbol{w}}^*}\left( {{k}} \right)} \right)$分别为优化问题(8)在$ {{k}} - 1 $$ {{k}} $时刻的经济最优解, 考虑函数(18), 将函数${V} _R^*\left({\boldsymbol{ x}} \right)$沿着闭环状态轨迹(19)做差分运算

    $$\begin{split} &V_R^ * ({\boldsymbol{x}}(k)) - V_R^ * ({\boldsymbol{x}}(k - 1)) \le \\ &\qquad \eta ({\boldsymbol{x}}(k),\lambda ) - V_R^ * ({\boldsymbol{x}}(k - 1)) = \\ & \qquad (1 - \lambda )(V_R^0({\boldsymbol{x}}(k)) - V_R^ * ({\boldsymbol{x}}(k - 1))) \;+ \\ &\qquad \lambda (1 + {\lambda _1}){L_w}(||{\boldsymbol{w}}||) \end{split} $$ (33)

    由定理1可知, ${V} _R^0( {{\boldsymbol{x}}( {k} )} ) \leq {V} _R^1( {{\boldsymbol{x}}( {k} )} ) + {\lambda _1}{{L} _{w} }( {\| {\boldsymbol{w}} \|} )$, 将该不等式代入式(33), 整理可得

    $$\begin{split} & V_R^ * ({\boldsymbol{x}}(k)) - V_R^ * ({\boldsymbol{x}}(k - 1)) \le \\ &\qquad (1 - \lambda )(V_R^1({\boldsymbol{x}}(k)) - V_R^ * ({\boldsymbol{x}}(k - 1))\; + \\ & \qquad {\lambda _1}{L_w}(||{\boldsymbol{w}}||)) + \lambda (1 + {\lambda _1}){L_w}(||{\boldsymbol{w}}||) \le \\ & \qquad (\lambda -1)L({\boldsymbol{x}}(k-1),{\boldsymbol{u}}(k-1)) + (1+ {\lambda _1}){L_w}(||{\boldsymbol{w}}||) \end{split} $$ (34)

    考虑函数${{V} _{N} }\left( {{\boldsymbol{x}}\left( {k} \right)} \right)$定义, 式(34)等价于

    $$\begin{split} &{V_N}({\boldsymbol{x}}(k)) - {V_N}({\boldsymbol{x}}(k - 1)) = \\ &\qquad V_R^ * ({\boldsymbol{x}}(k)) - V_R^ * ({\boldsymbol{x}}(k - 1)) \le \\ &\qquad (\lambda -1)L({\boldsymbol{x}}(k-1),{\boldsymbol{u}}(k-1)) + (1+{\lambda _1}){L_w}(||{\boldsymbol{w}}||) \end{split} $$ (35)

    由于$ \lambda \in \left[ {0,1} \right) $$ {\lambda _1} \geq 1 $, 故存在$ {K_\infty } $类函数$ {\alpha _3} $$ K $类函数$ {\delta _2} $, 使得如下不等式

    $$\begin{split} &{V_N}({\boldsymbol{x}}(k)) - {V_N}({\boldsymbol{x}}(k - 1)) \le \\ &\qquad {\delta _2}(||{\boldsymbol{w}}||) - {\alpha _3}(|{\boldsymbol{x}}(k - 1)|),\;\;{\rm{ }}\forall {\boldsymbol{x}}(k - 1) \in {X_N} \end{split} $$ (36)

    成立. 则联立不等式(26), (32)和(36), 由引理1可知, 值函数VN(x(k))为闭环系统(19)的一个ISS-Lyapunov函数. 因此, 闭环系统(19)在XN内相对于扰动具有输入到状态稳定性. □

    考虑不确定非线性连续搅拌釜反应器(CSTR)

    $$\left\{ {\begin{aligned} &{\dfrac{{{\rm{d}}{c_A}(t)}}{{{\rm{d}}t}} = \dfrac{{Q(t)({c_{Af}} - {c_A}(t) + \Delta c(t))}}{V} - {k_0}c_A^{\rm{2}}(t)} \\ &{\dfrac{{{\rm{d}}{c_B}(t)}}{{{\rm{d}}t}} = \dfrac{{Q(t)({c_{Bf}} - {c_B}(t))}}{V} + {k_0}c_A^{\rm{2}}(t)} \end{aligned}} \right.$$ (37)

    其中, $ {{{c}}_{A} } $$ {{{c}}_{B} } $分别为组分AB的浓度, $ {{Q}} $为反应器进料流量, ${{{c}}_{{A} {{\rm{f}}} }}$${{{c}}_{{B} {{\rm{f}}} }}$分别为进料中组分AB的浓度, $ \Delta c $为进料中组分A浓度的不确定波动, 体积$ {{V}} $和反应动力学参数$ {{{k}}_0} $. 当忽略进料中组分浓度的波动, 该模型广泛用于名义稳定EMPC综合策略的验证[10, 13, 21]. 这里假设进料中组分A的浓度波动是有界的, 用于验证本文鲁棒EMPC的有效性. 取模型参数[10]: ${{{c}}_{{A} {{\rm{f}}} }}$ = 1.0 mol/l, ${{{c}}_{{B} {{\rm{f}}} }}$ = 0, $ {{V}} $ = 10 l和$ {{{k}}_0} $ = 1.2 l/(mol⋅min).

    ${\left[ {{{{c}}_A},{{{c}}_B}} \right]^{\rm{T}}}$为系统状态${\left[ {{{{x}}_1},{{{x}}_2}} \right]^{\rm{T}}}$, $ {{Q}} $为控制输入$ {{u}} $, $ {{w}} $为扰动$ \Delta c $. 进一步, 定义状态约束和控制约束

    $${x_1} \in [0,1],{\rm{ }}\;{x_2} \in [0,1],\;{\rm{ }}u \in [0,15]$$ (38)

    选择采样周期$ {{{T}}_{{s}}} = 0.1 $ min, 利用欧拉差分法离散化连续时间模型(37), 得CSTR非线性离散时间模型

    $$\left\{ {\begin{aligned} & \left[ {\begin{array}{*{20}{c}} {{x_1}(k + 1)} \\ {{x_2}(k + 1)} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {{x_1}(k) - 1.2{T_s}{x_1}^2(k)} \\ {{x_2}(k) + 1.2{T_s}{x_1}^2(k)} \end{array}} \right] + \\ &\qquad \dfrac{{{T_s}}}{{10}}\left[ {\begin{array}{*{20}{c}} {1 - {x_1}(k)} \\ { - {x_2}(k)} \end{array}} \right]u(k) + \dfrac{{{T_s}}}{{10}}\left[ {\begin{array}{*{20}{c}} {u(k)} \\ 0 \end{array}} \right]w(k) \\ & {z(k) = {{\left[ {\begin{array}{*{20}{c}} {{\boldsymbol{x}}^{\rm{T}}{{(k)}}}&{u(k)} \end{array}} \right]}^{\rm{T}}}} \end{aligned}} \right.$$ (39)

    其中, k为采样时刻. 定义CSTR经济性能指标[10]

    $${L_e}({\boldsymbol{x}},u) = 0.5u(1 - 4{x_2})$$ (40)

    由式(4)计算最优经济平衡点为${\boldsymbol{x}}_{{e}}^* = ( 0.5785, $$ 0.4215)$${{{{u}}}}_{{e}}^* = 9.5258$. 通过求解关于平衡点$\left( {{\boldsymbol{x}}_{{e}}^*,{{{{u}}}}_{{e}}^*} \right)$的Riccati不等式方程(11), 得

    $$\begin{split} &{\boldsymbol{P}} = \left[ {\begin{array}{*{20}{l}} {20}&{0.5} \\ {0.5}&{20} \end{array}} \right]\\ & {{\boldsymbol{\pi}} {\rm{(}}{\boldsymbol{x}}{\rm{)}} = [ - 0.0655,\;0.0739]({\boldsymbol{x}} - {\boldsymbol{x}}_e^*) + u_e^*} \\ &{\boldsymbol{\Omega}} =\{ {\boldsymbol{x}} \in {{\bf{R}}^2}{\rm{:}}\;{{{\rm{(}}{\boldsymbol{x}} - {\boldsymbol{x}}_e^*)}^{\rm{T}}}{\boldsymbol{P}}{\rm{(}}{\boldsymbol{x}} - {\boldsymbol{x}}_e^*) \le {\rm{2}}{\rm{.12\} }} \end{split}$$

    进一步, 为保证终端状态集$\boldsymbol{\Omega} $的鲁棒不变性, 由式(15)计算容许扰动上界为0.1436.

    令预测步长$ N = 5 $, 仿真总步长${{{T}}_{{{{\rm{sim}}}}}} = 100$, 系数$ {\lambda _1} = 1 $, 并考虑不同收缩因子$ \lambda \in \left[ {0,1} \right) $的控制效果. 选择系统初始状态${{\boldsymbol{x}}_0} = \left( {0.15,0.7} \right)^{\rm{T}}$, 仿真结果如图2图3所示, 图2对应持续扰动${{w}}( {{k}})= 0.1436\sin ( {{{k/}}2} )$的仿真结果, 图3对应衰减扰动${{w}}\left( {{k}} \right)=0.1436 $$ \exp( - {{k/}}10)$的仿真结果. 分析图2可知, 在持续扰动下, 闭环系统最终在最优经济平衡点$ \left( {{\boldsymbol{x}}_{{e}}^*,{{{{u}}}}_{{e}}^*} \right) $附近有界稳定; 分析图3可知, 在衰减扰动下, 闭环状态轨迹渐近收敛于$\left( {{\boldsymbol{x}}_{{e}}^*,{{{{u}}}}_{{e}}^*} \right)$. 根据图2图3可知, 对于不同收缩因子$ \lambda \in \left[ {0,1} \right) $, 由算法1得到的鲁棒EMPC控制器使得闭环系统在$\left( {{\boldsymbol{x}}_{{e}}^*,{{{{u}}}}_{{e}}^*} \right)$相对于容许扰动总是ISS的, 但不同$\lambda $对应的闭环状态轨迹的动态响应不同. 以衰减扰动${{w}}\left( {{k}} \right) = 0.1436\exp( - {{k/}}10)$为例, 由图3可知, 因子$\lambda $越小, 闭环状态轨迹的收敛过渡时间$ {{{T}}_{{{\rm{{tr}}}}}} $越短, 具体数据如表1最右列所示.

    图 2  持续扰动 $w(k)=0.1436\sin(k/2) $的仿真结果
    Fig. 2  Simulation results under continuous disturbance $w(k)=0.1436\sin(k/2) $
    图 3  持续扰动 $w(k)=0.1436\exp(-k/10) $的仿真结果
    Fig. 3  Simulation results under continuous disturbance $w(k)=0.1436\exp(-k/10) $
    表 1  平均经济性能和收敛过渡时间
    Table 1  Average economic performance and transient time
    $\lambda $$w(k)= 0.1436\sin ( {k/} 2 )$$w(k)=0.1436\exp( - {{k/} }10)$
    ${J_{{\rm{ave}}} } $ ${J_{{\rm{ave}}} } $ ${ {{T} }_{ {\text{tr} } } }$
    0.1 −3.4361 −3.3953 49Ts
    0.3 −3.4464 −3.4019 54Ts
    0.5 −3.4553 −3.4083 58Ts
    0.7 −3.4623 −3.4143 65Ts
    0.9 −3.4712 −3.4194 74Ts
    下载: 导出CSV 
    | 显示表格

    定义闭环系统T步平均经济性能指标

    $${J_{{\rm{ave}}}} = \frac{{\sum\limits_{k = 0}^T {{L_e}({\boldsymbol{x}}(k),{{\boldsymbol{u}}^{{\rm{mpc}}}}({\boldsymbol{x}}(k)))} }}{T}$$ (41)

    ${T} = 100 ,$ 表1给出了不同$ \lambda $值对应的闭环系统平均经济性能. 分析表1可以看出, 因子$ \lambda $越大, 闭环系统平均经济性能越好. 这表明, 无论是名义系统还是不确定系统, 闭环系统的经济最优性和稳定性是互相冲突的双控制目标[10, 21]. 在本文鲁棒EMPC策略中, 可以通过调节收缩因子$ \lambda $对经济性控制目标和鲁棒稳定性控制目标进行权衡, 从而实现经济性和鲁棒稳定性综合控制效果.

    进一步, 为了验证本文鲁棒EMPC策略(简记为MM-EMPC)的优越性, 对比文献[38]中鲁棒收缩EMPC策略(简记为RC-EMPC), 研究不同容许扰动上界对系统稳定性的影响. 对约束CSTR系统(37)和(38), 在系统参数相同情况下, RC-EMPC策略容许扰动上界d1 = 0.0136, MM-EMPC容许扰动上界d2 = 0.1436. 选择持续扰动w(k) = 0.04sin(k/5), 令初始状态x0 = (0.5, $0.5)^{\rm{T}} $, 仿真步长Tsim = 500. 在相同仿真环境下, 两种鲁棒EMPC策略的控制结果如图4所示, 其中, 实线表示MM-EMPC策略仿真结果, 虚线表示RC-EMPC策略仿真结果.

    图 4  闭环状态轨迹和控制输入曲线
    Fig. 4  Closed-loop state trajectorand control input profiles

    图4可以看出, MM-EMPC策略对应的闭环状态轨迹和控制输入曲线均收敛于$( {{\boldsymbol{x}}_{{e}}^*,{{{\boldsymbol{u}}}}_{{e}}^*})$附近, 而RC-EMPC策略对应的闭环轨迹虽然收敛, 但存在较大的稳态误差, 且MM-EMPC闭环系统的动态响应更加快速. 进一步, 考虑衰减扰动${{w}}\left( {{k}} \right)= $$ 0.04\exp \left( { - {{k/}}5} \right)$, 选择4个不同的初始状态对两种控制策略进行仿真对比分析, 控制结果如图5所示. 综合图4图5分析可知, 当容许扰动上界$ {{d}} \in \left( {{{{d}}_1},{{{d}}_2}} \right) $时, MM-EMPC策略下的闭环系统相对于扰动是ISS的, 而RC-EMPC却无法保证闭环系统相对于扰动具有ISS, 其中一个重要原因是RC-EMPC对大扰动会丢失递推可行性. 因此, 相较于RC-EMPC策略, 本文策略在保证闭环系统ISS同时, 能够获得更大的容许扰动上界, 从而降低鲁棒EMPC控制器的保守性.

    图 5  不同初始状态的闭环系统相轨迹
    Fig. 5  Phase trajectories of the closed-loop system from different initial states

    本文针对有界扰动下的约束不确定仿射输入非线性系统, 提出了一种新的鲁棒EMPC策略. 基于微分对策原理分别对经济目标函数和关于最优经济平衡点的鲁棒稳定性目标函数进行优化, 利用得到的鲁棒稳定性目标最优值函数构造隐式收缩约束, 保证了双控制目标优化问题的递推可行性, 并建立了闭环系统在最优经济平衡点处相对于扰动的输入到状态稳定性结果. 通过对不确定CSTR经济优化控制的对比仿真实验, 验证了本文策略的有效性和优越性.

    尽管基于微分对策的min-max鲁棒EMPC在理论上能有效提高鲁棒EMPC的性能, 但min-max优化在线计算复杂, 将阻碍鲁棒EMPC在快速响应系统中的应用. 因此, 降低min-max鲁棒EMPC的在线优化计算量和设计更高效的鲁棒EMPC策略(如Tube鲁棒EMPC、本质鲁棒EMPC等)将是后续研究重点.


  • 收稿日期 2021-01-05 录用日期 2021-04-16 Manuscript received January 5, 2021; accepted April 16, 2021 国家自然科学基金 (U20A20190, 62073065), 国家重点研发计划 (2018YFA0702200) 资助 Supported by National Natural Science Foundation of China (U20A20190, 62073065), and National Key Research and Develo-
  • pment Program of China (2018YFA0702200) 本文责任编委 张俊 Recommended by Associate Editor ZHANG Jun 1. 东北大学信息科学与工程学院 沈阳 110819 1. College of Information Science and Engineering, Northeastern University, Shenyang 110819
  • 图  1  微电网系统拓扑图

    Fig.  1  The typical circuit of the microgrid system

    图  2  风力发电装置和直流母线间的电能变换器

    Fig.  2  The interface converter between wind energy generator and DC bus

    图  3  光伏发电装置和直流母线间的电能变换器

    Fig.  3  The interface converter between solar energy generator and DC bus

    图  4  风力发电装置与直流母线的等效电能变换器

    Fig.  4  The equivalent interface converter between wind energy generator and DC bus

    图  5  风力发电装置等效拓扑同胚电能变换器控制框图

    Fig.  5  Control block diagram for realizing the equivalent topological homeomorphism system of the wind energy interface converter

    图  6  基于广义升压变换器的微电网系统

    Fig.  6  The typical circuit of the microgrid system based on generalized boost converter

    图  7  自适应动态规划结构

    Fig.  7  The adaptive dynamic programming structure

    图  8  微电网系统实时电流

    Fig.  8  Real-time current of distributed generators in the microgrid system

    图  9  微电网系统分布式电源实时电压

    Fig.  9  Real-time voltage of distributed generators in the microgrid system

    图  10  微电网系统直流母线实时电压

    Fig.  10  Real-time voltage of DC bus in the microgrid system

    图  11  控制输入曲线

    Fig.  11  Control input curves

    图  12  值函数曲线

    Fig.  12  Value function curve

    图  13  基于文献[24]的微电网系统实时电流

    Fig.  13  Real-time current of distributed generators in the microgrid system based on reference [24]

    图  14  基于本文方法的微电网系统实时电流

    Fig.  14  Real-time current of distributed generators in the microgrid system based on this paper

    符号含义说明
    $D{G_i}$i 个分布式电源 (风机或光伏)
    N可再生能源的数目
    M负载的数量
    ${L_{rec}}$风机电能变换器的输入电感
    ${L_{boo}}$光伏电能变换器的输入电感
    ${C_{dc}}$风/光电能变换器的输出电容
    ${V_{dc}}$风/光电能变换器的输出电压
    ${e_d}$风机电能变换器 d 轴电源电压
    ${e_ q }$风机电能变换器 q 轴电源电压
    ${i_d}$风机电能变换器 d 轴输入电流
    ${i_ q }$风机电能变换器 q 轴输入电流
    ${V_d}$风机电能变换器 d 轴输入电压
    ${V_ q }$风机电能变换器 q 轴输入电压
    ${d_d}$风机电能变换器 d 轴开关函数
    ${d_ q }$风机电能变换器 q 轴开关函数
    $\omega $风机电能变换器交流转速
    $d$风机电能变换器等效占空比
    ${m_i}$可再生能源$D{G_i}$的比例系数
    ${V_{ref}}$直流母线的参考电压
    $h$采样/控制时间间隔
    ${u_i}\left( k \right)$在时刻${t_k}$的控制变量
    ${R_i}$$D{G_i}$与直流母线间的传输阻抗
    ${R_{Lj}}$微电网中第 j 个负载
    ${E_{Ii}}(k)$电流分担偏差
    ${E_v}(k)$电压恢复偏差
    $\alpha $折扣因子
    $a,b,c$三个正值权重
    $J_i^\# $最优值函数
    $u_i^\# $最优策略
    HJB哈密顿−雅克比−贝尔曼
    ${w_i}$期望控制器
    ${l_c}$评价网络的学习率
    $p$迭代次数编号
    $W_a^1(k)$输入层到隐含层的权重参数
    $W_a^2(k)$隐含层到输出层的权重参数
    ${l_a}$执行网络的学习率
    下载: 导出CSV
  • [1] Schäfer B, Beck C, Aihara K, Witthaut D, Timme M. Non-gaussian power grid frequency fluctuations characterized by lévy-stable laws and superstatistics. Nature Energy, 2018, 3(2): 119-126 doi: 10.1038/s41560-017-0058-z
    [2] 王睿, 孙秋野, 张化光. 信息能源系统的信-物融合稳定性分析. 自动化学报, DOI: 10.16383/j.aas.c210480

    Wang Rui, Sun Qiu-Ye, Zhang Hua-Guang. Stability analysis of cyber-physical fusion in cyber-energy systems. Acta Automatica Sinica, DOI: 10.16383/j.aas.c210480
    [3] 胡旭光, 马大中, 郑君, 张化光, 王睿. 基于关联信息对抗学习的综合能源系统运行状态分析方法. 自动化学报, 2020, 46(9): 1783-1797

    Hu Xu-Guang, Ma Da-Zhong, Zheng Jun, Zhang Hua-Guang, Wang Rui. An operation state analysis method for integrated energy system based on correlation information adversarial learning. Acta Automatica Sinica, 2020, 46(9): 1783-1797
    [4] 孙秋野, 胡旌伟, 杨凌霄, 张化光. 基于GAN技术的自能源混合建模与参数辨识方法. 自动化学报, 2018, 44(5): 901-914

    Sun Qiu-Ye, Hu Jing-Wei, Yang Ling-Xiao, Zhang Hua-Guang. We-energy hybrid modeling and parameter identification with GAN technology. Acta Automatica Sinica, 2018, 44(5): 901-914
    [5] Sekander S, Tabassum H, Hossain E. Statistical performance modeling of solar and wind-powered UAV communications. IEEE Transactions on Mobile Computing, 2021, 20(8): 2686-2700 doi: 10.1109/TMC.2020.2983955
    [6] Liu X K, Jiang H, Wang Y W, He H B. A distributed iterative learning framework for DC microgrids: Current sharing and voltage regulation. IEEE Transactions on Emerging Topics in Computational Intelligence, 2020, 4(2): 119-129 doi: 10.1109/TETCI.2018.2863747
    [7] Mehrjerdi H, Hemmati R, Shafie-khah M, Catalão J P S. Zero energy building by multicarrier energy systems including hydro, wind, solar, and hydrogen. IEEE Transactions on Industrial Informatics, 2021, 17(8): 5474-5484 doi: 10.1109/TII.2020.3034346
    [8] J. M. Guerrero, M. Chandorkar, T. Lee and P. C. Loh. Advanced Control Architectures for Intelligent Microgrids—Part I: Decentralized and Hierarchical Control. IEEE Transactions on Industrial Electronics
    [9] Zhou T P, Sun W. Optimization of battery-supercapacitor hybrid energy storage station in wind/solar generation system. IEEE Transactions on Sustainable Energy, 2014, 5(2): 408-415 doi: 10.1109/TSTE.2013.2288804
    [10] Ma G, Xu G C, Chen Y X, Ju R. Multi-objective optimal configuration method for a standalone wind-solar-battery hybrid power system. IET Renewable Power Generation, 2017, 11(1): 194-202 doi: 10.1049/iet-rpg.2016.0646
    [11] Aquila G, de Queiroz A R, Lima L M M, Balestrassi P P, Lima J W M, Pamplona E O. Modelling and design of wind-solar hybrid generation projects in long-term energy auctions: A multi-objective optimisation approach. IET Renewable Power Generation, 2020, 14(14): 2612-2619 doi: 10.1049/iet-rpg.2020.0185
    [12] Kong X B, Liu X J, Ma L L, Lee K Y. Hierarchical distributed model predictive control of standalone wind/solar/battery power system. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2019, 49(8): 1570-1581 doi: 10.1109/TSMC.2019.2897646
    [13] Chen J W, Chen J. Stability analysis and parameters optimization of islanded microgrid with both ideal and dynamic constant power loads. IEEE Transactions on Industrial Electronics, 2018, 65(4): 3263-3274 doi: 10.1109/TIE.2017.2756588
    [14] Urtasun A, Sanchis P, Marroyo L. State-of-charge-based droop control for stand-alone AC supply systems with distributed energy storage. Energy Conversion and Management, 2015, 106: 709-720 doi: 10.1016/j.enconman.2015.10.010
    [15] Lu X N, Guerrero J M, Sun K, Vasquez J C. An improved droop control method for DC microgrids based on low bandwidth communication with DC bus voltage restoration and enhanced current sharing accuracy. IEEE Transactions on Power Electronics, 2014, 29(4): 1800-1812 doi: 10.1109/TPEL.2013.2266419
    [16] Han R K, Tucci M, Martinelli A, Guerrero J M, Ferrari-Trecate G. Stability analysis of primary plug-and-play and secondary leader-based controllers for DC microgrid clusters. IEEE Transactions on Power Systems, 2019, 34(3): 1780-1800 doi: 10.1109/TPWRS.2018.2884876
    [17] 孙秋野, 王一帆, 杨凌霄, 张化光. 比特驱动的瓦特变革—信息能源系统研究综述. 自动化学报, 2021, 4701): 50-63

    Sun Qiu-Ye, Wang Yi-Fan, Yang Ling-Xiao, Zhang Hua-Guang. Bit-driven watt revolution—a review of cyber energy system. Acta Automatica Sinica, 2021, 47(1): 50-63
    [18] Liu X K, He H B, Wang Y W, Xu Q W, Guo F H. Distributed hybrid secondary control for a DC microgrid via discrete-time interaction. IEEE Transactions on Energy Conversion, 2018, 33(4): 1865-1875 doi: 10.1109/TEC.2018.2850279
    [19] Nasirian V, Moayedi S, Davoudi A, Lewis F L. Distributed cooperative control of DC microgrids. IEEE Transactions on Power Electronics, 2015, 30(4): 2288-2303 doi: 10.1109/TPEL.2014.2324579
    [20] Wang P B, Lu X N, Yang X, Wang W, Xu D G. An improved distributed secondary control method for DC microgrids with enhanced dynamic current sharing performance. IEEE Transactions on Power Electronics, 2016, 31(9): 6658-6673 doi: 10.1109/TPEL.2015.2499310
    [21] Nasirian V, Davoudi A, Lewis F L, Guerrero J M. Distributed adaptive droop control for DC distribution systems. IEEE Transactions on Energy Conversion, 2014, 29(4): 944-956 doi: 10.1109/TEC.2014.2350458
    [22] Tucci M, Riverso S, Ferrari-Trecate G. Line-independent plug-and-play controllers for voltage stabilization in DC microgrids. IEEE Transactions on Control Systems Technology, 2018, 26(3): 1115-1123 doi: 10.1109/TCST.2017.2695167
    [23] Sadabadi M S, Shafiee Q, Karimi A. Plug-and-play robust voltage control of DC microgrids. IEEE Transactions on Smart Grid, 2018, 9(6): 6886-6896 doi: 10.1109/TSG.2017.2728319
    [24] Zhou J G, Xu Y L, Sun H B, Wang L M, Chow M Y. Distributed event-triggered H consensus based current sharing control of DC microgrids considering uncertainties. IEEE Transactions on Industrial Informatics, 2020, 16(12): 7413-7425 doi: 10.1109/TII.2019.2961151
    [25] Liu X K, Wang Y W, Lin P F, Wang P. Distributed supervisory secondary control for a DC microgrid. IEEE Transactions on Energy Conversion, 2020, 35(4): 1736-1746 doi: 10.1109/TEC.2020.2994251
    [26] Wei Q L, Zhu L, Song R Z, Zhang P J, Liu D R, Xiao J. Model-free adaptive optimal control for unknown nonlinear multiplayer nonzero-sum game. IEEE Transactions on Neural Networks and Learning Systems, DOI: 10.1109/TNNLS.2020.3030127
    [27] 王鼎, 穆朝絮, 刘德荣. 基于迭代神经动态规划的数据驱动非线性近似最优调节. 自动化学报, 2017, 43(3): 366-375

    Wang Ding, Mu Chao-Xu, Liu De-Rong. Data-driven nonlinear near-optimal regulation based on iterative neural dynamic programming. Acta Automatica Sinica, 2017, 43(3): 366-375
    [28] Wei Q L, Lewis F L, Shi G, Song R Z. Error-tolerant iterative adaptive dynamic programming for optimal renewable home energy scheduling and battery management. IEEE Transactions on Industrial Electronics, 2017, 64(12): 9527-9537 doi: 10.1109/TIE.2017.2711499
    [29] 袁兆麟, 何润姿, 姚超, 李佳, 班晓娟. 基于强化学习的浓密机底流浓度在线控制算法. 自动化学报, 2021, 47(7): 1558-1571

    Yuan Zhao-Lin, He Run-Zi, Yao Chao, Li Jia, Ban Xiao-Juan. Online reinforcement learning control algorithm for concentration of thickener underflow. Acta Automatica Sinica, 2021, 47(7): 1558-1571
    [30] Wang R, Sun Q Y, Ma D Z, Qin D H, Gui Y H, Wang P. Line inductance stability operation domain assessment for weak grids with multiple constant power loads. IEEE Transactions on Energy Conversion, 2021, 36(2): 1045-1055 doi: 10.1109/TEC.2020.3021070
    [31] Wen B, Boroyevich D, Burgos R, Mattavelli P, Shen Z Y. Inverse nyquist stability criterion for grid-tied inverters. IEEE Transactions on Power Electronics, 2017, 32(2): 1548-1556 doi: 10.1109/TPEL.2016.2545871
    [32] Sun Q Y, Han R K, Zhang H G, Zhou J G, Guerrero J M. A multiagent-based consensus algorithm for distributed coordinated control of distributed generators in the energy internet. IEEE Transactions on Smart Grid, 2015, 6(6): 3006-3019 doi: 10.1109/TSG.2015.2412779
    [33] Nasirian V, Shafiee Q, Guerrero J M, Lewis F L, Davoudi A. Droop-free distributed control for AC microgrids. IEEE Transactions on Power Electronics, 2016, 31(2): 1600-1617 doi: 10.1109/TPEL.2015.2414457
    [34] Yang X, Wei Q L. Adaptive critic learning for constrained optimal event-triggered control with discounted cost. IEEE Transactions on Neural Networks and Learning Systems, 2021, 32(1): 91-104 doi: 10.1109/TNNLS.2020.2976787
    [35] Wang R, Sun Q Y, Tu P F, Xiao J F, Gui Y H, Wang P. Reduced-order aggregate model for large-scale converters with inhomogeneous initial conditions in DC microgrids. IEEE Transactions on Energy Conversion, 2021, 36(3): 2473-2484 doi: 10.1109/TEC.2021.3050434
  • 期刊类型引用(6)

    1. 任凯龙,薛斌强. 优先级分布式模型预测控制的多智能体系统. 电子设计工程. 2024(01): 82-85+90 . 百度学术
    2. 闫茂德,金鑫,杨盼盼,刘军浩. 基于MPC的智能网联卡车队列最优能耗控制. 计算机仿真. 2024(03): 128-133 . 百度学术
    3. 曹强,党晓圆,高俊,南亮生,吴胜磊,曾庆欣,张杰. 模型预测控制理论的研究与应用. 自动化应用. 2024(09): 8-14+18 . 百度学术
    4. 巢瑞云,刘源. 基于PSO优化双子支持向量机的电商经济预测研究. 贵阳学院学报(自然科学版). 2024(02): 11-15+42 . 百度学术
    5. 马小涵,刘晓华,高荣. 基于经济模型预测控制的证券投资组合策略. 鲁东大学学报(自然科学版). 2023(02): 153-158+164 . 百度学术
    6. 穆建彬,冯阳辉,何德峰. 有界扰动下异质车辆队列分布式鲁棒经济预测控制. 控制与决策. 2023(05): 1386-1394 . 百度学术

    其他类型引用(12)

  • 加载中
  • 图(14) / 表(1)
    计量
    • 文章访问数:  1668
    • HTML全文浏览量:  327
    • PDF下载量:  251
    • 被引次数: 18
    出版历程
    • 收稿日期:  2021-01-05
    • 录用日期:  2021-04-16
    • 网络出版日期:  2021-05-31
    • 刊出日期:  2022-02-18

    目录

    /

    返回文章
    返回