2.793

2018影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

间歇过程的批内自优化控制

叶凌箭

叶凌箭. 间歇过程的批内自优化控制. 自动化学报, 2020, 45(x): 1−11. doi: 10.16383/j.aas.c190855
引用本文: 叶凌箭. 间歇过程的批内自优化控制. 自动化学报, 2020, 45(x): 1−11. doi: 10.16383/j.aas.c190855
YE Ling-Jian. Within-Batch Self-optimizing Control For Batch Processes. Acta Automatica Sinica, 2020, 45(x): 1−11. doi: 10.16383/j.aas.c190855
Citation: YE Ling-Jian. Within-Batch Self-optimizing Control For Batch Processes. Acta Automatica Sinica, 2020, 45(x): 1−11. doi: 10.16383/j.aas.c190855

间歇过程的批内自优化控制


DOI: 10.16383/j.aas.c190855
详细信息
    作者简介:

    浙大宁波理工学院信息学院教授. 2006年, 2011年分别获得浙江大学化工系学士, 控制系博士学位. 主要研究方向为控制结构设计, 不确定系统的实时优化. 本文通信作者. E-mail: lingjian.ye@gmail.com

  • 基金项目:  国家自然科学基金项目(61673349), 轻工过程先进控制教育部重点实验室开放课题资助(江南大学)项目(APCLI1802), 宁波市自然科学基金(2018A610188)资助

Within-Batch Self-optimizing Control For Batch Processes

More Information
  • Fund Project:  National Natural Science Foundation of China(61673349), Foundation of Key Laboratory of Advanced Process Control for Light Industry (Jiangnan University, APCLI1802), Ningbo Natural Science Foundation (2018A610188)
  • 摘要: 针对间歇过程的实时优化问题, 提出了一种基于自优化控制的批内优化方法. 以测量变量的线性组合为被控变量, 在单批次内跟踪控制被控变量实现间歇过程的实时优化. 根据是否在间歇过程的不同阶段切换被控变量, 给出了两种自优化控制策略, 对每种策略又分别提出两种设定轨线选取方案. 为求解这些情形下的最优被控变量(组合矩阵), 以最小化平均经济损失为目标, 推导了组合矩阵和经济损失之间的函数关系, 分别将其描述为相应的非线性规划问题. 在此基础上, 进一步引入了扩张组合矩阵, 将这些非线性规划问题归纳为求解扩张组合矩阵的一致形式(扩张组合矩阵具有不同的结构约束), 并推导得到了其中一种方案的解析解计算方法. 以一个间歇反应器为研究对象, 验证了方法的有效性.
  • 图  1  间歇过程的离散化变量及自优化控制策略

    Fig.  1  Discretization of batch processes and self-optimizing control strategy

    图  2  最优扩张组合矩阵 $\small \bar H$ 的求解步骤

    Fig.  2  Procedure for solving the optimal extended combination matrix $\small \bar H$

    图  3  标称点的最优输入轨迹

    Fig.  3  Optimal input trajectory at the nominal point

    图  4  策略1方案1的设定值轨线

    Fig.  4  Setpoint trajectory for Strategy 1 (Scheme 1)

    图  5  批内自优化控制效果( $ k_1 $ : +20%, $ k_2 $ : -20%)

    Fig.  5  Within-batch self-optimizing performance ( $ k_1 $ : +20%, $ k_2 $ : -20%)

    图  6  批内自优化控制效果( $ k_1 $ : +40%, $ k_2 $ : -40%)

    Fig.  6  Within-batch self-optimizing performance ( $ k_1 $ : +40%, $ k_2 $ : -40%)

    表  1  间歇反应器参数及标称值

    Table  1  Parameters for the reactor model and nominal values

    符号 物理含义 标称值
    $ k_1 $ 主反应反应常数 0.053 L mol/min
    $ k_2 $ 副反应反应常数 0.128 L mol/min
    $ u_L $ $ u $ 下限 0 L/min
    $ u_U $ $ u $ 上限 0.001 L/min
    $ c_{Bin} $ B进料浓度 5 mol/L
    $ c_{Ao} $ A初始浓度 0.72 mol/L
    $ c_{Bo} $ B初始浓度 0.0614 mol/L
    $ V_o $ V初始值 1 L
    $ t_f $ 批次运行时间 250 min
    下载: 导出CSV

    表  2  损失函数 $ L_{\rm{av}} $

    Table  2  Loss function $ L_{\rm{av}} $

    方案 $ N = 2 $ $ N = 20 $
    策略1方案1 0.0371 0.0083
    策略1方案2 0.03423 0.0024
    策略2方案1 0.0368 0.0069
    策略2方案2 0.03420 0.0022
    下载: 导出CSV

    表  3  100组随机扰动下的非线性损失统计量

    Table  3  Statistics of nonlinear losses for 100 groups of random disturbances

    方案 平均损失 最大损失 标准差
    标称操作 0.0036 0.0227 0.0068
    控制 $ c_B $ 0.0042 0.0165 0.0054
    策略1方案1 0.0026 0.0167 0.0050
    策略1方案2 0.0007 0.0053 0.0016
    下载: 导出CSV
  • [1] Chachuat B, Srinivasan B, Bonvin D. Adaptation strategies for real-time optimization. Computers & Chemical Engineering, 2009, 33(10): 1557−1567
    [2] 柴天佑. 生产制造全流程优化控制对控制与优化理论方法的挑战. 自动化学报, 2009, 35(6): 641−649 doi:  10.3724/SP.J.1004.2009.00641

    Chai Tian-You. Challenges of Optimal Control for Plant-wide Production Processes in Terms of Control and Optimization Theories. Acta Automatica Sinica, 2009, 35(6): 641−649 doi:  10.3724/SP.J.1004.2009.00641
    [3] Engell S. Feedback control for optimal process operation. Journal of Process Control, 2007, 17(3): 203−219 doi:  10.1016/j.jprocont.2006.10.011
    [4] Chen C Y, Joseph B. On-line optimization using a two-phase approach: an application study. Industrial & Engineering Chemistry Research, 1987, 26(9): 1924−1930
    [5] Marlin T E, Hrymak A N. Real-time operations optimization of continuous processes. In: AIChE Symposium Series. 1997: New York, NY: American Institute of Chemical Engineers, 1987. 1971−2002
    [6] Marchetti A, Chachuat B, Bonvin D. Modifier-Adaptation Methodology for Real-Time Optimization. Industrial & Engineering Chemistry Research, 2009, 48(13): 6022−6033
    [7] Marchetti A G, Francois G, Faulwasser T, Bonvin D. Modifier adaptation for real-time optimization—methods and applications. Processes, 2016, 4(4): 55 doi:  10.3390/pr4040055
    [8] 代伟, 柴天佑. 数据驱动的复杂磨矿过程运行优化控制方法. 自动化学报, 2014, 40(9): 2005−2014

    Dai Wei, Chai Tian-You. Data-driven optimal operational control of complex grinding processes. Acta Automatica Sinica, 2014, 40(9): 2005−2014
    [9] 李金娜, 高溪泽, 柴天佑, 范家璐. 数据驱动的工业过程运行优化控制. 控制理论与应用, 2016, 33(12): 1584−1592 doi:  10.7641/CTA.2016.60455

    Li Jin-Na, Gao Xi-Zhe, Chai Tian-You. Data-driven operational optimization control of industrial processes. Control Theory & Applications, 2016, 33(12): 1584−1592 doi:  10.7641/CTA.2016.60455
    [10] 代伟, 陆文捷, 付俊, 马小平. 工业过程多速率分层运行优化控制. 自动化学报, 2019, 45(10): 1946−1959

    Dai Wei, Lu Wen-Jie, Fu Jun, Ma Xiao-Ping. Multi-rate Layered Optimal Operational Control of Industrial Processes. Acta Automatica Sinica, 2019, 45(10): 1946−1959
    [11] Skogestad S. Plantwide control: the search for the self-optimizing control structure. Journal of Process Control, 2000, 10(5): 487−507 doi:  10.1016/S0959-1524(00)00023-8
    [12] Ye L, Cao Y, Yuan X. Global approximation of self-optimizing controlled variables with average loss minimization. Industrial & Engineering Chemistry Research, 2015, 54(48): 12040−12053
    [13] Jaschke J, Cao Y, Kariwala V. Self-optimizing control–A survey. Annual Reviews in Control, 2017, 43: 199−223 doi:  10.1016/j.arcontrol.2017.03.001
    [14] Ye L, Miao A, Zhang H. Real-Time Optimization of Gold Cyanidation Leaching Process in a Two-Layer Control Architecture Integrating Self-Optimizing Control and Modifier Adaptation. Industrial & Engineering Chemistry Research, 2017, 56(14): 4002−4016
    [15] 叶凌箭, 关宏伟. 金氰化浸出过程的自优化控制. 控制与决策, 2017, 32(3): 481−486

    Ye Ling-Jian, Guan Hong-Wei. Self-optimizing control of gold cyanidation leaching process. Control and Decision, 2017, 32(3): 481−486
    [16] Ye L, Cao Y, Yuan X, Zhang H. Retrofit self-optimizing control: A step forward toward real implementation. IEEE Transactions On Industrial Electronics, 2017, 64(6): 4662−4670 doi:  10.1109/TIE.2017.2668991
    [17] Francisco M, Skogestad S, Vega P. Model predictive control for the self-optimized operation in wastewater treatment plants: Analysis of dynamic issues. Computers & Chemical Engineering, 2015, 82: 259−272
    [18] 卢静宜, 曹志兴, 高福荣. 批次过程控制—回顾与展望. 自动化学报, 2017, 43(6): 933−943

    Lu Jing-Yi, Cao Zhi-Xing, Gao Fu-Rong. Batch Process Control-Overview and Outlook. Acta Automatica Sinica, 2017, 43(6): 933−943
    [19] Lu J, Cao Z, Zhao C, Gao F. 110th Anniversary: An Overview on Learning-Based Model Predictive Control for Batch Processes. Industrial & Engineering Chemistry Research, 2019, 58(37): 17164−17173
    [20] 池荣虎, 侯忠生, 黄彪. 间歇过程最优迭代学习控制的发展: 从基于模型到数据驱动. 自动化学报, 2017, 43(6): 917−932

    CHI Rong-Hu, HOU Zhong-Sheng, HUANG Biao. Optimal Iterative Learning Control of Batch Processes: From Model-based to Data-driven. Acta Automatica Sinica, 2017, 43(6): 917−932
    [21] Lu J, Cao Z, Gao F. Multipoint iterative learning model predictive control. IEEE Transactions on Industrial Electronics, 2018, 66(8): 6230−6240
    [22] Lu J, Cao Z, Zhang R, Gao F. Nonlinear monotonically convergent iterative learning control for batch processes. IEEE Transactions on Industrial Electronics, 2017, 65(7): 5826−5836
    [23] Srinivasan B, Bonvin D, Visser V, Palanki S. Dynamic optimization of batch processes - Ⅱ. Role of measurements in handling uncertainty. Computers & Chemical Engineering, 2003, 27(1): 27−44
    [24] Cao Z, Gondhalekar R, Dassau E, Doyle F J. Extremum seeking control for personalized zone adaptation in model predictive control for type 1 diabetes. IEEE Transactions on Biomedical Engineering, 2017, 65(8): 1859−1870
    [25] Cao Z, Dürr H B, Ebenbauer C, Allgower F, Gao F. Iterative learning and extremum seeking for repetitive time-varying mappings. IEEE Transactions on Automatic Control, 2016, 62(7): 3339−3353
    [26] 史洪岩, 苑明哲, 王天然, 袁德成. 间歇过程动态优化方法综述. 信息与控制, 2012, 41(1): 75−82

    Shi Hong-yan, Yuan Ming-Zhe, Wang Tian-Ran, Yuan De-Cheng. A suvey on dynamic optimization methods of batch processes. Information and Control, 2012, 41(1): 75−82
    [27] Srinivasan B, Palanki S, Bonvin D. Dynamic optimization of batch processes - I. Characterization of the nominal solution. Computers & Chemical Engineering, 2003, 27(1): 1−26
    [28] Halvorsen I J, Skogestad S, Morud J C, Alstad V. Optimal selection of controlled variables. Industrial & Engineering Chemistry Research, 2003, 42(14): 3273−3284
    [29] Kariwala V. Optimal measurement combination for local self-optimizing control. Industrial & Engineering Chemistry Research, 2007, 46(11): 3629−3634
    [30] Alstad V, Skogestad S, Hori E S. Optimal measurement combinations as controlled variables. Journal of Process Control, 2009, 19(1): 138−148 doi:  10.1016/j.jprocont.2008.01.002
    [31] Alstad V, Skogestad S. Null space method for selecting optimal measurement combinations as controlled variables. Industrial & Engineering Chemistry Research, 2007, 46(3): 846−853
    [32] Francois G, Srinivasan B, Bonvin D. Use of measurements for enforcing the necessary conditions of optimality in the presence of constraints and uncertainty. Journal of Process Control, 2005, 15(6): 701−712 doi:  10.1016/j.jprocont.2004.11.006
    [33] 叶凌箭, 宋执环, 马修水. 间歇过程的批间自优化控制. 化工学报, 2015, 66(07): 2573−2580

    Ye Ling-Jian, Song Zhi-Huan, Ma Xiu-Shui. Batch-to-batch self-optimizing control for batch processes. CIESC Journal, 2015, 66(07): 2573−2580
    [34] Ye Ling-Jian, Guan Hong-Wei, Yuan Xiao-Feng, Ma Xiu-Shui. Run-to-run optimization of batch processes with self-optimizing control strategy. The Canadian Journal Of Chemical Engineering, 2017, 95(4): 724−736 doi:  10.1002/cjce.22692
    [35] Ye L, Skogestad S. Dynamic self-optimizing control for unconstrained batch processes. Computers & Chemical Engineering, 2018, 117: 451−468
    [36] Skogestad S. Control structure design for complete chemical plants. Computers & Chemical Engineering, 2004, 28(1−2): 219−234
    [37] Biegler L T, Zavala V M. Large-scale nonlinear programming using IPOPT: An integrating framework for enterprise-wide dynamic optimization. Computers & Chemical Engineering, 2009, 33(3): 575−582
  • [1] 赵春晖, 余万科, 高福荣. 非平稳间歇过程数据解析与状态监控回顾与展望[J]. 自动化学报, doi: 10.16383/j.aas.c190586
    [2] 马永杰, 陈敏, 龚影, 程时升, 王甄延. 动态多目标优化进化算法研究进展[J]. 自动化学报, doi: 10.16383/j.aas.c190489
    [3] 孙燕, 张弛, 路兴龙, 王靖戈, 付俊. 具有不等式路径约束的微分代数方程系统的动态优化[J]. 自动化学报, doi: 10.16383/j.aas.c180302
    [4] 池荣虎, 侯忠生, 黄彪. 间歇过程最优迭代学习控制的发展:从基于模型到数据驱动[J]. 自动化学报, doi: 10.16383/j.aas.2017.c170086
    [5] 黄德先, 江永亨, 金以慧. 炼油工业过程控制的研究现状、问题与展望[J]. 自动化学报, doi: 10.16383/j.aas.2017.c170157
    [6] 丁进良, 杨翠娥, 陈立鹏, 柴天佑. 基于参考点预测的动态多目标优化算法[J]. 自动化学报, doi: 10.16383/j.aas.2017.c150811
    [7] 王静, 胡益, 侍洪波. 基于GMM的间歇过程故障检测[J]. 自动化学报, doi: 10.16383/j.aas.2015.c130680
    [8] 陆志强, 张思源, 崔维伟. 集成预防性维护和流水线调度的鲁棒性优化研究[J]. 自动化学报, doi: 10.16383/j.aas.2015.c140560
    [9] 钱富才, 黄姣茹, 秦新强. 基于鲁棒优化的系统辨识算法研究[J]. 自动化学报, doi: 10.3724/SP.J.1004.2014.00988
    [10] 胡云卿, 刘兴高. 处理动态优化问题中控制变量路径约束的方法[J]. 自动化学报, doi: 10.3724/SP.J.1004.2013.00440
    [11] 常玉清, 王姝, 谭帅, 王福利, 杨洁. 基于多时段MPCA模型的间歇过程监测方法研究[J]. 自动化学报, doi: 10.3724/SP.J.1004.2010.01312
    [12] 张肃, 程启月, 申卯兴. 基于区间数型多因素指派模型的多传感器优化分配方法[J]. 自动化学报, doi: 10.3724/SP.J.1004.2008.00240
    [13] 陆宁云, 王福利, 高福荣, 王姝. 间歇过程的统计建模与在线监测[J]. 自动化学报
    [14] 胡刚, 谢湘生. 不确定离散广义系统的D稳定鲁棒控制[J]. 自动化学报
    [15] 胡中骥, 施颂椒, 翁正新. 一类多不确定性系统鲁棒H∞控制器的LMI设计方法[J]. 自动化学报
    [16] 郑连伟, 刘晓平, 张庆灵. 具有时变不确定性的线性时滞系统的鲁棒H∞控制[J]. 自动化学报
    [17] 俞立, 王景成, 褚健. 不确定离散动态系统的保成本控制[J]. 自动化学报
    [18] 陈善本, 张铨, 张福恩, 吴林. 具动态不确定性系统的观测器-控制器设计的鲁棒性[J]. 自动化学报
    [19] 傅春生, 王骥程. 在线识别间歇过程特性的新方法及其在发酵过程中的应用[J]. 自动化学报
    [20] 倪茂林, 谌颖. 含时变不确定性线性系统的鲁棒跟踪控制[J]. 自动化学报
  • 加载中
计量
  • 文章访问数:  4
  • HTML全文浏览量:  13
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-12-17
  • 录用日期:  2020-06-11

间歇过程的批内自优化控制

doi: 10.16383/j.aas.c190855
    基金项目:  国家自然科学基金项目(61673349), 轻工过程先进控制教育部重点实验室开放课题资助(江南大学)项目(APCLI1802), 宁波市自然科学基金(2018A610188)资助
    作者简介:

    浙大宁波理工学院信息学院教授. 2006年, 2011年分别获得浙江大学化工系学士, 控制系博士学位. 主要研究方向为控制结构设计, 不确定系统的实时优化. 本文通信作者. E-mail: lingjian.ye@gmail.com

摘要: 针对间歇过程的实时优化问题, 提出了一种基于自优化控制的批内优化方法. 以测量变量的线性组合为被控变量, 在单批次内跟踪控制被控变量实现间歇过程的实时优化. 根据是否在间歇过程的不同阶段切换被控变量, 给出了两种自优化控制策略, 对每种策略又分别提出两种设定轨线选取方案. 为求解这些情形下的最优被控变量(组合矩阵), 以最小化平均经济损失为目标, 推导了组合矩阵和经济损失之间的函数关系, 分别将其描述为相应的非线性规划问题. 在此基础上, 进一步引入了扩张组合矩阵, 将这些非线性规划问题归纳为求解扩张组合矩阵的一致形式(扩张组合矩阵具有不同的结构约束), 并推导得到了其中一种方案的解析解计算方法. 以一个间歇反应器为研究对象, 验证了方法的有效性.

English Abstract

叶凌箭. 间歇过程的批内自优化控制. 自动化学报, 2020, 45(x): 1−11. doi: 10.16383/j.aas.c190855
引用本文: 叶凌箭. 间歇过程的批内自优化控制. 自动化学报, 2020, 45(x): 1−11. doi: 10.16383/j.aas.c190855
YE Ling-Jian. Within-Batch Self-optimizing Control For Batch Processes. Acta Automatica Sinica, 2020, 45(x): 1−11. doi: 10.16383/j.aas.c190855
Citation: YE Ling-Jian. Within-Batch Self-optimizing Control For Batch Processes. Acta Automatica Sinica, 2020, 45(x): 1−11. doi: 10.16383/j.aas.c190855
  • 化工过程普遍存在不确定性, 如何采用有效的优化方法找到不确定条件下系统的真实最优点, 对提高化工企业的经济效益发挥着关键作用[1]. 大规模化工过程的控制系统通常为分层递阶结构[2-3], 控制层(下层)的主要任务是抑制底层扰动, 跟踪优化层传递来的被控变量设定值, 优化层(上层)根据调度层(顶层)传达的生产任务指标等, 对当前工况进行识别, 执行相应的优化算法计算出最优设定值, 传递给控制层执行.

    优化层执行的优化算法通常以化工过程的非线性模型为基础, 以传统的"二步法"实时优化[4-5] 为例, 首先确定模型的不确定参数, 运行过程中采集系统的输出量数据, 对未知参数进行估计, 再基于更新的系统模型进行重优化, 计算出被控变量的最优设定值后传递给控制层. 这一过程通常还需要结合数据调和、稳态检测等技术手段加强优化结果的可靠性, 工业过程的优化周期一般为4-8小时. 针对传统的"二步法"的缺点, 近年来涌现出了新的实时优化方法, 如Bonvin课题组提出的修正项自适应方法(Modifier adaptation)[6-7], 通过对标称模型的约束及梯度进行修正, 即使不估计扰动参数也能收敛到真实最优点. 李金娜, 代伟等[8-10]考虑运行层之间的不同时间尺度, 提出了数据驱动的多速率分层运行优化控制方法, 基于Q学习对基础控制回路的设定值进行在线优化, 使运行层能更好地优化控制性能指标. 自优化控制(self-optimizing control)[11-13] 提出通过离线选择控制层的被控变量, 设定值则在线保持不变, 提供了实时优化的另一种研究思路. 在自优化控制中, 被控变量可以是常规物理量的函数, 即构造虚拟量进行控制, 可使系统的操作变量可以在不确定性下进行自寻优. 当底层控制的优化作用较强时(经济损失可接受), 甚至可以省略单独的优化层, 从而简化控制系统. 相比传统的优化方式, 自优化控制的优化在工作频率为秒/分的反馈控制中完成, 因此优化速度得到大幅度提升, 在一系列研究中表现出良好的效果[14-17].

    间歇过程是一类批次加工的化工过程, 具有规模小、灵活性高的特点, 在需求多元化的现代市场中应用越来越广泛. 相比连续化工过程, 间歇过程具有"多重时变"的操作特征[18-19]. 一方面, 间歇过程具有重复特性, 可以引入学习机制从历史批次的数据中提炼出有用的信息, 改进后续批次的跟踪控制和经济指标优化, 典型的如迭代学习控制[18, 20-23]、批间实时优化[23-24] 等控制和优化技术. 另一方面, 由于其时变特性, 间歇过程在批次内无稳定操作点, 相比连续过程的控制和稳态优化更具挑战[25-27]. 自优化控制经过近二十年的发展, 针对连续过程已报道了一系列被控变量求解方法[12, 28-31], 但是针对需动态优化的间歇过程仍缺乏足够的研究. 值得注意的是, 由于从批间角度看间歇过程是一个静态过程[32], 近年来文献[33-34]提出了间歇过程的批间自优化控制方法. 此类方法仅利用了间歇过程的重复性, 基于已有的静态自优化控制方法求解被控变量, 然后设计批间控制器调节输入轨迹, 逐批次将被控变量控制于恒定设定点, 实现实时优化. 但批间优化本质上还是静态方法, 由于需要若干个批次才能实现被控变量的跟踪控制, 优化作用慢, 因此未充分发挥自优化控制的优势. 此外, 批间优化只对具有重复特性的扰动具有效果, 当系统受到高频扰动作用时, 批间控制器难以实现有效的实时优化.

    最近Ye等提出了一种针对间歇过程的动态自优化控制方法[35], 通过考虑批内变量的因果性, 最终得到了具有优化作用的控制律. 设计控制系统时, 选择被控变量和设计控制器通常是两个独立任务[36], 前者主要考虑经济指标的优化, 后者关注于如何更好地跟踪控制被控变量, 保证控制系统的稳定性和鲁棒性. 如何在此前提下求解批内被控变量, 仍是一个开放的课题.

    本文研究了间歇过程的批内自优化控制问题, 贡献如下: 1)基于自优化控制策略提出以输出变量的线性组合为被控变量(虚拟变量), 在批次运行过程中对其进行跟踪控制, 以控制手段实现实时优化; 2)根据是否在过程不同阶段切换被控变量, 给出了两种自优化控制策略, 对每种策略又分别给出了两种设定轨线选取方案; 3)引入扩张组合矩阵, 将这些情形统一描述为具有不同结构约束的最优组合矩阵求解问题, 并推导得到了其中一种方案的解析解计算方法. 目前为止, 本文所提方法在国内外文献中目前未见报道.

    • 对连续化工过程, 考虑如下静态优化问题

      $$ \begin{split} &\min\limits_{{{u}}} J({{u}}, {{d}})\\ s.t. \quad &{{y}} = {{g}}({{u}}, {{d}})\\& {{g}}_{\rm{in}}({{u}}, {{d}}) \text{≤} 0 \end{split} $$ (1)

      其中 $ J $ 为经济指标, $ {{u}}\in {\bf R}^{n_u} $ , $ {{d}}\in {\bf R}^{n_d} $ $ {{y}}\in {\bf R}^{n_y} $ 分别是操纵变量, 扰动变量和测量变量, $ {{g}} $ $ {{g}}_{\rm{in}} $ 为输出变量的模型函数和约束条件.

      扰动变量 $ {{d}} $ 变化且在线不可测是化工过程偏离最优点的主要原因. 当扰动 $ {{d}} $ 变化时, (1)式的解是 $ {{d}} $ 的函数, 不妨记为 $ {{u}}^{\rm{opt}}({{d}}) $ . 实时优化的任务是在 $ {{d}} $ 未知的前提下, 寻找到新的最优值 $ {{u}}^{\rm{opt}} $ , 实现过程的最优操作. 自优化控制(SOC)通过构造虚拟的被控变量 $ {{c}} = H{{y}} $ , 当反馈控制器将 $ {{c}} $ 控制在恒定设定值 $ {{c}}_s $ 上时, 控制器输出能自动逼近当前的实际最优值 $ {{u}}^{\rm{opt}}({{d}}) $ . 当组合矩阵 $ H $ 每行有且只有一个1, 其余为0时, $ {{c}} $ 为输出变量 $ {{y}} $ 的子集, 此时退化为传统的以单变量为被控变量的情形. 更一般的情况下, $ H $ 中的非零元素提供了更多优化自由度, 可提高系统的闭环经济性能. 例如, 假设系统自由度 $ n_u = 2 $ , $ {{y}} = [T\;P\;c_A]^{\rm{T}} $ , 包括温度 $ T $ , 压力 $ P $ 和物质A的浓度 $ c_A $ , 考虑两种情况:

      $$ {H_1} = \left[ {\begin{array}{*{20}{c}} 1&0&0\\ 0&0&1 \end{array}} \right];\;{H_2} = \left[ {\begin{array}{*{20}{c}} {{h_{11}}}&{{h_{12}}}&{{h_{12}}}\\ {{h_{21}}}&{{h_{22}}}&{{h_{23}}} \end{array}} \right] $$

      $ H_1 $ 对应的被控变量 $ {{c}} = H_1{{y}} $ $ T $ $ c_A $ (单个物理量), $ H_2 $ 的被控变量为三个物理量的线性组合. 显然, 前者为后者的一种特殊形式.

      为求解一般情形的最优组合矩阵 $ H $ , 研究人员针对不同过程特性和衡量标准提出了求解方法[12, 28-31]. 以一种针对线性系统的局部法(exact local method)为例[28], 首先定义损失函数 $ L $

      $$ L = J({{u}}, {{d}})-J^{\rm{opt}}({{d}}) $$ (2)

      对给定的 $ {{d}} $ , 将 $ J({{u}}, {{d}}) $ 在最优点 $ {{u}}^{\rm{opt}} $ 处进行二阶泰勒展开

      $$ \begin{split} J({{u}}, {{d}}) &\approx J^{\rm{opt}}({{d}})+J_{u}^{T}\left({{u}}-{{u}}^{\rm{opt}}\right)\\&+\frac{1}{2}\left({{u}}-{{u}}^{\rm{opt}}\right)^{T} J_{u u}\left({{u}}-{{u}}^{\rm{opt}}\right) \end{split} $$ (3)

      式中 $ J_u = \partial J/\partial {{u}} $ $ J_{uu} = \partial^2J/\partial {{u}}^2 $ 分别为一阶和二阶敏感矩阵. 根据最优性条件, 最优点处 $ J_u = 0 $ , 将其代入(1)式可得到二次型损失函数

      $$ L = \frac{1}{2}\left({{u}}-{{u}}^{\rm{opt}}\right)^{T} J_{u u}\left({{u}}-{{u}}^{\rm{opt}}\right) $$ (4)

      此外, 输出函数在标称点处的线性化方程为

      $$ {{y}} = G_{y} {{u}}+G_{yd}{{d}} $$ (5)

      若考虑测量变量含噪声: $ {{y}}_m = {{y}}+{{n}} $ , 当控制器将被控变量 $ {{c}} = H{{y}}_m $ 控制在原设定值上时( $ \Delta {{c}} = 0 $ ), 扰动变化 $ \Delta{{d}} $ 将引起的 $ {{u}} $ 变化量为

      $$ \Delta{{u}} = -\left(HG_{y}\right)^{-1} HG_{yd} \Delta{{d}}+\left(HG_{y}\right)^{-1} H{{n}} $$ (6)

      同时, 扰动变化 $ \Delta{{d}} $ 将引起最优点变化

      $$ \Delta {{u}}^{\rm{opt}} = -J_{uu}^{-1}J_{ud} \Delta{{d}} $$ (7)

      式中 $ J_{ud} = \partial^2J/(\partial {{u}}\partial{{d}}) $ . 将式(6)和(7)代入(4) 可计算损失函数[28]

      $$ \begin{split} &L = \frac{1}{2}\|{{z}}\|^2_2,\\ &{{z}}\triangleq V(HG_y)^{-1}H\tilde F\begin{bmatrix}{{d'}}\\ {{n}}' \end{bmatrix} = M\begin{bmatrix}{{d'}}\\ {{n}}' \end{bmatrix} \end{split} $$ (8)

      式中 $ V $ 满足 $ V^TV = J_{uu} $ , $ \tilde F = [FW_d\;W_n] $ , $ F = \partial {{y}}^{\rm{opt}}/ \partial {{d}} = -(G_yJ_{uu})^{-1}J_{ud}+G_{yd} $ , $ W_d $ $ W_n $ 为对角矩阵, 其对角元素为 $ {{d}} $ $ {{n}} $ 的幅值, $ {{d}}' $ $ {{n}}' $ 为归一化后的扰动和噪声向量, 其最大范数为1.

      (8)式中的损失 $ L $ 为单个工况 $ (\Delta{{d}},{{n}}) $ 引起的损失. 当 $ {{d}} $ $ {{n}} $ 在其变化范围内变化时, 文献[23-24]中分别以 $ L $ 的最大值 $ L_{\max} $ 和平均值 $ L_{\rm{av}} $ 为衡量标准, 提出了 $ H $ 的求解方法. 以平均损失 $ L_{\rm{av}} $ 为例, 当 $ {{d}}' $ $ {{n}}' $ 为正态分布时, 可得到如下最优化问题求解 $ H $

      $$ \min\limits_{H} L_{\rm{opt}} = 0.5\|M\|_{\rm{F}}^{2} $$ (9)

      引理1[35]. $ L_{\rm{av}}(H) = L_{\rm{av}}(QH) $ , 其中 $ Q $ 为任意 $ n_u $ 维非奇异方阵.

      该引理表明(9)式的解非唯一(因为控制 $ {{c}} = H{{y}} $ $ {{c}} = QH{{y}} $ 等效). 利用该特性, 可以先求解出(9)式的一个特解, 再推广至通解形式. 文献[24]给出了最优 $ H $ 的一个特解, 如下

      $$ H^{\rm{T}} = (\tilde{F}\tilde{F}^{\rm{T}})^{-1}{G}_y({G}_y^{\rm{T}}(\tilde{F}\tilde{F}^{\rm{T}})^{-1}G_y)^{-1}J_{uu}^{1/2} $$ (10)
    • 考虑一类带不确定参数的间歇过程优化问题

      $$ \begin{split} &\min\limits_{{{u}}(t)} J = \phi\left({{y}}\left(t_{f}\right)\right)\\ {\rm{st.}} \quad &\dot{{{x}}} = {{f}}({{x}}, {{u}}, {{d}}), \quad {{x}}(0) = {{x}}_{0}\\ &{{y}} = {{f}}_{y}({{x}},{{u}}) \\ &{{u}}_{L} \text{≤} {{u}}(t) \text{≤} {{u}}_{U} \\ &{{T}}({{x}}, {{u}}) \text{≤} 0 \end{split} $$ (11)

      式中 $ J $ 为最小化目标, $ {{u}}(t)\in {\bf R}^{n_u} $ 为操纵变量轨迹( $ {{u}}_L $ $ {{u}}_U $ 分别为输入下上限), $ {{x}}\in {\bf R}^{n_x} $ , $ {{y}}\in {\bf R}^{n_y} $ $ {{d}}\in {\bf R}^{n_d} $ 分别为状态向量(初态 $ {{x}}_0 $ ), 测量变量和不确定扰动, $ t_f $ 为批次运行时间, $ \phi $ 为目标函数, $ {{f}} $ , $ {{f}}_y $ $ {{T}} $ 分别为模型方程, 输出方程和过程约束.

      对(11)式所示的动态优化问题, 通常可以基于数值法将其近似为离散化的非线性规划(NLP)问题[37]

      $$ \begin{split} &\min_{{{u}}_i,\ldots,{{u}}_N} J = \phi\left({{y}}(N)\right)\\ {\rm{st. }} \quad &{{x}}(i+1) = {{\hat f}}({{x}}(i), {{u}}(i), {{d}}(i)), \quad {{x}}(0) = {{x}}_{0}\\ &{{y}}(i) = {{\hat f}}_{y}({{x}}(i),{{u}}(i)) \\ &{{u}}_{L} \text{≤} {{u}}(i) \text{≤} {{u}}_{U} \\ &{{T}}({{x}}(i), {{u}}(i)) \text{≤} 0\\ &\forall\;i = 1,\ldots,N \end{split} $$ (12)

      式中 $ N $ 为间歇过程在操作区间 $ [0, t_f] $ 内的离散段数, $ {{\hat f}} $ $ {{\hat f}}_y $ 代表离散后的非线性状态方程和输出方程.

      对上述间歇过程的优化问题, 文献[27-28]提出了批间自优化控制方法, 即构造被控变量 $ {{c}} = H{{y}} $ , 利用间歇过程的重复特性逐批次将 $ {{c}} $ 控制在恒设定值上. 从批间角度看, 间歇过程是一个静态过程, 因此第1节中针对连续过程的被控变量求解方法可以较为直接地拓展至间歇过程. 但批间优化需要经历若干批次实现被控变量的控制, 优化速度较慢. 并且, 若扰动的变化频率较高(如非重复性扰动), 则难以实现被控变量的跟踪控制, 优化效果有限.

    • 本文研究间歇过程的批内自优化控制方法, 即在单批次中控制被控变量实现实时优化. 和批间优化相比, 批内优化的响应速度更快, 能提高优化效果. 由于跟踪控制在单批次内完成, 批内优化能应对非重复性扰动. 对被控变量 $ {{c}} = H{{y}} $ 及其设定值 $ {{c}}_s $ , 考虑如下几种策略:

      策略0: $ H $ $ {{c}}_s $ 保持恒定;

      策略1: $ H $ 恒定, $ {{c}}_s $ 时变;

      策略2: $ H $ $ {{c}}_s $ 均时变.

      策略0为连续过程中采用的自优化控制方法, 对具有时变特性的间歇过程, 一般难以取得理想效果. 策略1采用恒定被控变量, 其设定值为动态轨线, 较策略0更适合间歇过程. 策略2进一步考虑具有切换结构的控制系统, 对离散化的间歇过程, 在 $ [t_i, t_{i+1}) $ 时间段内控制一组新的被控变量, 如图1所示.

      图  1  间歇过程的离散化变量及自优化控制策略

      Figure 1.  Discretization of batch processes and self-optimizing control strategy

      结合间歇过程的时变特性, 本文主要研究策略1和策略2的被控变量求解问题. 对此, 引入如下假设条件:

      假设1: 输出变量 $ {{y}} $ 在时间轴 $ [0,t_f] $ 上连续可测.

      假设2: 对一组选定的被控变量 $ {{c}}(i) = H(i){{y}} $ 及设定值 $ c_s(i) $ , 在对应的时间间隔 $ [t_i,t_{i+1}) $ 内, 控制器可以将被控变量 $ {{c}}(i) $ 控制在其设定值 $ {{c}}_s(i) $ 上, 即 $ \lim_{t\rightarrow t_{i+1}}H(i){{y}}(t) = {{c}}_s(i) $ .

      策略1( $ H $ 恒定, $ {{c}}_s $ 时变): 采用该策略时, 第1个时间段 $ [t_0,t_1) $ 内的被控变量 $ {{c}}(t) = H{{y}}(t) $ , 设定值为 $ c_s(1) $ , 至终点 $ t_1 $ 实现 $ H{{y}}(1) = {{c}}_s(1) $ ; 第2个时间段 $ {{c}}(t) = H{{y}}(t) $ 的设定值变为 $ {{c}}_s(2) $ , 至终点 $ t_2 $ 实现 $ H{{y}}(2) = {{c}}_s(2) $ ; 以此类推.

      对该策略, 进一步考虑两种设定值选取方案:

      方案1: 设定值轨线 $ [{{c}}_s(1),\ldots,{{c}}_s(N)] $ 为一组既定常数, 对给定的组合矩阵 $ H $ , 设定值 $ c_s(i) $ 为被控变量 $ {{c}} = H{{y}}(t) $ 在各时间节点处的标称值 $ {{c}}_s^*(i) $ , 使标称工况的损失为0;

      方案2: 设定值 $ {{c}}_s(i) $ 为当前批次运行至 $ t_{i-1} $ 时刻的变量 $ {{y}}(0:i-1): = [{{y}}^{\rm{T}}(0)\;\cdots\;{{y}}^{\rm{T}}(i-1)]^{\rm{T}} $ 的函数, 不妨假定为线性关系, 记为 $ {{c}}_s(i) = {{c}}_s^*(i)- H'(i){{y}}(0:i-1) $ , 其中 $ H'(i) $ 为待确定的系数矩阵.

      可以看到, 方案1中被控变量的设定轨线固定不变. 而方案2的被控变量设定轨线在当前批次运行过程中不断利用测量值进行修正. 相比方案1, 方案2更加充分地利用了过程信息, 理论上能进一步提高优化效果, 但需求解额外的决策变量 $ H'(i), i = 1,\cdots,N $ .

      为推导这两种方案中损失函数与组合矩阵 $ H $ 之间的关系, 定义如下超向量

      $$ \begin{split} &{{\bar{u}}}^{\rm{T}} = [{{u}}(0)^{\rm{T}} {{u}}(1)^{\rm{T}} \cdots {{u}}(N-1)^{\rm{T}}] \in {\bf R}^{n_{\bar{u}}\triangleq N_{u}}\\ &{{\bar{d}}}^{\rm{T}} = \left[{{d}}(0)^{\rm{T}} {{d}}(1)^{\rm{T}} \cdots {{d}}(N-1)^{\rm{T}}\right] \in {\bf R}^{n_{\bar{d}}\triangleq N n_{d}} \\ &{{\bar{y}}}^{\rm{T}} = \left[{{y}}(0)^{\rm{T}} {{y}}(1)^{\rm{T}} \cdots {{y}}(N)^{\rm{T}}\right] \in {\bf R}^{n_{\bar{y}}\triangleq (N+1) n_{y}} \end{split} $$ (13)

      式中超向量 $ {{\bar{u}}},{{\bar{y}}},{{\bar{d}}} $ 由时间轴 $ [0, t_f] $ 上各离散点处的变量堆叠组成. 为便于描述, 将上述超向量的非线性映射关系记为

      $$ {{\bar{y}}} = G({{\bar{u}}},{{\bar{d}}}) $$ (14)

      式中映射函数 $ G $ 由(12)式中的状态方程 $ {{\hat f}} $ $ {{\hat f}}_y $ 定义. 使用超向量, 间歇过程中变量的动态关系记为(14)式所示的静态函数.

      对方案1, 定义如下扩张组合矩阵 $ \bar H\in {\bf R}^{n_{\bar u}\times n_{\bar y}} $ 及总被控变量 $ {{\bar c}}\in {\bf R}^{Nn_{\bar u}} $

      $$ \bar{H} = \left[\begin{array}{ccccc} [0\;H] & 0 & \cdots & 0 \\ 0 & H & \cdots & 0 \\ \vdots & \ddots & &\vdots \\ 0 & 0 & \cdots & H \end{array}\right],{{\bar{c}}} = \bar{H} \bar{y} = \left[\begin{array}{c} H{{y}}(1) \\ H{{y}}(2) \\ \vdots \\ H{{y}}(N) \end{array}\right] $$ (15)

      方案2也可以定义相同维度的扩张组合矩阵 $ \bar H $ 及总被控变量 $ {{\bar c}} $ :

      $$ \bar H = \left[ \begin{array}{c} \left[ {{{H'}_1}\;H} \right]\;\;0\;\; \cdots \;\;0\\ \left[ {{{H'}_2}\;H} \right]\;\; \cdots \;\;0\\ \vdots \;\; \ddots \;\; \vdots \\ \left[ {{{H'}_N}\;\;H} \right] \end{array} \right], $$ (16)
      $$ \begin{align} &{{\bar{c}}} = \bar{H}{{\bar{y}}} = \left[\begin{array}{c} H{{y}}(1)+H_{1}' {{y}}(0) \\ H{{y}}(2)+H_{2}' {{y}}(0: 1) \\ \vdots \\ H{{y}}(N)+H_{N}' {{y}}(0: N-1) \end{array}\right] \end{align} $$

      式中 $ [t_{i-1}, t_i) $ 的被控变量为 $ {{\bar{c}}}(i) = H {{y}}(i)+ H_{i}'{{y}}(0: i-1) $ , 等同于被控变量 $ {{\bar{c}}}(i) = H {{y}}(i) $ , 且设定值修正量为 $ -H_{i}'{{y}}(0: i-1) $ , 因为在 $ t-1 $ 时刻 $ {{y}}(0: i-1) $ 为已知量.

      引入扩张组合矩阵 $ \bar{H} $ 后, 总被控变量 $ {{\bar{c}}} $ 由每个时间节点的被控变量组成, 方案1 和方案2被统一地描述成静态自优化控制问题的规范形. 结合第1节已有的结论, 可以得到损失函数 $ L_{\rm{av}} $ $ \bar{H} $ 的关系表达式, 即求解如下最优化问题

      $$ \begin{split} \min\limits_{\bar H} L_{\rm{av}}& = 0.5\left\|V\left(\bar{H} G_{y}\right)^{-1} \bar{H} \tilde{F}\right\|_{\rm{F}}^{2}\\ {\rm{s.t.}} \quad &(15)\;{\rm{or}}\;(16) \end{split} $$ (17)

      式中 $ V,G_y $ $ \tilde F $ 等矩阵均定义为超向量之间的关系.

      上述优化问题和静态问题(9)之间的不同之处在于, 此处扩张组合矩阵 $ \bar H $ 应满足(15)或(16)式所示的结构, 即矩阵 $ \bar H $ 具有结构性约束. (10)式所示的解析解不能直接推广至(17)式求解, 否则不满足约束条件(15)或(16).

      策略2( $ H $ $ {{c}}_s $ 均时变): 在第1个时间段 $ [t_0,t_1) $ 内, 控制器控制被控变量 $ {{c}}(t) = H(1){{y}}(t) $ , 设定值为 $ {{c}}_s(1) $ , 至终点 $ t_1 $ 实现 $ H(1){{y}}(1) = {{c}}_s(1) $ ; 在第2个时间段 $ [t_1,t_2) $ 内, 被控变量切换为 $ {{c}}(t) = H(2){{y}}(t) $ , 设定值为 $ {{c}}_s(2) $ , 至终点 $ t_2 $ 实现 $ H(2){{y}}(2) = {{c}}_s(2) $ ; 以此类推. 类似地, 对策略2也考虑两种方案:

      方案1: 每组被控变量 $ {{c}}(i) $ 对应的设定值 $ [{{c}}_s(1),\cdots,{{c}}_s(N)] $ 为既定常数, 为 $ H(i){{y}}(i) $ 在时间节点 $ t_i $ 处的标称值 $ {{c}}_s^*(i) $ ;

      方案2: 设定值 $ {{c}}_s(i) $ 为当前批次运行至 $ t_{i-1} $ 时刻的变量 $ {{y}}(0:i-1): = [{{y}}^{\rm{T}}(0)\;\cdots\;{{y}}^{\rm{T}}(i-1)]^{\rm{T}} $ 的函数, 记为 $ {{c}}_s(i) = {{c}}_s^*(i)-H'(i) {{y}}(0:i-1) $ , 其中 $ H'(i) $ 为待确定的系数矩阵.

      同理, 对策略2的两种方案也分别定义扩张组合矩阵 $ \bar H $ 及总被控变量 $ {{\bar c}} $

      方案1:

      $$ \begin{split} &\bar{H} = \left[\begin{array}{ccccc} [0\;H(1)] & 0 & \cdots & 0 \\ 0 & H(2) & \cdots & 0 \\ \vdots & \ddots & &\vdots \\ 0 & 0 & \cdots & H(N) \end{array}\right],\\ &{{\bar{c}}} = \bar{H} \bar{y} = \left[\begin{array}{c} H(1){{y}}(1) \\ H(2){{y}}(2) \\ \vdots \\ H(N){{y}}(N) \end{array}\right] \end{split} $$ (18)

      方案2:

      $$ \bar H = \left[ \begin{array}{c} \left[ {{{H'}_1}\;H\left( 1 \right)} \right]\;\;0\;\; \cdots \;\;0\\ \left[ {{{H'}_2}\;H\left( 2 \right)} \right]\;\; \cdots \;\;0\\ \vdots \;\; \ddots \;\; \vdots \\ \left[ {{{H'}_N}\;\;H\left( N \right)} \right] \end{array} \right], $$ (19)
      $$ \begin{align} &{{\bar{c}}} = \bar{H}{{\bar{y}}} = \left[\begin{array}{c} H(1){{y}}(1)+H_{1}' {{y}}(0) \\ H(2){{y}}(2)+H_{2}' {{y}}(0: 1) \\ \vdots \\ H(N){{y}}(N)+H_{N}' {{y}}(0: N-1) \end{array}\right] \end{align} $$

      和策略1相比, 策略2中两种方案的组合矩阵 $ H $ 是时变的, 即需求取 $ N $ 个组合矩阵 $ H(i), i = 1,\cdots,N $ . 同理, 对策略2求解如下最优化问题

      $$ \begin{split} \min\limits_{\bar H} L_{\rm{av}}& = 0.5\left\|V\left(\bar{H} G_{y}\right)^{-1} \bar{H} \tilde{F}\right\|_{\rm{F}}^{2}\\ {\rm s.t.} \quad &(18)\;{\rm{or}}\;(19) \end{split} $$ (20)

      从以上分析看到, 对不同的控制策略和设定值选取方案, 可以统一归结为具有不同结构的扩张组合矩阵 $ \bar H $ 的求解问题, 可以在优化问题中对 $ \bar H $ 施加等式约束实现. 一般来说, 具有特定结构的组合矩阵难以求得闭合解, 需使用数值优化算法.

      注1: 以上提出的4种被控变量选择方案, 从控制角度看, 执行策略1(方案1)最简单, 但优化效果可能较差; 策略2(方案2)理论上的优化效果最好, 但被控变量需要不断切换, 并且设定轨线也要在线修正. 针对具体过程, 需结合过程特性和优化性能结果综合考虑这两个因素, 选择最合理的自优化控制方案.

    • 下面提出一种针对策略2(方案2)的闭合解求解方法. 如(19)式所示, 此时 $ \bar H $ 为块下三角矩阵. 为表述方便, 将(17)式所示的 $ \bar H $ 表达式记为

      $$ \bar H = \left[ \begin{array}{c} {{\bar H}_1}\;\;0\;\; \cdots \;\;0\\ {{\bar H}_2}\;\; \cdots \;\;0\\ \vdots \;\; \ddots \;\; \vdots \\ {{\bar H}_N} \end{array} \right] $$ (21)

      式中子矩阵 $ \bar{H}(i) \triangleq\left[H_{i}'\;H(i)\right] \in {\bf R}^{n_{u} \times i n_{y}} $ , 同时包含了 $ i $ 时刻的被控变量组合矩阵 $ H(i) $ 及修正设定值轨线的系数矩阵 $ H_{i}' $ .

      引理 2. 对满足(21)式结构的 $ \bar{H} $ 及非奇异块下三角矩阵 $ Q $ , 转化矩阵 $ \bar H' = Q\bar{H} $ 同样满足(21)式结构, 并且 $ L_{\rm{av}}(\bar H) = L_{\rm{av}}(\bar H') $ .

      证明. 由于 $ \bar H $ $ Q $ 均为块下三角, 显然 $ \bar H' $ 也为块下三角矩阵. 将 $ \bar H' = Q\bar{H} $ 代入到损失函数表达式 $ L_{\rm{av}}\left(\bar{H}'\right) = 0.5\left\|V\left(\bar{H}'G_{y}\right)^{-1} \bar{H}'\tilde{F}\right\|_{\rm{F}}^{2} $ 中, $ Q $ 矩阵前后互消, 结论成立.

      和引理1类似, 引理2也可用于先求解 $ \bar H $ 的特解. 注意到敏感矩阵 $ G_y $ 为块下三角矩阵, 因此 $ \bar HG_y $ 的逆也为块下三角. 将 $ V $ 取为满足 $ V^TV = J_{uu} $ 的块下三角矩阵, 可以对 $ J_{uu} $ 进行Cholesky分解得到.

      定理 1. 对策略2(方案2)的 $ \bar H $ 矩阵, (20)式等同于求解如下问题

      $$ \begin{split} &\min\limits_{\bar{H}(1), \cdots, \bar H(N)} L_{\rm{av}} = 0.5 \sum\limits_{i = 1}^{N}\left\|\bar{H}(i) \tilde{F}_{i}\right\|_{\rm{F}}^{2}\\ &{\rm{s.t.}} \quad \bar{H}(i) G_{y i} = V_{i}, \forall i = 1, \cdots, N \end{split} $$ (22)

      式中 $ \tilde{F}_{i} $ $ \tilde{F} $ 的子矩阵 (前 $ n_yi $ 行, 前 $ n_d+n_yi $ 列), $ G_{yi} $ $ G_y $ 的子矩阵 (前 $ n_yi $ 行, 前 $ n_ui $ 列), $ V_i $ $ V $ 的第 $ i $ 个分块矩阵.

      证明. 根据引理2, 可选择任意非奇异的块下三角矩阵 $ Q $ 对矩阵 $ \bar H $ 进行转化求取特解, 可选择 $ Q = V(\bar HG_y)^{-1} $ , 使 $ \bar H' = Q\bar{H} $ 满足下式

      $$ \bar{H}'G_{y} = V\left(\bar{H} G_{y}\right)^{-1}\bar{H}G_{y} = V $$ (23)

      即对 $ \forall i = 1,\ldots,N $ 均满足

      $$ \bar{H}'({\rm{i}}) G_{y i} = V_{i} $$ (24)

      不失一般性, 上式可作为对决策变量 $ \bar H $ 的约束加入到优化问题中. 此时

      $$ \begin{split} L_{\rm{av}}& = 0.5\left\|V(\bar{H} G_{y})^{-1} \bar{H}\tilde{F}\right\|_{\rm{F}}^{2} = 0.5\left\| \bar{H} \tilde{F}\right\|_{\rm{F}}^{2} = \\ & 0.5 \sum\limits_{i = 1}^{N}\left\| \bar{H}(i) \tilde{F}\right\|_{\rm{F}}^{2} \end{split} $$ (25)

      通过合理利用转化矩阵 $ Q $ , 定理1将目标函数及约束条件分解到每个离散时间节点, 能够沿时间轴依次求解出子矩阵 $ \bar H(i) $ . 对 $ \forall i = 1,\ldots,N $ , 求解如下优化问题

      $$ \begin{split} &\min\limits_{\bar{H}(i)}\;\;0.5\left\|H_{i} \tilde{F}_{i}\right\|_{\rm{F}}^{2}\\ &{\rm{s.t.}}\;\;\bar{H}(i) G_{y i} = V_{i} \end{split} $$ (26)

      上式为带等式约束的二次型凸优化问题, 可进一步求得解析解.

      定理 2. 对(26)式所示的带等式约束的二次型凸优化问题, 其闭合解为

      $$ \bar{H}(i)^{\rm{T}} = (\tilde{F}_{i} \tilde{F}_{i}^{\rm{T}})^{-1} G_{yi}\left(G_{y i}^{\rm{T}}(\tilde{F}_{i} \tilde{F}_{i}^{\rm{T}})^{-1} G_{y i}\right)^{-1} V_{i}^{\rm{T}} $$ (27)

      证明. (26)式在形式上和第1节静态自优化控制问题一致, 闭合解(27)的推导过程可参见文献[28].

      综上, 本文求取最优扩张组合矩阵 $ \bar H $ 的计算步骤如图2所示, 其中策略2(方案2)可直接应用定理2 求得闭合解, 其它3种情况则需使用数值优化法求取. 由于目标函数 $ L_{\rm{av}} $ $ \bar H $ 的非线性函数, 优化问题(17)和(20)不能保证得到全局最优解. 对此, 策略2(方案2)得到的解析解可作为数值优化的初始解进行寻优.

      图  2  最优扩张组合矩阵 $\small \bar H$ 的求解步骤

      Figure 2.  Procedure for solving the optimal extended combination matrix $\small \bar H$

    • 本节研究一个带副反应的间歇反应器, 主副反应分别为 $ A+B\rightarrow C $ $ 2B\rightarrow D $ , 其中反应物 $ A $ 在初始时刻投放完毕, $ B $ 在反应过程中实时投放, 实时流量为操纵变量 $ u(t) $ . 体系的模型方程为

      $$ \frac{dc_A}{dt} = -k_1c_Ac_B-c_Au/V,\quad c_A(0) = c_{A0} $$ (28)
      $$\begin{split} \frac{dc_B}{dt} =& -k_1c_Ac_B-2k_2c_B^2-(c_B-c_{Bin})u/V, \\ & c_B(0) = c_{B0} \end{split} $$ (29)
      $$ \frac{dV}{dt} = u, \quad V(0) = V_0 $$ (30)
      $$c_C = (c_{A0}V_0-c_AV)/V $$ (31)
      $$ c_D = \frac{c_A+c_{Bin}-c_B}{2}-\frac{c_{A0}+c_{Bin}-c_{B0}}{2V} $$ (32)

      式中 $ c_X $ 表示物料 $ X $ 的浓度, $ V $ 为持液量, 其他符号含义及标称值列于表1.

      操作目标为在 $ [0, t_f] $ 操作时段内最大化产物产量 $ C $ 的同时减少副产物 $ D $ , 表示为如下优化问题

      $$ \begin{split} \max\limits_{u(t)} J& = [c_C(t_f)-c_D(t_f)]V(t_f) \\ s.t. \quad & 0\text{≤} u(t)\text{≤} 0.001 {\rm{L/min}} \end{split} $$ (33)

      表1所示的标称工况下, 使用数值优化方法求解(33)可得到 $ u(t) $ 的最优输入轨迹(图3), 可以看到此时 $ u(t) $ 整个轨线处于可行域内, 最优值 $ J^{\rm{opt}} $ = 0.271687 mol. 反应常数 $ k_1 $ $ k_2 $ 为不确定扰动, 变化范围为其标称值的 $ \pm $ 40%. 当 $ k_1 $ $ k_2 $ 变化时, $ u(t) $ 的最优输入轨迹随之改变.

      表 1  间歇反应器参数及标称值

      Table 1.  Parameters for the reactor model and nominal values

      符号 物理含义 标称值
      $ k_1 $ 主反应反应常数 0.053 L mol/min
      $ k_2 $ 副反应反应常数 0.128 L mol/min
      $ u_L $ $ u $下限 0 L/min
      $ u_U $ $ u $上限 0.001 L/min
      $ c_{Bin} $ B进料浓度 5 mol/L
      $ c_{Ao} $ A初始浓度 0.72 mol/L
      $ c_{Bo} $ B初始浓度 0.0614 mol/L
      $ V_o $ V初始值 1 L
      $ t_f $ 批次运行时间 250 min

      图  3  标称点的最优输入轨迹

      Figure 3.  Optimal input trajectory at the nominal point

    • 为更清晰地阐述本文方法, 以 $ N = 2 $ 为例(即 $ [0, t_f] $ 被均匀离散为两段), 介绍如何使用第2节介绍的方法求解不同被控变量. 离散后的优化变量个数 $ n_{\bar u} = 2 $ , 对(33)进行重优化后得到Hessian矩阵和 $ V $ 矩阵

      $$ \begin{split} & J_{\bar u\bar u} = \left[\begin{array}{cc} 3.70 & 1.74 \\ 1.74 & 3.47 \end{array}\right] \times 10^{5},\\ & V = \left[\begin{array}{cc} 532.2 & 0 \\ 294.9 & 589.0 \end{array}\right] \end{split} $$ (34)

      考虑使用 $ c_A $ $ c_B $ 构造被控变量, 对离散系统进行线性化得到

      $$ {{\bar{y}}} = G_{y}{{\bar{u}}}+G_{yd}{{d}} $$ (35)

      式中

      $$ \begin{split} & G_{y} = \left[\begin{array}{cc} 0 & 0 \\ 0 & 0 \\ -264.45 & 0 \\ 88.27 & 0 \\ -210.43 & -181.20 \\ 10.48 & 98.16 \end{array}\right], \\ & G_{y d} = \left[\begin{array}{cc} 0 & 0 \\ 0 & 0 \\ -2.07 & 0.32 \\ -0.41 & -0.15 \\ -2.90 & 0.52 \\ -0.21 & -0.19 \end{array}\right],\\ & F = \left[\begin{array}{cc} 0 & 0 \\ 0 & 0 \\ -4.03 & 0.81 \\ 0.24 & -0.31 \\ -4.99 & 1.02 \\ 0.16 & -0.27 \end{array}\right] \end{split} $$ (36)

      其中测量变量 $ {{\bar{y}}}^{\rm{T}} = \left[y(0)^{\rm{T}} y(1)^{\rm{T}} y(2)^{\rm{T}}\right] $ $ c_A $ , $ c_B $ 分别在0, 125 min及250 min时刻的量组成. 得到上述矩阵后, 可以构造(17)/(20)式所示的优化问题来求解被控变量, 结果如下:

      策略1方案1: $ H = [-0.0026\;0.0035] $ , 即整个时间段内都控制被控变量 $ c(t) = -0.0026 c_A+ 0.0035 c_B $ . 经计算, 前125 min的设定值为 $ c_s(1) = -0.000303 $ , 后125 min的设定值为 $ c_s(2) = -0.000059 $ .

      策略1方案2: 求解得到的扩张组合矩阵 $ \bar H $

      $$ \bar{H} = \left[\begin{array}{cccccc} 0 & 0 & -1.11 & 2.70 & 0 & 0 \\ 0 & 0 & 0.51 & 1.93 & -1.11 & 2.70 \end{array}\right] $$

      即整个时间段内被控变量为 $ c(t) = -1.11 c_A+ 2.70 c_B $ . 前125 min的设定值 $ c_s(1) = -0.33 $ , 后125 min设定值 $ c_s(2) = 0.20-0.51 c_A(1)-1.93 c_B(1) $ .

      策略2方案1: $ H(1) = [-0.0019\;0.0057] $ , $ H(2) = [-0.0015\;0.0074] $ , 即前125 min 被控变量 $ c(1) = -0.0019 c_A+0.0057 c_B $ , 后125 min被控变量 $ c(2) = -0.0015 c_A+0.0074 c_B $ , 其设定值分别为 $ c_s(1) = -0.00048 $ $ c_s(2) = -0.000034 $ .

      策略2方案2: 根据定理2, 求得扩张矩阵 $ \bar H $

      $$ \bar{H} = \left[\begin{array}{cccccc} 0 & 0 & -1.06 & 2.85 & 0 & 0 \\ 0 & 0 & 0.88 & 2.07 & -1.48 & 3.27 \end{array}\right] $$

      即前125 min被控变量 $ c(1) = -1.06 c_A+ 2.85 c_B $ , 设定值 $ c_s(1) = -0.29 $ , 后125 min被控变量 $ c(2) = -1.48 c_A+3.27 c_B $ , 设定值 $ c_s(2) = 0.31 - 0.88 c_A(1)-2.07 c_B(1) $ .

    • 由于 $ N = 2 $ 难以逼近整个间歇操作过程, 后文设置 $ N = 20 $ 并以相同的方法重新求解被控变量, 并且在测量变量中加入体积变量 $ V $ 提高优化效果. 从表2可观察到如下结果:

      表 2  损失函数 $ L_{\rm{av}} $

      Table 2.  Loss function $ L_{\rm{av}} $

      方案 $ N = 2 $ $ N = 20 $
      策略1方案1 0.0371 0.0083
      策略1方案2 0.03423 0.0024
      策略2方案1 0.0368 0.0069
      策略2方案2 0.03420 0.0022

      1. 四种方案的损失 $ L_{\rm{av}} $ 相比 $ N = 2 $ 都大幅度降低;

      2. 策略1方案1的损失函数为0.0083, 策略1方案2通过在线设定值修正, 进一步将损失减少到0.0024;

      3. 策略2方案1的损失为0.0069, 略低于策略1方案1;

      4. 策略1方案2(0.0024)和策略2方案2(0.0022)的损失很接近, 表明不切换被控变量也能得到较好的优化控制效果.

      基于表2的结果, 策略1方案2和策略2方案2效果接近, 但前者无需在线切换被控变量, 更易于在线控制, 因此考虑使用策略1方案2对该反应器进行批内自优化控制. 此外, 动态仿真中将与策略1方案1的结果进行对比, 有助于进一步理解本文方法.

      策略1方案1的被控变量为 $ c_1(t) = 0.0062 c_A+ 0.002 c_B+0.0831 V $ , 设定值轨线示于图4. 为进一步获取平滑的设定值轨线, 使操作更为平稳, 对这些离散点进行回归分析, 得到平滑的设定值轨迹方程 $ c_s(t) = 0.0877+3.705\times 10^{-5}t-1.97\times 10^{-8}t^2 $ , 为一条随时间 $ t $ 变化的连续曲线, 如图4所示. 对该系统, 可以采用普通的PI控制器对被控变量 $ c_1(t) $ 进行跟踪控制.

      图  4  策略1方案1的设定值轨线

      Figure 4.  Setpoint trajectory for Strategy 1 (Scheme 1)

      策略1方案2的被控变量为 $ c_2(t) = 0.0026 c_A+ 0.00032 c_B+0.0830 V $ , 设定值轨线在每批次运行过程中采集测量值进行在线修正. 为增强操作平稳性, 在 $ t_k $ 时刻计算得到 $ t_{k+1} $ 时刻的设定点后, 在 $ [t_k,t_{k+1}] $ 时间段内设置斜坡形设定值轨线, 使设定轨线维持连续性. 同样使用PI控制器跟踪控制得到的被控变量 $ c_2(t) $ .

      不确定参数 $ k_1 $ $ k_2 $ 分别改变+20%和-20%时的优化控制效果如图5所示, 从子图(a)中可以看到, 两种方法分别对 $ c_1(t) $ $ c_2(t) $ 都实现了较好的闭环跟踪控制, 其中 $ c_2(t) $ 的设定轨线根据批内采集到的测量值进行了调整, 相比自身的标称轨线有一定程度的上移; 子图(b)显示不同方法的控制输入 $ u(t) $ 轨迹, 其中控制 $ c_1(t) $ 时的 $ u(t) $ 轨迹相比标称操作更靠近当前工况真实的最优轨线, 性能指标 $ J $ 有所提高( $ J = 0.34374 \rightarrow 0.34505 $ ), 显示出一定的优化控制效果. 控制 $ c_2(t) $ 时的 $ u(t) $ 轨迹更靠近最优轨线, 其性能指标 $ J = 0.34701 $ 和最优值 $ J^{\rm{opt}} = 0.34755 $ 差别不大. 同时注意到控制 $ c_2(t) $ 时的 $ u(t) $ 轨迹振荡更加剧烈, 这是因为 $ c_2(t) $ 的设定轨线被不断在线修正, 为了得到满意的控制效果, 使用了高增益PI控制器( $ K_p = 20 $ ). 这并不影响最终得到了满意的优化效果( $ L = 0.00054 $ ), 从另一个角度说明了间歇过程中控制关键变量的重要性.

      图  5  批内自优化控制效果( $ k_1 $ : +20%, $ k_2 $ : -20%)

      Figure 5.  Within-batch self-optimizing performance ( $ k_1 $ : +20%, $ k_2 $ : -20%)

      不确定参数 $ k_1 $ $ k_2 $ 分别改变-40%和+40%时的优化控制效果如图6所示, 此时系统的不确定性向另一个方向变化, 并且幅度更大. 从图5(a)中可以看到, 两种方法同样对 $ c_1(t) $ $ c_2(t) $ 都实现了较好的闭环跟踪控制, 其中 $ c_1(t) $ 的设定轨线不变, 而 $ c_2(t) $ 的设定轨线相比自身的标称轨线有一定程度的下移. 从子图(b)来看, 虽然控制 $ c_1(t) $ 能将 $ u(t) $ 轨迹向着真实的最优轨线的方向调节, 其性能指标 $ J $ 从标称操作的0.09646提高到0.10312, 但作用有限, 距离最优值 $ J^{opt} = 0.12252 $ 仍有较大差距. 控制 $ c_2(t) $ 能进一步提高了优化控制效果, 其性能指标为 $ J = 0.11602 $ , 相比最优性能只有0.006的损失(此时 $ k_1 $ $ k_2 $ 的变化较大, 该损失在一定程度上由系统的非线性导致). 此外, 控制 $ c_2(t) $ 时的 $ u(t) $ 轨迹同样振荡较为剧烈, 但随反应进行, $ u(t) $ 大致围绕着最优轨线上下波动.

      图  6  批内自优化控制效果( $ k_1 $ : +40%, $ k_2 $ : -40%)

      Figure 6.  Within-batch self-optimizing performance ( $ k_1 $ : +40%, $ k_2 $ : -40%)

      表3进一步统计了100组随机扰动下各方法的非线性损失, 其中随机扰动 $ [k_1\; k_2] $ 均匀分布在各自的变化范围. 可以看到, 相比标称操作(平均损失0.0036)和以单变量 $ c_B $ (平均损失0.0042)为被控变量的情形, 两种批内自优化控制方法能有效提高了经济性能, 其中策略1方案1中控制 $ c_1(t) $ 将平均损失较少到0.0026, 策略1方案2中控制 $ c_2(t) $ 进一步将平均损失较少到0.0007, 几乎可以忽略不计. 此外, 最大损失和标准差等统计量也呈现出相同的变化趋势, 如表3所示.

      表 3  100组随机扰动下的非线性损失统计量

      Table 3.  Statistics of nonlinear losses for 100 groups of random disturbances

      方案 平均损失 最大损失 标准差
      标称操作 0.0036 0.0227 0.0068
      控制 $ c_B $ 0.0042 0.0165 0.0054
      策略1方案1 0.0026 0.0167 0.0050
      策略1方案2 0.0007 0.0053 0.0016
    • 本文研究了间歇过程的批内自优化控制问题, 在单批次运行过程中控制一组虚拟的被控变量(输出变量的线性组合), 实现间歇过程的实时优化. 对此, 给出了两种自优化控制策略(策略1: 被控变量恒定, 设定值时变; 策略2: 被控变量和设定值均时变), 对它们的设定值选取问题又分别提出两种方案(方案1: 设定值轨线固定不变; 方案2: 设定值轨线在线修正), 共计4种方法. 通过引入扩张组合矩阵 $ \bar H $ , 将这4种方法统一描述为具有不同结构约束的最优 $ \bar H $ 求解问题, 并推导得到了策略2方案2的 $ \bar H $ 解析解计算方法(定理2).

      文中提出的4种被控变量选择方法, 其对应的闭环控制系统具有不同的复杂度和优化性能. 针对一般的实际间歇过程, 应进行综合考虑这两个因素并取得合理权衡. 间歇反应器的仿真研究中, 采用策略1方案2(恒定被控变量: $ c_2(t) $ )得到的控制结构较为简单, 并且能通过在线修正 $ c_2(t) $ 的设定值增强优化效果, 是较为合理的方案.

WeChat 关注分享

返回顶部

目录

    /

    返回文章
    返回