Knowledge-data-driven Cooperative Optimal Control for Wastewater Treatment Denitrification Process
-
摘要: 为有效提升城市污水处理过程的脱氮效果, 提出一种知识和数据驱动的反硝化脱氮过程协同优化控制(Knowledge-data-driven cooperative optimal control, KDDCOC). 所提方法主要有以下两个方面: 首先, 建立一种基于自适应知识核函数的协同优化控制目标模型, 动态描述出水水质(Effluent quality, EQ)以及泵送能耗(Pumping energy consumption, PE)、关键变量的协同关系; 其次, 提出一种知识引导的协同优化算法(Knowledge guide-based cooperative optimization algorithm, KGCO), 快速准确求解硝态氮(Nitrate nitrogen, SNO)优化设定值, 提高KDDCOC的响应速度. KDDCOC利用比例−积分−微分(Proportional-integral-derivative, PID)控制器对硝态氮优化设定值进行跟踪, 将提出的KDDCOC应用于城市污水处理过程基准仿真模型 1 号(Benchmark simulation model No.1, BSM1), 实验结果表明, 该方法能够提高出水水质, 降低运行能耗, 有效改善脱氮效果.
-
关键词:
- 污水处理反硝化脱氮过程 /
- 知识和数据驱动 /
- 协同优化控制 /
- 自适应知识核函数 /
- 知识引导的协同优化算法
Abstract: In order to effectively improve the performance of wastewater treatment denitrification process, a knowledge-data-driven cooperative optimal control (KDDCOC) is proposed. The main work of this paper includes the following two points: First, a cooperative optimal control objective model, based on adaptive knowledge kernel function, is designed to dynamically describe the cooperative relationship among effluent quality (EQ), pumping energy consumption (PE), and key variables; Second, a knowledge guide-based cooperative optimization algorithm (KGCO) is proposed to quickly and accurately obtain the optimal set-points of nitrate nitrogen (SNO). Then, the response speed of KDDCOC is improved. A proportional-integral-derivative (PID) controller is used to track the optimal set-points of nitrate nitrogen. The proposed KDDCOC is applied to the benchmark simulation model No.1 (BSM1) of wastewater treatment process. The experimental results indicate that KDDCOC can improve the effluent quality and the efficiency of denitrification, reduce the energy consumption. -
随着我国工业化和城镇化进程的加快推进, 城市生活污水排放量逐年增加, 对城市污水处理能力提出新要求, 使其面临着达标排放和节能降耗的双重挑战[1-2]. 反硝化脱氮过程将硝态氮(Nitrate nitrogen, SNO)还原成氮气并释放到空气中, 是城市污水处理过程不可或缺的一环, 与此同时, 其泵送能耗(Pumping energy consumption, PE)已成为城市污水处理过程的运行能耗的主要组成部分[3-4]. 然而, 反硝化脱氮过程是一个典型的强非线性、不确定性严重的复杂系统, 涉及到物理处理、生物处理和化学处理等多种处理过程, 运行过程具有时变的特性, 导致其难以实现优化运行[5-6]. 因此, 如何设计一种反硝化脱氮过程优化控制策略, 有效提升出水水质(Effluent quality, EQ)的脱氮效果, 实现城市污水处理过程低碳、高效与可持续运行, 是亟待解决的难题.
为实现反硝化脱氮过程的优化控制, 一些学者提出基于机理模型的优化控制方法[7-8]. Plosz[9]提出基于生化反应池中反硝化脱氮过程动力学方程的优化控制策略, 该优化控制策略建立反硝化反应过程组分与EQ之间关系的表达, 结果表明, 该优化控制策略能够有效提高EQ, 降低总氮浓度(Total nitrogen concentration, $ N_{{\rm{tot}}}) $. Borzooei等[10] 提出基于活性污泥1号模型的优化控制策略, 该优化控制策略采用城市污水处理硝化反应过程和流体动力学描述固体停留时间与总操作成本之间的关系, 实验结果证明了该策略的有效性和可靠性. 然而, 由于城市污水处理过程的复杂性和时变特性, 基于机理模型的优化控制方法难以获得准确的城市污水处理反硝化脱氮过程的数学模型, 影响优化控制效果[11]. 为解决这个问题, 数据驱动的优化控制方法获得城市污水处理过程研究人员和工程师的关注[12-13]. Zhang等[14]设计基于动态贝叶斯网络的优化控制方法, 该优化控制方法建立$ S_{{\rm{NO}}} $、内回流(Internal recycle flow, $ Q_{a}) $、悬浮固体(Suspended solids, SS)、进水流量(Influent flow, $ Q_{{\rm{in}}}) $和EQ之间的关系. 仿真结果表明, 该优化控制方法能够获得反硝化脱氮过程动态的运行性能特征, 提高EQ的优化控制效果. Zeng等[15]为城市污水处理反硝化脱氮过程的泵送系统设计基于非线性规划模型和类电磁算法的优化控制方法. 非线性规划模型建立PE与其关键变量的关系, 类电磁算法获得使PE最小的优化设定值. 结果表明, 该优化控制方法使城市污水处理过程的PE显著降低. 然而, 上述模型只考虑运行能耗或EQ, 忽略运行能耗与EQ之间的内在联系, 导致其难以实现提质降耗的协同增效[16-17].
为协同优化控制运行能耗和EQ, Santín等[18]提出基于模型预测控制的分层优化控制方法, 该优化控制方法设计三层协同优化控制架构, 分别实现对$ S_{{\rm{NO}}} $、第四单元溶解氧浓度和第五单元溶解氧浓度的优化控制, 实现城市污水处理EQ和运行能耗的性能提升. Han等[19]为城市污水处理过程设计一种基于动态粒子群算法(Particle swarm optimization algorithm, PSO)的多工况协同优化控制方法. 该协同优化控制方法为不同工况设置不同种群规模的粒子群算法. 仿真结果表明, 所提出的优化控制方法可以提高城市污水处理过程的运行效率. 一些专家学者提出基于多目标优化算法的协同优化控制方法, 提高城市污水处理过程的运行能耗和EQ[20-22]. 尽管上述协同优化控制方法可以获得EQ和运行能耗的最优解, 但忽略数据采样区间不一致导致的EQ和运行能耗最佳优化控制周期差异[23-25]. 为解决这个问题, Han等[26]设计一种数据驱动粒子群优化算法的协同优化控制方法. 所提出的优化控制算法在运行能耗的最佳优化控制周期获得$ S_{{\rm{NO}}} $设定值和在EQ的最佳优化控制周期获得溶解氧的设定值. 实验结果表明, 该优化控制方法在EQ和运行能耗方面可以获得较好的性能. 然而, 这些数据驱动的协同优化控制方法依赖过程数据, 限制城市污水处理的EQ和运行能耗的性能提高[27-28]. 为减少协同优化控制方法对过程数据的依赖, Zhou等[29]提出一种城市污水处理过程基于知识引导的多目标操作优化控制方法, 该优化控制方法建立知识库用于指导优化算法求解优化设定值. 结果表明, 该优化控制方法利用知识提高优化控制性能, 保证水质的同时减少运行能耗. 上述知识驱动的优化控制方法有效减少优化控制方法对数据的依赖[30], 但如何根据城市污水处理反硝化脱氮过程运行特征, 建立数据和知识之间的动态联系, 设计协同优化控制方法是亟待解决的难题.
综上所述, 本文提出一种知识和数据驱动的污水处理反硝化脱氮过程协同优化控制方法 (Knowledge-data-driven cooperative optimal control, KDDCOC). 该方法主要有以下优势:
1) 构建基于自适应知识核函数的协同优化控制目标模型, 动态描述出水水质、运行能耗以及关键变量的关联关系, 设计自适应初始化模型参数策略, 获得准确的反硝化脱氮过程协同优化控制目标模型.
2) 提出知识引导的协同优化算法(Knowledge guide-based cooperative optimization algorithm, KGCO), 设计全局最佳选择机制和开发机制用于控制变量设定值的协同求解过程, 获取有效的控制变量优化设定值, 提高KDDCOC的响应速度.
3) 采用比例−积分−微分(Proportional-integral-derivative, PID)控制器跟踪优化设定值, 实现城市污水处理反硝化脱氮过程的协同优化控制.
1. 城市污水处理反硝化脱氮过程特性分析
城市污水处理过程如图1所示, 城市污水处理过程的生化反应池包括厌氧池、缺氧池和好氧池[31]. 生化反应池涉及许多复杂的生化和化学反应, 如硝化反应和反硝化反应. 反硝化反应发生在缺氧池中, 使用内回流泵将硝化液回流使硝酸盐分解为氮气, 从而实现脱氮, 反硝化脱氮过程的PE为运行能耗的主要部分[32]. 反硝化脱氮过程的主要操作特点可概括如下:
EQ和PE为城市污水处理反硝化脱氮过程的性能指标. 由于传感器的物理特性和城市污水处理过程固有的动态特性, 优化目标PE的相关变量的采样时间间隔为小时, 优化目标EQ的相关变量的采样时间间隔为分钟. 所以, PE以慢采样时间间隔为最佳优化控制周期, EQ以快采样时间间隔为最佳优化控制周期, 则PE和EQ的优化控制时刻表示为
$$ \begin{split} & \left\{\begin{aligned} & {t_1} = {t_0} + n{T_1},\quad n \in {{\bf{N}}^*}\\ & {t_2} = {t_1} + s{T_2} ,\quad s = 1,2,\cdots,\frac{T_1}{T_2} \end{aligned} \right. \end{split} $$ (1) 其中, $ t_0 $为开始时间, $T_1 $为慢采样时间间隔, $T_2 $为快采样时间间隔, $T_1/T_2 $为正整数, $t_1 $为PE和EQ的最佳优化控制时刻, $n $为从$t_1 $至$t_2$EQ和PE的共同优化控制次数, ${{\bf{N}}^*}$为正整数集, $t_2 $为EQ的最佳优化控制时刻, $s $为从$t_1 $至$t_2 $EQ的优化控制次数. 城市污水处理反硝化脱氮过程的采样数据用来建立PE、EQ与相关变量之间的关系, 即
$$ \begin{split} & \left\{ \begin{aligned} &{J_{{\rm{PE}}}}\left( {{t_1}} \right) = {l_{{\rm{PE}}}}\left( {{{\boldsymbol{x}}_{{\rm{PE}}}}\left( {{t_1}} \right)} \right)\\ &{J_{{\rm{EQ}}}}\left( {{t_1}} \right) = {l_{{\rm{EQ}}}}\left( {{{\boldsymbol{x}}_{{\rm{EQ}}}}\left( {{t_1}} \right)} \right)\end{aligned}\right.\\ &{J_{{\rm{EQ}}}}\left( {{t_2}} \right) = {l_{{\rm{EQ}}}}\left( {{{\boldsymbol{x}}_{{\rm{EQ}}}}\left( {{t_2}} \right)} \right) \end{split} $$ (2) 其中, $ l_{\rm{PE}}(\cdot) $为PE的未知非线性函数, $ l_{\rm{EQ}}(\cdot) $为EQ的未知非线性函数, ${\boldsymbol{x}}_{\rm{PE}}(t_1) = [S_{{\rm{NO}}}(t_1), Q_{{\rm{in}}}(t_1), MLSS(t_1)]$ 为$ t_1 $ 时刻PE的相关关键变量, $ MLSS(t_1) $为$ t_1 $时刻的混合液悬浮固体浓度, ${\boldsymbol{x}}_{\rm{EQ}}(t_1) = [S_{{\rm{NO}}}(t_1), Q_{{\rm{in}}}(t_1), SS(t_1)]$为$ t_1 $时刻EQ的相关关键变量, $S_{{\rm{NO}}}(t_1)$为 $ t_1 $时刻的决策变量, ${\boldsymbol{x}}_{\rm{EQ}}(t_2) = [S_{{\rm{NO}}}(t_2), \ Q_{{\rm{in}}}(t_2), SS(t_2)]$为$ t_2 $时刻EQ的相关变量, $S_{{\rm{NO}}}(t_2)$为$ t_2 $时刻的决策变量. 现有的优化控制策略在最小公共采样时刻计算$S_{{\rm{NO}}}$的最优解作为优化设定值, 并操作$ Q_{a} $使实际$S_{{\rm{NO}}}$跟踪优化设定值, 这实际上降低了优化控制频率, 大部分采样数据未能被合理应用, 最终使城市污水处理反硝化脱氮过程在PE和EQ方面性能下降.
2. 知识和数据驱动的污水处理反硝化脱氮过程协同优化控制
为实现城市污水处理反硝化脱氮过程的协同优化运行, 本文提出KDDCOC, 如图1所示. KDDCOC包括基于自适应知识核函数的协同优化控制目标模型、KGCO和PID.
2.1 基于自适应知识核函数的协同优化控制目标模型
为准确描述城市污水处理反硝化脱氮过程EQ、PE以及关键变量的动态关系, 本文建立基于自适应知识核函数的协同优化控制模型, 并提出自适应初始化模型参数策略预置协同优化控制目标模型参数.
2.1.1 协同优化控制目标模型
基于第1节对城市污水处理过程反硝化脱氮过程的特征分析, 本文设计协同优化控制目标模型. 当$ t = t_1 $时, 优化目标和约束条件为
$$ \begin{split} &{\rm{min }}\left[ {{J_{{\rm{PE}}}}\left( {{{\boldsymbol{x}}_{{\rm{PE}}}}({t_1})} \right),} \right.\left. {{J_{{\rm{EQ}}}}\left( {{{\boldsymbol{x}}_{{\rm{EQ}}}}({t_1})} \right)} \right]\\ &{\rm{s}}{\rm{.t}}{\rm{.}}\left\{ \begin{aligned} &0.3\;{\rm{mg/l}} \le {S_{{\rm{NO}}}}\left( {{t_1}} \right) \le 2\;{\rm{mg/l}}\\ &40\;{\rm{mg/l}} \le SS\left( {{t_1}} \right) \le 120\;{\rm{mg/l}} \end{aligned} \right. \end{split} $$ (3) 其中, 最小化PE和EQ为优化目标. 当$ t = t_2 $时, 优化目标和约束条件为
$$ \begin{split} &{\rm{min }}{J_{{\rm{EQ}}}}\left( {{{\boldsymbol{x}}_{{\rm{EQ}}}}({t_2})} \right)\\ &{\rm{s}}{\rm{.t}}{\rm{.}}\left\{ \begin{aligned} &{J_{{\rm{PE}}}}\left( {{S_{{\rm{NO}}}}({t_2}),{Q_{{\rm{in}}}}({t_2}),MLSS({t_1})} \right) \le\\ &\qquad {{J'}_{{\rm{PE}}}}\left( {{t_2}} \right)\\ &0.3\;{\rm{mg/l}} \le {S_{{\rm{NO}}}}\left( {{t_2}} \right) \le 2\;{\rm{mg/l}}\\ &40\;{\rm{mg/l}} \le SS\left( {{t_2}} \right) \le 120\;{\rm{mg/l}} \end{aligned} \right. \end{split} $$ (4) 其中, 最小化EQ为优化目标, $J'_{\rm{PE}}(t_2)$为$ t_2 $时刻PE的预测值, 具体计算为
$$ {J'_{{\rm{PE}}}}\left( {{t_2}} \right) = \alpha {J_{{\rm{PE}}}}\left( {{t_1}} \right) + \left( {1 - \alpha } \right){J'_{{\rm{PE}}}}\left( {{t_2} - {T_2}} \right) $$ (5) 其中, $ J'_{{\rm{PE}}}({{t_2}-{T_2}}) $ 为$ t_2-T_2 $时刻的预测值, $ J_{{\rm{PE}}}(t_1) $为$ t_1 $ 时刻PE的实际值, $ \alpha \in{(0,1)} $ 为一个由经验知识取值的参数. 基于式(3), $ t_1 $时刻建立PE和EQ的非线性模型为
$$ \begin{split} {J_{{\rm{PE}}}}\left( {{{\boldsymbol{x}}_{{\rm{PE}}}}\left( {{t_1}} \right)} \right) =\;& \sum\limits_{\kappa = 1}^K {{W_{{\rm{PE}},\kappa }}\left( {{t_1}} \right)} \;\times \\ &\sum\limits_{\kappa = 1}^K {{{\rm{e}}^{ - \frac{{\left\| {{{\boldsymbol{x}}_{{\rm{PE}}}}\left( {{t_1}} \right) - {{{\varphi }}_{{\rm{PE}},\kappa }}\left( {{t_1}} \right)} \right\|}}{{2{b^2_{{\rm{PE}},\kappa }}{{\left( {{t_1}} \right)}}}}}}} \; + \\&{W_{{\rm{PE}},0}}\left( {{t_1}} \right) \end{split} $$ (6) $$ \begin{split} {J_{{\rm{EQ}}}}\left( {{{\boldsymbol{x}}_{{\rm{EQ}}}}\left( {{t_1}} \right)} \right) = \;&\sum\limits_{\kappa = 1}^K {{W_{{\rm{EQ}},\kappa }}\left( {{t_1}} \right)} \;\times \\ &\sum\limits_{\kappa = 1}^K {{{\rm{e}}^{ - \frac{{\left\| {{{\boldsymbol{x}}_{{\rm{EQ}}}}\left( {{t_1}} \right) - {{{\varphi }}_{{\rm{EQ}},\kappa }}\left( {{t_1}} \right)} \right\|}}{{2{b^2_{{\rm{EQ}},\kappa }}{{\left( {{t_1}} \right)}}}}}}} \; + \\ &{W_{{\rm{EQ}},0}}\left( {{t_1}} \right) \end{split} $$ (7) 其中, $ J_{{\rm{PE}}}\left( {{{\boldsymbol{x}}_{{\rm{PE}}}}\left( {{t_1}} \right)} \right) $为PE的非线性模型在$ t_1 $时刻的输出, $ {J_{{\rm{EQ}}}}\left( {{{\boldsymbol{x}}_{{\rm{EQ}}}}\left( {{t_1}} \right)} \right) $为EQ的非线性模型在$ t_1 $时刻的输出, $ K $为核函数的个数, $ {W_{{\rm{PE}},\kappa }}\left( {{t_1}} \right) $, $ {W_{{\rm{EQ}},\kappa }}\left( {{t_1}} \right) $, $ {W_{{\rm{PE}},0}}\left( {{t_1}} \right) $, $ {W_{{\rm{EQ}},0}}\left( {{t_1}} \right) $ 为 $ t_1 $时刻核函数的权重, $ {b_{{\rm{PE}},\kappa }{\left( {{t_1}} \right)}} $ 和 $ {b_{{\rm{EQ}},\kappa }{\left( {{t_1}} \right)}} $ 为 $ t_1 $时刻核函数的宽度, $ {{{\varphi }}_{{\rm{PE}},\kappa }}\left( {{t_1}} \right) $ 和 $ {{{\varphi }}_{{\rm{EQ}},\kappa }}\left( {{t_1}} \right) $ 为 $ t_1 $时刻核函数的中心向量, ${{{\boldsymbol{x}}_{{\rm{PE}}}}\left( {{t_1}} \right)}$ 和 ${{{\boldsymbol{x}}_{{\rm{EQ}}}}\left( {{t_1}} \right)}$为$ t_1 $时刻模型的输入变量. 基于式(4), $ t_2 $时刻建立EQ的非线性模型为
$$ \begin{split} {J_{{\rm{EQ}}}}\left( {{{\boldsymbol{x}}_{{\rm{EQ}}}}\left( {{t_2}} \right)} \right) =\;& \sum\limits_{\kappa = 1}^K {{W_{{\rm{EQ}},\kappa }}\left( {{t_2}} \right)} \; \times \\ &\sum\limits_{\kappa = 1}^K {{{\rm{e}}^{ - \frac{{\left\| {{{\boldsymbol{x}}_{{\rm{EQ}}}}\left( {{t_2}} \right) - {{{\varphi }}_{{\rm{EQ}},\kappa }}\left( {{t_2}} \right)} \right\|}}{{2{b^2_{{\rm{EQ}},\kappa }}{{\left( {{t_2}} \right)}}}}}}} \; + \\ &{W_{{\rm{EQ}},0}}\left( {{t_2}} \right) \end{split} $$ (8) 其中, $ {J_{{\rm{EQ}}}}\left( {{{\boldsymbol{x}}_{{\rm{EQ}}}}\left( {{t_2}} \right)} \right) $为EQ的非线性模型在$ t_2 $时刻的输出, $ {W_{{\rm{EQ}},\kappa }}\left( {{t_2}} \right) $和$ {W_{{\rm{EQ}},0}}\left( {{t_2}} \right) $为$ t_2 $时刻的核函数的权重, $ {b_{{\rm{EQ}},\kappa }{\left( {{t_2}} \right)}} $为$ t_2 $时刻核函数的宽度, $ {{{\varphi }}_{{\rm{EQ}},\kappa }}\left( {{t_2}} \right) $为$ t_2 $时刻核函数的中心向量, $ {{{\boldsymbol{x}}_{{\rm{EQ}}}}\left( {{t_2}} \right)} $为$ t_2 $时刻EQ的非线性模型的输入变量.
2.1.2 自适应初始化模型参数策略
在实际的城市污水处理过程中, $ Q_{{\rm{in}}} $和入水组分是随时间变化的, 呈现出周期性和规律性. 利用周期性和规律性, 城市污水处理过程优化控制目标模型可以对相似的工况设置相同的初始参数值以辅助提高模型精度. 根据$ Q_{{\rm{in}}} $和优化控制目标的关键变量, 将城市污水处理过程的历史信息划分为不同工况, 记录为
$$ {{\boldsymbol{I}}^\ell }\left( t \right):\left\langle {Q_{{\rm{in}}}^\ell \left( t \right),{{\boldsymbol{x}}^\ell }\left( t \right);{{\boldsymbol{Ini}}^\ell }\left( t \right)} \right\rangle $$ (9) 其中, $ {{\boldsymbol{I}}^\ell }( t ) $为优化控制第$ \ell $个工况的历史信息, $Q_{{\rm{in}}}^\ell ( t )$为优化控制第$ \ell $个工况的入水流量, $ {{\boldsymbol{x}}^\ell }( t ) $为优化控制第$ \ell $个工况的关键变量, $ {{\boldsymbol{Ini}}^\ell }( t ) $为优化控制第$ \ell $个工况下的模型初始参数值. 根据相似度判断当前工况所属工况类型, 相似度具体计算为
$$ \begin{split} {z^\ell }\left( t \right) =\;& 1 - {\beta _0}\frac{{\left| {Q_{{\rm{in}}}^{{\rm{cur}}}\left( t \right) - Q_{{\rm{in}}}^\ell \left( t \right)} \right|}}{{\max \left( {\left| {Q_{{\rm{in}}}^{{\rm{cur}}}\left( t \right) - {Q_{{\rm{in}}}}\left( t \right)} \right|} \right)}}\; - \\ &\sum\limits_{\sigma = 1}^\Omega {{\beta _\sigma }\frac{{\left| {{{\boldsymbol{x}}^{{\rm{cur}},\sigma }}\left( t \right) - {{\boldsymbol{x}}^{\ell ,\sigma }}\left( t \right)} \right|}}{{\max \left( {\left| {{{\boldsymbol{x}}^{{\rm{cur}}}}\left( t \right) - {{\boldsymbol{x}}^\ell }\left( t \right)} \right|} \right)}}} \end{split} $$ (10) 其中, $ {z^\ell }\left( t \right) $为优化控制当前工况与第$ \ell $个历史工况的相似度, $ {\beta _0} $为$ Q_{{\rm{in}}} $的权重参数, $ {\beta _\sigma } $为$ {{\boldsymbol{x}}^\ell } $的第$ \sigma $个分量的权重参数, 约束为
$$ {\beta _0} + \sum\limits_{\sigma = 1}^\Omega {{\beta _\sigma }} = 1 $$ (11) 当$ {z^\ell }\left( t \right) $大于阈值$ \eta $时, 初始化当前工况的模型的参数
$$ {{{\boldsymbol{Ini}}}^{{\rm{cur}}}}\left( t \right) = {{{\boldsymbol{Ini}}}^\ell }\left( t \right) $$ (12) 其中, $ {{{\boldsymbol{Ini}}}^{{\rm{cur}}}}( t ) $为当前工况的协同优化控制目标模型的初始参数值. 根据第2.1.1节的介绍, $ t = t_1 $时, ${{{\boldsymbol{Ini}}}^{{\rm{cur}}}}( t_1 ) \;=\; [K,{W_{{\rm{PE}},\,\kappa }}( {{t_1}} ),\;{W_{{\rm{EQ}},\,\kappa }}( {{t_1}} ),$ ${W_{{\rm{PE}},0 }}( {{t_1}} ), {W_{{\rm{EQ}},0 }}( {{t_1}} ),\;{b_{{\rm{PE}},\kappa }{( {{t_1}} )}},\;{b_{{\rm{EQ}},\kappa }{( {{t_1}} )}},{b_{{\rm{PE}},0 }{( {{t_1}} )}},$ ${b_{{\rm{EQ}},0 }{( {{t_1}} )}}, {{{\varphi }}_{{\rm{PE}},\kappa }}( {{t_1}} ),{{{\varphi }}_{{\rm{EQ}},\kappa }}( {{t_1}} )]$ 为第$ \ell $个工况下初始化的模型参数; $t = t_2$ 时, ${{{\boldsymbol{Ini}}}^{{\rm{cur}}}}( t_2 ) = [K,{W_{{\rm{EQ}},\kappa }}( {{t_2}} ),{W_{{\rm{EQ}},0 }}( {{t_2}} ), {b_{{\rm{EQ}},\kappa }{( {{t_2}} )}},\ {b_{{\rm{EQ}},0 }{( {{t_2}} )}},$ $ {{{\varphi }}_{{\rm{EQ}},\kappa }}( {{t_2}} )] $ 为第 $ \ell $个工况下初始化的模型参数.
基于自适应知识核函数的协同优化控制目标模型充分考虑城市污水处理反硝化脱氮过程的数据采样时间不匹配的问题, 设计$ t_1 $时刻的优化控制目标PE和EQ的模型, $ t_2 $时刻的优化控制目标EQ的模型, 并自适应初始化模型参数, 充分利用城市污水处理反硝化脱氮过程的采样数据和历史信息, 在所有最佳优化控制时刻提供协同优化控制PE和EQ的数学模型, 确定协同优化控制的周期, 以满足PE和EQ协同增效的目的.
2.2 知识引导的协同优化算法
为求解协同优化控制目标的优化设定值, 本文提出KGCO. KGCO从种群的进化过程获取知识并利用知识引导种群进化, 具体包括全局最优选择机制设计和开发机制设计.
2.2.1 全局最佳选择机制
多目标粒子群优化算法(Multiple objective particle swarm optimization algorithm, MOPSO)中每个粒子通过重复应用速度和位置的更新规则在搜索空间中移动, $ S_{{\rm{NO}}} $为$ t_1 $时刻和$ t_2 $时刻的决策变量, 所以粒子的位置和速度为
$$ {y_{t,i}}\left( k \right) = {S_{{\rm{NO}},t,i}}\left( k \right) $$ (13) $$ {v_{t,i}}\left( k \right) = \Delta {S_{{\rm{NO}},t,i}}\left( k \right) $$ (14) 其中, $ k $为当前迭代次数, $i = 1,2,\cdots,{\Lambda}$, ${\Lambda}$为种群规模, $ y_{t,i}(k) $为$ t $时刻粒子$ i $第$ k $代的位置, 其物理含义为$ t $时刻粒子$ i $第$ k $代的$S_{{\rm{NO}}}$值, $ v_{t,i}(k) $为$ t $时刻粒子$ i $第$ k $代的速度, 其物理含义为$ t $时刻粒子$ i $第$ k $代的$ S_{{\rm{NO}}} $变化值. 粒子的速度和位置的更新规则为
$$ \begin{split} {v_{t,i}}\left( {k + 1} \right) =\;& \omega {v_{t,i}}\left( k \right) + \\ &{c_1}{r_1}\left( {pBes{t_{t,i}}\left( k \right) - {y_{t,i}}\left( k \right)} \right) + \\&{c_2}{r_2}\left( {gBes{t_t}\left( k \right) - {y_{t,i}}\left( k \right)} \right) \end{split} $$ (15) $$ {y_{t,i}}\left( {k + 1} \right) = {y_{t,i}}\left( k \right) + {v_{t,i}}\left( {k + 1} \right)\qquad\quad\; $$ (16) 其中, $ \omega $为惯性权重, $ c_1 $为自我认知系数, $ c_2 $为社会认知系数, $ r_1 $和$ r_2 $为区间(0, 1)的随机数, $ gBest_t(k) $ 为$ t $时刻第$ k $代的全局最优粒子, $ pBest_{t,i}(k) $为$ t $时刻粒子$ i $第$ k $代的个体最优粒子
$$ \begin{split} &pBes{t_{t,i}}\left( k \right) =\\ &\qquad\left\{ \begin{aligned} &{y_{t,i}}\left( k \right),&& {y_{t,i}}\left( k \right)\succ pBes{t_{t,i}}\left( {k - 1} \right)\\ &pBes{t_{t,i}}\left( {k - 1} \right),&&{{\rm{否则}}} \end{aligned} \right. \end{split} $$ (17) 其中, $ \succ $表示支配关系, 其定义为
$$ \begin{split} &{y_{t,i}}(k) \succ pBes{t_{t,i}}(k - 1),\\ &\quad \quad {\rm{若}}\left\{ \begin{aligned} &{J_{{\rm{PE}}}}\left( {{y_{t,i}}(k)} \right) \le {J_{{\rm{PE}}}}\left( {pBes{t_{t,i}}(k - 1)} \right)\\ &{J_{{\rm{EQ}}}}\left( {{y_{t,i}}(k)} \right) < {J_{{\rm{EQ}}}}\left( {pBes{t_{t,i}}(k - 1)} \right) \end{aligned} \right.\\ &\quad \quad {\rm{或}}\left\{ \begin{aligned} &{J_{{\rm{PE}}}}\left( {{y_{t,i}}(k)} \right) < {J_{{\rm{PE}}}}\left( {pBes{t_{t,i}}(k - 1)} \right)\\ &{J_{{\rm{EQ}}}}\left( {{y_{t,i}}(k)} \right) \le {J_{{\rm{EQ}}}}\left( {pBes{t_{t,i}}(k - 1)} \right) \end{aligned} \right.{\rm{ }} \end{split} $$ (18) 其中, $ J_{\rm{PE}}(\cdot) $为粒子关于优化目标PE的适应度值, 即PE值, $ J_{\rm{EQ}}(\cdot) $为粒子关于优化目标EQ的适应度值, 即EQ值. 不被其他粒子支配的解为非支配解, 种群中的非支配解被存储在档案$ {\boldsymbol{A}}_t(k) $中. 更新档案$ {\boldsymbol{A}}_t(k) $为
$$ {{\boldsymbol{A}}_t}\left( k \right) = \left\{ \begin{aligned} &{{\boldsymbol{A}}_t}\left( {k - 1} \right) \cup pBes{t_{t,i}}\left( {k - 1} \right),\\ \ &\;\;\qquad\quad\qquad pBes{t_{t,i}}\left( {k - 1} \right) \succ y_{t,d}^*\left( k \right)\\ &{{\boldsymbol{A}}_t}\left( {k - 1} \right),\;{\rm{否则}} \end{aligned} \right. $$ (19) 其中, $ {{\boldsymbol{A}}_t}( k ) = \{ {y_{t,1}^*( k ),\cdots,y_{t,d}^*( k ),\cdots,y_{t,D}^*( k )} \} $为$ t $时刻第$ k $代的第$ d $个非支配解, $ D $为$ {\boldsymbol{A}}_t(k) $的大小.
$ {\boldsymbol{A}}_t(k) $中每个维度粒子的支配差作为引导知识, 引导知识的和确定粒子的支配程度. 首先, 为消除不同维度适应度之间的差异, 将$ {\boldsymbol{A}}_t(k) $中非支配解的适应度值归一化为
$$ {\bar J_m}\left( {y_{t,d}^*\left( k \right)} \right) = \frac{{{J_m}\left( {y_{t,d}^*\left( k \right)} \right) - J_m^{\min }\left( {{y_t^*}\left( k \right)} \right)}}{{J_m^{\max }\left( {y_t^*\left( k \right)} \right) - J_m^{\min }\left( {y_t^*\left( k \right)} \right)}} $$ (20) 其中, $ m\in M $, $ M = \{{\rm{PE}},{\rm{EQ}}\} $, $ {\bar{J}}_m(\cdot) $为目标$ m $的归一化适应度值, $ J_m(y_{t,d}^*\left( k \right)) $为非支配解$ y_{t,d}^*\left( k \right) $关于目标$ m $的适应度值, $ J^{\rm{min}}_m(y_{t}^*\left( k \right)) $为非支配解关于目标$ m $的最小适应度值, $ J^{\rm{max}}_m(y_{t}^*\left( k \right)) $为非支配解关于目标$ m $的最大适应度值.
非支配解$ y_{t,d}^*\left( k \right) $关于目标$ m $的引导知识为
$$ {g_m}\left( {y_{t,d}^*\left( k \right),y_{t,d'}^*\left( k \right)} \right) = {\bar J_m}\left( {y_{t,d}^*\left( k \right)} \right) - {\bar J_m}\left( {y_{t,d'}^*\left( k \right)} \right) $$ (21) 其中, $ {g_m}( {y_{t,d}^*( k),y_{t,d'}^*( k)}) $为$ y_{t,d}^*( k) $ 和$ y_{t,d'}^*( k) $关于目标$ m $的适应度差值. 如果$ y_{t,d}^*( k) $在目标$ m $上支配$ y_{t,d'}^*( k) $, $ {g_m}( {y_{t,d}^*( k),y_{t,d'}^*( k)}) $为正数, 视作有效的引导知识; 否则, $ {g_m}( {y_{t,d}^*( k),y_{t,d'}^*( k)}) $为非正数, 视作无效的引导知识. 第$k $代中非支配解的有效引导知识之和计算为
$$ \begin{split} G\left( {y_{t,d}^*\left( k \right)} \right) = \;&\sum\limits_{d' = 1}^D {\sum\limits_{m \in M} {\frac{{\left| {{g_m}\left( {y_{t,d}^*\left( k \right),y_{t,d'}^*\left( k \right)} \right)} \right|}}{2}}} \;+\\ &\sum\limits_{d' = 1}^D {\sum\limits_{m \in M} {\frac{{{{g_m}\left( {y_{t,d}^*\left( k \right),y_{t,d'}^*\left( k \right)} \right)}}}{2}}} \end{split} $$ (22) 其中, $ G( {y_{t,d}^*( k )} ) $为非支配解$ y_{t,d}^*( k ) $的有效引导知识之和. $ G( {y_{t,d}^*( k )} ) $的值越大, 非支配解$ y_{t,d}^*( k ) $的支配性就越强. $ {\boldsymbol{A}}_t(k) $中具有最大$ G(k) $的非支配解选择为$ gBest_t(k) $, 其可以表示为
$$ gBes{t_t}\left( k \right) = \arg \mathop {\max }\limits_{{{y}}_{t,d}^*\left( k \right) \in {{\boldsymbol{A}}_t}\left( k \right)} \left\{ {G\left( {{{\boldsymbol{A}}_t}\left( k \right)} \right)} \right\} $$ (23) 具有较强支配优势的全局最优个体可以引导种群进化到同时具有PE和EQ的最优适应度的位置.
2.2.2 开发机制设计
在开发机制中, 个体最优粒子可以引导粒子向多个方向移动, 以提高局部开发能力. 在第$ k $代中, 粒子的开发知识为个体最优粒子在历史进化过程中的适应度在各个目标上的差值, 开发知识的和用来判断种群的进化状态. 开发知识具体计算为
$$ \begin{split} {h_{t,i,m}}\left( k \right) =\;&\sum\limits_{\tau = 1}^\lambda \Big[{{\bar J}_m}\left( {pBes{t_{t,i}}\left( {k - \tau } \right)} \right) - \\ &{{\bar J}_m}\left( {pBes{t_{t,i}}\left( {k - \tau + 1} \right)} \right) \Big]\end{split} $$ (24) 其中, $ {h_{t,i,m}}\left( k \right) $为 $ t $时刻第$ k $代粒子$ i $关于目标$ m $的开发知识, $ \lambda $为记录的历史代数, $ 1\leq \tau \leq \lambda $, $ \bar J_m(\cdot) $ 为式(20)计算的目标$ m $的归一化适应度值. 第$ k $代种群的开发知识的和为
$$ {H_t}\left( k \right) = {\sum\limits_{i = 1}^\Lambda {\sum\limits_{m \in M} {{h_{t,i,m}}\left( k \right)} } } $$ (25) 如果$ {H_t}\left( k \right) $大于$ {H_t}\left( k-1 \right) $, 则种群处于开发状态, 粒子的速度更新规则为
$$ \begin{split} {v_{t,i}}\left( {k + 1} \right) =\;& \omega {v_{t,i}}\left( k \right) + \\ &{c_1}{r_1}\left( {pBes{t_{t,i}}\left( k \right) - {y_{t,i}}\left( k \right)} \right) + \\&{c_2}{r_2}\left( {gBes{t_t}\left( k \right) - {y_{t,i}}\left( k \right)} \right) + \\ &{c_3}{r_3}{P_{t,i}}\left( k \right) \end{split} $$ (26) 其中, $ r_3 $为区间(0, 1)的随机数, $ c_3 $为与开发加速度相关的飞行参数, $ {P_{t,i}}\left( k \right) $为$ t $时刻第$ k $代粒子$ i $的方向知识, 即
$$ {P_{t,i}}( k ) = \frac1{\lambda}\sum\limits_{\tau = 1}^\lambda {pBes{t_{t,i}}( {k - \tau + 1} ) - pBes{t_{t,i}}( {k - \tau } )} $$ (27) KGCO算法的伪代码如下:
1: 初始化种群规模$ \it{\Lambda} $, 档案大小$ D $, 最大迭代次数$ k_{{\rm{max}}} $, 种 群速度和位置;
2: for $ k = 1:k_{{\rm{max}}} $ do
3: for $i = 1: \Lambda$ do
4: 计算粒子$ i $的适应度$J_{\rm{PE}}(y_{t,i}(k)), J_{\rm{EQ}}(y_{t,i}(k))$;
5: 更新个体最优位置并计算开发知识;
6: 计算引导知识并更新全局最优位置;
7: if $ {H_t}\left( k \right)>{H_t}\left( k-1 \right) $
8: 根据式(26)更新粒子$ i $的速度$ v_{t,i}(k+1) $;
9: else
10: 根据式(15)更新粒子$i $的速度$ v_{t,i}(k+1) $;
11: end if
12: 根据式(16)更新粒子$i $的位置$ y_{t,i}(k+1) $;
13: end for
14: end for
15: return最优位置
为提高求解速度和质量, 本文提出知识引导的协同优化算法, 其中包括全局最佳选择机制和开发机制. 全局最佳选择机制和开发机制设计用于MOPSO, 在$ t_1 $时刻求解如式(3)所示以PE和EQ为优化目标的优化问题, 获得$ S_{{\rm{NO}}} $的最优解; 开发机制设计用于PSO, 在$ t_2 $时刻求解如式(4)所示以EQ为优化目标的优化问题, 获得$ S_{{\rm{NO}}} $的最优解. 全局最佳选择机制设计和开发机制设计应用于MOPSO和PSO中, 从而实现协同求解优化控制目标.
2.3 PID控制
为有效地跟踪$ S_{{\rm{NO}}} $的优化设定值, KDDCOC使用PID控制. $ Q_{a} $为控制变量, $ S_{{\rm{NO}}} $为被控变量. 控制律计算为
$$ u\left( t \right) = {C_P}\left[ {e\left( t \right) + {C_I}\int_0^t {e\left( t \right){\rm{d}}t + {C_D}\frac{{{\rm{d}}e\left( t \right)}}{{\rm{d}}t}} } \right] $$ (28) 其中, $ {C_P} $为$ S_{{\rm{NO}}} $的比例系数, $ {C_PC_I} $为$ S_{{\rm{NO}}} $的积分时间常数, $ {C_PC_D} $为$ S_{{\rm{NO}}} $的微分时间常数, $ e(t) $ 为$ S_{{\rm{NO}}} $的跟踪误差, 即
$$ e\left( t \right) = r\left( t \right) - y\left( t \right) $$ (29) 其中, $ r(t) $为优化算法获得的$ S_{{\rm{NO}}} $在$ t $时刻的优化设定值, $ y(t) $为$ S_{{\rm{NO}}} $在$ t $时刻的实际输出值. 基于式(28)和式(29), PID控制器可以根据$S_{{\rm{NO}}} $的实际输出值和$S_{{\rm{NO}}} $的预期输出值之间的误差信号及时调整. 因此, KDDCOC可以及时跟踪$ S_{{\rm{NO}}} $的优化设定值. 图2介绍了KDDCOC的流程.
3. 实验结果及分析
为验证KDDCOC的性能, 本文实验利用基准仿真模型1号(Benchmark simulation model No.1, BSM1)仿真城市污水处理反硝化脱氮过程. 同时, 将KDDCOC与基于动态多目标粒子群优化的优化控制算法(Optimal control based on dynamic multi-objective particle swarm optimization algorithm, DMOPSO-OC)[20]、动态多目标优化控制(Dynamic multi-objective optimal control, DMOOC)[21]以及PID进行对比. 实验使用MATLAB 2021b版编程, 并在具有Microsoft Windows11.0环境的PC上运行.
3.1 实验设置
为评估KDDCOC的性能, 使用城市污水处理过程的运行性能指标EQ、PE、综合费用(Total consume, TC)和绝对误差积分(Integral of absolute error, IAE)对优化控制效果进行评价. TC具体计算为
$$ {{{{TC}}}} = {{{{PEC}}}} + {{{{EQF}}}} $$ (30) 其中, PEC为PE的费用, 按0.197 €$ /({\rm{kW}}\cdot{\rm{h}}) $的平均电价计算, EQF为EQ超标的罚款, 按0.10 €/(kg pollution unit)的平均出水罚款计算. IAE具体计算为
$$ {\mathop{ {{IAE}}}\nolimits} \left( t \right) = \int_{{t_0}}^{{t_f}} {\left| {r\left( t \right) - y\left( t \right)} \right|{\rm d}t} $$ (31) 其中, $ t_f $为优化控制终止时间.
根据城市污水处理反硝化脱氮过程的运行特征, 设置慢采样时间间隔$ T_1 $为2 h, 快采样时间间隔$ T_2 $为0.5 h, 则在$ T_1 $时间内优化控制EQ的次数为4. 为降低$ N_{{\rm{tot}}} $浓度, 将历史工况划分为两种工况, 分别为超标$ N_{{\rm{tot}}} $和未超标$ N_{{\rm{tot}}} $. 根据经验知识, 阈值$ \eta $为0.6. 为公平起见, 参考DMOPSO-OC和DMOOC的参数设置, 将KDDCOC、DMOPSO-OC和DMOOC的种群规模和档案大小统一为50, 最大迭代次数为100. 为使KGCO具备收敛性和多样性, 开发加速度飞行参数$ c_3 $设置为2.0. KDDCOC默认记录的历史代数$ \lambda = 5 $, 表1和表2分别展示了干燥天气下和暴雨天气下$ \lambda $值为1, 5, 10对应的结果. 表中, KDDCOC$ {\text{-}}\lambda_1 $表示$ \lambda = 1 $; KDDCOC${\text{-}}\lambda_2 $表示$ \lambda = 10 $. 当$ \lambda = 5 $时, KDDCOC具有最小的综合花费, 为城市污水处理反硝化脱氮过程带来更好的经济效益; 当$ \lambda = 1 $时, $ \lambda $设置过小对种群状态过于敏感, 无法准确判断种群是否处于开发状态; 当$ \lambda = 10 $时, $ \lambda $设置过大会降低种群对开发状态的响应速度.
表 1 干燥天气下不同优化控制方法的详细性能Table 1 Detailed performance of different optimal control methods in dry weather表 2 暴雨天气下不同优化控制方法的详细性能Table 2 Detailed performance of different optimal control methods in storm weather在BSM1中, 设置Qa的上限为92 230 $( {\rm{m^3/d}})$. BSM1可以模拟不同天气(如干燥天气和暴雨天气)条件下14天的进水流量. 实验考虑干燥和暴雨两种天气条件. 一旦时间$ t = t_1 $或$ t = t_2 $, KDDCOC建立协同优化控制目标模型, 并使用KGCO求解$ S_{{\rm{NO}}} $的最优解. 然后, KDDCOC随机选择一个$ S_{{\rm{NO}}} $的最优解作为优化设定值, PID控制对优化设定值进行跟踪控制.
3.2 结果及分析
对于干燥天气条件, 详细结果见图3 ~ 9. $ S_{{\rm{NO}}} $的优化和控制结果如图3所示, 在图3(a)中优化设定值随时间的动态曲线如图中的蓝色实线所示; 控制器的跟踪轨迹如黑色虚线所示; $ S_{{\rm{NO}}} $的实际输出和优化设定值之间的跟踪误差如图3(b)所示, 误差保持在$\pm0.53\;{\rm{mg/l}}$的范围内. $ S_{{\rm{NO}}} $的优化设定值可以动态变化, 以反映城市污水处理过程的动态特性, 控制器可以稳定地跟踪最优解, 如图4所示, 操作变量$ Q_{a} $可以相应地随时间变化. 图5 ~ 7分别为KDDCOC和其他优化控制方法在干燥天气下获得的城市污水处理过程的EQ、PE和TC值. 由图5的KDDCOC、DMOPSO-OC、DMOOC和PID的结果可知, 除第1天外, 所提出的KDDCOC在干燥天气下均可实现比其他优化控制方法更低的EQ. 由图6可知, 在干燥天气下连续14天KDDCOC的PE值小于其他优化控制方法的PE值, 虽然KDDCOC在第1天的EQ值高于PID方法, 但是KDDCOC在第1天实现了最低的PE值. 如图7所示, 除第1天外, KDDCOC在干燥天气下实现了最小TC值. 根据图5 ~ 7的分析, 在干燥天气下, KDDCOC可以比其他优化控制方法实现更好的优化控制性能. KDDCOC的优化算法展现了在干燥天气下获取$ S_{{\rm{NO}}} $最优解和平衡多个冲突性能指标的能力.
图8为在干燥天气下KDDCOC的EQ组分情况, EQ包括生化需氧量(Biochemical oxygen demand, BOD)、化学需氧量(Chemical oxygen demand, COD)、$ S_{{\rm{NH}}} $、$ SS $和$N_{{\rm{tot}}}$, 结果表明KDDCOC可以获得满意的水质结果. 图9为在干燥天气下KDDCOC和基于KGCO的优化控制方法(Knowledge guide based cooperative optimal control, KGCO-OC)的$N_{{\rm{tot}}}$结果, KGCO-OC为知识引导的全局最优选择机制和开发机制应用到MOPSO的方法, 其中, 红色实线为KDDCOC的$N_{{\rm{tot}}}$的结果, 黑色实线为KGCO-OC的$N_{{\rm{tot}}}$的结果. KGCO-OC的$N_{{\rm{tot}}}$峰值有超过出水限值的风险, KDDCOC有效降低了$N_{{\rm{tot}}}$的峰值, 降低了超标风险. 与KGCO-OC相比, KDDCOC增加了PE和EQ在不同最佳优化控制时刻协同的设计, 有效提高了优化控制性能, 实现了PE和EQ协同增效. 表1 为KDDCOC和其他优化控制方法在干燥天气下的详细性能, 与其他优化控制方法相比, KDDCOC实现了最低PE、EQ和TC值, KDDCOC能够协同优化控制EQ和PE, 并实现城市污水处理反硝化脱氮过程的最低总费用. 与此同时, KDDCOC获得了最低IAE值, 实现了最佳的优化控制效果.
KDDCOC在暴雨天气的结果如图10 ~ 16所示. 图10为关键变量$ S_{{\rm{NO}}} $的优化和跟踪控制结果. 在图10(a)中, 蓝色实线为$ S_{{\rm{NO}}} $的优化设定值, 黑色虚线为$ S_{{\rm{NO}}} $的跟踪控制结果. 跟踪误差如图10(b)所示, KDDCOC保持$ S_{{\rm{NO}}} $的跟踪误差在$[-0.6 \; {\rm{mg}}/{\rm{l}}, 0.47\;{\rm{mg}}/{\rm{l}}]$范围内. $ S_{{\rm{NO}}} $的最优设定点随时间变化以反映城市污水处理过程的动态特性, 控制器可以稳定地跟踪$ S_{{\rm{NO}}} $的最优设定值. 操作变量$ Q_{a} $的相应变化如图11所示.
图12给出了KDDCOC和其他优化控制方法在暴雨天气下的EQ值, 除第7天外, KDDCOC比其他优化控制方法实现了最小EQ值. KDDCOC和其他优化控制方法在暴雨天气下的PE值如图13所示, 在暴雨天气下KDDCOC连续14天实现了最低的PE值. 虽然KDDCOC在第1天的EQ值高于PID方法的EQ值, 但是KDDCOC在第1天实现了最低的PE值. 图14为暴雨天气下14天的KDDCOC和其他优化控制方法的TC值, 除第7天外, KDDCOC实现了比其他优化控制方法更小的TC值. 根据图12 ~ 14的分析, 在暴雨天气下, KDDCOC可以比其他优化控制方法实现更好的优化控制性能.
EQ在暴雨天气中的出水参数如图15所示. KDDCOC获得了不错的EQ出水参数值. 图16为在暴雨天气下KDDCOC和KGCO-OC的$ N_{{\rm{tot}}} $结果, KDDCOC有效降低了$N_{\rm{tot}} $和超标风险. 结果表明, KDDCOC的协同设计提高了城市污水处理反硝化脱氮过程的性能. 为了更直接地展示KDDCOC的性能, 暴雨天气条件下的KDDCOC和其他优化控制方法的PE、EQ、TC和IAE值如表2所示. 与DMOPSO-OC、DMOOC、PID相比, KDDCOC能够协同优化控制EQ和运行能耗, 并实现城市污水处理反硝化脱氮过程的最低总费用, 实现了最佳的优化控制效果.
如表1和表2所示, 无论干燥天气还是暴雨天气, KDDCOC获得了最佳的PE、EQ、TC和IAE, 充分证明了KDDCOC在城市污水处理反硝化脱氮过程中的优化控制性能. 综上所述, 与其他优化控制方法相比, KDDCOC能够建立城市污水处理反硝化脱氮过程的协同目标模型, 为后续优化控制步骤提供基础, KGCO能够获取有效的控制变量最优解, 获得满意的EQ的同时降低了PE, 使总费用最低.
4. 结束语
本文提出一种知识和数据驱动的协同优化控制方法, 提高城市污水处理反硝化脱氮过程效果, 提高EQ的同时降低PE. 基于上述结果, KDDCOC主要包括以下优点:
1) 设计基于自适应知识核函数的协同优化控制目标模型充分利用数据和知识来捕捉城市污水处理反硝化脱氮过程的特点, 通过自适应初始化策略预置模型参数初始值, 提高优化控制初始性能.
2) 提出基于知识引导的反硝化脱氮过程协同优化算法, 利用基于知识引导的全局最佳选择机制和开发机制提高协同求解效率, 快速获得满意的最优解.
实验效果显示, 与其他方法相比, KDDCOC能够建立城市污水处理反硝化脱氮过程中能耗和水质的协同模型, 具有较好的模型精度, 尤其是初始性能. 同时, 该方法可以获得有效的控制变量协同优化设定值, 提高EQ, 并降低运行能耗. 此外, KDDCOC证明数据和知识驱动协同优化控制方法在提高复杂工业过程优化控制性能方面有明显效果, 为石油化工、有色冶金等复杂工业过程提高产品质量与效率相关的运行指标并降低运行能耗提供了思路.
虽然本文提出的知识和数据驱动的协同优化控制策略能够取得较好的效果, 但尚存在局限性需要进一步研究, 例如城市污水处理脱氮过程还包括硝化脱氮过程, 如何综合考虑城市污水处理整体运行能耗和EQ, 将硝化脱氮过程考虑到城市污水处理脱氮过程协同优化控制中, 进一步提高城市污水处理脱氮过程性能仍是一个需要解决的难题.
-
表 1 干燥天气下不同优化控制方法的详细性能
Table 1 Detailed performance of different optimal control methods in dry weather
表 2 暴雨天气下不同优化控制方法的详细性能
Table 2 Detailed performance of different optimal control methods in storm weather
-
[1] 韩红桂, 张璐, 卢薇, 乔俊飞. 城市污水处理过程动态多目标智能优化控制研究. 自动化学报, 2021, 47(3): 620−629Han Hong-Gui, Zhang Lu, Lu Wei, Qiao Jun-Fei. Research on dynamic multiobjective intelligent optimal control for municipal wastewater treatment process. Acta Automatica Sinica, 2021, 47(3): 620−629 [2] 杜睿, 彭永臻. 城市污水生物脱氮技术变革: 厌氧氨氧化的研究与实践新进展. 中国科学: 技术科学, 2022, 52(3): 389−402 doi: 10.1360/SST-2020-0407Du Rui, Peng Yong-Zhen. Technical revolution of biological nitrogen removal from municipal wastewater: Recent advances in anammox research and application. Scientia Sinica Technologica, 2022, 52(3): 389−402 doi: 10.1360/SST-2020-0407 [3] 韩红桂, 张琳琳, 伍小龙, 乔俊飞. 数据和知识驱动的城市污水处理过程多目标优化控制. 自动化学报, 2021, 47(11): 2538−2546Han Hong-Gui, Zhang Lin-Lin, Wu Xiao-Long, Qiao Jun-Fei. Data-knowledge driven multiobjective optimal control for municipal wastewater treatment process. Acta Automatica Sinica, 2021, 47(11): 2538−2546 [4] 杨翠丽, 武战红, 韩红桂, 乔俊飞. 城市污水处理过程优化设定方法研究进展. 自动化学报, 2020, 46(10): 2092−2108Yang Cui-Li, Wu Zhan-Hong, Han Hong-Gui, Qiao Jun-Fei. Perspectives on optimal setting methods for municipal wastewater treatment processes. Acta Automatica Sinica, 2020, 46(10): 2092−2108 [5] 阳春华, 孙备, 李勇刚, 黄科科, 桂卫华. 复杂生产流程协同优化与智能控制. 自动化学报, 2023, 49(3): 528−539Yang Chun-Hua, Sun Bei, Li Yong-Gang, Huang Ke-Ke, Gui Wei-Hua. Cooperative optimization and intelligent control of complex production processes. Acta Automatica Sinica, 2023, 49(3): 528−539 [6] 韩红桂, 秦晨辉, 孙浩源, 乔俊飞. 城市污水处理过程自适应滑模控制. 自动化学报, 2023, 49(5): 1010−1018Han Hong-Gui, Qin Chen-Hui, Sun Hao-Yuan, Qiao Jun-Fei. Adaptive sliding mode control for municipal wastewater treatment process. Acta Automatica Sinica, 2023, 49(5): 1010−1018 [7] Borja S, Albert G, Xavier F, Ulf J, Juan A B. A plant-wide model describing GHG emissions and nutrient recovery options for water resource recovery facilities. Water Research, 2022, 215: Article No. 118223 doi: 10.1016/j.watres.2022.118223 [8] Reifsnyder S, Garrido-Baserba M, Cecconi F, Wong L, Ackman P, Melitas N, et al. Relationship between manual air valve positioning, water quality and energy usage in activated sludge processes. Water Research, 2020, 173: Article No. 115537 doi: 10.1016/j.watres.2020.115537 [9] Plosz B G. Optimization of the activated sludge anoxic reactor configuration as a means to control nutrient removal kinetically. Water Research, 2007, 41(8): 1763−1773 doi: 10.1016/j.watres.2007.01.007 [10] Borzooei S, Campo G, Cerutti A, Meucci L, Panepinto D, Riggio V, et al. Optimization of the wastewater treatment plant: From energy saving to environmental impact mitigation. Science of the Total Environment, 2019, 691: 1182−1189 doi: 10.1016/j.scitotenv.2019.07.241 [11] Abba S I, Pham Q B, Usman A G, Linh N T T, Aliyu D S, Nguyen Q, et al. Emerging evolutionary algorithm integrated with kernel principal component analysis for modeling the performance of a water treatment plant. Journal of Water Process Engineering, 2020, 33: Article No. 101081 doi: 10.1016/j.jwpe.2019.101081 [12] Feng J, Song W Z, Zhang H G, Wang W. Data-driven robust iterative learning consensus tracking control for MIMO multiagent systems under fixed and iteration-switching topologies. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2022, 52(2): 1331−1344 doi: 10.1109/TSMC.2020.3017289 [13] Santoso F, Finn A. A data-driven cyber-physical system using deep-learning convolutional neural networks: Study on false-data injection attacks in an unmanned ground vehicle under fault-tolerant conditions. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2023, 53(1): 346−356 doi: 10.1109/TSMC.2022.3170071 [14] Zhang H, Yang C, Shi X Q, Liu H B. Effluent quality prediction in papermaking wastewater treatment processes using dynamic Bayesian networks. Journal of Cleaner Production, 2021, 282: Article No. 125396 doi: 10.1016/j.jclepro.2020.125396 [15] Zeng Y H, Zhang Z J, Kusiak A, Tang F, Wei X P. Optimizing wastewater pumping system with data-driven models and a greedy electromagnetism-like algorithm. Stochastic Environmental Research and Risk Assessment, 2016, 30: 1263−1275 doi: 10.1007/s00477-015-1115-4 [16] Han H G, Chen C, Sun H Y, Qiao J F. Multiobjective integrated optimal control for nonlinear systems. IEEE Transactions on Cybernetics, 2023, 53(12): 7712−7722 doi: 10.1109/TCYB.2022.3204030 [17] 王凌, 王晶晶. 考虑运输时间的分布式绿色柔性作业车间调度协同群智能优化. 中国科学: 技术科学, 2023, 53(2): 243−257 doi: 10.1360/SST-2021-0355Wang Ling, Wang Jing-Jing. A cooperative memetic algorithm for the distributed green flexible job shop with transportation time. Scientia Sinica Technologica, 2023, 53(2): 243−257 doi: 10.1360/SST-2021-0355 [18] Santín I, Pedret C, Vilanova R, Meneses M. Advanced decision control system for effluent violations removal in wastewater treatment plants. Control Engineering Practice, 2016, 49: 60−75 doi: 10.1016/j.conengprac.2016.01.005 [19] Han H G, Zhang L, Qiao J F. Dynamic optimal control for wastewater treatment process under multiple operating conditions. IEEE Transactions on Automation Science and Engineering, 2023, 20(3): 1907−1919 doi: 10.1109/TASE.2022.3189048 [20] Han H G, Liu Z, Lu W, Hou Y, Qiao J F. Dynamic MOPSO-based optimal control for wastewater treatment process. IEEE Transactions on Cybernetics, 2021, 51(5): 2518−2528 doi: 10.1109/TCYB.2019.2925534 [21] Qiao J F, Zhang W. Dynamic multi-objective optimization control for wastewater treatment process. Neural Computing and Applications, 2018, 29: 1261−1271 doi: 10.1007/s00521-016-2642-8 [22] 张伟, 黄卫民. 基于种群分区的多策略自适应多目标粒子群算法. 自动化学报, 2022, 48(10): 2585−2599Zhang Wei, Huang Wei-Min. Multi-strategy adaptive multi-objective particle swarm optimization algorithm based on swarm partition. Acta Automatica Sinica, 2022, 48(10): 2585−2599 [23] Watari D, Taniguchi I, Goverde H, Manganiello P, Shirazi E, Catthoor F, et al. Multi-time scale energy management framework for smart PV systems mixing fast and slow dynamics. Applied Energy, 2021, 289: Article No. 116671 doi: 10.1016/j.apenergy.2021.116671 [24] Han H G, Fu S J, Sun H Y, Qiao J F. Data-driven model-predictive control for nonlinear systems with stochastic sampling interval. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2023, 53(5): 3019−3030 doi: 10.1109/TSMC.2022.3220550 [25] Jiang Y, Li X Y, Qin C W, Xing X Y, Chen Z Y. Improved particle swarm optimization based selective harmonic elimination and neutral point balance control for three-level inverter in low-voltage ride-through operation. IEEE Transactions on Industrial Informatics, 2022, 18(1): 642−652 doi: 10.1109/TII.2021.3062625 [26] Han H G, Zhang L, Liu H X, Yang C L, Qiao J F. Intelligent optimal control system with flexible objective functions and its applications in wastewater treatment process. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2019, 51(6): 3464−3476 [27] Song M, Sun W, Shahidehpour M, Yan M Y, Cao C C. Multi-time scale coordinated control and scheduling of inverter-based TCLs with variable wind generation. IEEE Transactions on Sustainable Energy, 2021, 12(1): 46−57 doi: 10.1109/TSTE.2020.2971271 [28] Han H G, Zhang L, Zhang L L, He Z, Qiao J F. Cooperative optimal controller and its application to activated sludge process. IEEE Transactions on Cybernetics, 2021, 51(8): 3938−3951 doi: 10.1109/TCYB.2019.2925143 [29] Zhou P, Wang X, Chai T Y. Multiobjective operation optimization of wastewater treatment process based on reinforcement self-learning and knowledge guidance. IEEE Transactions on Cybernetics, 2023, 53(11): 6896−6909 doi: 10.1109/TCYB.2022.3164476 [30] 桂卫华, 曾朝晖, 陈晓方, 谢永芳, 孙玉波. 知识驱动的流程工业智能制造. 中国科学: 信息科学, 2020, 50(9): 1345−1360 doi: 10.1360/SSI-2020-0211Gui Wei-Hua, Zeng Zhao-Hui, Chen Xiao-Fang, Xie Yong-Fang, Sun Yu-Bo. Knowledge-driven process industry smart manufacturing. Scientia Sinica Informationis, 2020, 50(9): 1345−1360 doi: 10.1360/SSI-2020-0211 [31] Ji M D, Wang J, Samir K K, Wang S Q, Zhang J, Liang S, et al. Water-energy-greenhouse gas nexus of a novel high-rate activated sludge-two-stage vertical up-flow constructed wetland system for low-carbon wastewater treatment. Water Research, 2023, 229: Article No. 119491 doi: 10.1016/j.watres.2022.119491 [32] Han H G, Liu Z, Liu H X, Qiao J F. Knowledge-data-driven model predictive control for a class of nonlinear systems. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2021, 51(7): 4492−4504 doi: 10.1109/TSMC.2019.2937002 期刊类型引用(0)
其他类型引用(1)
-