FeO Content Prediction in Sintering Process Based on Fusion of Data-Knowledge and AW-ESN
-
摘要: 氧化亚铁(FeO)含量是衡量烧结矿强度和还原性的重要指标, 烧结过程FeO含量的实时准确预测对于提升烧结质量、优化烧结工艺具有重要意义. 然而烧结过程热状态参数缺失、过程参数波动频繁给FeO含量的高精度预测带来巨大的挑战, 为此, 提出一种基于知识与变权重回声状态网络融合(Fusion of data-knowledge and adaptive weight echo state network, DK-AWESN)的烧结过程FeO含量预测方法. 首先, 针对烧结过程热状态参数缺失的问题, 建立烧结料层最高温度分布模型, 实现基于料层温度分布特征的FeO含量等级划分; 其次, 针对烧结过程参数波动频繁的问题, 提出基于核函数高维映射的多尺度数据配准方法, 有效抑制离群点的影响, 提升建模数据的质量; 最后, 针对烧结过程数据驱动模型缺乏机理认知致使模型预测精度不高的问题, 将过程数据中提取得到的FeO含量等级知识与AW-ESN (Adaptive weight echo state network)结合, 建立DK-AWESN模型, 有效提升复杂工况下FeO含量的预测精度. 现场工业数据试验表明, 所提方法能实时准确地预测烧结过程FeO含量, 为烧结过程的智能化调控提供实时有效的FeO含量反馈信息.Abstract: FeO content is an important index to characterize the strength and reducibility of sinter. Real-time and accurate prediction of FeO content in sintering process is of great significance for improving sintering quality and optimizing sintering process. However, the lack of thermal state parameters in sintering process and the frequent fluctuation of process parameters bring great challenges to the high-precision prediction of FeO content. In order to alleviate these problems, a method of FeO content prediction in sintering process by fusing data-knowledge and adaptive weight echo state network (DK-AWESN) is proposed in this paper. Firstly, aiming at the problem of lacking thermal state parameters in sintering process, the temperature distribution model of sinter bed is established, and the state of FeO content can be obtained based on the temperature distribution characteristics of sinter bed; Secondly, aiming at the frequent fluctuation of sintering process parameters, a multi-scale data registration method based on kernel function high-dimensional mapping is proposed, which effectively suppresses the influence of outliers and improves the quality of modeling data; Finally, to alleviate the problem of low prediction accuracy of data-driven model due to the lack of mechanism knowledge, the expert knowledge extracted from the process data is fused with adaptive weight echo state network (AW-ESN) to establish DK-AWESN, which improves the FeO content prediction performance of the model under complex working conditions. Industrial verification shows that the proposed method can accurately predict the FeO content in real time and provide effective FeO content information for the intelligent control of the sintering process.
-
随着钢铁冶金行业的不断发展, 铁矿石资源日益紧缺且禀赋恶化, 已难以满足高炉绿色高效低碳冶炼的需求[1-2]. 烧结是将贫铁矿加工成富铁矿, 有利于高炉冶炼的过程, 为高炉炼铁提供主要原料, 其烧结矿质量对高炉的稳定顺行至关重要.
烧结矿的FeO含量不仅是衡量烧结矿质量的重要指标, 而且是影响高炉冶炼能耗、排放的重要因素. 因此, 实时准确获取FeO含量对烧结过程的智能化调控、提升烧结矿质量、保证高炉平稳顺行和绿色低碳高效生产具有重要意义[3-6].
由于烧结过程中存在高温、高尘、多相共存、多场耦合等特点, 烧结矿FeO含量难以直接在线检测. 通常工业现场对FeO含量的检测, 主要是采用人工定期采样, 再利用重铬酸钾化学分析法、X射线光谱分析法等方法对采样样本进行离线分析[7-9]. 这些方法存在检测速度慢、设备成本高、操作复杂等局限性, 且检测结果时间滞后大, 导致烧结矿的质量信息不能得到及时反馈, 严重制约了烧结过程的精细化调控, 无法满足烧结现场实时检测的需求. 因此建立FeO含量的预测模型, 实现FeO含量的高精度在线预测对于烧结过程的优化具有重要意义. 目前, 烧结过程FeO含量建模方法可以总结为以下三种: 1)基于物料守恒的建模方法, 主要是通过对过程的其他相关参数进行在线检测, 基于物料守恒的原理, 建立机理模型, 计算FeO的含量[10-12], 该思路适用范围广、可解释性强, 但所需的检测设备费用高昂, 且各烧结厂冶炼环境和原材料各异, 烧结过程发生的物理化学反应复杂多变, 难以通过机理模型准确地计算出FeO含量. 2)基于烧结机尾断面图像信息, 结合现场专家经验建立的软测量模型[13-15]. 这一类方法基于专家经验建立模型, 提取到的图像信息一定程度上也能反映FeO的含量信息. 然而烧结机尾高温、多粉尘的生产环境, 会极大地影响图片获取的质量, 仅利用图像信息难以获取精准的FeO含量. 3)基于烧结过程生产数据建立的数据驱动模型[16-21]. 这一类方法不需要了解烧结过程发生的复杂反应, 仅通过数学工具和智能算法对历史时刻的过程数据中包含的规律进行挖掘, 就可以建立烧结矿质量指标的预测模型, 因此数据驱动模型成为近年烧结过程FeO含量建模研究的热点.
国内外学者在基于数据驱动的FeO含量预测上做了许多相关的研究. 文献[19]和文献[20]分别利用BP神经网络和前馈神经网络建立FeO含量的预测模型, 由于上述网络存在过拟合和易陷入局部最小值的问题, 取得的预测效果并不理想. 文献[21]采用深度信念网络(Deep belief network, DBN)进行FeO含量的预测, 然而DBN作为一种深度网络, 需要大量训练样本且计算成本较高, 难以应用于实际的烧结过程中. 由于烧结过程具有动态性和时序性, 烧结矿的FeO含量不仅与当前的工艺参数有关, 同时受历史时刻的工艺参数影响, 这要求网络具有较强的时间序列数据处理能力. 循环神经网络(Recurrent neural network, RNN)在时间序列建模上展现了良好的性能, 但收敛速度慢、易陷入局部最小值和计算复杂度高等问题限制了其在实际工业过程中的应用[22-23]. 回声状态网络(Echo state network, ESN)作为一种特殊的RNN, 具有短期记忆的显著潜力, 并且对于非线性系统的动态预测表现出了良好的性能[24-26]. ESN的输入层和储藏层的权值采用随机值初始化的方式确定, 只有输出层的权值需要通过训练获得, 一定程度上避免了预测模型陷入局部极小值, 提高了学习速率.
然而, 作为一种数据驱动模型, ESN应用于烧结过程的FeO含量建模仍存在一定的局限性, 由于烧结过程热状态参数缺失, 且数据驱动模型对机理缺乏认知, 易致使模型的泛化能力不足, 而工业过程存在的变量漂移等问题也会导致模型的预测精度降低. 针对上述问题, 本文提出了一种将机理知识与数据驱动模型相结合的建模方法. 通过对烧结过程的传热机理进行分析, 建立了料层最高温度分布模型, 从而获取烧结过程的温度分布特征, 结合过程数据和专家经验, 挖掘过程数据中的专家知识, 实现基于数据知识的FeO含量等级划分. 获取的FeO含量知识用于对ESN模型输出函数的改进, 实现机理知识与ESN的融合, 降低了过程扰动和噪声对预测结果的影响, 同时提出了一种新的基于梯度的权重调整策略(Adaptive weight strategy)用于ESN输出权重的学习, 最终建立基于知识与AW-ESN (Adaptive weight echo state network)融合的烧结过程FeO含量预测模型—基于知识与变权重回声状态网络融合的模型 (Fusion of data-knowledge and adaptive weight echo state network, DK-AWESN). 基于某钢铁厂的烧结厂的实际生产数据验证了本文所提的基于知识与AW-ESN融合的烧结过程FeO含量预测方法的有效性.
1. 基于料层温度分布特征的FeO含量等级划分
烧结矿中FeO主要以磁铁矿和含铁硅酸盐的形式存在, 如铁橄榄石、钙铁橄榄石, 而含FeO的液相铁橄榄石、钙铁橄榄石的生成温度要求极高, 因此烧结料层内部热状态与烧结矿的FeO含量关系密切, 但是烧结过程的工艺特性导致实际烧结过程不能直接观察, 现有的检测手段无法准确获取烧结过程各阶段的料层温度. 为了建立准确的烧结过程FeO含量预测模型, 需要在建模前对烧结料层内部热状态进行深入分析. 烧结料层内部热状态的变化体现为温度变化, 不同时刻的温度特征信息可以反映烧结料层中FeO的含量. 因此, 本节通过对烧结过程气−固传热机理分析建立烧结料层的最高温度分布模型, 获取各料层的温度分布特征, 结合专家经验, 从过程数据中提取出一系列规则作为专家知识, 利用模糊推理的方法, 实现对烧结矿FeO含量等级的划分.
1.1 烧结料层温度分布特征提取
如图1所示, 将带式烧结台车当作由若干个固定单元串联形成的整体, 混合料沿$y $方向横向铺在烧结机上, 同时在沿$x $方向水平缓慢移动, 风箱作业使得空气垂直混合料表面竖向沿$z $方向流动. 本节利用现场工艺参数结合传热学理论, 建立基于微元$ {\text{d}}z $的烧结过程热状态模型用以计算烧结矿各层温度的最大值, 实现烧结料层温度分布特征的提取.
为方便模型计算, 假设烧结过程在每一层的横向烧结状况相同, 在纵向对每个无穷小厚度$ {\text{d}}z $进行气体、固体的热平衡计算[27]. 首先针对固体在单位体积、单位时间的热增量等于气−固单位时间、体积热交换值与反应热增量之和建立热平衡方程, 其次针对气体在同样的单位时间、体积的热变化等于气−固热交换与反应热之和建立热平衡方程, 即
$$ \left\{ \begin{aligned} & {\rho _g}\varepsilon {{\overline C_g}} \left( {\frac{{\partial {T_g}}}{{\partial t}}} \right) - {R_c}\Delta {H_c} + hs\left( {{T_g} - {T_s}} \right) +\\ &\qquad{v_g}{\rho _g} {{\overline C_g}} \left( {\frac{{\partial {T_g}}}{{\partial z}}} \right) = 0 \\ & {\rho _s}(1 - \varepsilon ) {{\overline C_s}} \left( {\frac{{\partial {T_s}}}{{\partial t}}} \right) - {R_c}\Delta {H_c} + hs\left( {{T_g} - {T_s}} \right)+ \\ &\qquad {v_s}{\rho _s} {{\overline C_s}} (1 - \varepsilon )\left( {\frac{{\partial {T_s}}}{{\partial z}}} \right) - \frac{\partial }{{\partial z}}\left( {\tau \frac{{\partial {T_s}}}{{\partial z}}} \right) = 0 \end{aligned} \right. $$ (1) 式中, ${v_g}$和${v_s}$分别表示气体流速和固体流速, ${\rho _g}$和${\rho _s}$分别表示气体密度和固体密度, ${{\overline C_g}}$和${{\overline C_s}}$分别表示气体比热容和固体比热容, $ \varepsilon $表示料层孔隙率, $ {T_g} $和$ {T_s} $分别表示料层气相温度和固相温度, $ h $为气−固相间对流传热系数, $ s $为单位体积颗粒总表面积, $\tau $为料层的有效导热系数, ${R_c}$表示化学反应的综合反应速率, $\Delta {H_c}$表示反应的反应焓, 此处反应指焦粉的燃烧反应.
烧结过程按燃料的燃烧程度可以分为两个阶段: 1) 当燃料未燃尽时, 烧结域内的热源主要来自燃料的燃烧放热, 由式(1)可知烧结过程固相的热量主要由内部热源和上部气体传热供给. 假设气体只在$z $方向上均匀流动, 对于微小料层${\rm{d}}z$, 可以认为其处于静止状态的非稳态传热($ {v_s} = 0 $). 假设烧结料层不导热, 料层内部只进行气固热交换, 传热系数足够大使得空间内任何点有相同固相−气相温度, 则有$ {T_s} = {T_g} = T $, $ \frac{{\partial {T_g}}}{{\partial z}} = \frac{{\partial {T_s}}}{{\partial z}} $, $ \frac{{\partial {T_g}}}{{\partial t}} = \frac{{\partial {T_s}}}{{\partial t}} $, 热平衡方程为
$$ \left\{ \begin{aligned} &{\rho _g}\varepsilon {{\overline C_g}} \left( {\frac{{\partial {T_g}}}{{\partial t}}} \right) - {R_c}\Delta {H_c} + {v_g}{\rho _g} {{\overline C_g}} \left( {\frac{{\partial {T_g}}}{{\partial z}}} \right) = 0 \\ &{\rho _s}(1 - \varepsilon ) {{\overline C_s}} \left( {\frac{{\partial {T_g}}}{{\partial t}}} \right) = 0 \end{aligned} \right. $$ (2) 2)当烧结过程进行到燃料耗尽的成矿区域时, 假设此时只存在上层气体与下层物料的热交换, 无其他反应热供给(消耗), 则此时的化学反应热值$ q = {R_c}\Delta {H_c} $为0, 此时料层内部的热平衡方程为
$$ \left\{ \begin{aligned} & {\rho _g}\varepsilon {{\overline C_g}} \left( {\frac{{\partial {T_g}}}{{\partial t}}} \right) + {v_g}{\rho _g} {{\overline C_g}} \left( {\frac{{\partial {T_g}}}{{\partial z}}} \right) = 0 \\ &{\rho _s}(1 - \varepsilon ){{\overline C_s}} \left( {\frac{{\partial {T_g}}}{{\partial t}}} \right) = 0 \end{aligned} \right. $$ (3) 根据上述分析, 为了完善建立的热交换模型, 需要建立一个合适的燃料燃烧模型及判断两式转折的临界点模型.
1)燃料燃烧模型
对于烧结过程而言, 焦粉在料层中以焦炭颗粒形式存在, 其作为燃料在单位时间、体积内的反应热为
$$ q = {R_c} \times \Delta {H_c} $$ (4) 式中, ${R_c}$为反应速率, $\Delta {H_c}$为反应焓. 焦炭的燃烧过程采用一级化学反应式表示, 即
$$ {\text{C + }}{{\text{O}}_2} = {\text{C}}{{\text{O}}_2} ,\;\;\Delta {H_c} = - 393.5\;{\rm{kJ/mol}} $$ (5) 焦炭颗粒在燃烧时会由外向内逐步燃尽, 原粒径为r的焦炭颗粒在燃烧一段时间后剩余部分的粒径为${r_c}$. 因此在燃烧过程中, 焦炭颗粒的粒径可以直接反映燃料剩余量, 焦炭颗粒的反应速率可以表示为
$$ \left\{ \begin{aligned} &{k_c} = k{{\rm{e}}^{ - \frac{E}{{RT}}}}\sqrt T \\ &{k_m} = 0.066\frac{{P{D_{{{\rm{O}}_2}}}R{e^{\frac{4}{5}}}S{c^{\frac{1}{3}}}{{\ln }^{\frac{{{P_{{{\rm{O}}_2}2}}}}{{{P_{{{\rm{O}}_2}1}}}}}}}}{{\left( {{P_{{{\rm{O}}_2}2}} - {P_{{{\rm{O}}_2}1}}} \right)RT}} \\ &{k_{{o}}} = \frac{{\left( {r - {r_c}} \right){D_{{{\rm{O}}_2}}}}}{{{\varepsilon _c}{{\rm{e}}^{ - 0.006\left( {r - B{r_c}} \right)}}}} \\ &{R_c} = \frac{{4{\rm{\pi }}{r_c}^2{C_{{{\rm{O}}_2}}}}}{{\frac{1}{{{k_c}}} + \frac{1}{{{k_m}}} + {k_o}}} \end{aligned} \right. $$ (6) 由上述参数计算可知在每个时刻${\text{d}}z$内的综合反应速率${R_c}$, 计算所需的参数取值如表1所示. 假设单位体积的料层包含n个焦炭颗粒, 则
表 1 反应速率计算参数表Table 1 Reaction rate parameters参数名称 符号 值 指前因子 $ k $ $6.89 \times {10^5} \sim 8.3 \times {10^5}\;{{\rm{s}}^{ - 1} }$ 反应活化能 $ E $ ${ {125.61 \sim 137.16\;{\rm{kJ} } } \mathord{\left/ {\vphantom { {125.61 \sim 137.16\;{\rm{kJ} } } { {\rm{mol} } } } } \right. } {{\rm{mol}}} }$ 比例系数 $ R $ $8.314\;{\rm{kJ}}/({\rm{mol}} \cdot {\rm{K}})$ 抽风负压 $ P $ ${\text{1} }{\text{.2} } \times {\text{1} }{ {\text{0} }^4}\;{\rm{Pa} }$ 料前氧分压 ${P_{ {{\rm{O}}_2}1} }$ ${\text{0} }{\text{.21} }\;{\rm{P} }$ 料后氧分压 ${P_{ {{\rm{O}}_2}2} }$ $0.09 \sim 0.11\;{\rm{P}}$ 总氧气扩散系数 ${D_{ {{\rm{O}}^2} } }$ $ {\text{2}}.03 \times {10^{ - 5}}{T^{1.87}} $ 雷诺数 $ Re $ $ {\text{2}} \times {\text{1}}{{\text{0}}^3} \sim 3.5 \times {10^4} $ 燃料孔隙率 $ {\varepsilon _c} $ $ {\text{0}}{\text{.39}} $ 有效孔隙率 $ B $ $ 0.15 $ 施密特数 $Sc$ $ {\text{0}}{{.6 \sim 2}}{\text{.5}} $ 氧气浓度 ${C_{ {{\rm{O}}_2} } }$ 9.735% $$ n = \frac{{4\left( {1 - {\varepsilon _c}} \right){\beta _c}}}{{3{\rm{\pi }}{r^3}}} $$ (7) 式中, $ {\beta _c} $为燃料的百分含量, 若已知单位体积料层中燃料颗粒个数, 则可以通过计算得到每层烧结料中燃烧热为
$$ {q_n} = \frac{{16\left( {1 - {\varepsilon _c}} \right){\beta _c}{r_c}^2{C_{{{\rm{O}}_2}}}\Delta {H_c}}}{{3{r^3}\left( {\frac{1}{{{k_c}}} + \frac{1}{{{k_m}}} + {k_o}} \right)}} $$ (8) 式中, $ {k_c} $, $ {k_m} $, $ {k_o} $的计算方式见式(6).
2)燃料是否耗尽的分界判据
当燃料颗粒未耗尽时, 空气中氧气由于传质作用透过燃尽的灰层进一步与焦炭燃料接触, 此时外界温度已达到焦炭700 ℃的燃点, 所以仍然存在式(5)所示的一级反应. 由于化学反应导致的焦炭消耗将使得焦炭粒径减少, 在整个过程中单位体积内焦炭的摩尔数为
$$ {V_{{\text{mol}}}} = \frac{{\left( {1 - {\varepsilon _c}} \right){\beta _c}{\rho _c}}}{{{M_{{\text{mol}}}}}} $$ (9) 式中, $ {\rho _c} $为焦炭密度, $ {M_{{\rm{mol}}}} $为碳的摩尔质量, 所以在单位体积料层内包含的燃料量可以用$ {V_{{\text{mol}}}} $表示, 当燃料量小于$ {V_{{\text{mol}}}} $时则可以判断燃料被消耗完毕. 根据推导得到的燃料燃烧综合反应速率$ {R_c} $, 可以计算出燃烧反应t时刻后燃料的总消耗量为
$$ {V_{{\text{sum}}}} = \sum {R_c}{\text{d}}t $$ (10) 易知当$ {V_{{\text{sum}}}} = {V_{{\text{mol}}}} $时, 热交换方程中燃料燃烧的部分不再作用. 利用烧结过程中基于燃料是否耗尽的有、无热源分界判据结合燃料燃烧热模型可以代入式(2)和式(3)所示的两阶段的燃烧热平衡方程, 最终得到的解析式为
$$ \left\{ \begin{aligned} &{v_g}{\rho _g} {{\overline C_g}} \left( {\frac{{\partial {T_g}}}{{\partial z}}} \right) + {\rho _g} {{\overline C_g}} \varepsilon \left( {\frac{{\partial {T_g}}}{{\partial t}}} \right)- &{}\\ & \qquad\frac{{16\left( {1 - {\varepsilon _c}} \right){\beta _c}{r_c}^2{C_{{{\rm{O}}_2}}}\Delta {H_c}}}{{3{r^3}\left( {\frac{1}{{{k_c}}} + \frac{1}{{{k_m}}} + {k_o}} \right)}} = 0, &{V_{{\text{sum}}}} \leq {V_{{\text{mol}}}} \\ & {\rho _s} {{\overline C_s}} \left( {1 - \varepsilon } \right)\left( {\frac{{\partial {T_g}}}{{\partial t}}} \right) = 0,& {V_{{\text{sum}}}} \leq {V_{{\text{mol}}}} \\ & {v_g}{\rho _g} {{\overline C_g}} \left( {\frac{{\partial {T_g}}}{{\partial z}}} \right) + {\rho _g}{{\overline C_g}} \varepsilon \left( {\frac{{\partial {T_g}}}{{\partial t}}} \right) = 0,& {V_{{\text{sum}}}} > {V_{{\text{mol}}}} \\ & {\rho _s}{{\overline C_s}} \left( {1 - \varepsilon } \right)\left( {\frac{{\partial {T_g}}}{{\partial t}}} \right) = 0 ,&{V_{{\text{sum}}}} > {V_{{\text{mol}}}} \end{aligned} \right. $$ (11) 经推导, 得到了在一定假设下的完整烧结热交换模型, 在满足判据的条件下分别按照有热源、无热源的固−气偏微分方程进行计算. 由于模型为气−固两相的热交换偏微分方程, 本文利用偏微分方程的数值解方法求解.
根据模型计算得到整个烧结料层的最高温度分布在时间维度上的变化, 如图2所示. 随着吸风烧结过程的进行, 烧结过程前30%阶段燃烧带的最高温度快速增加, 但是在后70%阶段燃烧带最高温度增长速度变慢, 尤其是后30%阶段温度基本不再增加. 这是由于气固流动带来的显热增量逐渐达到饱和值, 饱和温度在1420 ℃左右, 与理论分析的情况相符合.
根据图3所示的烧结料层的全时空温度分布图可清晰地看出, 在整个烧结过程中, 随着蓄热作用的不断进行, 料层中燃烧层的温度会持续攀升, 燃烧区域会持续扩大, 这说明本文建立的模型能够较好地还原烧结过程的全时空传热状态. 且从图3中可以看出, 烧结料层在不同时刻下的最高温度值是变化的, 料层内部发生的物理化学反应也必然会存在差异, 因此烧结料层最高温度是影响烧结矿FeO含量的重要热状态参数.
1.2 烧结过程FeO含量等级划分
烧结过程是一个机理复杂、非线性的动态时变过程. 影响烧结过程的因素众多, 难以通过机理分析获取准确的FeO含量, 而烧结现场的专家通常能够基于经验和生产数据大致判断FeO含量的区间. 因此, 本节根据专家经验, 从过程数据中提取出一系列规则作为专家知识, 利用模糊推理的方法, 实现对烧结矿FeO含量等级的划分.
为了从过程数据和专家经验中获取知识, 基于模糊规则对过程数据进行规则提取, 提取得到的规则可以表示如下:
R1: IF x1 is A11 and x2 is A21 and x3 is A31 and x4 is A41 THEN y is f1.
R2: IF x1 is A12 and x2 is A22 and x3 is A32 and x4 is A42 THEN y is f2.
$\vdots$
Rq: IF x1 is A1q and x2 is A2q and x3 is A3q and x4 is A4q THEN y is fq.
在上述规则中, x1表示烧结料层最高温度, x2表示料层高度, x3表示混合料燃料比, x4表示全铁, y表示烧结过程烧结矿FeO含量等级, $ {A_{1q}} $, $ {A_{2q}} $, $ {A_{3q}} $, $ {A_{4q}} $, $ {f_q} $分别是$ {x_1} $, $ {x_2} $, $ {x_3} $, $ {x_4} $, $ y $的模糊集合, 且各规则的模糊蕴含关系都已知, 现在根据$ {x_1} $, $ {x_2} $, $ {x_3} $, $ {x_4} $, $ y $上的模糊集合$ A_1^* $, $ A_2^* $, $ A_3^* $, $ A_4^* $推出新的模糊集合$ f^* $.
基于某钢铁集团烧结厂数据库中的历史数据和料层最高温度模型的计算结果, 可以获得各过程参数的变化范围. 基于隶属度, 各参数的变化范围划分为4个区间, 即最大合适区间、中等合适区间、小合适区间以及不适合区间, 各参数的隶属度函数如图4所示.
推算值与数据库中FeO含量化验值对比如表2所示. 通过对600组样本的实验结果进行统计, 烧结矿FeO含量“偏大”数据有153组、“正常”有396组, “偏小”有51组, 对比推理结果与实际化验数据, 仅仅29组数据的推理结果与化验数据不符. 本文建立的FeO含量等级推理模型准确率高达95.17%, 实际生产允许的误差范围为5%以内, 因此, 所提基于烧结料层温度分布特征提取的烧结过程FeO含量等级划分方法的精度符合现场需求, 且能为后续建立准确高效的预测模型奠定基础.
表 2 FeO含量等级推理结果与实际值对比Table 2 Comparison of the inference results with measured values of FeO content序号 料层最高温度 (℃) 料层高度 (mm) 燃料比 (%) 全铁 (%) 推理结果 化验数据 1 1 278.55 749.129 4.187 61.874 正常 正常 (8.96) 2 1 127.32 736.383 4.496 60.899 正常 正常 (9.27) 3 1 158.76 761.918 4.492 61.854 正常 正常 (9.06) 4 1 211.36 718.536 4.331 61.715 正常 正常 (9.47) 5 1 274.22 717.253 4.162 60.706 偏小 偏小 (7.37) $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ 558 1 160.56 649.579 4.561 63.755 正常 正常 (9.47) 559 1 176.76 650.864 4.305 60.802 偏大 偏大 (10.60) 600 1 308.99 710.711 4.286 61.067 正常 正常 (8.16) 2. 基于DK-AWESN的烧结过程FeO含量预测
面对烧结过程的强耦合性和动态复杂性, 本文提出一种基于知识与AW-ESN融合的烧结过程FeO含量预测方法. 首先, 提出一种基于核函数高维映射的多尺度数据配准方法, 用于构造建模样本集; 其次, 提出一种新的权重调整策略用于ESN的输出权重调整; 最终, 基于模糊规则从过程数据中提取的FeO含量知识融入到AW-ESN, 建立DK-AWESN模型用于FeO含量的预测. 本文所提方法的总体框图如图5所示.
2.1 FeO含量相关变量确定及输入数据集的构建
烧结矿的FeO含量与配料参数、烧结过程检测参数和设备状态参数等过程参数息息相关. 本文采用灰色关联分析法(Grey relational analysis, GRA), 通过定量计算FeO含量序列的曲线与过程参数序列的曲线之间的相似程度判断FeO含量与过程参数的相关性, 从而确定预测模型的输入变量.
在计算参数与FeO含量之间的关联度之前, 对工艺参数序列进行归一化处理, 即
$$ \left\{ {{x_i}\left( k \right)} \right\} = \frac{{\left\{ {{z_i}\left( k \right)} \right\}}}{{\frac{1}{n}\sum\limits_{k = 1}^n {\left\{ {{z_i}\left( k \right)} \right\}} }} $$ (12) 式中, $i = 0,1,2,\cdots,m$, $k = 1,2,3,\cdots,n$, $ \left\{ {{z_i}\left( k \right)} \right\} $表示归一化前的第i个参数序列, $ {z_i}\left( k \right) $表示序列中的第k个元素, $ \left\{ {{x_i}\left( k \right)} \right\} $表示归一化后的序列. $ \left\{ {{z_0}\left( k \right)} \right\} $代表参考序列, 为FeO含量的序列, $ \left\{ {{z_i}\left( k \right)} \right\} $代表比较序列, 为各工艺参数的序列.
完成归一化后, 计算每个比较序列与参考序列的关联系数, 即
$$\begin{split} &{\xi _i}(k) = \\& \frac{ \mathop {\min }\limits_i \mathop {\min }\limits_k \{ \left| {{x_0}(k) - {x_i}(k)} \right|\} + \rho \mathop {\max }\limits_i \mathop {\min }\limits_k \{ \left| {{x_0}(k) - {x_i}(k)} \right|\} }{ \left| {{x_0}(k) - {x_i}(k)} \right| + \rho \mathop {\max }\limits_i \mathop {\min }\limits_k \{ \left| {{x_0}(k) - {x_i}(k)} \right|\} }\end{split} $$ (13) 式中, $ \rho $表示分辨系数, 取值范围为[0, 1], 本文取$ \rho = 0.5 $, $ {\xi _i}(k) $表示第i个参数的灰色关联系数.
在计算每一个参数值的关联度系数后, 根据式(14)计算烧结过程各工艺参数的灰色关联度${r_i}$.
$$ {r_i} = \frac{1}{m}\sum\limits_{k = 1}^n {{\xi _i}(k)} $$ (14) 以烧结矿FeO含量为参考序列, 烧结过程工艺参数为比较序列, 从烧结数据中心选取300组样本数据用于计算各过程参数与FeO含量之间的灰色关联度. 根据计算结果, 表3列出了灰色关联度较高的20个参数.
表 3 各过程参数的灰色关联度Table 3 The grey relational degree of process parameters序号 变量名称 关联度 序号 变量名称 关联度 1 风箱废气温度 0.803 11 空支流量 0.559 2 烧结机机速 0.798 12 CMgO 0.557 3 料层高度 0.778 13 透气性 0.549 4 烧结终点 0.737 14 返矿比 0.539 5 $ {\rm{C}}_{{\rm{SiO}}_2}$ 0.733 15 风箱负压 0.527 6 碱度 0.703 16 CCaO 0.459 7 燃料配比 0.669 17 烟道压力 0.337 8 环冷机速度 0.641 18 风机入口温度 0.327 9 点火温度 0.618 19 混一温度 0.271 10 煤支流量 0.574 20 圆辊速度 0.249 当过程变量与FeO含量之间的灰色关联度大于0.5时, 可以认为变量与FeO含量之间存在较强相关性. 从表3可以看出, 燃料配比、料层高度、原料中氧化镁含量(CMgO)等配料参数在灰色关联分析下与FeO含量存在较强相关性. 除了配料参数, 还有风箱废气温度、空支流量、烧结机机速、返矿比等10个过程参数也具有较高相关性, 因此将这15个变量作为预测模型的输入.
烧结数据中心FeO含量的数据记录间隔为2 h, 而这2 h内对应的工艺参数的采样频率远高于FeO含量, 数据量不平衡将导致预测模型无法正常训练, 且过程参数的频繁波动会造成模型精度的下降. 为解决这一问题, 本节提出了基于核函数高维映射的多尺度数据配准方法, 对不同时间尺度的数据进行匹配, 通过提高输入样本集的质量, 从而提升模型的预测精度. 该方法的具体步骤如下:
步骤 1. 从历史数据库中收集风箱废气温度、料层透气性等$q$个过程参数数据以及对应历史时刻的FeO采样数据. 初始化集合$ X = \left\{ {{B_i}} \right\}_{i = 1}^q = \emptyset $.
步骤 2. 假定第i个过程参数在第t个FeO采样时间间隔内的数据集为$\left\{ {{x_i}\left( k \right)} \right\}_{k = 1}^n$. 通过核函数$\varphi \left( \cdot \right)$, $\left\{ {{x_i}\left( k \right)} \right\}_{k = 1}^n$映射到高维空间, 其映射集为$ A = \left\{ {\varphi \left( {{x_i}(k)} \right)} \right\}_{k = 1}^n $, 式中$\varphi \left( \cdot \right)$为高斯函数, 其定义为
$$ K(x,{x_i}(k)) = {{\text{e}}^{ - \frac{{{{\left\| {x - {x_i}(k)} \right\|}^2}}}{{2{\sigma ^2}}}}} $$ (15) 其中, ${x_i}\left( k \right)$表示第$i$个输入参数序列中第$k$个数据点, $n$表示第$i$个过程参数序列的样本数, $ \sigma$表示高斯函数的伸缩量.
步骤 3. 定义$ N_\gamma ^k = \{ \varphi ({x_i}(l)) \in {{A}} $$|dist(\varphi ({x_i}(k)), \varphi ({x_i}(l))) \leq \gamma \}$, 式中, $ \gamma $为距离阈值, $dist( \varphi \left( {{x_i}\left( k \right)} \right), \varphi \left( {{x_i}\left( l \right)} \right))$为映射点$\varphi \left( {{x_i}\left( k \right)} \right)$和$\varphi \left( {{x_i}\left( l \right)} \right)$的欧氏距离, 计算式为
$$ \gamma = \sqrt[{\textstyle{m}}]{{\sum\limits_{p = 1}^m {{\varepsilon _i}{{\left( {X_{\max }^p - X_{\min }^p} \right)}^2}} }} $$ (16) $$ \begin{split}&dist( {\varphi ( {{x_i}( k )} ),\varphi ( {{x_i}( l )} )} ) =\\ &\qquad\sqrt {{{( {\varphi ( {{x_i}( k )} ) - \varphi ( {{x_i}( l )} )} )}^2}} \end{split}$$ (17) 式中, ${\varepsilon _i}$ 表示距离系数, 取值范围[0.1, 0.2], $ X_{\max }^P $, $ X_{\min }^P $分别表示映射集在第$p$维的最大值和最小值, $ m $表示映射维度.
步骤 4. 若存在$\varsigma \,( {N_\gamma ^k} ) \geq \varsigma \,( {N_\gamma ^l} )$, $\varsigma \,( {N_\gamma ^k} )$表示$ N_\gamma ^k $中包含的样本个数, 则称$\varphi \left( {{x_i}\left( k \right)} \right)$为核心对象$ {M_{\varphi \left( {{x_i}\left( k \right)} \right)}} $, 若$ {M_{\varphi \left( {{x_i}\left( k \right)} \right)}} $不唯一, 再进行一次高维映射, 重复步骤3和步骤4, 直至核心对象$ {M_{\varphi \left( {{x_i}\left( k \right)} \right)}} $唯一, 则令$ {x_i}\left( k \right) \in {B_i} $.
步骤 5. 重复步骤2 ~ 4, 直至计算得到所有FeO采样时间间隔内的$ {M_{\varphi \left( {{x_i}\left( k \right)} \right)}} $, 此时, ${B_i} = \left\{ {{x_i}\left( k \right)} \right\}_{k = 1}^N$, N为FeO样本个数.
步骤 6. 重复步骤2 ~ 5, 直至计算得到全部过程变量的核心数据集Bi, 最终得到输入样本集$X = \left\{ {{B_1},\cdots,{B_q}} \right\} = \left\{ {{x_1}\left( k \right),\cdots,{x_q}\left( k \right)} \right\}_{k = 1}^N$.
2.2 DK-AWESN预测模型搭建
由于烧结过程是一个动态的、时变的过程, 具有强耦合、大时滞等特点. 烧结过程参数在时间和空间维度上互相耦合, 致使当前时刻烧结矿的质量不仅与历史的烧结矿质量相关, 同时影响着未来的烧结矿质量. 因此, 烧结矿的FeO含量不仅与当前的工艺参数有关, 而且受历史时刻的工艺参数影响. 这就要求所建模型具有动态记忆历史信息的能力, 在学习新信息的同时存储历史信息. 回声状态网络(ESN)具有大规模随机稀疏网络(储备池)作为信息存储和处理的单元, 因此非常适合用于烧结过程FeO含量预测. 一个无输出反馈的ESN由三个基本单元组成: 一个输入层、一个大型的循环隐藏层(储备池)以及一个输出层. 输入层是随机连接到储备池的, 而储备池包含稀疏随机连接的神经元用于存储相关的信息和保存时间特性[28]. 假定网络的输入为$ {\boldsymbol{x}}\left( k \right) \in {{\bf{R}}^M} $, k−1时刻储存库的状态变量为$ {\boldsymbol{u}}\left( {k - 1} \right) \in {{\bf{R}}^N} $, 标准的ESN离散模型可以表示为
$$ {\boldsymbol{u}}\left( k \right) = f\left( {{{\boldsymbol{W}}^{{\text{res}}}}{\boldsymbol{u}}\left( {k - 1} \right) + {{\boldsymbol{W}}^{{\text{in}}}}{\boldsymbol{x}}\left( k \right)} \right) $$ (18) $$ y\left( k \right) = {f^{{\text{out}}}}\left( {{{\boldsymbol{W}}^{{\text{out}}}}\left( {{\boldsymbol{u}}\left( k \right),{\boldsymbol{x}}\left( k \right)} \right)} \right)\quad \;\;$$ (19) 式中, $y\left( k \right) \in {{\bf{R}}^L}$是k时刻的模型输出, ${{\boldsymbol{W}}^{{\rm{in}}}}$, ${{\boldsymbol{W}}^{{\rm{res}}}}$, ${{\boldsymbol{W}}^{{\rm{out}}}}$分别表示模型的输入权重、储存池的连接权重以及输出权重. 其中, ${{\boldsymbol{W}}^{{\rm{in}}}}$, ${{\boldsymbol{W}}^{{\rm{res}}}}$是随机生成的, ${{\boldsymbol{W}}^{{\rm{out}}}}$通常通过训练算法来计算和更新. $ f\left( \cdot \right) $是存储层的激活函数, 本文选择tanh函数; ${f^{{\rm{out}}}}\left( \cdot \right)$是输出层的激活函数.
模型性能与输入数据的选择方法和网络参数的确定方法具有强相关性. 本文在第2.1节中提出了基于核函数高维映射的多尺度数据配准方法, 用于建模数据集的构建. 本节中, 提出了一种基于梯度的权重调整策略用于ESN输出权重的更新. 首先定义网络的误差函数$ E\left( k \right) $为李雅普诺夫函数, 即
$$ E\left( k \right) = \frac{1}{2}{e^2}\left( k \right) = \frac{1}{2}{\left( {{y_t}\left( k \right) - y\left( k \right)} \right)^2} $$ (20) 式中, $ e\left( k \right) $为预测结果的误差, $ {y_t}\left( k \right) $表示实测值, $ y\left( k \right) $表示模型的预测值. 网络参数的学习算法为
$$ \begin{split} {\boldsymbol{\Theta }}\left( {k + 1} \right) =\;& {\boldsymbol{\Theta }}\left( k \right) - lr\frac{{\partial E\left( k \right)}}{{\partial {\boldsymbol{\Theta }}\left( k \right)}} =\\ & {\boldsymbol{\Theta }}\left( k \right) + lr \times{{ e}}\left( k \right)\frac{{\partial y\left( k \right)}}{{\partial {\boldsymbol{\Theta }}\left( k \right)}} \end{split} $$ (21) 式中
$$ \begin{split} &{\boldsymbol{\Theta }}\left( k \right) = {{\boldsymbol{W}}^{{\rm{out}}}} = \left[ {{w_1},{w_2},\cdots,{w_n}} \right] \\ & \frac{{\partial y\left( k \right)}}{{\partial {\boldsymbol{\Theta}} \left( k \right)}} = \left[ {\frac{{\partial y\left( k \right)}}{{\partial {w_1}\left( k \right)}},\frac{{\partial y\left( k \right)}}{{\partial {w_2}\left( k \right)}},\cdots,\frac{{\partial y\left( k \right)}}{{\partial {w_n}\left( k \right)}}} \right] \end{split} $$ $ lr $表示算法的学习率.
为了更好地证明所提模型的收敛性, 对误差函数$ e\left( k \right) $进行泰勒展开, 可得
$$ e\left( {k + 1} \right) = e\left( k \right) + {\left[ {\frac{{\partial e\left( k \right)}}{{\partial {\boldsymbol{\Theta }}\left( k \right)}}} \right]^{\text{T}}}\Delta {\boldsymbol{\Theta }}\left( k \right) + R\left( {{\boldsymbol{\Theta }}\left( k \right)} \right) $$ (22) 式中, $ R\left( {{\boldsymbol{\Theta }}\left( k \right)} \right) $为皮亚诺余项.
根据皮亚诺余项的性质, 可以推导得到
$$ \mathop {\lim }\limits_{\left\| {\Delta {\boldsymbol{\Theta}} \left( k \right)} \right\| \to 0} \frac{{\left| {R\left( {{\boldsymbol{\Theta }}\left( k \right)} \right)} \right|}}{{\left\| {\Delta {\boldsymbol{\Theta }}\left( k \right)} \right\|}} = 0 $$ (23) 即存在$\varphi > 0$, 使得$ \left\| {\Delta {\boldsymbol{\Theta }}\left( k \right)} \right\| < \varphi $时, $\left| {R\left( {{\boldsymbol{\Theta}} \left( k \right)} \right)} \right| < \left\| {\Delta {\boldsymbol{\Theta }}\left( k \right)} \right\|$. 由式(21)可知
$$ \left\| {\Delta {\boldsymbol{\Theta }}\left( k \right)} \right\| = \left\| {lr \times e\left( k \right)\frac{{\partial y\left( k \right)}}{{\partial {\boldsymbol{\Theta}} \left( k \right)}}} \right\| $$ (24) 所以, 当$ \left\| {\Delta {\boldsymbol{\Theta }}\left( k \right)} \right\| < \varphi $时, 可得
$$ \left| {R\left( {{\boldsymbol{\Theta }}\left( k \right)} \right)} \right| < lr \times \left| {e\left( k \right)} \right|{{\boldsymbol{\theta}} ^{\text{T}}}{\boldsymbol{\theta}} $$ (25) 其中, ${\boldsymbol{\theta}} = \frac{{\partial y}}{{\partial {\boldsymbol{\Theta }}\left( k \right)}}$.
定理1给出了参数学习算法的收敛性分析.
定理 1. 若$ \left\| {\Delta {\boldsymbol{\Theta }}\left( k \right)} \right\| $是有界的, 且$\left\| {\frac{{\partial y}}{{\partial {\boldsymbol{\Theta }}\left( k \right)}}} \right\|$也是有界的, 按照式(21)训练AW-ESN的网络参数, 则存在一个满足式(26)的学习率使得网络收敛.
$$ lr = \frac{{{{\rm{e}}^{\lambda \left\| {\boldsymbol{\theta}} \right\|}} - {{\rm{e}}^{ - \lambda \left\| {\boldsymbol{\theta}} \right\|}}}}{{{{\rm{e}}^{\lambda \left\| {\boldsymbol{\theta}} \right\|}} + {{\rm{e}}^{ - \lambda \left\| {\boldsymbol{\theta}} \right\|}}}} \times \varepsilon $$ (26) 式中,
$$ \varepsilon = \min \left\{ {\dfrac{1}{{\mathop {\mathop {\max }\limits_k {{\left\| {\frac{{\partial y\left( k \right)}}{{\partial {\boldsymbol{\Theta }}\left( k \right)}}} \right\|}^2}}\limits_{} }},\dfrac{\varphi }{{\mathop {\max }\limits_k \left\| {\frac{{\partial E\left( k \right)}}{{\partial {\boldsymbol{\Theta }}\left( k \right)}}} \right\|}}} \right\} $$ ${\boldsymbol{\theta}} = \frac{{\partial y}}{{\partial {\boldsymbol{\Theta }}\left( k \right)}}$, $ \lambda > 0 $, 由经验给定.
证明. 当学习率lr被选择满足式(26), 能够推得
$$ lr < \mathop {\min }\limits_k \left\{ {\frac{\varphi }{{\frac{{\partial E\left( k \right)}}{{\partial {\boldsymbol{\Theta }}\left( k \right)}}}}} \right\} $$ (27) 通过式(21), 可以得到
$$ \left\| {\Delta {\boldsymbol{\Theta}} \left( k \right)} \right\| = \left\| {lr\frac{{\partial E\left( k \right)}}{{\partial {\boldsymbol{\Theta}} \left( k \right)}}} \right\| < \frac{\varphi }{{\left\| {\frac{{\partial E\left( k \right)}}{{\partial {\boldsymbol{\Theta }}\left( k \right)}}} \right\|}} \times \left\| {\frac{{\partial E\left( k \right)}}{{\partial {\boldsymbol{\Theta }}\left( k \right)}}} \right\| =\varphi $$ (28) 根据式(20)和式(22), 可得
$$ \begin{split} \Delta E\left( k \right) =\;& \frac{1}{2}{e^2}\left( {k + 1} \right) - \frac{1}{2}{e^2}\left( k \right)= \\ & - {e^2}\left( k \right){{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} \left( {1 - \frac{1}{2}{{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} } \right) + \\ & R\left( {{\boldsymbol{\Theta}} \left( k \right)} \right)\left[ {\frac{1}{2}R\left( {{\boldsymbol{\Theta}} \left( k \right)} \right) + e\left( k \right)\left( {1 - {{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} } \right)} \right] \end{split} $$ (29) 通过式(25), 可以推导得到
$$ \begin{split} &\Delta E\left( k \right) < - {e^2}\left( k \right){{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} \left( {1 - \frac{1}{2}{{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} } \right)+ \\ &\qquad \left| {e\left( k \right)} \right|{{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} \left[ {\frac{1}{2}\left| {e\left( k \right)} \right|{{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} + e\left( k \right)\left( {1 - {{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} } \right)} \right] \end{split} $$ (30) 当$ e\left( k \right) > 0 $, 式(30)可以推得
$$ \begin{split} \Delta E\left( k \right) < \;&- {e^2}\left( k \right){{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} \left( {1 - \frac{1}{2}{{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} } \right)+ \\ &\;{e^2}\left( k \right){{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} \left[ {1 - \frac{1}{2}{{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} } \right] \end{split} $$ (31) 当$ e\left( k \right) < 0 $, 式(30)可以推得
$$ \Delta E\left( k \right) < 2{e^2}\left( k \right){{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} \left( {{{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} - 1} \right) $$ (32) 当选择的学习率$ lr $满足式(26)时, 可以推得
$$ {\text{0 < }}{{\boldsymbol{\theta}} ^{\text{T}}}lr{\boldsymbol{\theta}} {\text{ < 1}} $$ (33) 由式(32)和式(33)可知, 当$ e\left( k \right) < 0 $时, 可以推得
$$ E\left( k \right) < 0 $$ (34) 通过上述推导过程可知, 根据李雅普诺夫稳定性原理, 如果选择合适的学习率, AW-ESN的收敛性可以得到保证.
□ 2.3 知识与AW-ESN模型的融合
由于缺乏机理认知, 当数据驱动模型应用于实际工业过程, 面对复杂多变的工况时, 模型会出现泛化性能差, 从而导致预测精度下降等问题. 尽管本文已经从改善建模数据质量和提出新的训练算法两个方向上开展了一定的工作, 力求实现模型预测性能的提升. 但是由于样本的特征量多, 工业过程的数据波动仍会对模型预测性能的稳定性造成干扰. 机理分析和专家经验能够反映烧结过程的本质规律, 因此, 通过对烧结过程机理进行分析, 将过程数据中包含的专家知识与数据驱动模型相结合, 能够有效弥补数据驱动模型缺失的过程信息. 根据上述问题和解决策略, 本节基于过程数据中提取得到的FeO含量等级知识, 将提取得到的知识与AW-ESN融合, 建立DK-AWESN模型, 从而减少复杂工况造成的模型泛化性能下降.
如图5所示, 在DK-AWESN中, 烧结过程的专家知识被用于改进输出层中的激活函数$ {f_{{\text{out}}}}\left( \cdot \right) $. 基于料层温度分布特征和专家经验获取的FeO等级知识用于构建新的激活函数$ g\left( \cdot \right) $, 从而取代原本激活函数$ {f_{{\text{out}}}}\left( \cdot \right) $. $\; g\left( \cdot \right)$的表达式为
$$ g\left( \cdot \right) = \left\{ \begin{aligned} &\alpha {{\rm{e}}^{y - {k_{{g_1}}}}} + {k_{{g_1}}}, &y < {k_{{g_1}}} \qquad\;\;\\ &y, &{k_{{g_1}}} \leq y \leq {k_{{g_2}}} \\ & - \alpha {{\rm{e}}^{ - y + {k_{{g_2}}}}} + {k_{{g_2}}},&y > {k_{{g_2}}}\qquad\;\; \end{aligned} \right. $$ (35) 式中, $ y $表示模型的输出; $ {k_{{g_1}}} $, $ {k_{{g_2}}} $分别表示根据专家知识得到的FeO含量等级的下限值和上限值; $ \alpha $表示等级系数, 在本文中取值为0.5.
通过上述融合策略, 机理知识被融入到AW-ESN的输出激活函数中, 改进后的激活函数由于融入了基于过程机理划分的FeO等级知识, 能够有效地降低由于工况波动造成的模型预测结果过高或者过低的现象. 由改进的激活函数$ g\left( \cdot \right) $可以看出, 当预测结果超出专家知识划分的等级范围时, 模型能够综合专家知识和预测结果, 将最终的预测值调整回到正确的范围, 从而减少预测误差、提升预测精度.
3. 实例验证
为验证所提方法的有效性, 本文采用我国华南地区某钢铁集团3#烧结厂数据中心2019年1月1日 ~ 2019年10月30日记录的生产数据进行仿真实验. 表4中列出了模型的输入变量, 确定输入变量后, 依据基于核函数高维映射的多尺度数据配准方法构建了建模的样本集. 利用箱线图法剔除了异常值后, 获得了800个样本, 其中740个样本作为训练集, 60个样本作为测试集. 为避免输入变量量纲不同导致的建模样本集构建不合理, 输入变量归一化到[–1, 1]之间. 为更好地展示所提模型在动态的烧结过程建模上的优势, DK-ESN、AW-ESN以及ESN模型被用于与所提模型进行实例比较验证.
表 4 模型输入变量Table 4 The input variables of the model序号 变量名称 序号 变量名称 1 风箱废气温度 9 空支流量 2 烧结机机速 10 CMgO 3 料层高度 11 透气性 4 烧结终点 12 返矿比 5 ${\rm{C}}_{{\rm{SiO}}_2} $ 13 风箱负压 6 碱度 14 燃料配比 7 环冷机速度 15 点火温度 8 煤支流量 为更直观地对模型预测性能进行比较, 选择多次实验的测试集平均命中率(Hit rate, HR)以及平均绝对误差(Mean absolute error, MAE)、均方根误差(Root mean square error, RMSE)等标准统计指标作为定量评估模型性能的指标. 上述指标的计算式为
$$ \left\{ {\begin{aligned} &{RMSE=\sqrt {\frac{1}{n}\sum\limits_{k = 1}^n {{{err}}_k^2} } }\\ &{MAE=\frac{1}{n}\sum\limits_{k = 1}^n {\left| {{{err}}_k} \right|} }\\ &{HR=\frac{{\sum\limits_{k = 1}^n {{H_k}} }}{n} \times 100{\text{%}} ,\;\;{H_k} = \left\{ {\begin{aligned} &{1,\;\;\left| {{{err}}_k} \right| \le 0.4}\\ &{0,\;\;{\rm{其他}}} \end{aligned}} \right.} \end{aligned}} \right. $$ (36) 式中, ${{{err}}_k}= y(k)-{\hat y}^{(k)}$, y(k)和$ \hat y\left( k \right)$分别表示FeO含量的检测值和预测值; n表示测试样本个数; 考虑到过程数据存在噪声干扰, 本文将允许误差定为0.4以内. 为研究储备池规模对模型预测性能的影响, 本文选择了不同大小的储备池参数用于测试所提DK-AWESN模型. 对于不同储备池参数, 分别进行30次独立仿真, 并对结果进行统计, 统计结果如表5所示. 表中, NRMSE表示多次仿真结果RMSE的均值. 从表5可以看出, 当储备池神经元个数为200时, 模型的预测效果最好. 最终得到模型的参数为储备池神经元数N = 200, 谱半径ρ = 0.88, 稀疏度SD = 5%.
表 5 储备池规模对DK-AWESN性能的影响Table 5 Influence of reservoir size on the performance of DK-AWESN储备池规模 训练时间 (s) 测试 NRMSE 平均值 标准差 50 21.821 0.425 0.0332 100 21.832 0.371 0.0258 150 21.840 0.332 0.0254 200 21.841 0.301 0.0218 250 21.850 0.343 0.0262 300 21.864 0.399 0.0246 350 21.866 0.435 0.0321 400 21.891 0.482 0.0326 为提升模型的预测精度, 本文提出一种基于梯度的权重调整策略, 建立了AW-ESN. 为更直观地展示所提AW-ESN相较于ESN在FeO含量预测上的优越性, 图6展示了本文所提出的AW-ESN与ESN在同一个测试集上的预测结果. 从图6中可以看出, AW-ESN相较于ESN具有更好的跟踪性能, 在工况出现波动时, 如12、13、26、27、28样本点, AW-ESN均能实现较好的预测效果, 而ESN在第27个样本点处出现了较大的预测误差. 虽然当工况出现波动时, AW-ESN的预测误差相较于工况平稳时也增加了, 但是AW-ESN仍然能够较好地跟踪实测值的变化趋势, 展示了更好的预测性能.
针对数据驱动模型缺乏机理知识致使模型泛化性能差的问题, 本文将机理知识融入AW-ESN, 提出了DK-AWESN. 为验证融入机理知识对模型预测性能的提升, 图7和图8分别展示了AW-ESN和DK-AWESN、ESN和DK-ESN在同一个测试集上的预测结果. 从图7和图8可以看出, DK-ESN和DK-AWESN由于融入了基于过程机理划分的FeO等级知识, 能够有效地降低由于工况波动造成的模型预测结果过高或者过低的现象. 当FeO含量偏高或者偏低时, 模型预测结果与实测值之间易出现较大偏差, 在这种情况下, 相较于ESN和AW-ESN, DK-ESN和DK-AWESN能够将预测结果调整回到正确的范围内, 从而减少预测误差、提升预测精度. 当工况平稳, 预测模型预测效果较好时, 融入机理知识也不会对原本的预测效果造成影响, 从而保证工况平稳期的预测精度. 根据上述分析可知, 融入烧结过程机理知识后的数据模型能够在保证工况平稳期模型预测精度的同时, 兼顾工况波动期模型预测值跟踪实测值变化趋势的能力, 避免出现预测值大幅度偏离实测值的状况, 实现模型预测性能的提升.
通过上述实验结果与分析可知, 所提DK-AWESN在FeO含量预测上展现出良好的预测性能. 为进一步比较各模型的预测效果, 图9展示了各模型的预测误差, 预测误差越小说明预测性能越好. 从图9中可以看出, 所提DK-AWESN的预测误差相较于另外三种方法较小, 预测误差的波动也更稳定, 说明本文所提方法面对复杂的烧结工况具有更好的泛化性能. 当工况波动较大时, 所提方法的预测误差也会显著增加, 但是相较于其他几种方法, 本文所提DK-AWESN受到过程数据波动的影响更小, 预测性能更好.
为进一步比较不同模型的预测性能, 图10绘制了不同方法得到的FeO含量预测值和实测值的散点图. 从图10中可以看出, 所提DK-AWESN的圆形散点的分布更接近对角线, 而当预测值和实测相等时, 散点会处于对角线上, 因此说明所提DK-AWESN模型得到的预测结果与实测值更接近. 虽然仍然存在少数点偏离对角线, 但与ESN和AW-ESN相比, DK-AWESN能够较好地跟踪实测值的变化.
表6列出了上述预测模型的预测结果评价指标, 从表6数据可以看出, AW-ESN和DK-ESN的预测性能相较于ESN都有明显的提升, 而DK-AWESN的综合预测性能是最好的, 相较ESN而言, 在测试集上的预测命中率有较大幅度的提升, 达到了86.67%. 相较AW-ESN而言, 平均测试命中率提升了8.34%, 平均绝对误差降低了0.047, 均方根误差减少了0.044. 通过以上实验及其分析证明, 所提DK-AWESN方法通过将FeO等级知识融入AW-ESN使得预测值的波动区间减小, 一定程度上避免了由于缺乏机理认知导致模型泛化能力差的问题. 采用所提方法建立的模型的精度和泛化性能相较于另外三种数据驱动模型得到了增强, 能够较好地进行实际工程应用.
表 6 各模型的预测性能指标比较Table 6 Comparison of prediction performance indicators for different algorithms性能指标 ESN DK-ESN AW-ESN DK-AWESN MAE 0.351 0.254 0.298 0.251 RMSE 0.420 0.316 0.345 0.301 HR (%) 70.00 83.33 78.33 86.67 4. 结束语
本文提出了一种基于知识与AW-ESN融合(DK-AWESN)的烧结矿FeO含量预测方法. 在所提DK-AWESN中, 过程传热机理和专家经验中提取得到的知识与AW-ESN相结合, 实现了良好的FeO含量预测性能. 工业验证表明, 本文所建模型的命中率可达到86.67%, 模型预测精度受过程变量波动影响较小, 具有较好的泛化能力和建模精度. 通过统计分析, 利用均方根误差、命中率等统计指标对所提预测模型和其他数据驱动模型的预测精度进行对比. 结果表明, 所提方法有效提升了模型在复杂工况下的预测精度, 能够为烧结现场操作人员提供更可靠的信息, 从而提高烧结过程的调控能力和现场操作人员的操作准确率, 对实现烧结过程的稳定控制、提升烧结矿质量具有重要作用.
-
表 1 反应速率计算参数表
Table 1 Reaction rate parameters
参数名称 符号 值 指前因子 $ k $ $6.89 \times {10^5} \sim 8.3 \times {10^5}\;{{\rm{s}}^{ - 1} }$ 反应活化能 $ E $ ${ {125.61 \sim 137.16\;{\rm{kJ} } } \mathord{\left/ {\vphantom { {125.61 \sim 137.16\;{\rm{kJ} } } { {\rm{mol} } } } } \right. } {{\rm{mol}}} }$ 比例系数 $ R $ $8.314\;{\rm{kJ}}/({\rm{mol}} \cdot {\rm{K}})$ 抽风负压 $ P $ ${\text{1} }{\text{.2} } \times {\text{1} }{ {\text{0} }^4}\;{\rm{Pa} }$ 料前氧分压 ${P_{ {{\rm{O}}_2}1} }$ ${\text{0} }{\text{.21} }\;{\rm{P} }$ 料后氧分压 ${P_{ {{\rm{O}}_2}2} }$ $0.09 \sim 0.11\;{\rm{P}}$ 总氧气扩散系数 ${D_{ {{\rm{O}}^2} } }$ $ {\text{2}}.03 \times {10^{ - 5}}{T^{1.87}} $ 雷诺数 $ Re $ $ {\text{2}} \times {\text{1}}{{\text{0}}^3} \sim 3.5 \times {10^4} $ 燃料孔隙率 $ {\varepsilon _c} $ $ {\text{0}}{\text{.39}} $ 有效孔隙率 $ B $ $ 0.15 $ 施密特数 $Sc$ $ {\text{0}}{{.6 \sim 2}}{\text{.5}} $ 氧气浓度 ${C_{ {{\rm{O}}_2} } }$ 9.735% 表 2 FeO含量等级推理结果与实际值对比
Table 2 Comparison of the inference results with measured values of FeO content
序号 料层最高温度 (℃) 料层高度 (mm) 燃料比 (%) 全铁 (%) 推理结果 化验数据 1 1 278.55 749.129 4.187 61.874 正常 正常 (8.96) 2 1 127.32 736.383 4.496 60.899 正常 正常 (9.27) 3 1 158.76 761.918 4.492 61.854 正常 正常 (9.06) 4 1 211.36 718.536 4.331 61.715 正常 正常 (9.47) 5 1 274.22 717.253 4.162 60.706 偏小 偏小 (7.37) $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ 558 1 160.56 649.579 4.561 63.755 正常 正常 (9.47) 559 1 176.76 650.864 4.305 60.802 偏大 偏大 (10.60) 600 1 308.99 710.711 4.286 61.067 正常 正常 (8.16) 表 3 各过程参数的灰色关联度
Table 3 The grey relational degree of process parameters
序号 变量名称 关联度 序号 变量名称 关联度 1 风箱废气温度 0.803 11 空支流量 0.559 2 烧结机机速 0.798 12 CMgO 0.557 3 料层高度 0.778 13 透气性 0.549 4 烧结终点 0.737 14 返矿比 0.539 5 $ {\rm{C}}_{{\rm{SiO}}_2}$ 0.733 15 风箱负压 0.527 6 碱度 0.703 16 CCaO 0.459 7 燃料配比 0.669 17 烟道压力 0.337 8 环冷机速度 0.641 18 风机入口温度 0.327 9 点火温度 0.618 19 混一温度 0.271 10 煤支流量 0.574 20 圆辊速度 0.249 表 4 模型输入变量
Table 4 The input variables of the model
序号 变量名称 序号 变量名称 1 风箱废气温度 9 空支流量 2 烧结机机速 10 CMgO 3 料层高度 11 透气性 4 烧结终点 12 返矿比 5 ${\rm{C}}_{{\rm{SiO}}_2} $ 13 风箱负压 6 碱度 14 燃料配比 7 环冷机速度 15 点火温度 8 煤支流量 表 5 储备池规模对DK-AWESN性能的影响
Table 5 Influence of reservoir size on the performance of DK-AWESN
储备池规模 训练时间 (s) 测试 NRMSE 平均值 标准差 50 21.821 0.425 0.0332 100 21.832 0.371 0.0258 150 21.840 0.332 0.0254 200 21.841 0.301 0.0218 250 21.850 0.343 0.0262 300 21.864 0.399 0.0246 350 21.866 0.435 0.0321 400 21.891 0.482 0.0326 表 6 各模型的预测性能指标比较
Table 6 Comparison of prediction performance indicators for different algorithms
性能指标 ESN DK-ESN AW-ESN DK-AWESN MAE 0.351 0.254 0.298 0.251 RMSE 0.420 0.316 0.345 0.301 HR (%) 70.00 83.33 78.33 86.67 -
[1] Usamentiaga R, García D F, Molleda J, Bulnes F G, Orgeira V G. Temperature tracking system for sinter material in a rotatory cooler based on infrared thermography. IEEE Transactions on Industry Applications, 2014, 50(5): 3095-3102 doi: 10.1109/TIA.2014.2306984 [2] Li Y X, Yang C J, Sun Y X. Dynamic time features expanding and extracting method for prediction model of sintering process quality index. IEEE Transactions on Industrial Informatics, 2022, 18(3): 1737-1745 doi: 10.1109/TII.2021.3086763 [3] Fernández-González D, Ruiz-Bustinza I, Mochón J, González-Gasca C, Verdeja L F. Iron ore sintering: Process. Mineral Processing and Extractive Metallurgy Review, 2017, 38(4): 215-227 doi: 10.1080/08827508.2017.1288115 [4] Fernández-González D, Ruiz-Bustinza I, Mochón I, González-Gasca C, Verdeja L F. Iron ore sintering: Raw materials and granulation. Mineral Processing and Extractive Metallurgy Review, 2017, 38(1): 36-46 doi: 10.1080/08827508.2016.1244059 [5] Huang Z C, Yi L Y, Jiang T, Zhang Y B. Hot airflow ignition with microwave heating for iron ore sintering. ISIJ International, 2012, 52(10): 1750-1756 doi: 10.2355/isijinternational.52.1750 [6] 李温鹏, 周平. 高炉铁水质量鲁棒正则化随机权神经网络建模. 自动化学报, 2020, 46(4): 721-733Li Wen-Peng, Zhou Ping. Robust regularized RVFLNs modeling of molten iron quality in blast furnace ironmaking. Acta Automatica Sinca, 2020, 46(4): 721-733 [7] Chen X X, Shi X H, Lan T. A semi-supervised linear-nonlinear prediction system for tumbler strength of iron ore sintering process with imbalanced data in multiple working modes. Control Engineering Practice, 2021, 110: Article No. 104766 doi: 10.1016/j.conengprac.2021.104766 [8] Umadevi T, Karthik P, Mahapatra P C, Prabhu M, Ranjan M. Optimisation of FeO in iron ore sinter at JSW Steel Limited. Ironmaking & Steelmaking, 2012, 39(3): 180-189 [9] 廖继勇, 何国强. 近五年烧结技术的进步与发展. 烧结球团, 2018, 43(5): 1-11, 19Liao Ji-Yong, He Guo-Qiang. Progress and development of sintering technologies during the last five years. Sintering and Pelletizing, 2018, 43(5): 1-11, 19 [10] Kawaguchi T, Sato S, Takata K. Development and application of an integrated simulation model for iron ore sintering. Iron Making Proceeding, 1987, 73(15): 1940-1947 [11] Yamaoka H, Kawaguchi T. Development of a 3-D sinter process mathematical simulation model. ISIJ International, 2005, 45(4): 522-531 doi: 10.2355/isijinternational.45.522 [12] 王悦祥. 烧结矿与球团矿生产. 北京: 冶金工业出版社, 2006.Wang Yue-Xiang. Sinter and Pellet Production. Beijing: Metallurgical Industry Press, 2006. [13] Jiang Z H, Guo Y H, Pan D, Gui W H, Maldague X. Polymorphic measurement method of FeO content of sinter based on heterogeneous features of infrared thermal images. IEEE Sensors Journal, 2021, 21(10): 12036-12047 doi: 10.1109/JSEN.2021.3065942 [14] Wu C, Wang F B, Chen X Z, Hou Q W, Chen Z K, Zhang M, et al. RGB color decomposition and image feature extraction of flame image in rear of sintering machine. In: Proceedings of the 36th Chinese Control Conference. Dalian, China: IEEE, 2017. 5640−5463 [15] 周雨润. 基于机尾断面图像和风箱温度的烧结质量等级在线评测系统的研究[硕士学位论文], 安徽大学, 中国, 2013.Zhou Yu-Run. The Research on Online Evaluation System for Sintering Quality Grade Based on Tail Section Image and Bellows Temperature [Master thesis], Anhui University, China, 2013. [16] Zhou H, Zhang H F, Yang C J. Hybrid-model-based intelligent optimization of ironmaking process. IEEE Transactions on Industrial Electronics, 2020, 67(3): 2469-2479 doi: 10.1109/TIE.2019.2903770 [17] Du S, Wu M, Chen L F, Zhou K L, Hu J, Cao W H, et al. A fuzzy control strategy of burn-through point based on the feature extraction of time-series trend for iron ore sintering process. IEEE Transactions on Industrial Informatics, 2020, 16(4): 2357-2368 doi: 10.1109/TII.2019.2935030 [18] 周平, 张丽, 李温鹏, 戴鹏, 柴天佑. 集成自编码与PCA的高炉多元铁水质量随机权神经网络建模. 自动化学报, 2018, 44(10): 1799-1811Zhou Ping, Zhang Li, Li Wen-Peng, Dai Peng, Chai Tian-You. Autoencoder and PCA based RVFLNs modeling for multivariate molten iron quality in blast furnace ironmaking. Acta Automatica Sinica, 2018, 44(10): 1799-1811 [19] 张舒, 高为民. 人工神经网络在烧结矿指标预测中的应用. 烧结球团, 2001, 26(4): 6-10Zhang Shu, Gao Wei-Min. Application of neural networks in the prediction of sinter quality. Sintering and Pelletizing, 2001, 26(4): 6-10 [20] Laitinen P J, Saxén H. A neural network based model of sinter quality and sinter plant performance indices. Ironmaking & Steelmaking, 2007, 34(2): 109-114 [21] 袁致强. 基于深度置信网络的烧结矿化学成分预测模型研究[硕士学位论文], 武汉科技大学, 中国, 2018.Yuan Zhi-Qiang. Study on Prediction Modeling of the Sinter Chemical Component Based on Deep Learning [Master thesis], Wuhan University of Science and Technology, China, 2018. [22] 蒋朝辉, 许川, 桂卫华, 蒋珂. 基于最优工况迁移的高炉铁水硅含量预测方法. 自动化学报, 2022, 48(1): 194-206Jiang Zhao-Hui, Xu Chuan, Gui Wei-Hua, Jiang Ke. Prediction method of hot metal silicon content in blast furnace based on optimal smelting condition migration. Acta Automatica Sinica, 2022, 48(1): 1194-206 [23] 李泽龙, 杨春节, 刘文辉, 周恒, 李宇轩. 基于LSTM-RNN模型的铁水硅含量预测. 化工学报, 2018, 69(3): 992-997Li Ze-Long, Yang Chun-Jie, Liu Wen-Hui, Zhou Heng, Li Yu-Xuan. Research on hot metal Si-content prediction based on LSTM-RNN. CIESC Journal, 2018, 69(3): 992-997 [24] 吴高昌, 刘强, 柴天佑, 秦泗钊. 基于时序图像深度学习的电熔镁炉异常工况诊断. 自动化学报, 2019, 45(8): 1475-1485Wu Gao-Chang, Liu Qiang, Chai Tian-You, Qin S J. Abnormal condition diagnosis through deep learning of image sequences for fused magnesium furnaces. Acta Automatica Sinica, 2019, 45(8): 1475-1485 [25] Fang Y J, Jiang Z H, Pan D, Gui W H, Chen Z P. Soft sensors based on adaptive stacked polymorphic model for silicon content prediction in ironmaking process. IEEE Transactions on Instrumentation and Measurement, 2021, 70: Article No. 2503412 [26] 王磊, 乔俊飞, 杨翠丽, 朱心新. 基于灵敏度分析的模块化回声状态网络修剪算法. 自动化学报, 2019, 45(6): 1136-1145Wang Lei, Qiao Jun-Fei, Yang Cui-Li, Zhu Xin-Xin. Pruning algorithm for modular echo state network based on sensitivity analysis. Acta Automatica Sinica, 2019, 45(6): 1136-1145 [27] 姜涛. 铁矿造块学. 长沙: 中南大学出版社, 2016.Jiang Tao. Principle and Technology of Agglomeration of Iron Ores. Changsha: Central South University Press, 2016. [28] Yao X S, Wang Z S. Broad echo state network for multivariate time series prediction. Journal of Franklin Institute, 2019, 356(9): 4888−4906 期刊类型引用(2)
1. 唐佳润,刘月明,张福明,李贺. 烧结矿FeO含量预测技术的探讨. 烧结球团. 2025(01): 21-30+37 . 百度学术
2. 杨双平,张益玮,刘起航,王苗,池延斌,董洁. 烧结过程温度场数值模拟及烧结终点参数影响. 钢铁研究学报. 2024(09): 1174-1182 . 百度学术
其他类型引用(1)
-