2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于时序关联矩阵的高炉冶炼过程多重关联时延估计方法

蒋珂 蒋朝辉 谢永芳 潘冬 桂卫华

蒋珂, 蒋朝辉, 谢永芳, 潘冬, 桂卫华. 基于时序关联矩阵的高炉冶炼过程多重关联时延估计方法. 自动化学报, 2023, 49(2): 329−342 doi: 10.16383/j.aas.c220091
引用本文: 蒋珂, 蒋朝辉, 谢永芳, 潘冬, 桂卫华. 基于时序关联矩阵的高炉冶炼过程多重关联时延估计方法. 自动化学报, 2023, 49(2): 329−342 doi: 10.16383/j.aas.c220091
Jiang Ke, Jiang Zhao-Hui, Xie Yong-Fang, Pan Dong, Gui Wei-Hua. A multi-correlated time-delay estimation method in the blast furnace ironmaking process based on time-series correlation matrix. Acta Automatica Sinica, 2023, 49(2): 329−342 doi: 10.16383/j.aas.c220091
Citation: Jiang Ke, Jiang Zhao-Hui, Xie Yong-Fang, Pan Dong, Gui Wei-Hua. A multi-correlated time-delay estimation method in the blast furnace ironmaking process based on time-series correlation matrix. Acta Automatica Sinica, 2023, 49(2): 329−342 doi: 10.16383/j.aas.c220091

基于时序关联矩阵的高炉冶炼过程多重关联时延估计方法

doi: 10.16383/j.aas.c220091
基金项目: 国家重大科研仪器研制项目(61927803), 国家自然科学基金(61725306, 61290325), 湖南省科技创新计划(2021RC4054), 广东省重点领域研发计划(2021B0101200005), 中南大学研究生自主探索创新项目(2021zzts0183), 湖南省研究生科研创新项目(CX20210242)资助
详细信息
    作者简介:

    蒋珂:中南大学自动化学院博士研究生. 2019年获得中南大学硕士学位. 主要研究方向为数据驱动的工业过程建模与控制, 过程数据分析和机器学习. E-mail: jiangke@csu.edu.cn

    蒋朝辉:中南大学自动化学院教授. 2011年获得中南大学博士学位. 主要研究方向为智能传感与检测技术, 图像处理与智能识别, 人工智能和机器学习. 本文通信作者. E-mail: jzh0903@csu.edu.cn

    谢永芳:中南大学自动化学院教授. 1999 年获得中南工业大学博士学位. 主要研究方向为分散控制与鲁棒控制, 过程控制, 工业大数据和知识自动化. E-mail: yfxie@csu.edu.cn

    潘冬:中南大学自动化学院讲师. 分别于2015年和2021年获得中南大学学士学位和博士学位. 主要研究方向为红外热成像, 视觉检测, 图像处理和深度学习. E-mail: pandong@csu.edu.cn

    桂卫华:中国工程院院士, 中南大学自动化学院教授. 1981年获得中南矿冶学院硕士学位. 主要研究方向为复杂工业过程建模, 优化与控制应用, 故障诊断与分布式鲁棒控制. E-mail: gwh@csu.edu.cn

A Multi-correlated Time-delay Estimation Method in the Blast Furnace Ironmaking Process Based on Time-series Correlation Matrix

Funds: Supported by National Major Scientific Research Equipment of China (61927803), National Natural Science Foundation of China (61725306, 61290325), Science and Technology Innova-tion Program of Hunan Province (2021RC4054), Key-area Research and Development Program of Guangdong Province (2021B0101200005), Fundamental Research Funds for theCentral Universisities of Central South University (2021zzts0183), Hunan Provincial Innovation Foundation for Postgraduate (CX20210242)
More Information
    Author Bio:

    JIANG Ke Ph.D. candidate at the School of Automation, Central South University. She received her master degree from Central South University in 2019. Her research interest covers data-based modeling and control of industrial process, process data analysis, and machine learning

    JIANG Zhao-Hui Professor at the School of Automation, Central South University. He received his Ph.D. degree from Central South University in 2011. His research interest covers intelligent sensing and detection technology, image processing and intelligent recognition, artificial intelligence, and machine learning. Corresponding author of this paper

    XIE Yong-Fang Professor at the School of Automation, Central So-uth University. He received his Ph.D. degree from Central South University of Technology in 1999. His research interest covers decentralized control and robust control, process control, industrial big data, and knowledge automation

    PAN Dong Lecturer at the School of Automation, Central South University. He received his bachelor and Ph.D. degrees from Central South University in 2015 and 2021, respectively. His research interest covers infrared thermography, vision-based measurement, image processing, and deep learning

    GUI Wei-Hua Academician of Chinese Academy of Engineering, and professor at the School of Automation, Central South University. He received his master degree from Central South Institute of Mining and Metallurgy in 1981. His research interest covers complex industrial process modeling, optimization and control applications, fault diagnosis, and distributed robust control

  • 摘要: 高炉冶炼过程由炉料传输反应时间和冶炼单元在空间和时间分布上的差异带来的变量时延影响了数据的准确性和真实因果关系, 因此有效地估计过程变量间的时延信息, 并在时序上配准数据, 是后续过程建模、优化控制与性能评估的核心. 考虑到变量间时延的多重关联性, 提出了一种基于时序关联矩阵的时延参数估计方法. 首先, 根据过程变量的时延参数在时空上重构对应的时序关联矩阵, 并引入灰色关联分析量化时序矩阵的多重关联相关性; 接着, 考虑到穷举所有时序关联矩阵的时间复杂度, 提出了一种双尺度协同搜索策略的动态多群粒子群算法用于快速寻找最优的时延参数, 提出的粒子群算法能兼顾全局探索能力和局部探测能力并跳出局部最优解; 最后, 基于一个数值仿真和某钢铁厂2# 高炉的工业实验验证了所提时延参数估计方法的可行性和有效性, 且通过所提方法在时序上重构的数据能有效提高后续硅含量软测量模型性能.
  • 高炉炼铁是一个连续鼓风、周期性加料和间歇性出铁、在高温高压高粉尘等恶劣环境下发生复杂物理化学反应、剧烈的物质与相变转化、高强度转移与传递的生产过程[1]. 全过程是在炉料自上而下、煤气自下而上的相互接触过程中完成的, 高炉炼铁过程工艺如图1所示[2]. 固体燃料(焦炭、煤粉等)、含铁原料(烧结矿、球团矿和块矿)和溶剂(白云石、石灰石和锰矿等)按一定配比从炉顶装入炉内, 同时高炉下部喷煤系统喷吹的煤粉与热风炉加热高温热风中的氧气在风口平台发生燃烧反应产生一氧化碳和氢气等高温还原性气体. 上升煤气流与下降炉料间进行的一系列传热、传质以及干燥、蒸发、挥发、分解、还原、软熔、造渣、渗碳、脱硫等物理化学变化后生成熔融铁水, 当炉缸内的铁水到达一定容量后, 使用开孔机钻开出铁口间歇性地排出熔融铁水, 在撇渣器处实现渣铁分离后经鱼雷罐车运至后续生产工序[35].

    图 1  高炉三维仿真模拟图
    Fig. 1  Three-dimensional simulation diagram of the blast furnace cast field

    时延特性是所有流程工业, 包括但不限于高炉冶炼过程的一个共有属性, 主要是由炉料传输反应时间和冶炼单元在空间和时间分布上的差异所造成的. 由于炉料无法被标记跟踪, 导致很难确定高炉上部布料制度改变后多久才能影响到运行状态和炉缸内的铁水质量. 此外, 在高炉不同的空间位置上分布着不同的冶炼单元, 比如高炉中下部连通的热风炉系统和喷煤系统, 与喷煤和热风相关的控制变量对运行状态和铁水质量的影响也存在一定的时延, 主要是因为上升的高温煤气流和下降的炉料发生物理化学反应需要一定的时间.

    高炉冶炼过程时延的存在, 不仅增加了运行状态在线监测和铁水质量在线建模的难度, 也加大了运行状态和铁水质量调控的难度. 当矿源改变或者外界干扰引起高炉冶炼过程稳态工作点改变时, 一般需要依靠经验丰富的现场操作者基于经验进行调节, 逐渐过渡到新的稳态工作点, 这种动态调节较为粗放, 主观性较强, 并且高炉冶炼过程的滞后性使得动态调整的时间往往过长. 长时间的炉况不稳定造成铁水成分波动大、铁水质量不合格, 会给钢铁企业带来大量的能源和资源的浪费. 因此, 分析和准确估计高炉冶炼过程时延特性和参数, 对运行状态和铁水质量的建模和优化控制具有重要的意义[6].

    高炉的运行状态需要从原料、操作、出铁等方面考虑多个指标综合衡量, 铁水质量就是其中一个重要的指标[710], 因此本文主要聚焦于估计高炉冶炼过程的关键过程变量相对于铁水质量变量的时延参数. 铁水温度和硅含量是表征铁水质量的重要参数, 考虑到前期工作研发的红外视觉检测系统能实现出铁口铁水温度的实时在线检测[11], 为此, 本文工作主要是估计关键过程变量相对于铁水硅含量的时延参数, 并为铁水硅含量的实时建模和优化控制提供重要的参考信息. 关键过程变量与铁水硅含量的时延特性具有明显的多重性和关联性. 其中第一重是由于炉料传输反应的时间和冶炼单元在空间和时间分布上的差异所导致的时延. 第二重来自于高炉现场人工取样、冷却再化验过程和化验信息录入与审核下达存在不确定的时延. 除此以外, 高炉内部发生多达数百种物理化学反应使得各过程变量之间又互相影响, 导致过程变量的多重时延又存在关联.

    现有时延分析是根据专家经验结合相关系数得到最大相关性的某一确定滞后时间. 比较常见的做法是单独地计算不同时延步长下的过程变量与质量变量的皮尔逊相关系数, 最大相关系数所对应的步长即为时延时间[1214], 尽管这种方法有着便于实现、计算速度快等优点, 但是, 在计算时忽略了其他辅助过程变量对铁水硅含量的影响以及过程变量之间的相互影响, 即忽略了时延之间的关联性, 并且皮尔逊相关系数只能考虑两个变量之间的线性关系, 并不适合非线性强耦合的高炉冶炼过程. 在其他工业领域, 如石油化工过程, 文献[15]考虑了过程变量间的联合互信息来确定时延参数, 但是基于互信息的时延联合估计在输入维数高、样本数量大的情况下往往运算时间较长, 不利于实际的工程实践[15]. 本质上来说, 无论是基于相关系数还是互信息的时延参数估计方法, 都是在寻找与待估计变量相关性最大的过程变量.

    现有的方法为过程变量之间的时延参数估计提供了很好的思路, 但考虑到过程变量与硅含量之间的时延存在多重关联性, 导致传统的单变量时延估计方法难以准确地估计出复杂的高炉冶炼过程真实时延. 随着集散控制系统和工业互联网成功运用以来, 高炉冶炼系统已积累了海量能反映冶炼过程的知识和数据, 这些数据中隐含着过程的多重关联时延特性. 因此, 本文从数据驱动的角度出发, 提出了一种基于时序关联矩阵的过程变量多重关联时延参数估计方法, 采用多元时间序列描述不同时延系统的多重关联特性, 运用时基标识不同时延的反馈信息, 改变多元时间序列和时基, 来寻找隐藏在数据中的真实时延参数. 具体而言, 以变量在某段时间稳定运行的数据为对象, 根据过程变量的时延序列重构对应的时序关联矩阵, 并引入灰色关联度来量化时序关联矩阵的多重关联相关性.

    此外, 考虑到单个变量的时延参数的取值$ c_i $为预估时延区间内采样周期整数倍个数, 不失一般性, 若估计$ N $个过程变量相对于硅含量的时延参数, 可能的时序关联矩阵将会有$ \prod\nolimits_{i = 1}^N {{c_i}} $种可能. 穷举计算所有可能时延组合下的时序关联矩阵的相关性是非常耗时的, 因此在保证精度的前提下, 以尽量小的计算开销, 快速估计出最优的时延参数是十分必要的. 基于此, 本文提出了一种双尺度协同搜索策略的动态多群粒子群算法用来快速搜寻具有最大相关性的时序关联矩阵, 将多重关联时延参数估计问题转化为求解一系列时序关联矩阵的最大相关性的优化问题. 最后, 根据估计的时延参数在时序上重新配准过程变量和硅含量时间序列来恢复真实的数据分布, 提高了建模数据的准确性和一致性. 数值仿真的结果和高炉冶炼过程定性的分析结果和定量的硅含量在线预测结果也进一步验证本文所提方法的可行性和有效性.

    高炉冶炼过程测量数据的准确性和有效性是过程建模、优化控制与性能评估的核心, 作为一种典型的具有多重关联时延特性的生产过程, 时延特性反映了冶炼过程的动态因果关系. 因此, 若不考虑高炉冶炼过程的多重关联时延问题, 则关键过程变量与铁水硅含量之间实际的因果关系将被打乱. 本文的主要工作是充分挖掘大量历史数据的分布规律, 从中估计出过程变量相对于硅含量的多重关联时延参数.

    为了实时监测高炉冶炼过程的运行状态, 假设在高炉四周安装了如图2(a)所示的多个传感器, 其中$ {x_0} $表示硅含量, $ {x_i} $表示第$ i $个过程变量. 假设样本实时且均匀地在时间轴上采样$ M $次, 若不考虑过程变量与硅含量之间的多重关联时延, 那么在第$ t $时刻与硅含量对应的过程变量为如图2(b)所示时间序列数据, 即:

    图 2  高炉炼铁过程中变时滞问题描述
    Fig. 2  Illustration of variable time-delay problem in the blast furnace ironmaking process
    $$ \begin{array}{l} {{\boldsymbol{x}}^t} = \left[ {x_0^t|x_1^t, \cdots ,x_i^t, \cdots ,x_N^t} \right] \end{array} $$ (1)

    但是, 由炉料传输反应时间和冶炼单元在空间和时间分布上的差异可知, 不同的过程变量与铁水硅含量之间有着不同的时延, 假设铁水硅含量与各过程变量之间真实的多重关联时延为$ {\boldsymbol{\Gamma '}} $, 即:

    $$ \begin{array}{l} {\boldsymbol{\Gamma '}} = \left[ {{{\tau '}_1},{{\tau '}_2}, \cdots ,{{\tau '}_i}, \cdots ,{{\tau '}_N}} \right] \end{array} $$ (2)

    因此本文的目的就是基于高炉冶炼过程保存的大量的生产运行数据估计出最优的多重关联时延序列$ {\boldsymbol{\Gamma }} $, 使得${\boldsymbol{\Gamma }} = \left[ {{\tau _1}, {\tau _2}, \cdots , {\tau _i}, \cdots , {\tau _N}} \right] \approx {\boldsymbol{\Gamma '}} = [ {{\tau '}_1}, {{\tau '}_2}, \cdots , {{\tau '}_i}, \cdots , {{\tau '}_N}]$. 根据估计出来的时延参数, 在时序上重构过程变量与硅含量之间的对应关系, 消除时延后的时间序列数据如图2(c)所示, 即:

    $$ \begin{array}{l} {{\boldsymbol{x}}^t} = \left[ {x_0^t|x_1^{t - {\tau _1}}, \cdots ,x_i^{t - {\tau _i}}, \cdots ,x_N^{t - {\tau _N}}} \right] \end{array} $$ (3)

    为了准确地估计各辅助过程变量的时延参数, 本文提出了一种基于时序关联矩阵的过程变量多重关联时延估计方法. 引入灰色关联分析来定量描述时序关联矩阵的多重关联相关性, 并提出一种基于双尺度协同搜索策略的动态多群粒子群算法用来快速寻找最优时延参数.

    高炉冶炼过程中保存着大量的生产运行数据, 这些数据隐含着过程变量与硅含量之间时延特性.为了分析时延的多重关联性, 需要将待估计的所有过程变量归纳到一起进行综合考虑. 定义铁水硅含量为零时延参考变量, 基于时延参数在时序上重构过程变量数据形成对应的多元时间序列, 重构的过程变量与硅含量组成能反映不同时延特性的时序关联矩阵.

    假设在高炉冶炼过程中, 从上到下在竖式容器四周安装了$ N $个传感器, 在时间轴上采样$ M $次可以得到过程变量形成的原始时序数据矩阵$ {\boldsymbol{X}} $:

    $$ \begin{split} {\boldsymbol{X}} =\;& \left[ {{{\boldsymbol{x}}_0},{{\boldsymbol{x}}_1}, \cdots ,{{\boldsymbol{x}}_i}, \cdots ,{{\boldsymbol{x}}_N}} \right] = \\ &{\left[ {\begin{array}{*{20}{c}} {x_0^1}&{x_1^1}& \cdots &{x_i^1}& \cdots &{x_N^1}\\ {x_0^2}&{x_1^2}& \cdots &{x_i^2}& \cdots &{x_N^2}\\ \vdots & \vdots & \ddots & \vdots & \ddots & \vdots \\ {x_0^t}&{x_1^t}& \cdots &{x_i^t}& \cdots &{x_N^t}\\ \vdots & \vdots & \ddots & \vdots & \ddots & \vdots \\ {x_0^M}&{x_1^M}& \cdots &{x_i^M}& \cdots &{x_N^M} \end{array}} \right]_{M \times \left( {N + 1} \right)}} \end{split} $$ (4)

    原始时序数据矩阵中元素的下标代表过程变量, 上标代表采样时刻. 其中$ {{\boldsymbol{x}}_0} $为零时延参考变量铁水硅含量的时间序列数据, $ {{\boldsymbol{x}}_i} $为第$ i $个过程变量的时间序列数据.

    为了避免多重关联时延估计过程中量纲对结果的影响, 需要将原始时序数据矩阵$ {\boldsymbol{X}} $进行归一化处理, 公式如下:

    $$ \tilde x_i^t = \frac{{x_i^t - x_i^{{\rm{min}}}}}{{x_i^{{\rm{max}}} - x_i^{{\rm{min}}}}} $$ (5)

    式中, $ \tilde x_i^t $表示第$ i $个过程变量在第$ t $个采样时刻数据归一化的结果, $ x_i^t $表示第$ i $个过程变量在第$ t $个采样时刻的值, $ {x_i^{{\rm{max}}}} $$ {x_i^{{\rm{min}}}} $分别为第$ i $个过程变量在所有数据样本中的最大值和最小值. 经过归一化处理后的原始时序数据矩阵为${\boldsymbol{\tilde X}} = [ {{{\boldsymbol{\tilde x}}}_0}, {{{\boldsymbol{\tilde x}}}_1},\cdots, {{{\boldsymbol{\tilde x}}}_i}, \cdots, {{{\boldsymbol{\tilde x}}}_N} ]_{_{M \times \left( {N + 1} \right)}}$, 其中 ${{\boldsymbol{\tilde x}}_i} = [ \tilde x_i^1, \tilde x_i^2, \cdots , \tilde x_i^t, \cdots , \tilde x_i^M ]^{\rm{T}}$.

    假设估计的零时延参考变量(铁水硅含量)与各过程变量的多重关联时延参数用时延序列表示, 即:

    $$ \begin{array}{l} {\boldsymbol{\Gamma }} = \left[ {{\tau _1}, {\tau _2}, \cdots , {\tau _i}, \cdots , {\tau _N}} \right] \end{array} $$ (6)

    原始时序数据矩阵中各过程变量的采样周期记为$ T $, 则第$ i $个过程变量相对于零时延参考变量的时延参数需要满足:

    $$ \begin{array}{l} {\boldsymbol{\Gamma }} = DT = \left[ {{d_1}T, {d_2}T, \cdots , {d_i}T, \cdots , {d_N}T} \right] \end{array} $$ (7)

    式中, $ D $是时基序列, $ {d_i} $是第$ i $个过程变量的时基, 是一个无量纲的整数, 这样可以保证过程变量的多重关联时延参数为采样周期的整数倍, 这是为了确保过程变量在时序上重构的可行性.

    经过归一化处理后的原始时序数据矩阵中隐藏着高炉冶炼过程的时延特性. 为了估计出不同过程变量的多重关联时延参数, 在时空维度上重构不同时基序列下的过程变量与铁水硅含量组成的时序关联矩阵, 运用时基标识不同时延的反馈信息. 其重构过程如下, 首先从零时延参考变量$ {{\boldsymbol{\tilde x}}_0} $中选取从第$ t $时刻开始采样频率为$ T $$ F $个数据构成时间序列$ {{\boldsymbol{\dot x}}_0} $:

    $$ \begin{array}{l} {{\boldsymbol{\dot x}}_0} = {\left[ {\tilde x_0^t,\tilde x_0^{t + T},\tilde x_0^{t + 2T}, \cdots ,\tilde x_0^{t + \left( {F - 1} \right)T}} \right]^{\rm{T}}} \end{array} $$ (8)

    其中

    $$ \begin{array}{l} FT \ge {\rm{max}}\left( {{\tau _1},{\tau _2}, \cdots ,{\tau _i}, \cdots ,{\tau _N}} \right) \end{array} $$ (9)

    使得序列所含的数据至少能包含从高炉顶部布料到炉缸出铁的一个完整的冶炼周期, 并且从采样时刻$ t $开始选取的$ F $个数据需要保证包含零时延参考变量的一个过渡态.

    考虑到高炉是一个竖式的冶炼容器, 铁水硅含量的采样点在垂直方向上等效于高炉底部, 其余的过程变量$ {x_i} $监测点位于高炉底部及上方, 根据上文定义的多重关联时延序列可知, 相对于铁水硅含量, 过程变量$ {x_i} $相对于零时延参考变量的滞后系数为$ {\tau _i} $, 因此取过程变量$ {x_i} $$ t - {\tau _i} $时刻开始的$ F $个数据生成新的时间序列$ {{\boldsymbol{\dot x}}_i} $, 即从$ t - {d_i}T $开始的连续$ F $个采样数据:

    $$ \begin{split} {\boldsymbol{\dot x}}_i =\;& \Big[ \tilde x_i^{t - {d_i}T},\tilde x_i^{t - \left( {{d_i} - 1} \right)T},\tilde x_i^{t - \left( {{d_i} - 2} \right)T}, \cdots ,\\ &\tilde x_i^{t - \left( {{d_i} - \left( {F - 1} \right)} \right)T}\Big]^{\rm{T}} \end{split} $$ (10)

    按照上述规则就可以根据时延序列重构出新的数据矩阵, 即根据过程变量的时延参数在时空上重构的时序关联矩阵$ {{\boldsymbol{\dot X}}} $:

    $$ \begin{split} {\boldsymbol{\dot X}} =\;& [{{{\boldsymbol{\dot x}}}_0}\;\;\;{{{\boldsymbol{\dot x}}}_1}\;\;\; \cdots \;\;\;{{{\boldsymbol{\dot x}}}_i}\;\;\; \cdots \;\;\;{{{\boldsymbol{\dot x}}}_N}] = \\ &\left[ {\begin{array}{*{20}{c}} {\tilde x_0^t}&{\tilde x_1^{t - {d_1}T}}& \cdots \\ {\tilde x_0^{t + 1T}}&{\tilde x_1^{t - \left( {{d_1} - 1} \right)T}}& \cdots \\ {\tilde x_0^{t + 2T}}&{\tilde x_1^{t - \left( {{d_1} - 2} \right)T}}& \cdots \\ \vdots & \vdots & \ddots \\ {\tilde x_0^{t + \left( {F - 1} \right)T}}&{\tilde x_1^{t - \left( {{d_1} - \left( {F - 1} \right)} \right)T}}& \cdots \end{array}} \right.\\ & {\left. {\begin{array}{*{20}{c}} {\tilde x_i^{t - {d_i}T}}& \cdots &{\tilde x_N^{t - {d_N}T}}\\ {\tilde x_i^{t - \left( {{d_i} - 1} \right)T}}& \cdots &{\tilde x_N^{t - \left( {{d_N} - 1} \right)T}}\\ {\tilde x_i^{t - \left( {{d_i} - 2} \right)T}}& \cdots &{\tilde x_N^{t - \left( {{d_N} - 2} \right)T}}\\ \vdots & \ddots & \vdots \\ {\tilde x_i^{t - \left( {{d_i} - \left( {F - 1} \right)} \right)T}}& \cdots &{\tilde x_N^{t - \left( {{d_N} - \left( {F - 1} \right)} \right)T}} \end{array}} \right]_{F \times \left( {N + 1} \right)}} \end{split} $$ (11)

    时序关联矩阵将过程变量在不同时延参数下的时间序列数据归纳在一起, 为了有效地描述多元时间序列数据之间的相关程度, 必须对时序关联矩阵的相关性进行量化. 灰色关联分析是多元时间序列关联分析中常用的方法, 其通过灰色关联度来定量描述多组变量之间的变化趋势, 多组变量之间的关联度越高, 灰色关联度越大, 反之亦然[16]. 此外, 灰色关联分析对数据数量和分布规律没有要求[17]. 因此, 本文采用灰色关联度来衡量多个时间序列数据之间的相关程度, 即表示相互影响的过程变量时间序列数据与铁水硅含量时间序列数据之间的相关性.

    令重构的时序关联矩阵中的零时延铁水硅含量序列为母序列, 需要估计时延参数的多元过程变量为子序列, 首先计算母序列与子序列对应元素之差, 用矩阵$ {\boldsymbol{A}} $表示:

    $$ \begin{array}{l} {\boldsymbol{A}} = {\left[ {\begin{array}{*{20}{c}} {{a_{01}}}& \cdots &{{a_{0i}}}& \cdots &{{a_{0N}}}\\ \vdots & \ddots & \vdots & \ddots & \vdots \\ {{a_{j1}}}& \cdots &{{a_{ji}}}& \cdots &{{a_{jN}}}\\ \vdots & \ddots & \vdots & \ddots & \vdots \\ {{a_{\left( {F - 1} \right)1}}}& \cdots &{{a_{\left( {F - 1} \right)i}}}& \cdots &{{a_{\left( {F - 1} \right)N}}} \end{array}} \right]_{F \times N}} \end{array} $$ (12)

    其中

    $$ \begin{split} {a_{ji}} = \;&\left| {\tilde x_0^{t + jt} - \tilde x_i^{t - \left( {{d_i} - j} \right)T}} \right|, \ j = 0,1,2, \cdots ,F - 1, \\ &\;\; i = 1,2, \cdots ,N\\[-10pt] \end{split} $$ (13)

    $ a = {\rm{min}}\left\{ {{a_{ji}}} \right\},b = {\rm{max}}\left\{ {{a_{ji}}} \right\} $, 则灰色关联系数矩阵可用$ {\boldsymbol{\gamma }} $表示:

    $$ \begin{array}{l} {\boldsymbol{\gamma }} = {\left[ {\begin{array}{*{20}{c}} {{\gamma _{01}}}& \cdots &{{\gamma _{0i}}}& \cdots &{{\gamma _{0N}}}\\ \vdots & \ddots & \vdots & \ddots & \vdots \\ {{\gamma _{j1}}}& \cdots &{{\gamma _{ji}}}& \cdots &{{\gamma _{jN}}}\\ \vdots & \ddots & \vdots & \ddots & \vdots \\ {{\gamma _{\left( {F - 1} \right)1}}}& \cdots &{{\gamma _{\left( {F - 1} \right)i}}}& \cdots &{{\gamma _{\left( {F - 1} \right)N}}} \end{array}} \right]_{F \times N}} \end{array} $$ (14)

    其中

    $$ \begin{split} {\gamma _{ji}} =\;& \frac{{a + \rho b}}{{{a_{ji}} + \rho b}}, \ j = 0,1,2, \cdots ,F - 1,\\ &\;\;i = 1,2, \cdots ,N \end{split} $$ (15)

    式中, $ \rho $是分辨系数, $ \rho $越小表示分辨能力越大, 根据现有参考文献可知$ \rho = 0.5 $计算的灰色关联系数矩阵更能反映实际的多元变量之间的相关关系[18].灰色关联系数矩阵描述的是多元子序列(过程变量)与母序列(零时延硅含量)在不同采样时刻之间的相关程度, 为了描述子序列与母序列之间的总体关联程度, 将灰色关联系数矩阵中的元素按列求取均值, 即子序列相对于母序列的灰色关联度定义为:

    $$ \begin{array}{l} {\boldsymbol{r}} = \left[ {{r_1}, {r_2}, \cdots , {r_i}, \cdots , {r_N}} \right] \end{array} $$ (16)

    其中

    $$ \begin{array}{l} {r_i} = \frac{1}{F}\sum\limits_{j = 0}^{F - 1} {{\gamma _{ji}}} \end{array} $$ (17)

    为了定量描述重构的时序关联矩阵各过程变量与铁水硅含量之间的多重关联程度, 采用灰色关联度之和$ R $来描述多元过程变量与硅含量之间的总体相关性, 其中$ R $表示为:

    $$ R = \sum\limits_{i = 1}^N {{r_i}} $$ (18)

    灰色关联度之和$ R $能在一定程度上度量时序关联矩阵中多元时间序列之间的相关性, $ R $的值越大表明多元时间序列相关性越强, 此时对应的多重关联时延$ {\boldsymbol{\Gamma }} $即为高炉冶炼过程的真实多重关联时延$ {\boldsymbol{\Gamma '}} $.

    根据式(6)可知, 每个过程变量$ {x_i} $相比于零时延参考变量硅含量都有一个时延参数. 考虑到高炉四周安装的传感器和控制点位置不同, 导致过程变量相对于铁水硅含量的时延参数是不一样的. 如高炉顶部上料系统检测数据的时延明显就要比高炉中下部热风炉系统检测数据的时延要长. 加上入炉矿源和冶炼参数的变化, 每个过程变量的时延参数也处于动态变化的过程中, 因此需要对各过程变量时延取值范围的上下界进行适当放宽, 这样就可以得到过程变量$ {x_i} $的取值范围$ {\tau _i} \in \left[ {\tau _i^{{\rm{min}}},\tau _i^{{\rm{max}}}} \right] $.

    由本文所研究的中国西南某钢铁厂2# 2650 m3高炉的冶炼工艺特点可知, 其冶炼过程是一个周期性布料, 间歇式出铁的过程. 根据现场的专家经验知识可知, 下降的炉料与上升的热风在炉内发生$1 \sim 2\; {\rm{h}}$物理化学反应后会打开炉缸下方的出铁口间歇性地排出铁水, 考虑到这种情况下投入的炉料可能没有完全完成一个冶炼周期, 因此对基于专家经验确定的时延区间进一步放宽到$ 1 \sim 4 $h. 再考虑到时延的多重性, 即铁水硅含量现场采样、冷却后离线化验和信息录入还存在$ 1 \sim 1.5 $h的滞后, 综合考虑认为高炉冶炼过程中各过程变量相对于零时延参考变量硅含量的时延区间预估为$ 1 \sim 6 $h. 根据过程变量$ {x_i} $时延区间的取值范围$ {\tau _i} \in \left[ {\tau _i^{{\rm{min}}},\tau _i^{{\rm{max}}}} \right] $, 可以计算出对应的时基区间为$ {d_i} \in \left[ {{{\tau _i^{{\rm{min}}}} / T},{{\tau _i^{{\rm{max}}}} / T}} \right] $, 考虑到$ {d_i} $只能取整数, 记$ {d_i} $的取值范围为${d_i} \in [ d_i^{{\rm{min}}}, d_i^{{\rm{max}}} ]$, 因此过程变量$ {x_i} $时基的可能取值个数为:

    $$ \begin{array}{l} {c_i} = d_i^{{\rm{max}}} - d_i^{{\rm{min}}} + 1 \end{array} $$ (19)

    需要注意的是, 本文所有过程变量的时延区间都设置为一样的范围, 过程变量$ {x_i} $时延区间下限为所有过程变量中时延最小值, 上限为所有过程变量中时延最大值. 尽管这样会放宽高炉中部或者底部检测到的部分过程变量的时延区间范围, 增加时序关联矩阵的数量, 但能在一定程度上避免由于专家经验的主观性导致部分过程变量时延区间预估不准, 进而导致时序关联矩阵不全和估计的多重关联时延序列不准确的问题.

    时序关联矩阵的数量与过程变量和时基个数呈爆炸式增长, 利用穷举计算的方法虽能保证得到最优的时基序列, 但是该方法具有很大的计算开销和时间复杂度. 为此, 本文提出一种基于双尺度协同搜索策略的动态多群粒子群来快速搜寻高炉冶炼过程真实的多重关联时延, 也就是基于时延参数重构的具有最大相关性的时序关联矩阵, 将多重关联时延估计问题转化为求解一系列时序关联矩阵的最大灰色关联度之和的优化问题.

    粒子群算法(Particle swarm optimization, PSO)是一种经典的智能优化算法, 具有结构简单、调整参数少、收敛速度快等优点[19], 因此本文采用粒子群算法来搜索最优的多重关联时延参数. 粒子群算法将群体中的鸟抽象为没有质量和体积的粒子, 每个粒子包含两个向量: 位置向量和速度向量.位置向量代表了粒子在搜索空间的位置, 即优化问题的一个备选解[20], 速度向量代表了粒子在搜索过程中的运动状态. 备选解的好坏由适应度函数来评价. 在本文所研究的多重关联时延参数估计问题中, 相对于零时延参考变量硅含量有$ N $个过程变量的时延参数需要估计. 因此, 粒子群需要在$ N $维空间中搜索最优时基序列, 评价时基序列好坏的适应度函数为重构的时序关联矩阵的灰色关联度之和$ R $.假设$ N $维空间中第$ i $个粒子的位置向量表示为${{\boldsymbol{p}}_i} = [ {p_i^1, p_i^2, \cdots , p_i^n, \cdots , p_i^N} ]^{\rm{T}}$, 其中$p_i^n \in [ {x^{{\rm{min}}}}, {x^{{\rm{max}}}} ]$, 其对应的速度向量表示为${{\boldsymbol{v}}_i} = [ v_i^1, v_i^2, \cdots , v_i^n, \cdots , v_i^N ]^{\rm{T}}$, 其中$ v_i^n \in \left[ {{v^{{\rm{min}}}},{v^{{\rm{max}}}}} \right] $. 第$ i $个粒子的速度和位置更新的数学描述如下:

    $$ \begin{split} {{\boldsymbol{v}}_i} = \;&\omega \cdot {{\boldsymbol{v}}_i} + {c_1} \cdot {r_1} \cdot \left( {{\boldsymbol{pbes}}{{\boldsymbol{t}}_i} - {{\boldsymbol{p}}_i}} \right) +\\ &{c_2} \cdot {r_2} \cdot \left( {{\boldsymbol{gbest}} - {{\boldsymbol{p}}_i}} \right) \end{split} $$ (20)
    $$ \begin{array}{l} {{\boldsymbol{p}}_i} \leftarrow {{\boldsymbol{p}}_i} + {{\boldsymbol{v}}_i} \end{array} $$ (21)

    式中, $ {\boldsymbol{pbes}}{{\boldsymbol{t}}_i} $是第$ i $个粒子在当前迭代次数之前的个体历史最优位置向量, $ {\boldsymbol{gbest}} $是种群中所有粒子在当前迭代次数之前的全局最优位置向量. $ \omega $是速度的惯性权重, $ {c_1} $$ {c_2} $分别表示第$ i $个粒子向 $ {\boldsymbol{pbes}}{{\boldsymbol{t}}_i} $$ {\boldsymbol{gbest}} $靠近的权值系数, $ {r_1} $$ {r_2} $表示在区间$ \left[ {0, 1} \right] $内均匀分布的随机数.

    由式(20)和式(21)可以看出, 经典的PSO算法中粒子主要通过向全局最优粒子学习来更新自己的速度和位置, 当全局最优粒子陷入局部最优时进化停滞, 导致算法将过早收敛. 因此为了解决PSO算法易于过早收敛的缺点, 本文提出了一种基于双尺度协同搜索策略的动态多群粒子群优化算法(Dynamic multi-swarm particle swarm optimization based on double-scale collaborative search strategy, DMS-PSO-CS). 首先, 为了平衡粒子群的全局搜索能力和局部搜索能力, 将粒子群分为两个尺度, 即探索性子群和探测性子群. 大尺度的探索性子群主要聚焦全局搜索能力, 能快速定位到最优解的区域, 具有一定的空间勘探能力. 小尺度的探测性子群主要聚焦于局部精细搜索能力, 能在最优解附近进行精确的搜索, 具有较强的开采能力. 其中, 双尺度的粒子主要是通过粒子的惯性权重和最大速度来描述. 较大的惯性权重可以提升粒子的跳跃能力, 增强全局探索能力, 而较小的惯性权重则可以精确搜索当前区域, 增强局部探测能力. 另一方面, 粒子的最大速度$ {v^{{\rm{max}}}} $决定了粒子在迭代过程中的最大移动距离, 较大$ {v^{{\rm{min}}}} $能获得较强的全局搜索能力但容易错过最优解, 反之能获得较强的局部精细搜索能力但容易陷入局部最优解.

    大尺度探索性子群的权重调整策略和最大速度分别为:

    $$ \left\{ \begin{aligned} &{\omega _l} = \frac{{{\omega _{{\rm{min}}}} + \left( {{\omega _{{\rm{max}}}} - {\omega _{{\rm{min}}}}} \right)\left[ {1 + \cos \left( { \frac{{6\pi \left( {k - 1} \right)}}{{{k_{{\rm{max}}}} - 1}}} \right)} \right]}}{2}\\ &{v_{l,{\rm{max}}}} = 1 \end{aligned} \right. $$ (22)

    式中, $ {\omega _l} $$ {v_{l,{\rm{max}}}} $分别为探索性粒子的惯性权重和最大速度, $ {\omega _{{\rm{max}}}} $$ {\omega _{{\rm{min}}}} $分别为权重的上限和下限, $ {k_{{\rm{max}}}} $为最大的迭代次数. 需要注意的是探索性子群的惯性权重是跟迭代次数有关的周期性振荡函数.大尺度探索性子群的速度向量更新公式如下:

    $$ \begin{split} {{\boldsymbol{v}}_i} =\;& \omega \cdot {{\boldsymbol{v}}_i} + {c_1} \cdot {r_1} \cdot \left( {{\boldsymbol{pbes}}{{\boldsymbol{t}}_i} - {{\boldsymbol{p}}_i}} \right) + \\ &{c_2} \cdot {r_2} \cdot \left( {{\boldsymbol{lbest}} - {{\boldsymbol{p}}_i}} \right) \end{split} $$ (23)

    式中, $ {\boldsymbol{lbest}} $是探索性子群的全局最优位置, 位置向量通过式(21)更新.

    小尺度探测性子群的权重调整策略和最大速度分别为:

    $$ \left\{ \begin{aligned} &{\omega _s} = {\omega _{{\rm{min}}}} + \left({{ \omega _{{\rm{max}}}} - {\omega _{{\rm{min}}}}} \right)\Bigg[ {1 - } \\ &\qquad {\rm{sigmoid}} {\left( { \frac{{12 \cdot k}}{{{k_{{\rm{max}}}}}} - 6} \right)} \Bigg]\\ &{v_{s,{\rm{max}}}} = {\rm{max}}\left( {{v_{{\rm{max}}}}} \right) + \left[ {{\rm{min}}\left( {{v_{{\rm{max}}}}} \right) - } \right.\\ &\left. \qquad\qquad {{\rm{max}}\left( {{v_{{\rm{max}}}}} \right)} \right] \cdot \frac{k}{{{k_{{\rm{max}}}}}} \end{aligned} \right. $$ (24)

    式中$ {\omega _s} $$ {v_{s,{\rm{max}}}} $分别为探测性粒子的惯性权重和最大速度, $ {\rm{max}}\left( {{v_{{\rm{max}}}}} \right) $$ {\rm{min}}\left( {{v_{{\rm{max}}}}} \right) $分别为最大速度的上限和下限. 需要注意的是探测性子群的惯性权重是跟迭代次数有关的单调递减函数, 最大速度是跟迭代次数有关的线性下降函数.

    其次, 为了增加探测性子群的多样性, 将探测性子群分为多个动态小子群, 避免子群最优粒子陷入局部最优导致整个子群提前收敛的问题. 并且, 为了能快速地搜索到全局最优解, 提出了一种探索性子群和探测性子群协同搜索策略, 小尺度探测性子群粒子的位置更新不仅要根据上一时刻粒子本身的速度和粒子历史时刻最优位置决定, 还要考虑到探测性子群的局部最优位置与探索性子群局部最优位置之间的关系. 具体来说, 当探索性子群局部最优位置的适应度函数优于探测性子群的局部最优位置对应的适应度函数值, 探测性子群的粒子在更新的时候就会有选择地向探索性子群局部最优粒子方向靠近, 精细搜索该区域提高收敛精度. 小尺度探测性子群的速度向量更新公式如下:

    $$ \begin{split} {{\boldsymbol{v}}_i} =\;& \omega \cdot {{\boldsymbol{v}}_i} + {c_1} \cdot {r_1} \cdot \left( {{\boldsymbol{pbes}}{{\boldsymbol{t}}_i} - {{\boldsymbol{p}}_i}} \right) +\\ &{c_2} \cdot {r_2} \cdot \left( {{\boldsymbol{sbes}}{{\boldsymbol{t}}_j} - {{\boldsymbol{p}}_i}} \right) \end{split} $$ (25)
    $${\boldsymbol{sbes}}{{\boldsymbol{t}}_j} = \left\{ \begin{aligned} &{\boldsymbol{sbes}}{{\boldsymbol{t}}_j}{\rm{ }}, & f\left( {{\boldsymbol{sbes}}{{\boldsymbol{t}}_j}} \right) \ge {\rm{ }}f\left( {{\boldsymbol{lbest}}} \right)\\ &{\boldsymbol{lbest}}{\rm{ }}, & f\left( {{\boldsymbol{sbes}}{{\boldsymbol{t}}_j}} \right) < {\rm{ }}f\left( {{\boldsymbol{lbest}}} \right) \end{aligned} \right. $$ (26)

    式中, $ {\boldsymbol{sbes}}{{\boldsymbol{t}}_j} $为探测性子群中第$ j $个小子群的全局最优位置, $ f\left( \cdot \right) $为粒子的适应度函数. 将探测性子群分为多个小子群能增加空间搜索的广泛性, 避免跟随全局最优粒子的位置而提前收敛, 位置向量通过式(21)更新.

    最后, 迭代一定次数后对粒子群进行随机打乱和重组, 这种随机重组策略可以看作粒子间周期性的信息交换, 重组后能改变粒子的邻域拓扑结构, 使得原本处于探索状态的粒子对搜索空间进行探测, 处于探测状态的粒子对搜索空间进行探索. 该策略能够增强粒子群的搜索空间, 很大程度上避免算法陷入局部最优. 综上所述, 基于双尺度协同搜索策略的动态多群粒子群优化算法流程如下:

    算法 1. 双尺度协同搜索策略的动态多群粒子群优化算法

    输入. 预设大尺度探索性子群规模$ {N_1} $, 小尺度探测性子群个数$ j $和规模$ {N_2} $, 粒子的初始位置向量$ {{\boldsymbol{p}}_i} $和速度向量$ {{\boldsymbol{v}}_i} $, 重组周期$ Re $和算法最大迭代次数$ {k_{{\rm{max}}}} $.

    输出. 待优化问题最优解.

    1)按照设定的子群规模和个数, 随机初始化大尺度探索性子群和$ j $个小尺度探测性子群, $ k = 1 $;

    2)计算每个粒子的适应度函数, 确定个体最优$ {\boldsymbol{pbes}}{{\boldsymbol{t}}_i} $, 大尺度探索性子群全局最优$ {\boldsymbol{lbest}} $$ j $个小尺度探测性子群对应的全局最优$ {\boldsymbol{sbes}}{{\boldsymbol{t}}_j} $;

    3)利用式(21)和式(23)分别更新大尺度探索性子群粒子的位置和速度向量, 利用式(21)和式(25)分别更新第$ j $个小尺度探测性子群粒子的位置和速度向量;

    4) $k \leftarrow k + 1$;

    5)如果迭代次数$ k \le {k_{{\rm{max}}}} $$ k\% Re \ne 0 $时, 按当前拓扑结构更新个体最优$ {\boldsymbol{pbes}}{{\boldsymbol{t}}_i} $, 大尺度探索性子群全局最优$ {\boldsymbol{lbest}} $$ j $个小尺度探测性子群对应的全局最优$ {\boldsymbol{sbes}}{{\boldsymbol{t}}_j} $, 并返回步骤3);

    6)如果迭代次数$ k \le {k_{{\rm{max}}}} $$ k\% Re = 0 $时, 对所有的粒子进行随机打乱和重组, 并更新重组后的拓扑结构下的大尺度探索性子群全局最优$ {\boldsymbol{lbest}} $$ j $个小尺度探测性子群对应的全局最优$ {\boldsymbol{sbes}}{{\boldsymbol{t}}_j} $, 并返回步骤3);

    7)当迭代次数$ k > {k_{{\rm{max}}}} $时, 终止迭代, 输出全局最优粒子位置, 即为待优化问题的最优解.

    将本文所提的基于双尺度协同搜索策略的动态多群粒子群算法用来寻找最优时基序列, 需要注意的是, 考虑到时基$ {d_i} $只能取整数, 因此每个粒子的位置向量$ {{\boldsymbol{p}}_i} = {\left[ {p_i^1, p_i^2, \cdots , p_i^n, \cdots , p_i^N} \right]^{\rm{T}}} $都被限制为正整数. 基于双尺度协同搜索策略的动态多群粒子群算法寻找最优时基序列流程如图3所示, 具体步骤如下:

    图 3  基于DMS-PSO-CS算法的时延参数估计框架
    Fig. 3  Time-delay parameter estimation framework based on DMS-PSO-CS algorithm

    步骤 1. 根据专家经验和高炉冶炼过程机理分析, 从高炉历史数据库中挑选出与铁水硅含量相关的过程变量组成原始数据集${\boldsymbol{X}} = [ {{\boldsymbol{x}}_0}, {{\boldsymbol{x}}_1}, \cdots , {{\boldsymbol{x}}_i}, \cdots , {{\boldsymbol{x}}_N}]$, 其中 ${{\boldsymbol{x}}_i} =[ {x_i^1, x_i^2, \cdots , x_i^t, \cdots , x_i^M]^{\rm{T}}}$, $ {{\boldsymbol{x}}_0} $为零时延参考变量铁水硅含量, $ {{\boldsymbol{x}}_i} $为第$ i $个对硅含量有影响的过程变量;

    步骤 2. 对采集的数据进行相关数据预处理, 包括异常值剔除、缺失值处理、归一化处理, 预处理之后的数据集记为${\boldsymbol{\tilde X}} = \left[ {{{{\boldsymbol{\tilde x}}}_0}, {{{\boldsymbol{\tilde x}}}_1}, \cdots, {{{\boldsymbol{\tilde x}}}_i},\cdots, {{{\boldsymbol{\tilde x}}}_N}} \right]$;

    步骤 3. 分析各过程变量相对于铁水硅含量的时延预估区间, 确定时延序列${\boldsymbol{\Gamma }} = [ {\tau _1}, {\tau _2}, \cdots , {\tau _i}, \cdots , {\tau _N} ]$中各时延参数的取值范围$ {\tau _i} \in \left[ {\tau _i^{{\rm{min}}},\tau _i^{{\rm{max}}}} \right] $;

    步骤 4. 随机初始化双尺度协同搜索粒子群中粒子的参数, 根据粒子的位置参数${{\boldsymbol{p}}_i} = [ p_i^1, p_i^2, \cdots , p_i^n, \cdots , p_i^N ]^{\rm{T}} = {\left[ {{\tau _1}, {\tau _2}, \cdots , {\tau _i}, \cdots , {\tau _N}} \right]^{\rm{T}}}$构造对应的时序关联矩阵$ {\boldsymbol{\dot X}} = [{{\boldsymbol{\dot x}}_0}, {{\boldsymbol{\dot x}}_1}, \cdots , {{\boldsymbol{\dot x}}_i}, \cdots , \;{{\boldsymbol{\dot x}}_N}] $, 并计算各粒子对应的适应度函数$ f = \sum\nolimits_{i = 1}^N {{r_i}} $, 更新个体最优和子群最优;

    步骤 5. 判断算法是否达到最大迭代次数, 如达到, 则停止寻优并输出全局最优时基序列$ {\boldsymbol{D}} $, 并基于此计算出时延序列$ {\boldsymbol{\Gamma }} $; 否则, 执行步骤6;

    步骤 6. 判断算法运行次数是否为重组周期的整数倍, 如果是, 则对双尺度协同搜索粒子群进行随机打乱和重组, 更新个体最优和子群最优并转到步骤7; 否则, 直接执行步骤7;

    步骤 7. 利用式(21)和(23)、式(21)和(25)分别更新探索性子群粒子和探测性子群粒子的速度和位置参数, 并重复执行步骤 $4 \sim 6$直到达到终止条件, 输出全局最优时基序列$ {\boldsymbol{D}} $, 并基于此计算出时延序列$ {\boldsymbol{\Gamma }} $.

    本文提出的多重关联时延估计方法的有效性和可行性首先在一个数值仿真的实例上进行了验证,接着在中国西南某钢铁厂2# 高炉上采集的数据进行了工业试验, 基于本文方法估计出来的时延结果与现场的专家经验较为符合, 并且时序配准后的数据也进一步提高了后续硅含量软测量模型的性能.

    为了体现过程的非线性和时序性, 数值仿真中数据的生成规则为:

    $$ \left\{ \begin{aligned} &{{\boldsymbol{x}}^t} = {\left[ {x_1^t,x_2^t,x_3^t,x_4^t} \right]^{\rm{T}}} = {\boldsymbol{A}}{{\boldsymbol{\Gamma }}^t} + {{\boldsymbol{\varepsilon }}^t}\\ &x_0^t = {f_1}\left( {{{\boldsymbol{x}}^t}} \right) + {f_2}\left( {{{\boldsymbol{x}}^{t - 1}}} \right) + {f_3}\left( {{{\boldsymbol{x}}^{t - 2}}} \right) + {\beta ^t} \end{aligned} \right. $$ (27)

    式中, $ {\boldsymbol{A}} \in {{\bf{R}}^{4 \times 3}} $是一个随机生成的矩阵, $ {\boldsymbol{\Gamma }} \in {{\bf{R}}^{3 \times 1}} $是服从正态分布${\rm{N}}\left( {0,2} \right)$生成的一个向量, ${f}\left( \cdot\right)$是一个矩阵函数, 其基本元素为非线性的sin、cos、exp和平方函数, $ {\boldsymbol{\varepsilon }} \in {{\bf{R}}^{4 \times 1}} $$\beta \in {{\bf{R}}}$是服从正态分布${\rm{N}}\left( {0,0.01} \right)$生成的一个干扰项. 对于生成的1000组数据, 时延向量被设置为${\boldsymbol{\Gamma '}} = \left[ {{{\tau '}_1},{{\tau '}_2},{{\tau '}_3},{{\tau '}_4}} \right] = \left[ {1,2,3,4} \right]$, 即将变量${x_1}、{x_2}、{x_3}、{x_4}$分别相对于$ {x_0} $往前推$1、2、3、4$采样周期. 变量时延区间设置为$ \left[ {0,10} \right] $, 因此对应的时基序列和重构的时序关联矩阵共有$ \prod\nolimits_{i = 1}^4 {11 = 14\,641} $个. 为了比较本文所提双尺度协同搜索动态多群粒子群优化算法的性能, 经典的粒子群算法也被用来寻优比较. 其中, 两种算法粒子群规模都设置为30个. 但DMS-PSO-CS算法中, 大尺度的探索性子群中粒子个数设置为15个, 小尺度的探测性动态子群个数设置为3个, 其中粒子个数设置为5个. 根据文献[21]的分析可知, PSO算法权重线性下降时能取得较好的寻优效果[21], 其调整策略为:

    $$ \omega = {\omega _{{\rm{max}}}} + \left[ {{\omega _{{\rm{min}}}} - {\omega _{{\rm{max}}}}} \right] \cdot \frac{k}{{{k_{{\rm{max}}}}}} $$ (28)

    式中, $ {\omega _{{\rm{max}}}} = 0.9 $, $ {\omega _{{\rm{min}}}} = 0.4 $, $ {c_1} = {c_2} = 2 $, 最大迭代次数${k_{{\rm{max}}}}$设置为500. 双尺度子群的${\omega_{{\rm{max}}}}、 {\omega _{{\rm{min}}}}、 {c_1}、 {c_2}$与PSO保持一致, 小尺度的探测性子群的速度上下限设置为$ 1 $$ -1 $, 即$ {\rm{max}}\left( {{v_{{\rm{max}}}}} \right)\; =\; 1 $, $ {\rm{min}}\left( {{v_{{\rm{min}}}}} \right) = -1 $, 重组周期$ Re $设置为10.

    此外, 传统的单变量时延估计方法, 皮尔逊相关系数(Pearson correlation coefficient, PCC)[22]和互信息相关系数(Mutual information coefficient, MIC)[23]也用来估计时延进行相应的对比, 即, 单独地计算不同时延步长下的$ {x_1} \sim {x_4} $$ {x_0} $的相关系数, 最大相关系数所对应的步长即为时延时间. 基于不同方法估计的时延结果见表1. 由表1可以看出, 在单变量估计方法中, 基于互信息系数估计的时延结果明显优于皮尔逊系数估计的结果, 这也说明了基于线性关系估计时延的方法并不适合具有非线性特点的数据模式. 相比于单变量时延估计方法, 基于时序关联矩阵估计的时延参数与真实设置的时延更加一致, 这也说明了本文所提方法的有效性. 此外, 本文所提的双尺度协同搜索粒子群算法在同样的解空间中能找到更准确的时延参数, 也验证了本文所提优化算法在寻优能力上的优越性.

    表 1  数值仿真中基于不同方法估计的过程变量时延值
    Table 1  The estimated variable time-delay values based on different methods in numerical simulation
    变量 PCC MIC PSO DMS-PSO-CS $ \tau ' $
    $ {x_1} $ 1 1 1 1 1
    $ {x_2} $ 0 2 2 2 2
    $ {x_3} $ 2 0 3 3 3
    $ {x_4} $ 1 3 3 4 4
    下载: 导出CSV 
    | 显示表格

    1)过程数据分析与预处理. 根据高炉冶炼过程的工艺和现场专家经验确定了对铁水硅含量有影响的过程变量, 其详细描述如表2所示. 为了估计选取的过程变量与铁水硅含量的时延参数, 选取了2# 高炉2020年8月1日至2020年12月17日连续生产的、24个过程变量的采样时间序列数据, 其中过程变量的采样周期大概为10秒一次, 铁水硅含量在一个班次(8 h)大概有$6 \sim 8$个化验数据, 选取时间范围内过程变量有1160141组, 铁水硅含量数据有7282组. 此外, 为了定性地分析时延参数估计的结果准确性, 与硅含量有着一定正相关关系的铁水温度数据也加入分析, 其中铁水温度数据是由前期工作中研发的出铁口红外视觉检测系统实时在线检测的[11]. 需要说明的是, 铁水温度的检测跟硅含量离线取样基本是在同一垂直位置进行的, 因此铁水温度跟硅含量, 在理论上只存在化验过程的时延, 选取时间范围内铁水温度数据有172352组.

    表 2  基于不同方法估计的过程变量时延参数
    Table 2  The estimated process variable time-delayvalues based on different methods
    变量 (单位) PCC MIC PSO DMS-PSO-CS
    富氧率(wt%) 1 5 5 5
    透气性指数$(\rm m^{3}/min \cdot kPa)$ 1 1 1 2
    一氧化碳(wt%) 1 2 1 1
    二氧化碳(wt%) 1 1 1 1
    标准风速(m/s) 6 6 2 1
    富氧流量$(\rm m^{3}/s)$ 1 3 6 1
    冷风流量$(\rm m^{3}/min)$ 6 2 2 2
    鼓风动能(J/s) 1 2 2 3
    炉腹煤气量 (t) 6 1 2 2
    炉腹煤气指数 6 2 2 2
    顶压 (kPa) 1 3 1 4
    富氧压力(kPa) 2 3 6 6
    冷风压力 (kPa) 1 1 6 2
    全压差(kPa) 1 2 2 2
    热风压力(kPa) 1 1 5 2
    实际风速 (m/s) 1 3 2 2
    冷风温度 (°C) 1 6 1 1
    热风温度 (°C) 1 6 2 2
    顶温(°C) 1 5 1 2
    顶温下降管 (°C) 1 1 2 6
    阻力系数 1 1 2 1
    鼓风湿度 ($ \rm g/m^{3} $) 3 6 1 1
    本小时实际喷煤量(t/h) 2 1 1 3
    上小时实际喷煤量 (t/h) 1 1 5 5
    铁水温度 (°C) 1 1 1 1
    下载: 导出CSV 
    | 显示表格

    为提高多重关联时延估计结果准确性, 需要对数据集进行相关预处理, 得到标准的和干净的数据提供给后续的流程. 对于休风以及设备故障等原因造成的缺失数据直接删除, 对于设备故障或者人工录入错误而导致的异常数据通过箱线图直接剔除[24].对于采样频率不一致导致过程变量与铁水硅含量数据时标不对齐的问题, 首先将过程变量和硅含量数据集通过时标进行匹配, 再以小时为单位进行均值化处理, 预处理后的过程变量数据共有111041组, 带标签的数据共有3120组, 即为原始时序数据矩阵$ {\boldsymbol{\tilde X}} $.

    2)过程变量多重关联时延估计结果定性分析. 根据前面数据预处理分析可知, 需要估计出表3中选取的25个过程变量相对于硅含量的时延参数, 所以时延序列的长度$ N = 25 $, 即粒子的位置向量$ {{\boldsymbol{p}}_i} = {\left[ {p_i^1, p_i^2, \cdots , p_i^n, \cdots , p_i^{25}} \right]^{\rm{T}}} $. 根据时延区间预估分析可知$ {\tau _i} \in \left[ {\tau _i^{{\rm{min}}},\tau _i^{{\rm{max}}}} \right]= \left[ {1, 6} \right] $, 考虑到原始时序数据矩阵的采样周期$T = 1\;{\rm{h}}$, 时基区间为${d_i} \in \left[ {{{\tau _i^{{\rm{min}}}} / T},{{\tau _i^{{\rm{max}}}} / T}} \right] = \left[ {1,6} \right]$, 即可取值$ 1 $$ 2 $$ 3 $$ 4 $$ 5 $$ 6 $.

    表 3  基于不同建模策略下的铁水硅含量软测量模型性能
    Table 3  Soft-sensor model performance of silicon content in molten iron based on different modeling strategies
    序号 建模策略 TrRMSE TrMAE TsRMSE TsMAE 训练时间 (s)
    1 SDAE + DM-PSO-CS 0.0715 0.0530 0.0723 0.0542 12.2 $ \times $ 60 + 8
    2 SDAE + PSO 0.0748 0.0565 0.0759 0.0574 12.4 $ \times $ 60 + 10
    3 SDAE + MIC 0.0752 0.0562 0.0765 0.0575 12.3 $ \times $ 60 + 12
    4 SDAE + PCC 0.0763 0.0561 0.0776 0.0573 12.2 $ \times $ 60 + 10
    5 SVR + DM-PSO-CS 0.0775 0.0572 0.0792 0.0588 7
    6 RVFLN + DM-PSO-CS 0.0769 0.0573 0.0782 0.0585 3
    7 SDAE + 无时延估计 0.0826 0.0605 0.0840 0.0613 12.3 $ \times $ 60 + 9
    下载: 导出CSV 
    | 显示表格

    为了定性地分析估计的时延参数的准确性, 将不同方法估计的结果与现场专家经验进行定性的比较, 其中DMS-PSO-CS和PSO算法中的参数与数值仿真中的设置保持一致. 基于不同方法估计的过程变量时延参数如表3所示. 理论上, 铁水温度相对于硅含量只存在化验过程的时延, 高炉现场从取样冷却到化验得到硅含量的百分比含量, 一般需要$ 1 \sim 1. 5 $h的时间间隔, 考虑到原始数据矩阵是按小时采样的, 因此过程变量的时基只能取小时的整数倍, 理论上铁水温度相对于零时延硅含量只存在$ 1 $h滞后. 基于时序关联矩阵和单变量估计方法寻找到的铁水温度时延参数都为$ 1 $h, 符合高炉冶炼现场的实际情况. 根据现场专家经验, 高炉中下部的煤粉喷吹系统对调控的滞后时间为$ 2 \sim 3 $h, 而基于互信息和PSO算法估计出来的本小时实际喷煤量对铁水硅含量影响滞后时间都为$ 1 $h, 显然不符合现场的专家经验, 尽管基于皮尔逊相关系数估计出来的本小时实际喷煤量的时延为$ 2 $h, 但是其估计的实际喷煤量对铁水硅含量影响滞后时间为$ 1 $h, 这显然也是与专家经验相违背的, 而基于DMS-PSO-CS算法估计的本小时和上小时实际喷煤量对铁水硅含量影响滞后时间分别为$ 3 $h和$ 5 $h, 这与现场操作者的先验知识更符合. 高炉中下部的热风炉系统一般需要$ 1 $h的滞后时间才能作用到高炉调控上, 基于互信息和PSO算法估计出来的热风温度对硅含量的滞后时间分别为$ 6 $h和$ 2 $h, 而热风压力对硅含量的影响滞后时间分别为$ 1 $h和$ 5 $h, 理论上热风压力与热风温度都是由热风系统控制的, 因此与热风相关的变量估计的时延参数不应相差过大. 相比而言, 基于皮尔逊相关系数和DMS-PSO-CS算法估计出热风温度和热风压力的时延更加符合现场的经验. 总而言之, 基于不同的方法估计出来的时延参数对于部分变量都有一定的合理性, 但总体来看, 本文所提的方法对于大部分变量估计的时延结果都比较符合现场的专家经验, 这也进一步说明了本文所提的方法的有效性和可靠性.

    3)过程变量多重关联时延估计结果定量分析.为了定量地验证上述多重关联时延参数估计结果的准确性, 将未经时序配准的数据、基于上述四种方法估计出时延后配准的数据分别用于铁水硅含量软测量建模分析. 本文的软测量模型选用了主流的数据驱动模型: 支持向量回归机(Support vector regression, SVR)[6]、随机权神经网络(Random vector functional-link network, RVFLN)[9]和深度网络(Deep network stacked by denoising autoencoder, SDAE)[25]. 考虑到本文的主要工作聚焦于铁水硅含量软测量建模前期的多重关联时延参数估计, 因此软测量模型都是基本的模型结构并没有根据过程或者数据的特点进行相应改进. 由于支持向量机和随机权神经网络都采用有监督的训练方式, 因此采用2820组带标签的样本训练模型, 300组样本用于测试模型的性能. 而深度网络采用半监督的训练方式, 即深度模型预训练阶段, 先用111041组过程变量无监督的训练模型参数, 模型微调阶段, 在预训练好的深度网络后加一层回归层, 并用2820组带标签的硅含量数据有监督的微调网络参数. 计算机配置如下: Windows 10 (64-b)操作系统, 32 GB内存, 酷睿i7-9700 (3. 0 GHz) CPU, Python 编程语言.

    为了评价不同软测量模型的性能, 本文采用均方根误差(Root mean squared error, RMSE)和平均绝对误差(Mean absolute error, MAE)进行定量衡量, 定义如下:

    $$ {\rm{RMSE}} = \sqrt {\frac{1}{N}\sum\limits_{t = 1}^N {{{\left( {{y^t} - {{\hat y}^t}} \right)}^2}} } $$ (29)
    $$ {\rm{MAE}} = \frac{1}{N}\sum\limits_{t = 1}^N {\left| {{y^t} - {{\hat y}^t}} \right|} $$ (30)

    式中, $ {y^t} $代表铁水硅含量实际化验值, $ {\hat y^t} $代表模型预测的硅含量值, $ N $为样本的个数. 统计指标RM-SE和MAE越小表示模型的性能越好. 此外, 为了满足工业现场的实时性需求, 模型的训练时间也用来评估其性能.

    为了验证不同方法估计的时延参数对硅含量预测性能的影响, 实验组1、2、3、4和 7开展相关的对比实验. 不同对照组的详细的实验对比结果如表3所示, 其中Tr和Ts分别代表训练集和测试集, 深度网络的训练时间由无监督预训练和有监督微调两部分组成. 由表3可知, 相比于过程变量无时延估计直接建立硅含量软测量模型, 基于单变量法和时序关联矩阵确定的时延都能在一定程度上描述高炉冶炼过程的时延特性, 提高硅含量预测模型的精度. 在单变量时延估计方面, 基于互信息估计的时延参数重构后的样本训练的硅含量模型相比于皮尔逊相关系数方法有一定的提升, 说明了基于非线性关系估计出来的时延参数更符合真实的数据分布且有利于提高模型的性能. 进一步对比本文所提出的基于时序关联矩阵和单变量的时延估计方法, 可以看出, 考虑了时延多重关联特性所确定的时延参数更能反映真实的输入−输出因果关系, 这一点体现在实验组1、2、3、4性能评价指标上, 也验证了本文所提出的基于时序关联矩阵估计过程变量多重关联时延的可行性和有效性. 此外, 基于DMS-PSO-CS算法时序配准后的数据训练的硅含量软测量模型, 在测试集上统计的RMSE和MAE, 相比于PSO算法时序配准后的数据训练的模型, 分别降低了0.0036和0.0032, 这也说明相比于直接用粒子群算法寻找的最优时延参数, 基于本文所提的双尺度协同搜索策略的动态粒子群算法寻找到的最优时延参数, 能更好地恢复真实的输入输出时序对应关系.

    为了验证不同软测量模型对硅含量预测性能的影响, 实验组1、5和 6比较了同一批数据下相关的对比实验. 由表3可以看出, 相比于传统的机器学习算法, 深度学习算法的性能有一定的提升, 其中一个主要的原因是深度网络在无监督预训练过程中充分利用了无标签的过程变量数据, 此外, 这种无监督的训练方式迫使隐含层能学到有用的特征表示在输出层更好的重构输入, 有助于挖掘数据中隐含的关系, 进而提高模型的性能. 尽管支持向量回归模型在小样本数据集上有着出色的性能, 但是并没有在硅含量预测任务上表现出明显的优势, 主要原因可能是这种浅层的模型结构并不能很好地描述具有强非线性的高炉冶炼过程. 相比而言, 随机权神经网络的非线性描述能力使得模型的性能有了一定的提升, 但网络初始化权重的随机性和数据噪声的影响使得模型性能还有进一步提高的空间. 在模型泛化能力方面, 深度网络和随机权神经网络在测试集上的性能回落相比于训练集均在可接受的范围内, 说明这两种模型能学习到隐藏在数据背后的规律并对新的样本展示出较好的预测精度. 在模型训练时间方面, 随机权神经网络在这三种算法中有着明显的优势, 展示了其在工业过程实时性方面的巨大潜力, 但模型的预测精度是其工业应用需要进一步考虑的问题. 尽管深度网络两阶段的训练时间远远多于其他两种方法, 但在工业应用现场时, 无监督的预训练完全可以离线完成, 只需使用带标签的样本有监督地在线微调预训练好的网络结构. 因此, 本文所提的方法在工业现场也具有一定的应用价值.

    考虑到本文的主要目的是估计高炉冶炼过程的多重关联时延参数并提高后续建模数据的准确性和有效性, 为了更直观地展示不同方法确定的时延参数对硅含量软测量模型的影响, 图4 ~ 8分别绘制了实验组1、2、3、4和 7的预测细节信息, 即不同方法配准后的数据训练的软测量模型预测值曲线和实际化验曲线以及对应的预测误差. 从图中可以看出, 相比于没有经过时序配准的数据, 使用单变量分析和时序关联分析矩阵进行过程变量时延参数估计后, 软测量模型的准确度和跟踪能力均要显著优于无时延估计的模型, 说明引入过程变量的时延信息能有效提高软测量模型的准确度. 但是, 相比于基于皮尔逊相关系数和互信息系数分别计算不同时延步长下的最大相关性确定的时延参数, 考虑了时延多重关联特性的模型性能明显更好, 模型预测误差大都集中在现场可接受的$ \left[ { - 0. 1, 0. 1} \right] $范围之内. 此外, 对比图4图5可以看出, 经过DMS-PSO-CS算法时序配准后的数据训练的软测量模型数值和趋势跟踪的更好, 样本预测误差更小, 也进一步说明了本文所提的DMS-PSO-CS寻优算法找到的时延参数序列, 更能真实地反映模型输入跟输出之间的因果关系, 通过提高建模数据集的质量进而提高模型的预测性能.

    图 4  基于DMS-PSO-CS算法时延估计的铁水硅含量预测结果
    Fig. 4  The prediction details of silicon content in molten iron with time-delay estimation based on DMS-PSO-CS algorithm
    图 5  基于PSO算法时延估计的铁水硅含量预测结果
    Fig. 5  The prediction details of silicon content in molten iron with time-delay estimation based on PSO algorithm
    图 6  基于MIC算法时延估计的铁水硅含量预测结果
    Fig. 6  The prediction details of silicon content in molten iron with time-delay estimation based on MIC algorithm
    图 7  基于PCC算法时延估计的铁水硅含量预测结果
    Fig. 7  The prediction details of silicon content in molten iron with time-delay estimation based on PCC algorithm
    图 8  无时延估计的铁水硅含量预测结果
    Fig. 8  The prediction details of silicon content in molten iron without time-delay estimation

    4)粒子群算法寻优性能对比分析. 为了快速地寻找到最优的时延序列, 本文在原始粒子群优化算法基础上提出了一种双尺度协同搜索策略的动态多群粒子群优化算法, 为了对比两种算法在寻优性能上的差异, 绘制了如图9所示的寻优迭代曲线图, 其适应度函数为本文优化的目标函数, 即时序关联矩阵的灰色关联度. 由图9可以看出, 经典的PSO算法在第26次迭代时就能收敛, 但是难以跳出局部最优值. 而本文所提的DMS-PSO-CS算法在第18次迭代的时候就能达到相同的寻优效果, 并且能多次跳出局部最优值, 迭代到第296次才收敛. 这也说明了本文设计的双尺度粒子群能较好地在全局探索和局部探测能力之间进行很好的平衡, 在保证当前最优的情况下通过周期性信息交换策略增加探索更优解的可能. 从适应度函数来看, DMS-PSO-CS算法和原始PSO算法最终得到的最大灰色关联度分别为18.109和18.442. 从寻优结果上也能看出, 本文所提优化算法的有效性和可靠性.

    图 9  基于不同算法的寻优迭代曲线
    Fig. 9  Optimization iteration curve based on different algorithms

    高炉冶炼过程大时滞特性导致了变量之间存在多重关联时延, 为了有效地估计变量间的时延参数, 本文从冶炼过程保存的运行生产数据出发, 提出了一种基于时序关联矩阵的过程变量多重时延参数估计方法. 引入灰色关联分析来描述重构后的时序关联矩阵之间的相关性, 将多重关联时延估计问题转化为求解一系列时序关联矩阵最大相关性的优化问题. 为了降低穷举所有时序关联矩阵的计算开销和时间复杂度, 提出了一种基于双尺度协同搜索策略的动态多群粒子群算法用于快速寻优, 提出的双尺度粒子能很好地平衡粒子群的全局探索能力和局部探测能力, 粒子之间的周期性重组操作能在一定程度上保证算法多次跳出局部最优. 相比于传统的单变量时延估计方法, 考虑了多重关联时延特性估计出来的时延参数能提高数据的准确性进而提高后续硅含量预测模型的精度. 此外, 估计出来的时延参数也能为铁水质量精细化调控提供重要的参考信息, 避免现场操作者频繁调整或者过调整.

    本文从数据的角度出发提出了一种多重关联时延估计方法, 但高炉冶炼过程的动态性也是影响时延结果准确性的一个重要性因素, 因此炉况变动下时延参数的动态调整也是下一步需要考虑的问题. 此外, 尽管本文提出的时延估计方法能提高数据的质量进而提高后续硅含量模型的预测精度, 但是相比于最新的硅含量软测量结果还有进一步提升的空间, 因此下一步可以考虑将时延参数作为软测量模型的参数, 模型的性能作为时延参数准确性的评价指标, 进而将后续的软测量建模与时延估计有机结合起来, 在提高模型性能的同时提高时延估计结果的准确性和可靠性.

  • 图  1  高炉三维仿真模拟图

    Fig.  1  Three-dimensional simulation diagram of the blast furnace cast field

    图  2  高炉炼铁过程中变时滞问题描述

    Fig.  2  Illustration of variable time-delay problem in the blast furnace ironmaking process

    图  3  基于DMS-PSO-CS算法的时延参数估计框架

    Fig.  3  Time-delay parameter estimation framework based on DMS-PSO-CS algorithm

    图  4  基于DMS-PSO-CS算法时延估计的铁水硅含量预测结果

    Fig.  4  The prediction details of silicon content in molten iron with time-delay estimation based on DMS-PSO-CS algorithm

    图  5  基于PSO算法时延估计的铁水硅含量预测结果

    Fig.  5  The prediction details of silicon content in molten iron with time-delay estimation based on PSO algorithm

    图  6  基于MIC算法时延估计的铁水硅含量预测结果

    Fig.  6  The prediction details of silicon content in molten iron with time-delay estimation based on MIC algorithm

    图  7  基于PCC算法时延估计的铁水硅含量预测结果

    Fig.  7  The prediction details of silicon content in molten iron with time-delay estimation based on PCC algorithm

    图  8  无时延估计的铁水硅含量预测结果

    Fig.  8  The prediction details of silicon content in molten iron without time-delay estimation

    图  9  基于不同算法的寻优迭代曲线

    Fig.  9  Optimization iteration curve based on different algorithms

    表  1  数值仿真中基于不同方法估计的过程变量时延值

    Table  1  The estimated variable time-delay values based on different methods in numerical simulation

    变量 PCC MIC PSO DMS-PSO-CS $ \tau ' $
    $ {x_1} $ 1 1 1 1 1
    $ {x_2} $ 0 2 2 2 2
    $ {x_3} $ 2 0 3 3 3
    $ {x_4} $ 1 3 3 4 4
    下载: 导出CSV

    表  2  基于不同方法估计的过程变量时延参数

    Table  2  The estimated process variable time-delayvalues based on different methods

    变量 (单位) PCC MIC PSO DMS-PSO-CS
    富氧率(wt%) 1 5 5 5
    透气性指数$(\rm m^{3}/min \cdot kPa)$ 1 1 1 2
    一氧化碳(wt%) 1 2 1 1
    二氧化碳(wt%) 1 1 1 1
    标准风速(m/s) 6 6 2 1
    富氧流量$(\rm m^{3}/s)$ 1 3 6 1
    冷风流量$(\rm m^{3}/min)$ 6 2 2 2
    鼓风动能(J/s) 1 2 2 3
    炉腹煤气量 (t) 6 1 2 2
    炉腹煤气指数 6 2 2 2
    顶压 (kPa) 1 3 1 4
    富氧压力(kPa) 2 3 6 6
    冷风压力 (kPa) 1 1 6 2
    全压差(kPa) 1 2 2 2
    热风压力(kPa) 1 1 5 2
    实际风速 (m/s) 1 3 2 2
    冷风温度 (°C) 1 6 1 1
    热风温度 (°C) 1 6 2 2
    顶温(°C) 1 5 1 2
    顶温下降管 (°C) 1 1 2 6
    阻力系数 1 1 2 1
    鼓风湿度 ($ \rm g/m^{3} $) 3 6 1 1
    本小时实际喷煤量(t/h) 2 1 1 3
    上小时实际喷煤量 (t/h) 1 1 5 5
    铁水温度 (°C) 1 1 1 1
    下载: 导出CSV

    表  3  基于不同建模策略下的铁水硅含量软测量模型性能

    Table  3  Soft-sensor model performance of silicon content in molten iron based on different modeling strategies

    序号 建模策略 TrRMSE TrMAE TsRMSE TsMAE 训练时间 (s)
    1 SDAE + DM-PSO-CS 0.0715 0.0530 0.0723 0.0542 12.2 $ \times $ 60 + 8
    2 SDAE + PSO 0.0748 0.0565 0.0759 0.0574 12.4 $ \times $ 60 + 10
    3 SDAE + MIC 0.0752 0.0562 0.0765 0.0575 12.3 $ \times $ 60 + 12
    4 SDAE + PCC 0.0763 0.0561 0.0776 0.0573 12.2 $ \times $ 60 + 10
    5 SVR + DM-PSO-CS 0.0775 0.0572 0.0792 0.0588 7
    6 RVFLN + DM-PSO-CS 0.0769 0.0573 0.0782 0.0585 3
    7 SDAE + 无时延估计 0.0826 0.0605 0.0840 0.0613 12.3 $ \times $ 60 + 9
    下载: 导出CSV
  • [1] Zhou H, Zhang H F, and Yang C J. Hybrid model based intelligent optimization of ironmaking process. IEEE Transaction on Industrial Electronics, 2020, 67(3): 2469-247 doi: 10.1109/TIE.2019.2903770
    [2] 蒋朝辉, 许川, 桂卫华, 蒋珂. 基于最优工况迁移的高炉铁水硅含量预测方法. 自动化学报, 2021, 48(1): 207-219

    Jiang Zhao-Hui, Xu Chuang, Gui Wei-Hua, Jiang Ke. Prediction method of hot metal silicon content in blast furnace based on optimal smelting condition migration. Acta Automatica Sinica, 2021, 48(1): 207-219
    [3] 李温鹏, 周平. 高炉铁水质量鲁棒正则化随机权神经网络建模. 自动化学报, 2020, 46(4): 721-733

    Li Wen-Peng, Zhou Ping. Blast furnace hot metal quality robust regularization random weight neural network modeling. Acta Automatica Sinica, 2020, 46(4): 721-733
    [4] Chen S H, Gao C H. Linear priors mined and integrated for transparency of blast furnace black-Box SVM model. IEEE Transactions on Industrial Informatics, 2020, 16(6): 3862-3870 doi: 10.1109/TII.2019.2940475
    [5] Li J P, Hua C C, Yang Y N, Zhang L M, Guan X P. Output space transfer based multi-input multi-output Takagi–Sugeno fuzzy modeling for estimation of molten iron quality in blast furnace. Knowledge-Based Systems, 2021, 219: 106906 doi: 10.1016/j.knosys.2021.106906
    [6] Saxen H, Gao C H, and Gao Z W. Data-driven time discrete models for dynamic prediction of the hot metal silicon content in the blast furnace—A review. IEEE Transactions on Industrial Informatics, 2013, 9(4): 2213-2225 doi: 10.1109/TII.2012.2226897
    [7] Tang X L, Zhuang L, Jiang C J. Prediction of silicon content in hot metal using support vector regression based on chaos particle swarm optimization. Expert Systems with Applications, 2009, 36(9): 11853-11857 doi: 10.1016/j.eswa.2009.04.015
    [8] 周平, 张丽, 李温鹏, 戴鹏, 柴天佑. 集成自编码与PCA的高炉多元铁水质量随机权神经网络建模. 自动化学报, 2018, 44(10): 1799-1811

    Zhou Ping, Zhang Li, Li Wen-Peng, Dai Peng, Chai Tian-You. Modeling of blast furnace multi-element molten iron quality with random weight neural network based on self-encoding and PCA. Acta Automatica Sinica, 2018, 44(10): 1799-1811
    [9] Zhou P, Li W P, Wang H, Li M J, Chai T Y. Robust online sequential RVFLNs for data modeling of dynamic time-varying systems with application of an ironmaking blast furnace. IEEE Transactions on Cybernetics, 2019, 50(11): 4783-4795
    [10] Pan D, Jiang Z H, Chen Z P, Gui W H, Xie Y F, Yang C H. Temperature measurement and compensation method of blast furnace molten iron based on infrared computer vision. IEEE Transactions on Instrumentation and Measurement, 2018, 68(10): 3576-3588
    [11] Pan D, Jiang Z H, Chen Z P, Jiang K, Gui W H. Compensation method for molten iron temperature measurement based on heterogeneous features of infrared thermal images. IEEE Transactions on Industrial Informatics, 2020, 16(11): 7056-7066 doi: 10.1109/TII.2020.2972332
    [12] 蒋朝辉, 董梦林, 桂卫华, 阳春华, 谢永芳. 基于Bootstrap的高炉铁水硅含量二维预报. 自动化学报, 2016, 42(5): 715-723

    Jiang Zhao-Hui, Dong Meng-Lin, Gui Wei-Hua, Yang Chun-Hua, Xie Yong-Fang. Two-dimensional prediction for silicon content of hot metal of blast furnace based on bootstrap. Acta Automatica Sinica, 2016, 42(5): 715-723
    [13] 蒋珂, 蒋朝辉, 谢永芳, 潘冬, 桂卫华. 基于动态注意力深度迁移网络的高炉铁水硅含量在线预测方法. 自动化学报, 2021, DOI:10. 16383/j.aas.c210524

    Jiang Ke, Jiang Zhao-Hui, Xie Yong-Fang, Dong Pan, Gui Wei-Hua. Online prediction method for silicon content of molten iron in blast furnace based on dynamic attention deep transfer network. Acta Automatica Sinica, 2021, DOI:10. 16383/j.aas.c210524
    [14] Jiang K, Jiang Z H, Xie Y F, Chen Z P, Pan D, Gui W H. Classification of silicon content variation trend based on fusion of multilevel features in blast furnace ironmaking. Information Sciences, 2020, 521: 32-45 doi: 10.1016/j.ins.2020.02.039
    [15] 阮宏镁, 田学民, 王平. 基于联合互信息的动态软测量方法. 化工学报, 2014, 65(11): 4497-4502 doi: 10.3969/j.issn.0438-1157.2014.11.040

    Ruan Hong-Mei, Tian Xue-Min, Wang Ping. Dynamic soft sensor method based on joint mutual information. CIESC Journal, 2014, 65(11): 4497-4502 doi: 10.3969/j.issn.0438-1157.2014.11.040
    [16] Zhai L Y, Khoo L P, Zhong Z W. Design concept evaluation in product development using rough sets and grey relation analysis. Expert Systems with Applications, 2009, 36(3): 7072-7079 doi: 10.1016/j.eswa.2008.08.068
    [17] Singh T, Patnaik A, Chauhan R. Optimization of tribological properties of cement kiln dust-filled brake pad using grey relation analysis. Materials & Design, 2016, 89: 1335-1342
    [18] Patel M T. Multi optimization of process parameters by using grey relation analysis-a review. International Journal of Advanced Research in IT and Engineering, 2015, 4(6): 1-15
    [19] Poli R, Kennedy J, Blackwell T. Particle swarm optimization. Swarm Intelligence, 2007, 1(1): 33-57 doi: 10.1007/s11721-007-0002-0
    [20] Banks A, Vincent J, Anyakoha C. A review of particle swarm optimization. Part I: background and development. Natural Computing, 2007, 6(4): 467-484 doi: 10.1007/s11047-007-9049-5
    [21] Van den Bergh F, Engelbrecht A P. A cooperative approach to particle swarm optimization. IEEE Transactions on Evolutionary Computation, 2004, 8(3): 225-239 doi: 10.1109/TEVC.2004.826069
    [22] Komulainen T, Sourander M, Jämsä-Jounela S L. An online application of dynamic PLS to a dearomatization process. Computers and Chemical Engineering, 2004, 28(12): 2611-2619 doi: 10.1016/j.compchemeng.2004.07.014
    [23] Curreri F, Graziani S, Xibilia M G. Input selection methods for data-driven Soft sensors design: Application to an industrial process. Information Sciences, 2020, 537: 1-17 doi: 10.1016/j.ins.2020.05.028
    [24] Williamson D F, Parker R A, Kendrick J S. The box plot: a simple visual method to interpret data. Annals of Internal Medicine, 1989, 110(11): 916-921 doi: 10.7326/0003-4819-110-11-916
    [25] Vincent P, Larochelle H, Lajoie I, Bengio Y, and Manzagol P. Stacked denoising autoencoders: Learning useful representations in a deep network with a local denoising criterion. Journal of Machine Learning Research, 2010, 11: 3371-3408
  • 期刊类型引用(3)

    1. 郭云鹏,安剑奇,赵国宇. 基于冶炼强度分类的高炉煤气利用率时间序列预测模型. 冶金自动化. 2024(02): 60-73 . 百度学术
    2. 钟林生,常玉清,王福利,高世红. 基于慢特征分析的分布式动态工业过程运行状态评价. 自动化学报. 2024(04): 745-757 . 本站查看
    3. 孙婧,党耀国,杨圣祥,王俊杰,杨绍闻. 基于面板数据的灰色差值关联模型构建及其应用. 控制与决策. 2024(11): 3839-3847 . 百度学术

    其他类型引用(5)

  • 加载中
图(9) / 表(3)
计量
  • 文章访问数:  713
  • HTML全文浏览量:  237
  • PDF下载量:  231
  • 被引次数: 8
出版历程
  • 收稿日期:  2022-02-08
  • 录用日期:  2022-07-04
  • 网络出版日期:  2022-09-23
  • 刊出日期:  2023-02-20

目录

/

返回文章
返回