2.793

2018影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于KPLS鲁棒重构误差的高炉燃料比监测与异常识别

周平 刘记平 梁梦圆 张瑞垚

周平, 刘记平, 梁梦圆, 张瑞垚. 基于KPLS鲁棒重构误差的高炉燃料比监测与异常识别. 自动化学报, 2020, 46(x): 1−11. doi: 10.16383/j.aas.c180579
引用本文: 周平, 刘记平, 梁梦圆, 张瑞垚. 基于KPLS鲁棒重构误差的高炉燃料比监测与异常识别. 自动化学报, 2020, 46(x): 1−11. doi: 10.16383/j.aas.c180579
Zhou Ping, Liu Ji-Ping, Liang Meng-Yuan, Zhang Rui-Yao. KPLS Robust reconstruction error based monitoring and anomaly identification of fuel ratio in blast furnace ironmaking. Acta Automatica Sinica, 2020, 46(x): 1−11. doi: 10.16383/j.aas.c180579
Citation: Zhou Ping, Liu Ji-Ping, Liang Meng-Yuan, Zhang Rui-Yao. KPLS Robust reconstruction error based monitoring and anomaly identification of fuel ratio in blast furnace ironmaking. Acta Automatica Sinica, 2020, 46(x): 1−11. doi: 10.16383/j.aas.c180579

基于KPLS鲁棒重构误差的高炉燃料比监测与异常识别


DOI: 10.16383/j.aas.c180579
详细信息
    作者简介:

    东北大学教授. 分别于2003年, 2006年, 2013年获得东北大学学士学位、硕士学位和博士学位. 主要研究方向为工业过程运行反馈控制、数据驱动建模与控制等. 本文通信作者.E-mail: zhouping@mail.neu.edu.cn

    于2017年获得东北大学硕士学位. 主要研究方向为数据驱动质量监测.E-mail: m18842388402@163.com

    东北大学硕士研究生, 期间获国家奖学金. 于2016年获得东北大学秦皇岛分校大学学士学位. 主要研究方向为数据驱动质量监测.E-mail: liangmy1994@163.com

    东北大学硕士研究生. 于2018年获得东北大学学士学位. 主要研究方向为数据驱动质量监测.E-mail: 1870768@stu.neu.edu.cn

  • 基金项目:  国家自然科学基金项目(61890934, 61790572), 辽宁省'兴辽英才计划'项目(XLYC1907132), 中央高校基本科研业务费项目(N180802003), 矿冶过程自动控制技术国家(北京市)重点实验室开放课题资助(BGRIMM-KZSKL-2017-04)

KPLS Robust Reconstruction Error Based Monitoring and Anomaly Identification of Fuel Ratio in Blast Furnace Ironmaking

More Information
  • Fund Project:  Supported by National Natural Science Foundation of China (61890934, 61790572), Liaoning Revitalization Talents Program (XLYC1907132), and Fundamental Research Funds for the Central Universities (N180802003). This work was also supported by the State (Beijing) Key Laboratory of Process Automation in Mining & Metallurgy (BGRIMM-KZSKL-2017-04)
  • 摘要: 作为钢铁冶金制造的核心工序, 高炉炼铁是典型的高能耗过程, 其运行能耗约占钢铁总能耗的50%以上, 这 其中80%的能耗是焦炭和煤粉等燃料消耗. 因此, 对表征高炉燃料消耗的燃料比参数进行监测, 并尽可能早地 识别影响燃料比异常波动的关键因素, 对于高炉炼铁过程的节能降耗具有重要意义. 本文针对先验故障知识少的 高炉燃料比监测与异常识别难题, 提出一种基于核偏最小二乘(Kernel partial least squares, KPLS)鲁棒重构误差的故障识别方法. 该方法首先 建立过程变量与监测变量的KPLS监测模型, 然后根据非线性映射空间的协方差矩阵和核空间Gram矩阵之间的关系, 反向估计原始空间变量的正常估值. 为了增强算法的鲁棒性, 采用迭代去噪算法减少异常数据对原始空间正常估值的影响. 通过利用原始空间正常估值和真实值来构造故障识别指标, 并给出故障识别指标的控制限. 基于实际工业数据的高炉数据试验表明所提方法不仅可以监测出正常工况下影响燃料比异常变化的潜在因素, 还可识别出异常工况下影响燃料比异常变化的关键因素, 具有很好的工程应用前景.
  • 图  1  高炉炼铁过程能耗示意图

    Fig.  1  Schematic diagram of energy consumption in blast furnace ironmaking process

    图  2  故障1的KPLS监测图

    Fig.  2  KPLS monitoring chart for fault 1

    图  4  故障2的KPLS监测图

    Fig.  4  KPLS monitoring chart for fault 2

    图  6  故障3的KPLS监测图

    Fig.  6  KPLS monitoring chart for fault 3

    图  3  故障1的故障变量识别图

    Fig.  3  Fault variable identification map of fault 1

    图  5  故障2的故障变量识别图

    Fig.  5  Fault variable identification map of fault 2

    图  7  故障3的故障变量识别图

    Fig.  7  Fault variable identification map of fault 3

    图  8  高炉燃料比监测曲线

    Fig.  8  Blast furnace fuel ratio monitoring curve

    图  9  高炉燃料比休哈顿图及残差图

    Fig.  9  Blast furnace fuel ratio Hughton diagram and residual map

    图  10  鼓风湿度异常时高炉燃料比异常识别曲线

    Fig.  10  Blast furnace fuel ratio anomaly identification curve when blast humidity is abnormal

    图  11  高炉操作调节关联图

    Fig.  11  Association diagram of blast furnace operation adjustment

    图  12  管道行程异常工况时高炉燃料比异常识别曲线

    Fig.  12  Abnormal identification curve of blast furnace fuel ratio in abnormal pipeline condition

    表  1  部分过程变量控制限与故障指标值的差值

    Table  1  The value of the control limit is reduced to the value of the fault index for part process variables.

    过程变量 时间 $(1h)$
    $T$ 290 $T$ 291 $T$ 292 $T$ 293 $T$ 294 $T$ 295 $T$ 296 $T$ 297 $T$ 298 $T$ 299 $T$ 300
    焦炭负荷 0.618 0.692 0.692 0.692 0.095 -0.394 -0.306 -0.397 -18.397 -0.676 -5.217
    球团 0.847 0.847 0.847 0.880 -0.533 -0.577 -0.581 -0.245 -0.611 -1.366 -0.552
    烧结比 1.025 1.025 1.024 1.024 -1.464 -1.545 -1.557 -1.556 -1.599 -1.508 -1.504
    球团比 0.869 0.871 0.870 0.870 -0.730 -0.793 -0.798 -0.801 -0.837 -0.768 -0.758
    顶压风量比 0.372 -0.744 -0.744 -0.744 -1.818 -2.467 -1.816 -0.286 -0.722 -3.198 -0.731
    标准风速 0.027 -0.654 -0.502 -0.654 0.861 0.790 0.861 0.909 0.909 0.184 0.068
    鼓风动能 0.087 -0.569 0.156 -0.217 0.906 0.901 0.906 0.902 0.906 0.638 0.673
    炉腹煤气指数 0.080 -0.771 -0.309 -0.771 0.933 0.929 0.933 0.864 0.932 0.694 0.690
    下载: 导出CSV
  • [1] Zhou Ping, Song He-Da, Wang Hong, Chai Tian-You. Data-driven nonlinear subspace modeling for prediction and control of molten iron quality indices in blast furnace ironmaking. IEEE Trans. Control Systems Technology, 2017, 25(5): 1761−71774 doi:  10.1109/TCST.2016.2631124
    [2] 蒋朝辉, 董梦林, 桂卫华, 阳春华, 谢永芳. 基于Bootstrap的高炉铁水硅含量二维预报. 自动化学报, 2016, 42(5): 715−723

    Jiang Zhao-Hui, Dong Meng-Lin, Gui Wei-Hua, Yang Chun-Hua, Xie Yong-Fang. Two-dimensional prediction for silicon content of hot metal of blast furnace based on bootstrap. Acta Automatica Sinica, 2016, 42(5): 715−723
    [3] Jian Ling, Li Jun-dong, Luo Shi-Hua. Exploiting expertise rules for statistical data-driven modelling. IEEE Trans. Ind. Electron., 2017, 64(11): 8647−8656 doi:  10.1109/TIE.2017.2703659
    [4] 周平, 刘记平. 基于数据驱动多输出ARMAX建模的高炉十字测温中心温度在线估计. 自动化学报, 2018, 44(3): 552−561

    Zhou Ping, Liu Ji-Ping. Data-driven multi-output ARMAX modeling for online estimation of central temperatures for cross temperature measuring in blast furnace ironmaking. Acta Automatica Sinica, 2018, 44(3): 552−561
    [5] Xu Wan-Ren, Zhu Ren-Liang, Zhang Long-Lai, Zhang Yong-Zhong. Reason and control practice of hearth sidewall erosion of No. 2 BF at Baosteel. Iron and Steel, 2007, 42(1): 8−12
    [6] Gao Jian-Jun, Zhang Ying-Yi, Qi Yuan-Hong, Xu Hai-Chuan, Shi Xue-Feng. Energy consumption analysis on blast furnace ironmaking process using pre-reduced burden. Iron and Steel, 2014, 49(7): 61−65
    [7] Liu Xiong, Chen Lin-Gen, Qin Xiao-Yong, Sun Feng-Rui. Exergy loss minimization for a blast furnace with comparative analyses for energy flows and exergy flows. Energy, 2015, 93: 10−19 doi:  10.1016/j.energy.2015.09.008
    [8] Zhang Yan-Yan, Zhang Xiao-Lei, Tang Li-Xin. Energy consumption prediction in ironmaking process using hybrid algorithm of SVM and PSO[C]// International Conference on Advances in Neural Networks, 2012, 1(4): 594−600
    [9] Wei Na, Li Li, Zhu Jun, Li Na. Iron and steel process energy consumption prediction model based on selective ensemble[C]// International Conference on Advanced Mechatronic Systems, 2013: 203−207
    [10] Naito M, Takeda K, Matsui Y. Ironmaking technology for the last 100 years: deployment to advanced technologies from introduction of technological know-how, and evolution to next-generation process. ISIJ International, 2015, 55(1): 7−35 doi:  10.2355/isijinternational.55.7
    [11] Lin Zhi-Ling, Yue You-Jun, Zhao Hui, Li Hong-Ru. Judging the states of blast furnace by ART2 neural network. International Symposium on Neural Networks, 2009, 56: 857−864
    [12] Rajakarunakaran S, Venkumar P, Devaraj D, Rao K S P. Artificial neural network approach for fault detection in rotary system. Applied Soft Computing, 2008, 8(1): 740−748 doi:  10.1016/j.asoc.2007.06.002
    [13] Dong Li-Xin, Xiao Deng-Ming, Liang Yi-Shan, Liu Yi-Lu. Rough set and fuzzy wavelet neural network integrated with least square weighted fusion algorithm based fault diagnosis research for power transformers. Electric Power Systems Research, 2008, 78(1): 129−136 doi:  10.1016/j.jpgr.2006.12.013
    [14] Zhao Chun-Hui, Wang Fu-Li, Zhang Ying-Wei. Nonlinear process monitoring based on kernel dissimilarity analysis. Control Engineering Practice, 2009, 17(1): 221−230 doi:  10.1016/j.conengprac.2008.07.001
    [15] Zhao Chun-Hui, Gao Fu-Rong. Fault-relevant principal component analysis (FPCA) method for multivariate statistical modeling and process monitoring. Chemometrics and Intelligent Laboratory Systems, 2014, 133: 1−16 doi:  10.1016/j.chemolab.2014.01.009
    [16] Zhao Chun-Hui, Sun You-Xian. Multispace total projection to latent structures and its application to online process monitoring. IEEE Trans. Control Systems Technology, 2014, 22(3), 868−883
    [17] Yao Li-Na, Qin Ji-Feng, Wang Hong, Jiang Bin. Design of new fault diagnosis and fault tolerant control scheme for non-Gaussian singular stochastic distribution systems. Automatica, 2012, 48(9): 2305−2313 doi:  10.1016/j.automatica.2012.06.036
    [18] Qin S J. Statistical process monitoring: basics and beyond. Journal of Chemometrics, 2003, 17(8-9): 480−502 doi:  10.1002/cem.800
    [19] Lee J M, Yoo C K, Choi S, Vanrolleghem P A, Lee I B. Nonlinear process monitoring using kernel principal component analysis. Chemical Engineering Science, 2004, 59(1): 223−234 doi:  10.1016/j.ces.2003.09.012
    [20] Cho J H, Lee J M, Choi S W, Lee D, Lee I B. Fault identification for process monitoring using kernel principal component analysis. Chemical Engineering Science, 2005, 60(1): 279−288 doi:  10.1016/j.ces.2004.08.007
    [21] Rosipal R, Trejo L J. Kernel partial least squares regression in reproducing kernel Hilbert space. Journal of Machine Learning Research, 2002, 2(2): 97−123
    [22] Wold S, Kettaneh-Wold N, Skagerberg B. Nonlinear PLS modeling. Chemometrics and Intelligent Laboratory Systems, 1989, 7(1-2): 53−65 doi:  10.1016/0169-7439(89)80111-X
    [23] Qin S J, Mcavoy T J. Nonlinear PLS modeling using neural networks. Computers and Chemical Engineering, 1992, 16(4): 379−391 doi:  10.1016/0098-1354(92)80055-E
    [24] Baffi G, Martin E B, Morris A J. Non-linear projection to latent structures revisited (the neural network PLS algorithm). Computers and Chemical Engineering, 1999, 23(9): 1293−1307 doi:  10.1016/S0098-1354(99)00291-4
    [25] Peng Kai-Xing, Zhang Kai, You Bo, Dong Jie, Wang Z D. A quality-based nonlinear fault diagnosis framework focusing on industrial multimode batch processes. IEEE Transactions on Industrial Electronics, 2016, 63(4): 2615−2624
    [26] Shao R, Jia F, Martin E B, Morris A J. Wavelets and non-linear principal components analysis for process monitoring. Control Engineering Practice, 1997, 7(7): 865−879
    [27] Dunia R, Qin S J, Edgar T F, McAvoy T J. Identification of faulty sensors using principal component analysis. AIChE Journal, 2010, 42(10): 2797−2812
    [28] Sang W C, Lee C, Lee J M, Lee I B. Fault detection and identification of nonlinear processes based on kernel PCA. Chemometrics and Intelligent Laboratory Systems, 2005, 75(1): 55−67 doi:  10.1016/j.chemolab.2004.05.001
    [29] Kim K, Lee J M, Lee I B. A novel multivariate regression approach based on kernel partial least squares with orthogonal signal correction. Chemometrics and Intelligent Laboratory Systems, 2005, 79(1-2): 22−30 doi:  10.1016/j.chemolab.2005.03.003
    [30] Miller P, Swanson R E, Heckler C E. Contribution plots: a missing link in multivariate quality control. Applied Mathematics and Computer Science, 1998, 8(4): 775−792
    [31] Struc V, Pavesic N. Gabor-based kernel partial-least-squares discrimination features for face recognition. Informatica, 2009, 20(1): 115−138 doi:  10.15388/Informatica.2009.240
    [32] Mika S, Scholkopf B, Smola A, Muller K R, Scholz M, Ratsch G. Kernel PCA and de-noising in feature spaces. Advances in Neural Information Processing Systems, 1999, 11: 536−542
    [33] Takahashi T, Kurita T. Robust de-noising by kernel PCA. International Conference on Artificial Neural Networks, 2002, 2415: 739−744
    [34] Koc E K, Bozdogan H. Model selection in multivariate adaptive regression spines (MARS) using information complexity as the fitness function. Machine Learning, 2015, 101(1-3): 35−58 doi:  10.1007/s10994-014-5440-5
  • [1] 李温鹏, 周平. 高炉铁水质量鲁棒正则化随机权神经网络建模[J]. 自动化学报, doi: 10.16383/j.aas.2018.c170670
    [2] 张瑞垚, 周平. 基于鲁棒加权模糊聚类的污水处理过程监测方法[J]. 自动化学报, doi: 10.16383/j.aas.c200392
    [3] 周平, 张丽, 李温鹏, 戴鹏, 柴天佑. 集成自编码与PCA的高炉多元铁水质量随机权神经网络建模[J]. 自动化学报, doi: 10.16383/j.aas.2018.c170299
    [4] 周平, 刘记平. 基于数据驱动多输出ARMAX建模的高炉十字测温中心温度在线估计[J]. 自动化学报, doi: 10.16383/j.aas.2018.c160840
    [5] 宋贺达, 周平, 王宏, 柴天佑. 高炉炼铁过程多元铁水质量非线性子空间建模及应用[J]. 自动化学报, doi: 10.16383/j.aas.2016.c150819
    [6] 赵春晖, 李文卿, 孙优贤, 高福荣. 基于多重局部重构模型的连续过程故障诊断[J]. 自动化学报, doi: 10.3724/SP.J.1004.2013.00487
    [7] 汤健, 柴天佑, 余文, 赵立杰. 在线KPLS建模方法及在磨机负荷参数集成建模中的应用[J]. 自动化学报, doi: 10.3724/SP.J.1004.2013.00471
    [8] 孙明轩, 毕宏博. 学习辨识:最小二乘算法及其重复一致性[J]. 自动化学报, doi: 10.3724/SP.J.1004.2012.00698
    [9] 李妍, 毛志忠, 王琰. 基于偏差补偿递推最小二乘的Hammerstein-Wiener模型辨识[J]. 自动化学报, doi: 10.3724/SP.J.1004.2010.00163
    [10] 谭帅, 王福利, 常玉清, 王姝, 周贺. 基于差分分段PCA的多模态过程故障监测[J]. 自动化学报, doi: 10.3724/SP.J.1004.2010.01626
    [11] 常玉清, 王姝, 谭帅, 王福利, 杨洁. 基于多时段MPCA模型的间歇过程监测方法研究[J]. 自动化学报, doi: 10.3724/SP.J.1004.2010.01312
    [12] 赵春晖, 王福利, 姚远, 高福荣. 基于时段的间歇过程统计建模、在线监测及质量预报[J]. 自动化学报, doi: 10.3724/SP.J.1004.2010.00366
    [13] 张颖伟, 周宏, 秦泗钊. 基于多块核主元分析的复杂过程的分散故障诊断[J]. 自动化学报, doi: 10.3724/SP.J.1004.2010.00593
    [14] 郜传厚, 渐令, 陈积明, 孙优贤. 复杂高炉炼铁过程的数据驱动建模及预测算法[J]. 自动化学报, doi: 10.3724/SP.J.1004.2009.00725
    [15] 刘丹, 孙金玮, 魏国, 刘昕. 移动最小二乘法在多功能传感器数据重构中的应用[J]. 自动化学报, doi: 10.1360/aas-007-0823
    [16] 颜学峰. 基于径基函数-加权偏最小二乘回归的干点软测量[J]. 自动化学报, doi: 10.1360/aas-007-0193
    [17] 陆宁云, 王福利, 高福荣, 王姝. 间歇过程的统计建模与在线监测[J]. 自动化学报
    [18] 赵龙, 陈哲. 新型联邦最小二乘滤波算法及应用[J]. 自动化学报
    [19] 冯冬青, 陈铁军, 姚志红. 热工过程在线监测和故障诊断专家系统[J]. 自动化学报
    [20] 孟晓风, 王行仁, 黄俊钦. 最小二乘估计的HOUSEHOLDER变换快速递推算法[J]. 自动化学报
  • 加载中
计量
  • 文章访问数:  6
  • HTML全文浏览量:  5
  • 被引次数: 0
出版历程

基于KPLS鲁棒重构误差的高炉燃料比监测与异常识别

doi: 10.16383/j.aas.c180579
    基金项目:  国家自然科学基金项目(61890934, 61790572), 辽宁省'兴辽英才计划'项目(XLYC1907132), 中央高校基本科研业务费项目(N180802003), 矿冶过程自动控制技术国家(北京市)重点实验室开放课题资助(BGRIMM-KZSKL-2017-04)
    作者简介:

    东北大学教授. 分别于2003年, 2006年, 2013年获得东北大学学士学位、硕士学位和博士学位. 主要研究方向为工业过程运行反馈控制、数据驱动建模与控制等. 本文通信作者.E-mail: zhouping@mail.neu.edu.cn

    于2017年获得东北大学硕士学位. 主要研究方向为数据驱动质量监测.E-mail: m18842388402@163.com

    东北大学硕士研究生, 期间获国家奖学金. 于2016年获得东北大学秦皇岛分校大学学士学位. 主要研究方向为数据驱动质量监测.E-mail: liangmy1994@163.com

    东北大学硕士研究生. 于2018年获得东北大学学士学位. 主要研究方向为数据驱动质量监测.E-mail: 1870768@stu.neu.edu.cn

摘要: 作为钢铁冶金制造的核心工序, 高炉炼铁是典型的高能耗过程, 其运行能耗约占钢铁总能耗的50%以上, 这 其中80%的能耗是焦炭和煤粉等燃料消耗. 因此, 对表征高炉燃料消耗的燃料比参数进行监测, 并尽可能早地 识别影响燃料比异常波动的关键因素, 对于高炉炼铁过程的节能降耗具有重要意义. 本文针对先验故障知识少的 高炉燃料比监测与异常识别难题, 提出一种基于核偏最小二乘(Kernel partial least squares, KPLS)鲁棒重构误差的故障识别方法. 该方法首先 建立过程变量与监测变量的KPLS监测模型, 然后根据非线性映射空间的协方差矩阵和核空间Gram矩阵之间的关系, 反向估计原始空间变量的正常估值. 为了增强算法的鲁棒性, 采用迭代去噪算法减少异常数据对原始空间正常估值的影响. 通过利用原始空间正常估值和真实值来构造故障识别指标, 并给出故障识别指标的控制限. 基于实际工业数据的高炉数据试验表明所提方法不仅可以监测出正常工况下影响燃料比异常变化的潜在因素, 还可识别出异常工况下影响燃料比异常变化的关键因素, 具有很好的工程应用前景.

English Abstract

周平, 刘记平, 梁梦圆, 张瑞垚. 基于KPLS鲁棒重构误差的高炉燃料比监测与异常识别. 自动化学报, 2020, 46(x): 1−11. doi: 10.16383/j.aas.c180579
引用本文: 周平, 刘记平, 梁梦圆, 张瑞垚. 基于KPLS鲁棒重构误差的高炉燃料比监测与异常识别. 自动化学报, 2020, 46(x): 1−11. doi: 10.16383/j.aas.c180579
Zhou Ping, Liu Ji-Ping, Liang Meng-Yuan, Zhang Rui-Yao. KPLS Robust reconstruction error based monitoring and anomaly identification of fuel ratio in blast furnace ironmaking. Acta Automatica Sinica, 2020, 46(x): 1−11. doi: 10.16383/j.aas.c180579
Citation: Zhou Ping, Liu Ji-Ping, Liang Meng-Yuan, Zhang Rui-Yao. KPLS Robust reconstruction error based monitoring and anomaly identification of fuel ratio in blast furnace ironmaking. Acta Automatica Sinica, 2020, 46(x): 1−11. doi: 10.16383/j.aas.c180579
  • 高炉炼铁是钢铁生产制造流程的前端关键工序, 其作用就是将固态的铁矿石通过复杂高温、高压等 物理化学变化和多相多场耦合效应, 在焦炭、煤气等作用下还原成液态铁水, 为后续炼钢提供铁水原料. 如图1所示, 一个典型高炉炼铁过程主要由高炉本体、上料系统、送风系统、喷吹系统、渣铁处理系统 以及高炉烟气净化系统等组成[1-2]. 由于炼铁高炉内部在高温、高压条件下进行着复杂气-固、气-液、固-固、固-液等多相转换, 众多变量和参数之间错综复杂和相互耦合, 被公认为是最复杂的逆流反应器[3]. 高炉炼铁是典型的高能耗、低效率过程, 其运行能耗约占钢铁生产总能耗的50%以上, 生产成本占钢铁生产总成本的70%左右. 因此. 降低炼铁能耗对钢铁行业的节能减排、低成本可持续生产具有重要意义[1, 4]. 图1为高炉炼铁能耗示意图, 其中焦炭和煤粉等燃料消耗约占高炉炼铁总能耗的80%左右, 因此降低高炉燃料消耗是高炉炼铁节能 降耗的重中之重[5]. 高炉燃料消耗影响因素众多, 例 如热风温度、富氧量等高炉操作变量和过程变量, 都能直接或间接地影响高炉燃料消耗. 高炉燃料比(即生产1吨铁所消耗的焦炭、焦丁、煤粉等燃料量)作为反映高炉燃料消耗的最主要指标, 对高炉操作人员执行高炉操作制度具有重要指导作用. 随着节能减排, 倡导绿色生产以及降低成本的需求日益迫切, 对高炉节能减排的学术研究与工程实践也越来越多. 文献[6]和[7]基于物流平衡与能量平衡原理建立高炉能耗模型, 并从工艺角度进行节能分析与优化. 文献[8]和[9]分别采用支持向量机、神经网络等智能 建模技术建立了高炉能耗模型, 实现了能耗的在线估计; 文献[10]和[11]提出基于专家系统、神经网络的过程监测方法, 并将其应用于高炉炼铁过程. 但是这些方法没有对高炉能耗异常工况进行识别, 因而不能提供减少能耗及其波动的操作指导, 实际工程意义不大. 另外, 上述方法需要大量带有故障标签的数据去训练模型, 而高炉实际运行中很难获取大量带标签的故障数据. 因此, 针对能耗异常先验知识少的高炉炼铁过程, 需要研究如何利用高炉运行操作变量和状态变量数据与监测变量燃料比的关系, 对高炉燃料比进行监测, 并尽可能早的识别影响燃料比异常波动的关键因素及其低能耗调节的有效方法, 这对高炉炼铁过程的节能降耗具有重要意义. 随着现代工业生产的大规模和复杂化, 工业过程的安全监测、故障诊断与识别成为工业用户关注的重要问题. 近年来, 随着新型传感技术与计算机技术的快速发展和广泛应用, 使得工业生产能够获得比以往更多的生产过程运行数据. 因此, 如何从海量数据中进行有效数据挖掘, 使其服务于生产安全监测与诊断, 成为现代工业工程的热点问题. 文献[12, 13]利用系统在正常和故障情况下的历史数据训练神经网络或者支持向量机等机器学习算法用于故障诊断, 但诊断精度与故障样本的完备性和代表性有很大关系, 因此难以用于无法获得大量故障数据的复杂工业过程. 文献[14]针对线性相异分析在监测非线性过程时存在的不足, 引入一个核相异指数来定量评价非线性数据分布结构之间的差异, 从而反映非线性过程的相关性和操作条件的变化, 取得较好的非线性过程监测效果. 类似方法还有基于主成分分析(Principal component analysis,PCA)的监测方法, 不同是的PCA通过降维方式提取高维变量数据的主要信息, 从而对过程运行状况与故障进行分析. 作为数据驱动多变量统计过程监测(Multivariate statistical process monitoring, MSPM)的主流技术[15-17], 偏最小二乘(Partial least squares, PLS)监测方法更注重过程变量与监测变量(如高炉炼铁过程燃料比)之间的关联关系 以及影响监测变量的故障或异常工况[18-20]. PLS的主要优点是可以建立过程变量与监测变量之间的关系模型, 能够有效解决多变量系统的相关性、数据样本和故障先验知识少的问题. 然而, 常规PLS是线性降维投影方法, 很难捕捉生产过程的非线性特性[21]. 为解决该问题, 可通过两种方法来对常规线性PLS进行扩展, 其一是调整PLS内部模型, 其二是调整PLS外部模型. 如S. Wold和S. J. Qin等[22-23]分别 基于二次函数和神经网络模型建立PLS的非线性内模型, 即过程变量得分主元和监测变量得分主元之间的非线性模型, 从而解释生产过程的非线性关系; R. Rosipa和G. Baffi等[21, 24]分别利用核函数和带有权重更新的神经网络模型建立PLS的非线性外模型, 即通过将过程输入变量变换到高维空间, 并在此空间执行线性PLS算法, 从而实现非线性过程监测. 基于核函数的PLS又称为核函数潜投影结构(KPLS), 与其他非线性PLS方法相比, KPLS的优点在于可以避免非线性优化, 因而成为较为流行的过程监测与诊断方法. 但是, 基于KPLS的过程诊断方法在很多情况下难以找到特征空间到原始过程变量空间的逆映射函数, 从而增加了故障识别的难度[25]. 为此, J. H. Cho和R. Shao等[20, 26]通过计算当前时刻变量对统计量的一阶偏导数值来确定故障变量, 并认为异常时刻有最大偏导数的过程变量为故障变量. 但是这种方法难以适用于KPLS, 因为基于核的非线性映射是不可微函数, 并且在很多情况下不是显式的形式. 针对基于核函数的非线性过程故障识别问题, 文献[27]和[28]提出一种基于重构误差的故障指标, 即利用两种平方误差的比值, 一种是SPE(Squared prediction error)即Q统计量, 另一种是基于变量相关性, 用其他变量去估计过程变量中的一个, 并用此变量的估值和剩余变量来计算Q统计量. 这种方法的核心思想是当重构的变量是故障变量时, 此变量的故障指标会比非故障变量的指标值偏小. 目前, 该方法在 连续搅拌釜式反应器(Continuous stirred tank reactor, CSTR)的模拟实验中获得较好的诊断效果[25]. 本文针对先验故障知识少的非线性高炉炼铁过程燃料比监测和故障识别问题, 基于文献[27]和[28]的思想, 提出一种基于KPLS鲁棒重构误差的新型故障识别方法. 该方法通过分析Gram矩阵和高维特征空间映射矩阵的关系, 重构原始过程变量, 以原始过程变量的重构误差构造故障识别指标并给出指标控制限. 同时, 所提方法引入迭代去噪算法以减少异常数据对原始空间正常估值的影响, 从而增强算法的鲁棒性. 数值仿真及基于实际高炉实际数据的工业试验表明所提方法能够准确识别引起高炉燃料比异常变化的影响因素, 从而给出高炉的调节方向, 指导高炉操作人员调节高炉操作制度, 使高炉在顺行的前提下, 朝着降低能耗的方向运行. 此外, 基于KPLS鲁棒重构误差的新型故障识别方法不仅可以监测出正常工况下影响燃料比异常变化的潜在影响因素, 还可以监测出异常工况下影响燃料比异常变化的关键因素.

    图  1  高炉炼铁过程能耗示意图

    Figure 1.  Schematic diagram of energy consumption in blast furnace ironmaking process

    • 由于基本PLS是一个线性降维投影方法, 无法描述过程的非线性特性, Dunia等[27]提出利用核函数将原始数据投影到高维空间, 并在高维空间运行PLS算法, 以此来描述过程的非线性. 其基本思想是: 如果核函数满足Mercer条件[27], 则KPLS只需利用核技术在原始过程数据空间进行点积运算, 不需要具体的非线性映射函数, 即可实现非线性PLS.

      设非线性系统的过程变量为 ${ X} = [{{{x}}_{1}}, {{{x}}_{2}},\cdots,$ ${{{x}}_{n}}]^{\rm T}\in {{\bf{R}}^{n\times m} },$ 待监测变量(如质量变量)为 ${ Y} = [{{{y}}_{1}},$ ${{{y}}_{2}},\cdots,{{{y}}_{n}}]^{\rm T} \in {{\bf{R}}^{n\times p}},$ 其中 $ n $ 为数据数, $ m $ 为过程变量数, $ p $ 为质量变量数. 定义 $ \phi $ 为非线性映射, 用于将过程变量从原始空间映射到特征空间 $ F. $ KPLS利用核函数将原始输入数据映射到特征空间 $F: $ $ {{x}}\rightarrow \phi({{x}})\in{F} ,$ 并在特征空间执行线性PLS算法. 设映射矩阵 $ \Phi = {[\phi({{x}}_{1}),\phi({{x}}_{2}),\cdots,\phi({{x}}_{n})]}^{\rm T}\in {{\bf{R}}^{n\times f}}, $ 为简化计算, 令 $\begin{matrix} \sum_{i = 1}^n \phi({{x}}_{i}) = {\bf 0}\end{matrix},$ 即输入变量映射到特征空间的均值为零. 定义Gram矩阵 $ { K} = { \Phi}{ \Phi}^{\rm T}\in $ ${\bf{R}}^{n\times n} ,$ $ { K}_{ij} = k({{x}}_{i},{{x}}_{j}) = {\langle\phi({{x}}_{i}),\phi({{x}}_{j}) \rangle} ,$ 通过核映射和内积运算, 即 $ {\phi({{x}}_{i})}^{\rm T}\phi({{x}}_{j}) = k({{x}}_{i},{{x}}_{j}), $ 避免计算原始输入空间到特征空间的非线性映射矩阵 $ \Phi ,$ 直接得到Gram矩阵 $ K. $ 另外, 基于非线性迭代的KPLS可以避免求解Gram矩阵的特征值, 通过迭代的方式直接求得Gram矩阵的特征向量和得分向量[29].

      此外, 为满足假设 $ \begin{matrix} \sum_{i = 1}^n \phi({{x}}_{i}) = {\bf{0}} \end{matrix}, $ 需要对 $ \Phi $ 进行中心化处理, 即 ${ \Phi}_{0} = { \Phi}-{{1}}_{n}{{\Phi}}_{ \rm{mean}},{{\Phi}}_{ \rm{mean}}$ 为映射矩阵的均值向量, $ {\bf{1}}_{n} $ $ n $ 维全1列向量, $ {\Phi}_{0} $ 为中心化处理的 $ { \Phi}. $ 则Gram矩阵 $ K $ 的中心化处理可按如下式计算:

      $$ { K}_{0} \!=\! { \Phi}_{0}{ \Phi}_{0}^{\rm T} \!=\! \left({ E}_{n}-\frac{1}{n}{\bf{1}}_{n}{\bf{1}}_{n}^{\rm T}\right)\!{ K}\!\left({ E}_{n}-\frac{1}{n}{\bf{1}}_{n}{\bf{1}}_{n}^{\rm T}\right) $$ (1)

      式中: $ { K}_{0} $ 为中心化后的 $ { K}, { E}_{n} $ $ n\times n $ 的单位矩阵. 对于新数据 $ {{{x}}_{k}^{ \rm{new}}}\in{\bf R}^{m} , k = 1,\cdots,N, $ 对应映射向量为 $ \phi({{x}}_{k}^{ \rm{new}})\in{\bf R}^{f}, $ 当采样数为 $ N $ 时, 对应特征向量为 $ {{\Phi}}^{ \rm{new}} ,$ 从而对 $ {{\Phi}}^{ \rm{new}} $ 中心化得 $ {{\Phi}}_{0}^{ \rm{new}} = {{\Phi}}^{ \rm{new}}-{\bf{1}}_{N}{{\Phi}}_{ \rm{mean}} ,$ 其中 $ {{\Phi}}_{ \rm{mean}} $ 为训练集特征矩阵的均值[27], $ {\bf{1}}_{N} $ $ N $ 维全1列向量, $ {\Phi}_{0}^{ \rm{new}} $ 为中心化后的新样本特征向量, 新样本的Gram矩阵 $ {K}^{ \rm{new}} $ 中心化可按下式计算:

      $$ \begin{split} {K}_0^{ \rm{new}} =& {{\Phi }}_0^{ \rm{new}}{{{\Phi }}_0}^{ \rm{T}} = \\ &\left({K}^{ \rm{new}} - \frac{1}{n}{{\bf{1}}_N}{\bf{1}}_n^{ \rm{T}}{K}\right)\left({E}_n - \frac{1}{n}{{\bf{1}}_n}{\bf{1}}_n^{ \rm{T}}\right) \end{split} $$ (2)

      在高维特征空间, KPLS模型如下所示:

      $$ \left\{ {\begin{array}{*{20}{l}} {\Phi = \hat \Phi + {\Phi _r} = T{{\bar P}^{\rm{T}}} + {\Phi _r}}\\ {Y = \hat Y + {Y_r} = T{Q^{\rm{T}}} + {Y_r}} \end{array}} \right. $$ (3)

      引入核技术, 上述模型可变换成如下形式:

      $$ \left\{ {\begin{array}{*{20}{l}} {K = \hat K + {K_r} = T{P^{\rm{T}}} + {K_r}}\\ {Y = \hat Y + {Y_r} = T{Q^{\rm{T}}} + {Y_r}} \end{array}} \right. $$ (4)

      基于KPLS算法的统计量和SPE统计量计算公式如下所示:

      $$ \left\{ {\begin{array}{*{20}{l}} {{T^2} = {{t}}_{{\rm{new}}}^{\rm{T}}{\Lambda ^{ - 1}}{{{t}}_{{\rm{new}}}} < T_{{\rm{lim}}}^2 = \dfrac{{A({n^2} - 1)}}{{n(n - 1)}}{F_{A,n - A,\alpha }}}\\ {{\rm{SPE}} = {{\left\| {{\phi _r}({{{x}}_{{\rm{new}}}})} \right\|}^2} < {Q_{{\rm{lim}}}} = {g_1}\chi _{{h_1},\alpha }^2} \end{array}} \right.$$ (5)

      式中, $ A $ 为KPLS主元个数, 可由交叉验证方法得到, $ {{t}}_{ \rm{new}} $ 为新采样数据分向量, 计算公式为:

      $$ {{t}}_{ \rm{new}} = { R}^{\rm T}{\phi({{x}}_{ \rm{new}})} = ({ U}^{\rm T}{ K}{ T})^{-1}{ U}^{\rm T}{ K}^{ \rm{new}}\in{\bf R}^{A} $$ (6)

      式中, ${ R} \!\!=\!\! { \Phi}^{\rm T}{ U}({ T}^{\rm T}{ K}{ U})^{-1} ,{ T} \!\!=\!\! { \Phi}{ R} ,{\Lambda}^{-1} \!\!=\!\!(1/n-1){T}^{\rm T}{ T},$ ${ T}$ 为KPLS训练集得分矩阵,

      此外, 式(5)中, $ T_{ \rm{lim}}^{2} $ $ Q_{ \rm{lim}} $ 分别为 $ T^{2} $ 统计量和SPE统计量的控制限[23]; $ \alpha $ 为控制限置信水平, $ F_{A,n-A,\alpha} $ 为在置信区间为 $ (\alpha-1,1-\alpha) $ , 自由度为 $ A $ , $ n-A $ $ F $ 分布临界值[25]; $ g_{1}\cdot h_{1} = {\rm{mean}}(Q) $ 以及 $ 2g_{1}^2\cdot h_{1} = {\rm{var}}(Q) .$ 由于 $ {\phi_{r}({{x}}_{ \rm{new}})} $ 不能显式计算, 需要利用核技术计算Gram矩阵,

      则SPE统计量可按如下公式计算:

      $$ \begin{split} Q =& {\left\| {{{\overline { \phi} }_r}({{{x}}_{ \rm{new}}})} \right\|^2} = \\ &{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \overline k ({{{x}}_{ \rm{new}}},{{{x}}_{ \rm{new}}}) - 2{{{{t}}}_{ \rm{new}}}{{{T}}^T}{{{K}}^{ \rm{new}}}+\\ &{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {{{{t}}}_{ \rm{new}}}{{{T}}^T}{{KT}}{({{{{t}}}_{ \rm{new}}})^T} \end{split} $$ (7)

      式中 $ \bar{\phi}({{x}}_{ \rm{new}}) $ 为中心化后的 $ {\phi}({{x}}_{ \rm{new}}), \bar{k}({{x}}_{ \rm{new}},{{x}}_{ \rm{new}}) $ 为中心化后的 $ {k}({{x}}_{ \rm{new}},{{x}}_{ \rm{new}}), $

      $$ \begin{split} &\bar{k}({{x}}_{ \rm{new}},{{x}}_{ \rm{new}}) = \\ &\qquad({\phi}({{x}}_{ \rm{new}})-{{{\Phi}}_{ \rm{mean}}})({\phi}({{x}}_{ \rm{new}})-{{{\Phi}}_{ \rm{mean}}})^{\rm T} = \\ &\qquad1-\frac{2}{n} \sum\limits_{i = 1}^n{k}({{x}}_{ \rm{new}},{{x}}_{i})+\frac{1}{n^2}\sum\limits_{i = 1}^n\sum\limits_{j = 1}^n{k}({{x}}_{i},{{x}}_{j}) \end{split} $$ (8)

      式中, $ {{x}}_{i} , {{x}}_{j} $ 为训练集数据.

    • 燃料比异常时, 需要识别过程变量中造成燃料比异常的关键变量, 从而指导操作人员有针对性的调整高炉操作制度, 减少异常工况造成的损失. 基于KPLS的故障识别是非线性过程监测中的一个难题, 至今还没有一个确定的理论体系对非线性故障变量进行识别. 基于PLS的质量监测可以通过贡献图的方法对故障进行识别[30], 即对统计量或SPE统计量的贡献值较大的变量为故障变量. 而基于核函数的非线性过程监测通过非线性映射改变原始过程变量之间的相关关系, 在很多情况下很难找到特征空间到原始过程变量空间的逆映射函数[18, 31], 加大了非线性故障识别的难度. 针对这些问题, W. C. Sang等[28]提出基于KPCA(Kernel principal component analysis)误差重构的故障识别方法, 并在连续搅拌釜反应器进行仿真实验验证, 取得较好效果. 本文针对基于KPLS的非线性质量监测故障识别难题, 将鲁棒重构误差计算方法应用于基于KPLS的故障识别, 提出基于KPLS鲁棒重构误差的非线性系统故障识别方法, 具体如下:

    • 鲁棒重构误差估计方法是迭代去噪估计的扩展[32-33]. 基于KPLS的鲁棒重构误差方法首先建立过程的KPLS模型, 并在原始输入空间而不是特征空间重构输入变量, 输入变量的重构值为正常时刻的估计值. 设 $ { X} = {[{{{x}}_{1}},{{{x}}_{2}},\cdots,{{{x}}_{m}}]^{\rm T}} \in {{\bf{R}}^{m\times n}} $ 为过程变量训练集, $ { Y} = {[{{{y}}_{1}},{{{y}}_{2}},\cdots,{{{y}}_{p}}]^{\rm T}} \in {{\bf{R}}^{p\times n}} $ 为监测(质量)变量, $ m , p $ 分别为过程变量个数和质量变量个数. KPLS首先通过非线性函数将数据映射到特征空间 $ F:{{x}} \rightarrow \phi({{x}})\in{F}, $ 然后建立特征与质量变量的PLS监测模型. 定义特征空间数据矩阵为 ${ \Phi}({ X}) = $ ${ \Phi}^{\rm T}\!\! =\!\! {{[\phi({{x}}_{1}),\phi({{x}}_{2}),\cdots,\phi({{x}}_{n})]}}\!\!\in\!\!{\bf R}^{f\times n} ,$ $\sum_{i = 1}^n \phi({{x}}_{i}) \!=$ ${\bf 0},$ 则过程变量在特征空间的方差矩阵 $ C $ 以及Gram矩阵 $ K $ 可表示成:

      $$ \left\{ \begin{array}{l} {C} \!=\! \dfrac{1}{n}\displaystyle\sum\limits_{i = 1}^n {\phi ({x_i})} {(\phi ({x_i}))^{ \rm{T}}} \!=\! \frac{1}{n}\Phi ({{X}}){(\Phi ({{X}}))^{ \rm{T}}}\\ {K} \!=\! \dfrac{1}{n}\displaystyle\sum\limits_{i = 1}^n {{{(\phi ({x_i}))}^{ \rm{T}}}\phi ({x_i})} \!=\! \frac{1}{n}{(\Phi ({{X}}))^{ \rm{T}}}\Phi ({{X}}) \end{array} \right. $$ (9)

      式中, ${ K}_{i,j} \!\!=\!\! \langle\phi({{x}}_{i})\!\!\cdot\!\!\phi({{x}}_{j})\rangle \!\!=\!\! k({{x}}_{i},{{x}}_{j}) \!\!=\!\! \exp(-{\rm{norm}}({{x}}_{i}-$ ${{x}}_{j})^2/c).$ 对Gram矩阵进行特征分解得:

      $$ [{{p}}_{1}, {{p}}_{2},\cdots,{{p}}_{A}]{\rm{diag}}\{\lambda_{i}\}_{A\times A} = { K}[{{p}}_{1}, {{p}}_{2}\cdots, {{p}}_{A}] $$ (10)

      式中, $ { P} = [{{p}}_{1}, {{p}}_{2},\cdots, {{p}}_{A}]\in{\bf R}^{n\times A} $ $ K $ 的特征向量, $ \lambda_{i} $ 为对应特征值, $ A $ 为KPLS的主元个数, 对上式两边同时乘以 $ { \Phi}( X) $ 则有下式成立:

      $$ \begin{split} &{ \Phi}({ X})[{{p}}_{1},{{p}}_{2},\cdots,{{p}}_{A}]{\rm{diag}}\{\lambda_{i}\}_{A\times A} = \\ &\qquad{ \Phi}( X){ K}[{{p}}_{1},{{p}}_{2},\cdots,{{p}}_{A}] = \\ &\qquad\frac{1}{n}{ \Phi}( X)({ \Phi}(X))^{\rm T}{\Phi}( X)[{{p}}_{1},{{p}}_{2},\cdots, {{p}}_{A}] = \\ &\qquad{ C}{ \Phi}( X)[{{p}}_{1} ,{{p}}_{2},\cdots,{{p}}_{A}] \end{split} $$ (11)

      $ { V} = [{{v}}_{1}, {{v}}_{2},\cdots ,{{v}}_{A}]\in{\bf R}^{m\times A} $ 为过程变量的方差矩阵 $ { C} $ 的特征向量矩阵, 则下式成立:

      $$ { V} = { \Phi}( X){ P} $$ (12)

      设新观测到的过程数据为 $ {{{x}}_{ \rm{new}}}\in{\bf R}^{m} $ , 在高维特征空间的非线性映射值为 $ {\phi}({{x}}_{ \rm{new}}) $ , 则 $ {\phi}({{x}}_{ \rm{new}}) $ $ V $ 坐标系上的得分向量为:

      $$ \begin{split} {{h}} =& \phi {({{{x}}_{ \rm{new}}})^{\rm T}}{{V}} = \phi {({{{x}}_{ \rm{new}}})^{\rm T}}\Phi ({{X}}){{P}} = \\ &k({{{x}}_{ \rm{new}}} \cdot {{X}}){{P}} = {{{k}}_{ \rm{new}}}{{P}} \end{split} $$ (13)

      式中, $ { k}_{ \rm{new}} $ 为新观测的数据在高维特征空间的Gram矩阵.

      注1: 此处得分向量 $ {{h}} $ 与前文得分向量 $ {{t}} $ 不同, 得分向量 $ {{h}} $ 是由新观测数据的高维映射 $ {\phi}({{x}}_{ \rm{new}}) $ $ { V} $ 坐标系上投影得到, 表示投影关系; 得分向量 $ {{t}} $ 是由新观测数据的高维映射 $ {\phi}({{x}}_{ \rm{new}}) $ 根据KPLS模型求得的主元.

      由于 $ {\phi}({{x}}_{ \rm{new}}) $ 的估计值 $ \hat{\phi}({{x}}_{ \rm{new}}) = { V}{{h}}^{\rm T}, $ 设存在投影矩阵 $ { P}_{H} $ 使得 $ { P}_{H}{\phi}({{x}}_{ \rm{new}}) = \hat{\phi}({{x}}_{ \rm{new}}) = {V}{{h}}^{\rm T} $ 成立, 为了能够在原始数据空间识别故障变量, 需要在原始过程变量空间而不是在特征空间重构数据. 如存在向量 $ {{z}}\in{\bf R}_{m} $ 满足 $ {\phi}({{z}}) = { P}_{H}{\phi}({{x}}_{ \rm{new}}) ,$ 则可将 $ {{z}} $ 作为 $ {{x}}_{ \rm{new}} $ 的一组重构数据. 因此重构 $ {{x}}_{ \rm{new}} $ 可转化为求解如下优化问题:

      $$ \min{{{\rho}}}({{z}}) = \|{\phi}({{z}})-{P}_{H}{\phi}({{x}}_{ \rm{new}})\|^2 $$ (14)
      $$ \begin{split} {{{\rho}}}({{z}}) =& \|{\phi}({{z}})-{ P}_{H}{\phi}({{x}}_{ \rm{new}})\|^2 = \\ &-2({\phi}({{z}}))^{\rm T}{ P}_{H}{\phi}({{x}}_{ \rm{new}})+\Omega \end{split} $$ (15)

      式中, $ \Omega $ 为确定常数项, 又因为 ${ P}_{H}{\phi}({{x}}_{ \rm{new}}) = \hat{\phi}({{x}}_{ \rm{new}}) =$ ${ V}{{h}}^{\rm T},$ $ { V} = { \Phi}({ X}){ P} ,$ 则上述优化问题转化为:

      $$ \max({\phi}({{z}}))^{\rm T}{ \Phi}({ X}){ P}{{h}}^{\rm T} $$ (16)

      $$ \max k({{z}}\cdot{ X}){ P}{{h}}^{\rm T} $$ (17)

      应用梯度下降求解上述优化问题

      $$ \left\{ \begin{array}{l} {\nabla _z}\rho ({{z}}) = \sum\limits_{i = 1}^n {{\gamma _i}} k'({\left\| {{{z}} - {{{x}}_i}} \right\|^2})({{z}} - {{{x}}_i}) = 0\\ {\gamma _i} = \sum\limits_{k = 1}^A {{{{P}}_{i,k}}{{{h}}_k}} \end{array} \right. $$ (18)

      对于高斯核函数 $ k({{x}}\cdot{{y}}) = \exp(-\|{{x}}-{{y}}\|^2/c) $ , 所得最优解为

      $$ {{z}} = \frac{\sum\limits_{i = 1}^{n}\gamma_{i}\exp(-\|{{z}}-{{x}}_{i}\|^2/c){{x}}_{i}}{\sum\limits_{i = 1}^{n}\gamma_{i}\exp(-\|{{z}}-{{x}}_{i}\|^2/c)} $$ (19)

      为了简化计算, 采用迭代方式[32]求解 $ {{z}} $ :

      $$ {{z}}_{t} = \frac{\sum\limits_{i = 1}^{n}\gamma_{i}\exp(-\|{{z}}_{t-1}-{{x}}_{i}\|^2/c){{x}}_{i}}{\sum\limits_{i = 1}^{n}\gamma_{i}\exp(-\|{{z}}_{t-1}-{{x}}_{i}\|^2/c)} $$ (20)

      由于主元变量对过程变量中的异常值敏感, 会影响对过程数据重构值的精度, 针对此问题, 进一步采用Takahashi提出的改进鲁棒重构方法[33], 即在更新重构值的同时更新得分向量 $ {{h}} $ :

      $$ \left\{ \begin{array}{l} {{{h}}(t)} = \sum\limits_{i = 1}^n {{{P}}_i^Tk({{{z}}_t},{{{x}}_i})} \\ {\gamma _i} = \sum\limits_{k = 1}^A {{{{P}}_{i,k}}{{h}}{{(t)}_k}} \\ {{{z}}_t} = \left\{ \begin{array}{l} {{{x}}_{ \rm{new}}},{\rm{ }}t = 0\\ {{{z}}_{t - 1}},{\text{否则}} \end{array} \right. \end{array} \right. $$ (21)

      为了解决迭代不收敛问题, 设 $ x_{ \rm{new},i},i = 1,2,\cdots,m $ 为新观测数据的第 $ i $ 个变量, 定义数据的确定性指标为 $\beta_{i}\in{\bf R},i = 1,2,\cdots,m$ 以及数据确定性指标矩阵为 $ {{B}}(t) = {\rm{diag}}({\beta _1},{\beta _2}, \cdots ,{\beta _m}) \in {{\bf R}^{m \times m}} .$ 采用新观测数据和重构数据的差值来估计数据的确定性: 当差值较大时, 认为新观测数据是正常数据的可能性小, 因此减少此数据的确定性 $ {\beta _i} $ ; 当差值较小时, 认为新观测的数据是正常数据的可能性大, 并以此来修改第次迭代的观测数据重构值, 使原始观测数据在下一时刻重构值中占比较大, 从而减少迭代次数, 使迭代估计尽快收敛. 当 $ t>0 $ 时, 重构数据的迭代可由下式替代:

      $$ {\widetilde {{z}}_{t - 1}} = {{B}}(t){{{x}}_{ \rm{new}}} + ({{I}} - {{B}}(t)){{{z}}_{t - 1}} $$ (22)

      式中, $ {I} $ 是维数为 $ m \times m $ 的单位矩阵. 这里, 前述定义的数据确定性指标可按下式计算:

      $$ \left\{ \begin{array}{l} {\beta _i} = \exp ( - {({{{x}}_{ \rm{new},i}} - {{{z}}_i}(t - 1))^2}/2\sigma _i^2)\\ \sigma _i^2 = {(1.4826(1 + 5/(n - 1))E{\left\langle {\left| {{{{x}}_{ \rm{new},i}} - {{{x}}_{j,i}}} \right|} \right\rangle _d})^2} \end{array} \right. $$ (23)

      式中, $ E{\left\langle {\left| {{{{x}}_{ \rm{new},i}} - {{{x}}_{j,i}}} \right|} \right\rangle _d} $ 表示前 $ d $ 个新观测数据与训练数据差值最小值的均值, $i = 1,2, \cdots, m ,j =1,$ $2, \cdots ,n .$ 因此原始数据 $ t $ 次迭代重构值可按下式计算:

      $$ {{{z}}_t} = \frac{{\sum\limits_{i = 1}^n {{\gamma _i}} \exp ( - {{\left\| {{{\widetilde {{z}}}_{t - 1}} - {{{x}}_i}} \right\|}^2}/c){{{x}}_i}}}{{\sum\limits_{i = 1}^n {{\gamma _i}} \exp ( - {{\left\| {{{\widetilde {{z}}}_{t - 1}} - {{{x}}_i}} \right\|}^2}/c)}} $$ (24)

      最后, 所提基于KPLS鲁棒重构误差的故障识别算法实现步骤总结如下所示:

      step1: 给定重构数据的初值 $ {{z}}_{0} = {{x}}_{ \rm{new}} $ ;

      step2: 根据式(23)计算数据的确定性矩阵 $ \beta_i $ ;

      step3: 根据式(22)修改上次迭代重构值 $ \tilde{{{z}}} _{t-1} $ ;

      step4: 根据式(21)更新观测数据得分向量 $ {{h}} $ $ \gamma_i $ ;

      step5: 根据式(24)计算当次迭代重构值 $ {{z}}_t $ ;

      step6: 若 $ \|{{z}}_t-{{z}}_{t-1}\|<10^{-5} $ , 则输出新观测数据的重构值, 反之令 $ {{z}}_{t-1} = {{z}}_t $ , 返回Step2;

    • 利用KPLS鲁棒重构误差识别算法得出的变量正常估值与真值的误差, 同时考虑识别算法对不同变量估值精度来构造故障识别指标, 如下所示

      $$ {\xi _i} = \frac{{{{\left\| {{{{x}}_i} - {{\hat {{x}}}_i}} \right\|}^2} - \min \left( {{{\left\| {{{{X}}_i} - {{{{\hat X}}}_i}} \right\|}^2}} \right)}}{{\max \left( {{{\left\| {{{{X}}_i} - {{{{\hat X}}}_i}} \right\|}^2}} \right) - \min \left( {{{\left\| {{{{X}}_i} - {{{{\hat X}}}_i}} \right\|}^2}} \right)}} $$ (25)

      式中: $ {{{X}}_i} $ 表示第 $ i $ 个变量的所有采样数据, $ {{{\hat X}}_i} $ 为第 $ i $ 个变量的鲁棒重构估计值, $ {x_i} $ 为第 $ i $ 个变量新的采样值, $ {\hat x_i} $ 表示相应的重构估计值.

      由于不同变量的估计精度不一样, 因此为了统一误差贡献值, 需要对每个变量的故障指标值进行归一化处理. 当第 $ i $ 个变量发生故障时, 故障指标值会大幅度增加, 未发生故障的指标值不会增加太多. 从而只需比较所有变量的指标值的大小就可以识别出异常变量. 式(25)所示故障识别指标的本质是原始特征变量的重构误差, 与SPE统计量类似, 因此故障识别指标的控制上限可按下式计算:

      $$ \xi \le {\xi _{ \rm{lim} }} = {g_2}\chi _{{h_2},\alpha }^2 $$ (26)

      式中: $ {g_2} = s/2\mu ,{h_2} = 2{\mu ^2}/s, \mu $ $ \sum {_{i = 1}^m{\xi _i}} $ 的均值, $ s $ $ \sum {_{i = 1}^m{\xi _i}} $ 的方差, $ \alpha $ 为控制限的置信水平. 在实际工业过程中, 可以用训练数据集中所有变量的故障识别指标和均值加3倍方差的均值计算该控制限.

    • 为了验证所提方法, 首先进行数值仿真. 为此, 考虑文献[34]研究的非线性系统, 该系统包括18个输入变量 $ {{X}} = [{{{x}}_1},{{{x}}_2}, \cdots ,{{{x}}_m}] \in {{\bf R}^{n \times m}},m = 18 $ 和1个输出变量. 输入变量中, $ [{{{x}}_1},{{{x}}_2}, \cdots ,{{{x}}_{10}}]\sim $ $U( -1,1) , {{{x}}_1},{{{x}}_2},{{{x}}_3} $ 与输出变量呈非线性关系, $ {{{x}}_4},{{{x}}_5} $ 与输出变量呈线性关系, $ {{{x}}_6},{{{x}}_7},{{{x}}_8},{{{x}}_9},{{{x}}_{10}} $ 是独立于输出变量的噪声变量, 另外增加四个与 $ {{{x}}_1},{{{x}}_2},{{{x}}_3},{{{x}}_4} $ 呈线性关联的变量 $ {{{x}}_{11}},{{{x}}_{12}},{{{x}}_{13}},{{{x}}_{14}} $ , 两个呈现非线性关联的变量 $ {{{x}}_{15}},{{{x}}_{16}} $ , 以及与独立噪声变量呈非线性关系的变量 $ {{{x}}_{17}},{{{x}}_{18}} $ . 因此, 输入变量可分为两类, 一类是与输出变量相关的, 另一类是看作不同来源的噪声 $ {{e}} $ , 这里 $ {{e}}\sim N(0,0.1) $ . 综上该系统可用下式表示:

      $$ y = 10\exp ({{{x}}_1}{{{x}}_2}) + 20{{x}}_3^2 + 10{{{x}}_4} + 5{{{x}}_5} + {{e}} $$ (27)

      数值仿真时, 首先产生200组数据作为正常的训练样本, 之后产生400组数据作为测试样本, 在测试样本中前200组数据为正常样本, 从201个样本开始加入如下三类故障:

      1)故障1: 对变量3加入幅值为 $ 0.5(k - {\rm{200}}) $ 的漂移变化, 即 $ {{{x}}_3} = {{x}}_3^* + 0.5{{k}} ;$

      2)故障2: 对变量4加入幅值为5的阶跃扰动, 即 $ {{{x}}_4} = {{x}}_4^* + 5; $

      3)故障3: 对变量4和15分别加入幅值为8和5的阶跃扰动, 即 $ {{{x}}_4} = {{x}}_4^* + 8 $ $ {{{x}}_{15}} = {{x}}_{15}^* + 5 ,$ 对变量14和17分别加入幅值为0.1和0.05且故障时刻为200到300采样点的漂移变化, 即 ${{{x}}_{14}} = $ $ {{x}}_{14}^* + 0.1{{k}} $ $ {{{x}}_{17}} = {{x}}_{17}^* + 0.05{{k}}. $

      故障1和故障2用于验证故障识别方法对不同类型故障的识别能力, 故障3用于验证本文所提故障方法对多变量故障的识别能力.

      数据仿真时, 参数设置如下: 高斯核函数宽度设置为165, 交叉验证选取主元个数为5. $ {T^2} $ 统计量根据Mahalanobis距离定义, 能够对KPLS得分进行监测, SPE统计量由欧几里得距离定义, 对KPLS残差进行监控. 一般来说, 只有当 $ {T^2} $ 统计量和SPE统计量都处于控制限以下时表示过程正常运行, 当 $ {T^2} $ 统计量或SPE统计量至少有一个在控制限以上时表示过程发生异常. 针对上述3类故障, 所提方法KPLS监测效果如图246所示, 可以看出故障发生时所提方法能够及时有效地监测出上述3类故障. 图357显示了所提故障方法在两种故障指标下均能有效识别故障, 即系统运行正常时, 每个过程变量的故障指标均在控制限以下. 而当故障发生时, 所提方法能够快速显示故障源所在, 说明基于所提鲁棒重构误差的故障识别方法能够有效识别出系统中不同类型的故障以及多变量故障.

      图  2  故障1的KPLS监测图

      Figure 2.  KPLS monitoring chart for fault 1

      图  4  故障2的KPLS监测图

      Figure 4.  KPLS monitoring chart for fault 2

      图  6  故障3的KPLS监测图

      Figure 6.  KPLS monitoring chart for fault 3

      图  3  故障1的故障变量识别图

      Figure 3.  Fault variable identification map of fault 1

      图  5  故障2的故障变量识别图

      Figure 5.  Fault variable identification map of fault 2

      图  7  故障3的故障变量识别图

      Figure 7.  Fault variable identification map of fault 3

    • 选取柳钢有效容积为2 650 $ {\rm{m}}^3 $ 的2号高炉的实际工业运行数据对所提方法进行数据测试. 根据工艺机理, 确定影响燃料比的主要过程变量包括矿批、焦批、焦丁等高炉上部调剂变量, 冷/热风流量、富氧量、设定喷煤等高炉下部调剂变量, 另外还有顶压、压差、理论燃烧温度、炉腹煤气量等计算或测量变量. 由于过程变量为37个, 根据经验原则, 选取高斯核函数宽度为185, 通过交叉验证KPLS主元个数为8.

      图8为基于实际工业数据的高炉燃料比监测曲线, 图中可以看出 $ {T^2} $ 统计量监测曲线共出现5次报警, 其中第一次报警为鼓风湿度波动异常, 第二次报警与第四次报警均为休风检修, 第三次报警为休风下料, 第五次报警为管道行程异常工况. 高炉燃料比监测重要意义是用于及时发现和识别过程中引起燃料比异常波动的潜在故障源. 通常, 初步监测与识别的故障源不一定会影响高炉顺行和燃料比, 例如图8图9监测的第一次报警. 可以发现, 第一次报警出现时, 燃料比的休哈顿控制曲线仅仅在30和50时刻显示异常, 因而图8高炉燃料比监测报警实际上并未引起燃料比的异常波动. 详细原因还需做进一步的故障识别分析, 即下节内容.

      图  8  高炉燃料比监测曲线

      Figure 8.  Blast furnace fuel ratio monitoring curve

      图  9  高炉燃料比休哈顿图及残差图

      Figure 9.  Blast furnace fuel ratio Hughton diagram and residual map

      表 1  部分过程变量控制限与故障指标值的差值

      Table 1.  The value of the control limit is reduced to the value of the fault index for part process variables.

      过程变量 时间 $(1h)$
      $T$290 $T$291 $T$292 $T$293 $T$294 $T$295 $T$296 $T$297 $T$298 $T$299 $T$300
      焦炭负荷 0.618 0.692 0.692 0.692 0.095 -0.394 -0.306 -0.397 -18.397 -0.676 -5.217
      球团 0.847 0.847 0.847 0.880 -0.533 -0.577 -0.581 -0.245 -0.611 -1.366 -0.552
      烧结比 1.025 1.025 1.024 1.024 -1.464 -1.545 -1.557 -1.556 -1.599 -1.508 -1.504
      球团比 0.869 0.871 0.870 0.870 -0.730 -0.793 -0.798 -0.801 -0.837 -0.768 -0.758
      顶压风量比 0.372 -0.744 -0.744 -0.744 -1.818 -2.467 -1.816 -0.286 -0.722 -3.198 -0.731
      标准风速 0.027 -0.654 -0.502 -0.654 0.861 0.790 0.861 0.909 0.909 0.184 0.068
      鼓风动能 0.087 -0.569 0.156 -0.217 0.906 0.901 0.906 0.902 0.906 0.638 0.673
      炉腹煤气指数 0.080 -0.771 -0.309 -0.771 0.933 0.929 0.933 0.864 0.932 0.694 0.690
    • 图8图9所示高炉燃料比第一次异常报警时燃料比参数仍然在休哈顿控制图的正常范围内, 为此进一步利用KPLS鲁棒重构误差识别算法进行异常识别, 结果如图10所示. 图10上部是故障指标1识别结果而图10下部是故障指标分解图. 为了说明问题,图10下部分解图包含全部异常变量和部分正常变量, 并给出变量的分组. 可以看出, 所提识别算 法给出并给出变量的分组. 可以看出, 所提识别算法给出的异常变量为鼓风湿度. 通过查阅交班记录及相关数据可知,1-50采样时刻所对应的时间段, 炼铁现场大气湿度波动大即鼓风湿度异常, 因此所提方法能够正确识别故障源. 鼓风湿度的波动会影响风口理论燃烧温度, 即燃料燃烧的火焰温度. 通常, 鼓风湿度变化10 $ {\rm{g}}/{\rm{m}}^3 $ 时, 会引起风口理论燃烧温度 $ 60\sim70\;^{\circ}{\rm{C}} $ 的变化以及吨铁炉腹煤气量1%的变化, 从而影响炉缸热状态以及煤气初始分布. 由于水蒸气分解时需要消耗热量, 在相同情况下, 鼓风湿度的增加会显著增加燃料消耗. 因此, 根据图11所示高炉操作变量对高炉工况影响的传播作用流程, 在鼓风湿度异常时, 为了稳定炉况以及低燃料比运行, 应当适当调节风温、喷煤、富氧等参数. 另外, 从图10所示燃料比异常识别曲线可以看出, 理论燃烧温度、炉腹煤气量、炉腹煤气指数仍然处于正常范围内. 结合交班记录可知, 鼓风湿度异常时, 及时调节风温、富氧、喷煤等操作变量, 使得燃料比恢复正常. 这从图9燃料比的休哈顿和残差图也可看出燃料比未发生异常. 因此, 在炉况波动时, 由于操作人员的及时调整, 并未破坏高炉顺行, 因此说所提方法可以监测出正常工况下影响燃料比异常变化的潜在影响因素. 图8图9监测的管道行程异常工况会直接影响高炉燃料比指标. 通常, 管道发生时必须先稳定炉况, 并在炉况顺行的前提下, 通过燃料比监测结果来调控高炉以达到稳定燃料比的目的. 此外, 由于高炉燃料比与高炉透气性等相关运行性能指标以及风温、富氧等操作变量具有重要关系, 是高炉运行状况的一个量化描述, 能够表示高炉运行的健康状态, 因此高炉燃料比监测不仅能够监测燃料比, 也能间接的反映高炉的运行状况. 表2为部分高炉过程变量故障识别控制限减去故障识别值的差, 当差为负时表明过程变量为异常. 从表2和图12的故障识别数据与图可以看出: 在管道异常工况出现前, 高炉顶压风量比首先出现异常, 随后高炉透气性、鼓风动能、炉腹煤气量以及炉腹煤气指数都出现较大波动且部分时刻超出正常控制限, 之后高炉上下部调节参数中的块矿、烧结比、冷风流量、设定喷煤量也出现较大波动. 根据高炉交班记录可知, 由于顶压风量的设置不当, 高炉透气性、阻力系数等关键运行性能指标波动较大, 而之后的高炉上下部调节参数波动幅度较大, 使得高炉炉温波动异常, 进而使得高炉燃料比出现较大波动. 由此可知, 所提基于KPLS鲁棒重构误差的高炉燃料比监测不仅可以监测出正常工况下影响燃料比异常变化的潜在影响因素, 还可以监测出异常工况下影响燃料比异常变化的关键因素.

      图  10  鼓风湿度异常时高炉燃料比异常识别曲线

      Figure 10.  Blast furnace fuel ratio anomaly identification curve when blast humidity is abnormal

      图  11  高炉操作调节关联图

      Figure 11.  Association diagram of blast furnace operation adjustment

      图  12  管道行程异常工况时高炉燃料比异常识别曲线

      Figure 12.  Abnormal identification curve of blast furnace fuel ratio in abnormal pipeline condition

    • 为了解决先验故障知识少的高炉炼铁过程燃料比非线性监测与异常识别难题, 本文将鲁棒重构误差计算方法应用于基于KPLS的故障识别, 提出基于KPLS鲁棒重构误差的非线性系统故障识别方法. 该识别方法首先建立待监测变量与过程变量的KPLS模型, 然后利用从数据中提取负载向量并采用鲁棒去噪算法估计原始过程变量的正常值. 该算法不仅可以给出故障变量, 还可以估计出故障变量的正常值, 提高识别准确度. 当故障变量为操作变量时, 可以依照故障变量的估计值以及相应操作制度来进行故障(异常)修正和过程操作调整. 具有不同类型故障的数值仿真验证了所提算法的有效性. 最后, 基于实际工业数据的高炉燃料比监测与异常识别表明: 所提方法可以有效监测高炉燃料比参数, 并正确识别影响燃料比异常变化的关键因素, 是一种非常有效的非线性过程的在线监测与异常识别. 但是, 由于所提方法在判断异常时需要确定置信度, 该置信度目前只能凭经验来确定, 因而具有一定的主观性.

WeChat 关注分享

返回顶部

目录

    /

    返回文章
    返回