2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于混合型判别分析的工业过程监控及故障诊断

陈晓露 王瑞璇 王晶 周靖林

陈晓露, 王瑞璇, 王晶, 周靖林. 基于混合型判别分析的工业过程监控及故障诊断. 自动化学报, 2020, 46(8): 1600−1614 doi: 10.16383/j.aas.c180089
引用本文: 陈晓露, 王瑞璇, 王晶, 周靖林. 基于混合型判别分析的工业过程监控及故障诊断. 自动化学报, 2020, 46(8): 1600−1614 doi: 10.16383/j.aas.c180089
Chen Xiao-Lu, Wang Rui-Xuan, Wang Jing, Zhou Jing-Lin. Industrial process monitoring and fault diagnosis based on hybrid discriminant analysis. Acta Automatica Sinica, 2020, 46(8): 1600−1614 doi: 10.16383/j.aas.c180089
Citation: Chen Xiao-Lu, Wang Rui-Xuan, Wang Jing, Zhou Jing-Lin. Industrial process monitoring and fault diagnosis based on hybrid discriminant analysis. Acta Automatica Sinica, 2020, 46(8): 1600−1614 doi: 10.16383/j.aas.c180089

基于混合型判别分析的工业过程监控及故障诊断

doi: 10.16383/j.aas.c180089
基金项目: 

国家自然科学基金 61573050

国家自然科学基金 61473025

东北大学流程工业综合自动化国家重点实验室开放课题基金 PAL-N201702

详细信息
    作者简介:

    陈晓露  北京化工大学信息科学与技术学院控制科学与工程专业博士研究生.主要研究方向复杂工业过程的建模与故障诊断, 数据因果关系分析和智能学习算法. E-mail: 18810493810@163.com

    王瑞璇  北京化工大学信息科学与技术学院控制工程专业硕士研究生.主要研究方向为复杂工业过程的过程监控和故障诊断.E-mail: wangruixuan11@126.com

    周靖林  北京化工大学信息科学与技术学院教授. 1999年获得了大庆石油学院的工程学士学位, 2002年获得了长沙湖南大学硕士学位, 2005年获得了中国科学院自动化研究所博士学位.英国谢菲尔德大学自动控制与系统工程系的学者.主要研究内容为随机分布控制, 故障检测与诊断, 变结构控制及其应用. E-mail: jinglinzhou@mail.buct.edu.cn

    通讯作者:

    王晶  北京化工大学信息科学与技术学院教授. 1994年和1998年分别获得了东北大学自动化专业的学士学位和控制理论与控制工程专业博士学位. 2014年在美国特拉华大学担任访问教授.主要研究方向为非线性、多变量、受约束的工业过程的先进控制方法的应用, 复杂的工业过程的建模, 优化和控制, 化学反应器中聚合物微观质量的非线性模型控制, 过程监控和复杂工业过程的故障诊断.本文通信作者.E-mail: jwang@mail.buct.edu.cn

Industrial Process Monitoring and Fault Diagnosis Based on Hybrid Discriminant Analysis

Funds: 

National Natural Science Foundation of China 61573050

National Natural Science Foundation of China 61473025

The Open-project Grant Funded by the State Key Laboratory of Synthetical Automation for Process Industry at the Northeastern University PAL-N201702

More Information
    Author Bio:

    CHEN Xiao-Lu  Ph.D. candidate in control science and engineering at the College of Information Science and Technology, Beijing University of Chemical Technology. Her research interest covers the modeling and fault diagnosis of complex industrial processes, data causality analysis and intelligent learning algorithm

    WANG Rui-Xuan  Master student in control engineering at the College of Information Science and Technology, Beijing University of Chemical Technology. Her research interest covers the process monitoring and fault diagnosis of the complex industrial process

    ZHOU Jing-Lin  Professor at the College of Information Science and Technology, Beijing University of Chemical Technology. He received his bachelor, master and Ph.D. degrees from Daqing Petroleum Institute, Hunan University, and the Institute of Automation, Chinese Academy of Sciences, in 1999, 2002, and 2005, respectively. He was an academic visitor in the Department of Automatic Control and Systems Engineering, University of Sheffield, Sheffield, U.K. His research interest covers stochastic distribution control, fault detection and diagnosis, variable structure control and their applications

    Corresponding author: WANG Jing  Professor at the College of Information Science and Technology, Beijing University of Chemical Technology. She received bachelor degree in industry automation, the Ph.D. degree in control theory and control engineering from the Northeastern University, in 1994 and 1998, respectively. She was a visiting professor at the University of Delaware, USA in 2014. Her research interest covers orient, application of advanced control schemes to nonlinear, multivariable, constrained industrial processes, modeling, optimization and control for complex industrial process, nonlinear model-based control of polymer microscopic quality in chemical reactor, process monitoring and fault diagnosis for complex industrial process. Corresponding author of this paper
  • 摘要: 工业过程数据具有规模性大、复杂性高、变量多、关联性强等特点.如何从数据出发准确并快速地发现故障并处理, 保证过程高效运行意义重大.本文针对复杂的工业过程, 提出了一种多方法结合的混合型过程监控与故障诊断方法, 完成数据分类, 构建故障模型库, 故障在线诊断及可视化相关处理.首先通过常规主成分分析(Principal component analysis, PCA)方法对历史数据进行初筛, 区分出正常和故障信息, 然后利用聚类方法对故障数据集进行分类, 接着利用局部线性指数判别分析方法(Local linear exponential discriminant analysis, LLEDA)建立故障模型库进而进行故障诊断.本文将基于监督学习的LLEDA方法拓展到无监督学习, 便于复杂工业大量无标签数据的处理.最后利用典型的田纳西伊士曼(Tennessee Eastman, TE)过程对所提出的方法进行有效性验证.
    Recommended by Associate Editor MU Chao-Xu
  • 数据降维方法在众多领域应用广泛, 其划分依据也不尽相同, 按照数据结构特征保持与否的准则进行划分, 则可根据数据的全局结构保持和局部结构保持分成两类[1], 前者反映了数据的外部形状, 后者反映了数据的内在属性, 可以寻找出高维观测数据中所隐藏的低维流形结构.其中, 主成分分析(Principal component analysis,PCA)[2]、独立元分析[3]和人工神经网络[4]等方法均为数据全局特征结构保持的代表方法, 核主成分分析(Kernel principal component analysis, KPCA)[5]通过非线性映射函数将线性不可分的原始样本数据输入空间通过投影变换到线性可分的高维特征空间, 然后在新的特征空间中利用线性方法完成主成分分析, 从而实现数据整体方差最大化, 但KPCA方法只能够提取数据的全局结构信息, 若数据中低维局部结构中包含较多特征信息的话, 则效果较差.另外, 流形学习能够从高维历史信息中获取数据间有效的内部联系, 从而得以保持局部结构特征, 具有良好的非线性数据内部属性的处理能力[6-7], 代表性的流行学习[8]方法主要包括等距特征映射算法(Isometric feature mapping, ISOMAP)[9], 拉普拉斯特征映射算法(Laplacian eigenmaps, LE)[10], 局部线性嵌入算法(Locally linear embedding, LLE)[11], 局部保持投影算法(Locality preserving projections, LPP)[12]等, 其中, 有学者在LPP算法中引入核方法, 提出核局部保持投影(Kernel locality preserving projection, KLPP)[13], 其在保持局部结构特征的同时实现线性计算, 反映出数据的局部结构特征, 但本质上KLPP是一种基于局部结构保持的降维方法, 它并不能有效提取出数据的全局特征信息[14].

    针对以上问题, 本研究拟对KPCA与KLPP相结合的降维方法进行探讨, 提出了本文的解决办法, 并把新提出的算法命名为改进全局与局部结构保持算法(Global and local structure preserving, GLSP), 在进行原始数据的投影变换时, 既考虑全局结构得以保持, 也兼顾保持局部近邻结构.首先使用局部与全部特征提取方法, 解决数据有效降维的问题, 使用聚类分析中类内距离与类间距离等作为衡量指标, 并使用K近邻(K-nearest neighbor, KNN)方法进行故障的检测[15].本文数据使用柴油机仿真故障数据[16]和TE过程公共数据集, 用于验证方法的有效性.

    作为非线性特征提取的经典方法, KPCA通过非线性映射将线性不可分的原始数据从低维空间变换到一个线性可分的高维特征空间, 运用线性方法进行数据降维与特征提取, 其目标是使得数据方差最大化, 但数据方差指标主要用来描述数据集的全局结构信息.此外, KLPP是通过建立样本点之间的近邻关系来保持数据集的局部结构, 本质是保持原始数据局部结构和内部属性.综合考虑KPCA与KLPP两种投影保持方法的思想, 本文提出GLSP, 其目标函数可以理解为由全局目标函数和局部目标函数共同组成.

    KLPP通过非线性投影映射, 在投影空间建立近邻图, 最大限度地保持了数据集的近邻结构, 其局部结构保持目标函数定义如下[17]:假设数据集$ {\pmb X} = {\left[ {{{\pmb x}_1}, {{\pmb x}_2}, \cdots , {{\pmb x}_n}} \right]^{\rm T}} \in {\textbf{R}^{n \times m}} $, n为样本个数, m为数据维数, 通过非线性映射$ {\pmb \Phi} $将原始数据映射到高维空间中, 记为$ {\pmb \Phi} \left( {{\pmb x}_i} \right) $, $ {{\pmb J}_{\rm{local}}}\left( {\pmb w} \right) $的目标是在特征空间中找到投影向量$ {\pmb w} $, 使得投影$ {{\pmb y}_i} = {\pmb \Phi}^{\rm T} {\left( {{{\pmb x}_i}} \right)}{\pmb w} $在高维特征空间保持数据点之间的近邻关系, 可以认为, 如果$ {\pmb \Phi} \left( {{{\pmb x}_i}} \right) $和$ {\pmb \Phi} \left( {{{\pmb x}_j}} \right) $是近邻, 那么$ {{\pmb y}_i} = {\pmb \Phi}^{\rm T}{\left( {{{\pmb x}_i}} \right)}{\pmb w} $和$ {{\pmb y}_j} = {\pmb \Phi}^{\rm T} {\left( {{{\pmb x}_j}} \right)}{\pmb w} $也是近邻的.其局部结构保持的目标函数定义为:

    $$ \begin{align} &{{\pmb J}_{\rm{local}}}\left( {\pmb w} \right) = \mathop {\min }\limits_{\pmb w} \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^n {{{\left\| {{{\pmb y}_i} - {{\pmb y}_j}} \right\|}^2}{{\pmb s}_{ij}}} } = \\&\quad \mathop {\min }\limits_{\pmb w} \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^n {{{\left\| {{\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_i}} \right)}}{\pmb w} - {\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_j}} \right)}} {\pmb w}} \right\|}^2}{{\pmb s}_{ij}}} } = \\&\quad \mathop {\min }\limits_{\pmb w} \left\{ {{{\pmb w}^{\rm T}}{\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_i}} \right)}}\left( {{\pmb D} - {\pmb S}} \right){\pmb \Phi} \left( {{{\pmb x}_j}} \right){\pmb w}} \right\} \end{align} $$ (1)

    式中, $ {{\pmb s}_{ij}} $为权重参数, 表示数据点之间的近邻关系, $ {\pmb S} $为权重矩阵, $ {\pmb D} $为对角矩阵, $ {{\pmb D}_{ii}} = \sum_{j = 1}^n {{{\pmb s}_{ij}}} $, $ {{\pmb s}_{ij}} $取值一般为:

    $$ \begin{align*} {\pmb s}_{ij} = \begin{cases} \dfrac{{\exp \left( { - {{\left\| {{{\pmb x}_i} - {{\pmb x}_j}} \right\|}^2}} \right)}}{t}, &{{\pmb x}_i} \in \Omega _{{{\pmb x}_j}}^k, {{\pmb x}_j} \in \Omega _{{{\pmb x}_i}}^k\\ 0, &\mbox{其他} \end{cases} \end{align*} $$ (2)

    式中, $ \Omega _{{{\pmb x}_i}}^k $为$ {{\pmb x}_i} $的k邻域.

    引入核函数$ {{\pmb K}_{ij}} = {\pmb K}\left( {{{\pmb x}_i}, {{\pmb x}_j}} \right) = {\pmb \Phi}^{\rm T} {\left( {{{\pmb x}_i}} \right)}{\pmb \Phi} \left( {{{\pmb x}_j}} \right) $, 并存在系数$ {\pmb \alpha} = [{\alpha _1}, {\alpha _2}, \cdots , {\alpha _n}] $对特征空间中的样本线性表示为$ {\pmb w} = \sum_{i = 1}^n {{\alpha _i}{\pmb \Phi} \left( {{{\pmb x}_i}} \right)} $, 局部结构保持的目标函数转化为:

    $$ \begin{align} &{{\pmb J}_{\rm{local}}}\left( {\pmb \alpha} \right) = \mathop {\min }\limits_{\pmb \alpha} \Big\{ {{\pmb \alpha} ^{\rm T}}{\pmb \Phi} \left( {{{\pmb x}_i}} \right){\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_j}} \right)}}\\&\quad \left( {{\pmb D} - {\pmb S}} \right) {\pmb \Phi} \left( {{{\pmb x}_i}} \right)\boldsymbol {\Phi} ^{\rm T}{{\left( {{{\pmb x}_j}} \right)}}\boldsymbol {\alpha} \Big\} = \\&\quad \mathop {\min }\limits_{\pmb \alpha} \left\{ {{\boldsymbol {\alpha} ^{\rm T}}{\pmb \Phi} \left( {{{\pmb x}_i}} \right){\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_j}} \right)}}{\pmb L}{\pmb \Phi} \left( {{{\pmb x}_i}} \right){\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_j}} \right)}}{\pmb \alpha} } \right\} = \\&\quad \mathop {\min }\limits_{\pmb \alpha} {{\pmb \alpha} ^{\rm T}}{\pmb{ KLK}}{\pmb \alpha} = \mathop {\min }\limits_{\pmb \alpha} {{\pmb \alpha} ^{\rm T}}{\pmb L}'{\pmb \alpha} \end{align} $$ (3)

    式中, $ {\pmb L} = {\pmb D} - {\pmb S} $为Laplacian矩阵, $ {\pmb L}' = \pmb{ KLK} $.

    KLPP算法的目的是使数据在高维映射空间中, 仍能保持数据之间的近邻结构, 但是算法本身忽略了对数据集的整体结构特征描述.其本质是因为局部目标函数表达式中没有显式地考虑样本点的全局特征, 只是利用局部结构来代替全局信息, 导致了数据在低维映射中全局特征的扭曲显示.

    PCA算法常用于数据主要成分的分析与维度约简, 其本质是将线性数据变换为各个维度线性无关表示的几组数据, 便于对数据中主要特征分量的提取. KPCA算法由核映射将数据映射到高维核空间, 然后使用PCA方法, 与KLPP算法类似, 通过非线性映射$ {\pmb \Phi} $将原始数据$ {\pmb X} = {\left[ {{{\pmb x}_1}, {{\pmb x}_2}, \cdots , {{\pmb x}_n}} \right]^{\rm T}} \in {\textbf{R}^{n \times m}} $映射到高维空间, 记为$ {\pmb \Phi}( {\pmb x} _i ) $, 经过投影向量$ {\pmb w} $投影后的映射$ {{\pmb y} _i} = {\pmb \Phi}^{\rm T}{\left( {{{\pmb x}_i}} \right)}{\pmb w} $, 在投影方向上保证数据方差最大化, 这样可以充分利用高阶统计信息和全局特征结构保持.其全局结构目标函数定义为:

    $$ \begin{align} {{\pmb J} _{\rm{global}}}\left( {\pmb w} \right) = \, & \mathop {\max }\limits_{\pmb w} \sum\limits_{i = 1}^n {{{\pmb y}_i}^2} = \\& \mathop {\max }\limits_{\pmb w} \sum\limits_{i = 1}^n {{{\left( {{\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_i}} \right)}}{\pmb w}} \right)}^2}} \end{align} $$ (4)

    式中, $ {{\pmb w}^{\rm T}}{\pmb w} = 1 $.

    引入核函数$ {{\pmb K}_{ij}} = {\pmb K}\left( {{{\pmb x}_i}, {{\pmb x}_j}} \right) = {\pmb \Phi}^{\rm T} {\left( {{{\pmb x}_i}} \right)}{\pmb \Phi} \left( {{{\pmb x}_j}} \right) $, 可看出即使不确定核函数的具体表达形式, 但是其转化为映射后的数据的内积运算, 存在系数$ {\pmb \alpha} = [{\alpha _1}, {\alpha _2}, \cdots , {\alpha _n}] $对特征空间中的样本线性表示为$ {\pmb w} = \sum_{i = 1}^n {{\alpha _i}{\pmb \Phi} \left( {{{\pmb x}_i}} \right)} $, 全局结构保持的目标函数转化为:

    $$ \begin{align} {{\pmb J}_{\rm{global}}}\left( {\pmb \alpha} \right) = \, & \mathop {\max }\limits_{\pmb \alpha} \sum\limits_{i = 1}^n {{{\left( {{\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_i}} \right)}}\sum\limits_{j = 1}^n {{\alpha _j}{\pmb \Phi} \left( {{{\pmb x}_j}} \right)} } \right)}^2}} = \\& \mathop {\max }\limits_{\pmb \alpha} \sum\limits_{i = 1}^n {{{\left( {\sum\limits_{j = 1}^n {{{\pmb \alpha}_j} {\pmb \Phi}^{\rm T} {{\left( {{{\pmb x}_i}} \right)}} {\pmb \Phi} \left( {{{\pmb x}_j}} \right)} } \right)}^2}} = \\& \mathop {\max }\limits_{\pmb \alpha} {{\pmb \alpha} ^{\rm T}}\pmb{ KK}{\pmb \alpha} = \mathop {\max }\limits_{\pmb \alpha} {{\pmb \alpha}^{\rm T} }{\pmb C}{\pmb \alpha} \end{align} $$ (5)

    式中, $ {{\pmb \alpha} ^{\rm T}}{\pmb K}{\pmb \alpha} = 1 $, $ {\pmb C} = \pmb{ KK} $.

    因为KPCA是一种面向全局的变换方法, 由于其保持了原始数据的大部分方差信息, 所以实现了全局结构的特征提取.然而, 保持全局结构的目标函数中没有考虑各类数据点之间的内部联系, 在低维空间里, 数据点之间的局部几何关系与内在属性可能被忽视, 甚至导致重要信息的丢失.

    全局结构目标保持函数的思想是在最大程度保持全局信息方差不变的情况下, 提取出样本数据的非线性特征; 而局部结构保持目标函数的思想是在投影中保持样本对之间的远近亲疏关系, 在低维空间中最小化近邻样本间的距离加权平方和, 即尽量避免样本集的发散.

    结合全局结构保持目标函数和局部结构保持目标函数的意义, 构造一种新的结构保持目标函数, 使得映射后的特征空间能够保留全局结构的同时, 又可以保持数据间的局部近邻结构[18-19], 构造出如式(6)的最大值选择问题, 由于局部结构保持的目标函数为求取最小值, 所以式(6)中引入其相反数:

    $$ \begin{equation} {\pmb J}\left( {\pmb \alpha} \right) = \mathop {\max }\limits_{\pmb \alpha} \left\{ {{{\pmb J}_{\rm{global}}}\left( {\pmb \alpha} \right), - {{\pmb J}_{\rm{local}}}\left( {\pmb \alpha} \right)} \right\} \end{equation} $$ (6)

    由于式(6)只从两个目标函数中选择其一, 是一个典型的多目标求取最值问题, 由于未考虑两个目标函数的综合效果, 通常很难求解到全局最优解, 因此, 将式(6)中两个目标函数进行求和操作, 求和后的目标函数如式(7)所示:

    $$ \begin{align} {\pmb J}\left( {\pmb \alpha} \right) = \, &\mathop {\max }\limits_{\pmb \alpha} \left( {{{\pmb J}_{\rm{global}}} \left( {\pmb \alpha} \right) - {{\pmb J}_{\rm{local}}} \left( {\pmb \alpha} \right)} \right) = \\& \mathop {\max }\limits_{\pmb \alpha} \left( {{{\pmb \alpha} ^{\rm T}} {\pmb C}{\pmb \alpha} - {{\pmb \alpha} ^{\rm T}}{\pmb L}'{\pmb \alpha} } \right) = \\& \mathop {\max }\limits_{\pmb \alpha} \left( {{{\pmb \alpha} ^{\rm T}} \left( {{\pmb C} - {\pmb L}'} \right) {\pmb \alpha} } \right) \end{align} $$ (7)

    同理, 这两个目标函数很难同时达到最佳效果.考虑到两个目标函数之间的差异, 所以, 引入一个权重参数$ \beta $来平衡上述两个目标函数, $ \beta $是一个介于0和1之间的值, 其值的大小对于新的目标函数$ {\pmb J}\left( {\pmb \alpha} \right) $有很大影响, 因为它决定着两个原始目标函数的重要性问题[20].实际上$ \beta $可以看作是平衡两个目标函数的能量变化. $ \beta $越小越侧重于全局特征的提取, $ \beta $越大越侧重于局部特征的提取, $ \beta $值的选取按照如下准则:

    $$ \begin{equation} \beta {S_{\rm{global}}} = \left( {1 - \beta } \right){S_{\rm{local}}} \end{equation} $$ (8)

    其中, $ {S_{\rm{global}}} $和$ {S_{\rm{local}}} $分别表示$ {{\pmb J}_{\rm{global}}}\left( {\pmb w} \right) $和$ {{\pmb J}_{\rm{local}}}\left( {\pmb w} \right) $的规模大小, 受到参考文献[18, 21]启发, 定义为:

    $$ \begin{equation} {S_{\rm{global}}} = \rho \left( {\pmb C} \right) \end{equation} $$ (9)
    $$ \begin{equation} {S_{\rm{local}}} = \rho \left( {{\pmb L}'} \right) \end{equation} $$ (10)

    式中, $ \rho \left( \cdot \right) $是相关矩阵谱半径.结果表明, 该平衡参数的引入策略能够很好地平衡全局和局部的行为, GLSP的降维性能也可以得到保证.事实上, 权重参数也可以根据不同背景下原始数据的特性, 赋予不同定义, 而不仅限于本文所提方法, 这使得改进的结构保持算法更加灵活.结合式(8)~(10), 可得到权重参数$ \beta $的计算公式如下:

    $$ \begin{equation} {\beta _{\pmb C} } = \frac{{\rho \left( {\pmb C} \right)}}{{\rho \left( {\pmb C} \right) + \rho \left( {{\pmb L}'} \right)}}, \beta _{{\pmb L}'} = 1 - {\beta _{\pmb C}} \end{equation} $$ (11)

    因此, 改进的整体目标函数表示为:

    $$ \begin{align} {\pmb J}\left( {\pmb \alpha} \right) = \, &\mathop {\max } \limits_{\pmb \alpha} \left( {{{\beta _{\pmb C} }{\pmb J}_{\rm{global}}} \left( {\pmb \alpha} \right) - {{\beta _{{\pmb L}'} }{\pmb J}_{\rm{local}}} \left( {\pmb \alpha} \right)} \right) = \\& \mathop {\max }\limits_{\pmb \alpha} \left( {{{\pmb \alpha} ^{\rm T}} \left( {{\beta _{\pmb C} }{\pmb C} - \beta _{{\pmb L}'}{\pmb L}'} \right){\pmb \alpha} } \right) = \\& \mathop {\max }\limits_{\pmb \alpha} {{\pmb \alpha} ^{\rm T}}{\pmb M}{\pmb \alpha} \end{align} $$ (12)

    式中$ {\pmb M} = {\beta _{\pmb C}}{\pmb C} - \beta _{{\pmb L}'}{\pmb L}', 0 \le {\beta _{\pmb C}} \le 1, 0 \le \beta _{{\pmb L}'} \le 1 $.

    最后将上述目标函数的优化问题转化为求解特征向量问题.确定权重参数$ \beta $的值之后, 结合式(5)中的条件, 引入拉格朗日乘子法, 求解特征向量:

    $$ \begin{equation} {\pmb L} = {{\pmb \alpha} ^{\rm T}}{\pmb M}{\pmb \alpha} - \lambda \left( {{{\pmb \alpha} ^{\rm T}}{\pmb K}{\pmb \alpha} - 1} \right) \end{equation} $$ (13)

    当$ \frac{{\partial {\pmb L}}}{{\partial {\pmb \alpha} }} = 0 $, 可得:

    $$ \begin{equation} {\pmb M}{\pmb \alpha} = \lambda {\pmb K}{\pmb \alpha} \end{equation} $$ (14)

    非线性问题的求解过程中, 引入正则化方法, 我们用$ {\pmb K} + \eta {{\pmb I}_n} $来代替式(14)中的$ {\pmb K} $, 其中, $ \eta $是一个很小的正整数, $ {{\pmb I}_n} $是一个$ n \times n $的单位向量.

    与PCA类似, 本文使用累积方差贡献率准则选取满足贡献率达到要求的主成分个数, 依据式(15)选取前$ p $个特征值确定主成分个数, 本研究中贡献率选定为$ 85\, \% $.

    $$ \begin{equation} \frac{{\sum\limits_{k = 1}^p {{\lambda _k}} }}{{\sum\limits_{k = 1}^N {{\lambda _k}} }} > 85\, \% \end{equation} $$ (15)

    原始数据在降维时, 将面临难以全面提取有用信息的困难, 为解决这一问题, 本文提供一种结合全局与局部结构保持的数据降维思想, 实现方法为:采集原始数据, 建立能够从多角度反映数据信息的高维数据集, 并加以验证; 再将数据集输入所提全局与局部结构保持算法中进行降维处理:将低维特征子集输入KNN最近邻分类器, 计算KNN的识别率, 并将聚类分析中类间距与类内距的比值$ {{\pmb S}_B}/{{\pmb S}_W} $作为衡量降维效果指标[22].

    Fisher判别分析是模式识别方法中的一种数据降维与分类方法.其通过投影将测试数据映射到不同方向, 使得不同类别的测试样本的投影的类间离散度最大, 类内离散度最小[23].类内距$ {{\pmb S}_W} $描述同一类样本内部分布的紧密程度, 而类间距$ {{\pmb S}_B} $用反映不同类别之间的分离程度, 定义如下[15, 24]:

    $$ \begin{align} {{\pmb S}_B} = \, & \frac{1}{N}\sum\limits_{i = 1}^C {{N_i}\left( {{{\pmb m}_i} - {\pmb m}} \right){{\left( {{{\pmb m}_i} - {\pmb m}} \right)}^{\rm T}}} \end{align} $$ (16)
    $$ \begin{align} {{\pmb S}_W} = \, & \frac{1}{N}\sum\limits_{i = 1}^C \sum\limits_{j = 1}^{{N_i}} \left[ {{\pmb \Phi} \left( {{\pmb x}_i^j} \right) - {{\pmb m}_i}} \right]\times\\&{{\left[ {{\pmb \Phi} \left( {{\pmb x}_i^j} \right) - {{\pmb m}_i}} \right]}^{\rm T}} \end{align} $$ (17)

    其中, $ {{\pmb m}_i} $表示特征空间中第$ i $类采样均值, $ {\pmb m} $表示所有样本点在特征空间中的均值.显然, $ {{\pmb S}_B}/{{\pmb S}_W} $越大说明该方法的分类与聚类效果越好, 因此将该指标作为降维效果的综合衡量指标之一.

    KNN是对不同类别的数据信息根据训练样本特征进行分类的方法, 具有操作直观、效果稳定、时效性强等优点, 广泛应用到各类数据分类领域, 尤其是故障数据的诊断与分类中.原始数据进行降维操作, 其最终目的是实现不同故障类别的准确分类, 故KNN方法的识别率越高, 其反映出对数据的初始降维方法越好[25-26].

    总结局部与全局结构保持算法的流程图如图 1所示.

    图 1  数据降维方法流程
    Fig. 1  The dimension reduction process of data

    算法主要流程如下.

    步骤1.  对于数据集$ {\pmb X} = {\left[ {{{\pmb x}_1}, {{\pmb x}_2}, \cdots , {{\pmb x}_n}} \right]^{\rm T}} \in $ $ {\textbf{R}^{n \times m}} $, 构造局部结构保持函数$ {{\pmb J}_{\rm{local}}}\left( {\pmb \alpha} \right) $.

    步骤2.  构造全局方差最大目标函数$ {{\pmb J}_{\rm{global}}}\left( {\pmb \alpha} \right) $.

    步骤3.  构造整体目标函数$ {\pmb J}\left( {\pmb \alpha} \right) $.

    步骤4.  根据式(14)求解特征值$ {\lambda _1}, {\lambda _2}, \cdots , {\lambda _n} $与对应的特征向量$ {{\pmb A}} = \left[ {{\alpha _1}, {\alpha _2}, \cdots , {\alpha _n}} \right] $.

    步骤5.  根据式(15)求解前$ p $个特征值$ {\lambda _1} $, $ {\lambda _2} $, $ \cdots $, $ {\lambda _p} $与对应的特征向量$ {{\pmb A'}} = \left[ {{\alpha _1}, {\alpha _2}, \cdots , {\alpha _p}} \right] $.

    步骤6.  根据公式$ {\pmb T} = {{\pmb K}^{\rm T}}{{\pmb A'}} $, 获得样本集在低维正交特征子空间的投影.

    步骤7.  通过映射矩阵对训练及测试样本进行维数约简, 再将得到的低维特征子集输入到KNN, 并计算低维特征子集的$ {{\pmb S}_B} $, $ {{\pmb S}_W} $及$ {{\pmb S}_B}/{{\pmb S}_W} $指标.

    船舶柴油机广泛应用于实际航运工程中, 其安全稳定的运行状态对整个系统起着至关重要的影响.因此, 在船舶柴油机发生故障时, 如果能够准确将故障信号的有效特征提取并分析, 则可提供足够多有效信息, 便于故障的分类和诊断[27-28].

    1) 模型设计

    本文以MAN公司S35ME-B9型柴油机为主要研究对象, 利用专业模拟软件AVL Boost完成柴油机故障模型仿真模拟系统, 图 2为柴油机仿真模型.

    图 2  柴油机模型仿真
    Fig. 2  The diesel engine simulation

    图 2中, SB1、SB2、SB3为系统边界, 外界气体通过SB1进入系统, 系统工质通过SB3排出系统, MP1$ \sim $MP8为测点, MP1和MP2测量中冷器前后的气体压力、温度, MP3和MP4测量气体进入和流出进气管PL1的气体压力、温度, MP5和MP6测量进入和流出1号缸的气体压力、温度, MP7和MP8测量废气进入和流出涡轮增压的气体压力、温度, C1$ \sim $C6为气缸, 1$ \sim $29为管道连接, PL1为进气管, CO1为中冷器, TC1为涡轮增压器.

    本文对正常工况以及三种常见的船舶柴油机故障进行仿真模拟, 包括空冷器冷却不足, 排气口堵塞以及涡轮增压器效率降低, 如表 1所示, 由于本文采用的数值仿真模型, 因此采用设置关键参数的方式对故障进行模拟.在每种工况下, 记录模型中8个测量点的15个状态参数作为原始数据, 分别为功率(kW), 最大爆发压力(100 kPa), 压力机流量(kg/c), 压力机出口温度($ ^\circ $C), 压力机出口压力(100 kPa), 中冷器后温度($ ^\circ $C), 中冷器温差($ ^\circ $C), 中冷器后压力(100 kPa), 中冷器压差(100 kPa), 扫气温度($ ^\circ $C), 扫气压力(100 kPa), 排气管温度($ ^\circ $C), 排气管压力(100 kPa), 废气进涡轮机温度($ ^\circ $C), 涡轮增压出口温度($ ^\circ $C).

    表 1  正常工况与故障工况模拟
    Table 1  The simulation of normal and fault conditions
    No. 工况类型 样本个数 数据维数
    1 正常工况 960 15
    2 故障1_空冷器冷却不足 960 15
    3 故障2_排气口堵塞 960 15
    4 故障3_涡轮增压效率降低 960 15
    下载: 导出CSV 
    | 显示表格

    将故障数据集经本文所提降维方法进行处理, 选取KPCA、KLPP、核Fisher判别分析(Kernel fisher discriminant analysis, KFDA)[29]、局部和全局主成分分析(Local and global principal component analysis, LGPCA)[30]、全局–局部结构张量分析(Tensor global-local structure analysis, TGLSA)[20]和本文共6种算法进行对比, 在本研究中选取的目标维数为3维, 研究中采用了交叉验证方法选取最优高斯核参数, 实验从降维效果可视化、降维效果综合衡量指标和特征提取速度分析三方面验证方法的有效性.

    2) 模型验证

    使用AVL Boost进行柴油机工作状态仿真模型的建立, 选择台架实验的关键状态参数数据和AVL Boost对应状态参数进行对比验证.以柴油机功率、排气温度对柴油机模型正确性进行验证, 以排气阀堵塞和空冷器冷却不足等故障对柴油机模型进行故障模拟验证.

    表 2是使用三种不同的工作状态的特定工作参数平均值与台架实验中对应参数的比较, 可以发现台架实验数据与AVL Boost相差较小, 可以认为使用AVL Boost建立的柴油机模型与台架实验使用柴油机具有相同的工作参数.

    表 2  数据与台架实验数据多工况对比
    Table 2  The data contrast between AVL Boost and bench test under multiple working conditions
    负荷 排气温度(℃) 相对误差(%) 功率(kW) 相对误差(%)
    模型数据 台架实验数据 模型数据 台架实验数据
    90%负荷 329.89 328.50 0.42 3 281.40 3 277.00 0.13
    75%负荷 304.39 307.30 0.95 2 839.20 2 844.00 0.17
    75%推进 319.23 320.90 0.37 2 866.85 2 864.00 0.10
    下载: 导出CSV 
    | 显示表格

    排气口堵塞是采用逐渐减小单个气缸的排气口直径的方法进行仿真验证, 排气口堵塞会造成排气效率不佳, 气缸内废气无法及时排出, 会造成气缸内气体逐渐增加, 缸内压力逐渐增大, 引起扫气压力增大, 进气逐渐减少, 也就是压力机流量减小.排气口堵塞还会造成气缸内高速积碳, 引起后燃现象, 使得排气温度上升, 燃烧效率下降, 但由于上述故障因素只是增加在一个气缸中, 其余五个气缸的燃烧过程影响不大, 因此对柴油机的功率影响不大.使用AVL Boost仿真这种故障, 上述提到的理论上的参数变化均获得了较好的验证.

    空冷器冷却不足是使用逐渐增加冷却液温度, 逐渐降低空冷器冷却效率的方法仿真验证.这种故障最直观的反映就是空冷器前后温差降低, 另外由于空冷器冷却效率下降, 增压之后的气体无法较好地得到冷却, 扫气温度上升, 进入气缸内的气体质量会下降, 随之扫气压力上升, 流经压力机的空气流量会相应减小, 由于进入气缸的新鲜空气减少, 功率和最大爆发压力都会出现下降趋势, 同时由于进入气缸的空气温度上升, 排气温度也会上升.

    3) 降维效果可视化

    为验证本文降维方法的有效性, 将故障数据集经KPCA、KLPP、KFDA、LGPCA、TGLSA和本文所提降维方法进行处理, 选取前480个样本作为训练样本, 后480个样本作为测试样本.根据本文所提算法选取降维后的前三个主成分即可较为直观有效的表现降维效果, 图 3为根据贡献率原则, 选择不同降维维数与对应的主元贡献率, 由图中可知, 本文中选择主成分为前三维, 其贡献率之和即可达到总贡献率的85$ \% $, 因此仿真实验中的贡献率选择为85$ \% $即可.得到降维后的测试样本三维特征量分布见图 4~9.

    图 3  不同维度贡献率统计图
    Fig. 3  The contribution rate of different dimensions
    图 4  KPCA降维结果
    Fig. 4  The dimension reduction based on KPCA
    图 5  KLPP降维结果
    Fig. 5  The dimension reduction based on KLPP
    图 6  KFDA降维结果
    Fig. 6  The dimension reduction based on KFDA
    图 7  LGPCA降维结果
    Fig. 7  The dimension reduction based on LGPCA
    图 8  TGLSA降维结果
    Fig. 8  The dimension reduction based on TGLSA
    图 9  GLSP降维结果
    Fig. 9  The dimension reduction based on GLSP

    图 4可以看出, KPCA可以分辨正常工况与故障1, 但对于故障2和故障3有较严重的数据重叠现象.从图 5可以看出, KLPP对于4种工况均不能较为有效地进行区分.

    图 6~8分别为KFDA、LGPCA、TGLSA三种不同降维方法的对比实验效果图, KFDA效果较差, 样本数据大部分呈现混叠状态, LGPCA和TGLSA算法也综合保持了全局结构和局部结构, 因此其效果略好于KFDA、LGPCA和TGLSA三种算法, 但由于其主要应用于维数较低的数据, 因此对于船舶柴油机的高维复杂数据, 效果一般.

    本文所提降维方法效果图如图 9所示, 其中, 权重参数根据计算得到$ {\beta _{\pmb C}} = 0.79 $, $ {\beta _{{\pmb L}'}} = 0.21 $, 可见对于柴油机故障数据, KPCA方法所侧重的全局特征占主导地位.由于全局和局部结构特征提取过程的综合考虑, 在完成数据约简和可视化的同时, 有效地分离了四种状态, 同时具有良好的聚类能力.因此, 本文提出的方法能够提取故障特征, 解决了数据降维可视化问题.

    4) 降维效果综合衡量指标

    为直观有效地可视化各类方法的降维效果, 将类间距$ {{\pmb S}_B} $, 类内距$ {{\pmb S}_W} $及二者的比值$ {{\pmb S}_B}/{{\pmb S}_W} $作为衡量指标, 类间距$ {{\pmb S}_B} $及二者的比值$ {{\pmb S}_B}/{{\pmb S}_W} $越大, 表明分类效果明显, 得到的评价结果见图 10, 从图中可以看出, 六种方法中, 本文所提GLSP方法对应的类间距及二者的比值具有最大值.分析如下:

    图 10  六类算法降维效果衡量指标
    Fig. 10  The dimension reduction performance of 6 methods

    a) KPCA降维效果及识别率一般, 虽然可以去除特征空间中的数据冗余信息, 但并未达到能够有效表达最佳情况的条件; KLPP局部结构保持的方法的类间距明显提高, 该方法能有效提取出数据集中局部结构, 但对于综合全局与结构方法所得到的类间距与类内距的比值, 还有一定差距; KFDA方法具有较高类内距, 但是对于类内距没有很好的聚合效果; LGPCA和TGLSA两种方法均具有较好类内聚合作用, 但是由于不同类别的类间距离较小, 导致综合类间距与类内距比值较小.

    b) 本文所提方法的降维效果及识别率要高于其他对比方法, 该方法能够避免子空间重构, 更利于故障类别的划分, 且具有较强的全局与局部判别信息的挖掘能力.

    故障诊断的实质是模式识别, 考虑船舶柴油机故障诊断的实船应用性, 选择极限学习机(Extreme learning machine, ELM)、支持向量机(Support vector machine, SVM)、相关向量机(Relevance vector machine, RVM)、KNN四种基础有效的分类方法进行检验, 将低维样本分别应用于上述四种方法进行分类效果比较, 表 3~5给出了测试样本的故障诊断结果, 可知相较传统的分类方法, 对于仿真所得故障数据的诊断率均不高, 但是所提出的GLSP降维方法所获得的低维有效数据在大部分情况下获得最高的故障识别精度, 未获得最高识别精度情况下, 其精度与最高精度相差不大.

    表 3  故障1识别准确率($ \% $)
    Table 3  The accuracy of fault1 diagnosis ($ \% $)
    方法 Fault1
    KPCA KLPP KFDA LGPCA TGLSA GLSP
    ELM 55.32 61.38 60.58 54.21 58.69 62.97
    SVM 58.69 70.61 71.68 65.34 68.49 69.27
    RVM 72.77 69.59 74.21 68.98 63.40 76.35
    KNN 72.26 66.86 70.38 75.49 77.36 78.53
    下载: 导出CSV 
    | 显示表格
    表 4  故障2识别准确率($ \% $)
    Table 4  The accuracy of fault2 diagnosis ($ \% $)
    方法 Fault2
    KPCA KLPP KFDA LGPCA TGLSA GLSP
    ELM 80.95 76.85 79.65 77.49 70.28 82.62
    SVM 78.36 77.32 77.05 74.39 72.15 80.09
    RVM 79.74 74.16 78.66 85.68 81.29 83.62
    KNN 82.35 82.63 75.39 78.91 86.54 88.84
    下载: 导出CSV 
    | 显示表格
    表 5  故障3识别准确率($ \% $)
    Table 5  The accuracy of fault3 diagnosis ($ \% $)
    方法 Fault3
    KPCA KLPP KFDA LGPCA TGLSA GLSP
    ELM 70.65 72.39 77.16 74.29 70.53 79.26
    SVM 66.34 68.29 68.49 65.39 60.87 66.58
    RVM 59.38 62.58 55.21 59.86 60.13 66.34
    KNN 58.62 62.38 65.98 63.24 61.09 65.08
    下载: 导出CSV 
    | 显示表格

    5) 降维效果综合衡量指标

    时间性能比较是在实验室中台式机电脑上进行, 其配置为Intel Core i3 CPU 3.3GHz, RAM 4GB, Win7操作系统, 仿真软件为MATLAB 2010a, 计算结果如表 6所示.由表 6可知, 本文所提方法降维所需时间相对于其他方法有所增加, 但是都是在一个数量级, 且运行速度均在5s以内, 满足实际情况中对于实时的要求.

    表 6  特征提取所需时间(s)
    Table 6  Feature extraction time (s)
    维度 特征提取方法
    KPCA KLPP KFDA LGPCA TGLSA GLSP
    3 0.651 1.155 1.039 2.598 2.134 1.596
    5 0.795 1.159 1.118 2.019 1.495 1.632
    8 0.815 1.209 0.975 1.069 1.396 1.885
    10 0.867 1.344 1.185 1.563 2.098 1.962
    下载: 导出CSV 
    | 显示表格

    TE过程是一个公认的对比各种控制和监控方案的平台, 为验证本文所提方法的通用性, 将本文算法应用于故障检测与诊断领域被广泛使用的TE化工数据集上. TE过程是基于真实工业过程的仿真平台, 包含了一组正常状态和21组不同故障状态, 分别涵盖了12个操纵变量和41个测量变量, 每组状态包含480组训练数据和960组测试数据, 每一组故障从第160个数据点引入, 过程的详细描述、工艺流程图以及其故障形式的具体介绍见文献[31].

    从TE数据集中选取1组正常工况数据和3组故障数据(故障4、故障8和故障14), 使用本文所提GLSP算法得到降维后的前两维特征矢量, 对于TE数据, 前两维即可较好体现降维效果, 本文权重参数根据计算得到$ {\beta _{\pmb C}} = 0.64, {\beta _{{\pmb L}'}} = 0.36 $, 并将本文算法与KPCA、KLPP、KFDA、LGPCA和TGLSA五种降维方法进行比较, 如图 11图 16.

    图 11  KPCA算法降维效果
    Fig. 11  The dimension reduction performance of KPCA on TE data
    图 12  TE数据下KLPP算法降维效果
    Fig. 12  The dimension reduction performance of KLPP on TE data
    图 13  TE数据下KFDA算法降维效果
    Fig. 13  The dimension reduction performance of KLPP on TE data
    图 14  TE数据下LGPCA算法降维效果
    Fig. 14  The dimension reduction performance of LGPCA on TE data
    图 15  TE数据下TGLSA算法降维效果
    Fig. 15  The dimension reduction performance of TGLSA on TE data
    图 16  TE数据下GLSP算法降维效果
    Fig. 16  The dimension reduction performance of GLSP on TE data

    图 11图 12前两维降维效果可以看出, KPCA和KLPP对于4类数据分离效果较差, 特别是正常工况与故障4和故障14存在大量重合现象; 图 13图 14中KFDA和LGPCA方法对于正常工况和故障14难以有效区分; 图 15图 16的特征提取效果略好于前几种方法, 但TGLSA方法虽然能够较好地区分故障4和故障14, 但是正常工况和故障8仍有较大重叠, 而本文所提算法提取了更为丰富的全局与局部结构信息, 在完成数据降维可视化的同时能够将四类数据有效分离.

    本文通过融合全局特征提取KPCA与局部特征提取KLPP两种降维方法, 提出一种结合两种降维方法的数据维数约简方法GLSP, 增强了数据低维可视化效果, 同时提高了识别精度, 并将其应用于故障诊断中.所提方法将流形学习保持局部结构的思想融入核主成分分析的目标函数中, 使得到的特征空间不仅具有原始样本空间的整体结构, 还保持样本空间相似的局部近邻结构, 可以包含更丰富的特征信息.使用AVL Boost软件对船舶柴油机工作过程进行故障仿真, 提取正常工况与故障工况下的仿真数据, 并将AVL Boost软件仿真数据和TE化工公共故障数据应用到所提方法中, 实验结果证明, 本文所提GLSP算法具有较好的维度约简效果, 并具有较高分类精度的优势.


  • 本文责任编委 穆朝絮
  • 图  1  混合型故障检测和诊断方法

    Fig.  1  Hybrid fault detection and diagnostic framework

    图  2  混合型故障检测和诊断信息流程

    Fig.  2  The flow diagram of Hybrid fault detection and diagnostic information

    图  3  TE过程流程图

    Fig.  3  The flow diagram of TE process

    图  4  基于PCA的故障检测图

    Fig.  4  The fault detection diagram based on PCA

    图  5  层次聚类分析

    Fig.  5  Hierarchical cluster analysis

    图  6  故障数据的平行坐标可视化图

    Fig.  6  Parallel coordinate visualization of fault data

    图  7  LLEDA方法中邻近点个数对识别率的影响

    Fig.  7  The influence of the neighboring points's number on recognition rate in LLEDA method

    图  8  FDA、LLE + FDA和LLEDA方法下不同特征矢量对应的故障4, 8和13的识别率

    Fig.  8  Recognition rate of fault 4, 8 and 13 corresponding to different eigenvectors under the FDA, LLE + FDA and LLEDA methods

    图  9  在EDA和LLEDA方法下故障数据的投影

    Fig.  9  Projection of fault data under EDA and LLEDA methods

    图  10  LLEDA方法下故障4, 8和13的诊断结果

    Fig.  10  Diagnostic results of fault 4, 8 and 13 under the LLEDA method

    表  1  TE故障汇总

    Table  1  TE fault summary

    编号 描述 类型
    IDV (0) 正常操作 -
    IDV (1) A/C进料比率, B成分不变 阶跃
    IDV (2) B成分, A/C进料比不变 阶跃
    IDV (3) D的进口温度 阶跃
    IDV (4) 反应器冷却水的入口温度 阶跃
    IDV (5) 冷凝器冷却水的入口温度 阶跃
    IDV (6) A进料损失 阶跃
    IDV (7) C存在压力损失-可用性降低 阶跃
    IDV (8) A、B、C进料成分 随机变量
    IDV (9) D的进料温度 随机变量
    IDV (10) C的进料温度 随机变量
    IDV (11) 反应器冷却水的入口温度 随机变量
    IDV (12) 冷凝器冷却水的入口温度 随机变量
    IDV (13) 反应动态 慢漂移
    IDV (14) 反应器冷却水阀门 粘住
    IDV (15) 冷凝器冷却水阀门 粘住
    IDV (16) 未知 未知
    IDV (17) 未知 未知
    IDV (18) 未知 未知
    IDV (19) 未知 未知
    IDV (20) 未知 未知
    IDV (21) 阀固定在稳态位置 未知的恒定位置
    下载: 导出CSV

    表  2  基于PCA方法的故障识别率

    Table  2  Fault recognition rate based on PCA method

    故障识别率 故障1 故障2 故障3 故障4 故障5 故障6 故障7 故障8 故障9 故障10 故障11 故障12 故障13 故障14 故障15 故障16 故障17 故障18 故障19 故障20 故障21
    T2 0.5212 0.995 0.9825 0.0225 0.41 0.2625 0.99 1 0.975 0.0362 0.4163 0.9875 0.9513 0.9988 0.0488 0.2325 0.8013 0.8912 0.0675 0.3738 0.3775
    SPE 0.8163 0.9988 0.9925 0.2675 1 0.5025 1 1 0.9825 0.235 0.7638 0.99 0.9625 1 0.2625 0.6937 0.975 0.9375 0.5913 0.735 0.6687
    下载: 导出CSV

    表  3  不同方法下故障4, 8和13的识别率

    Table  3  Recognition rate of fault 4, 8 and 13 under different methods

    特征向量数 识别率 FDA LLE + EDA LLEDA
    2 Fault 8 0.525 0.675 0.85
    Fault 4 1 1 1
    Fault 13 0.2275 0.37 0.265
    3 Fault 8 0.525 0.67 0.955
    Fault 4 1 1 1
    Fault 13 0.215 0.375 0.125
    4 Fault 8 0.5475 0.66 0.945
    Fault 4 1 1 1
    Fault 13 0.225 0.365 0.4
    5 Fault 8 0.585 0.655 0.93
    Fault 4 1 1 1
    Fault 13 0.585 0.655 0.93
    6 Fault 8 0.5925 0.68 0.9025
    Fault 4 1 1 1
    Fault 13 0.2525 0.345 0.5725
    7 Fault 8 0.605 0.6475 0.8875
    Fault 4 1 1 1
    Fault 13 0.265 0.3925 0.6025
    8 Fault 8 0.615 0.6775 0.8775
    Fault 4 1 1 1
    Fault 13 0.2475 0.375 0.62
    9 Fault 8 0.6525 0.675 0.8925
    Fault 4 1 1 1
    Fault 13 0.2425 0.255 0.615
    10 Fault 8 0.6625 0.7175 0.9125
    Fault 4 1 1 1
    Fault 13 0.26 0.2325 0.7325
    下载: 导出CSV
  • [1] Ge Z Q, Song Z H, Gao F R. Review of recent research on data-based process monitoring. Industrial & Engineering Chemistry Research, 2013, 52(10): 3543-3562 http://cn.bing.com/academic/profile?id=4e283210b5bf9dbde9c5dbb2fd6682d6&encoded=0&v=paper_preview&mkt=zh-cn
    [2] Yin S, Ding S X, Xie X C, Luo H. A review on basic data-driven approaches for industrial process monitoring. IEEE Transactions on Industrial Electronics, 2014, 61(11): 6418-6428 doi: 10.1109/TIE.2014.2301773
    [3] Yin S, Gao H J, Kaynak O. Data-driven control and process monitoring for industrial applications-part Ⅰ. IEEE Transactions on Industrial Electronics, 2014, 61(11): 6356-6359 doi: 10.1109/TIE.2014.2312885
    [4] Yin S, Gao H J, Kaynak O. Data-driven control and process monitoring for industrial applications-Part Ⅱ. IEEE Transactions on Industrial Electronics, 2015, 62(1): 583-586
    [5] 文成林, 吕菲亚, 包哲静, 刘妹琴.基于数据驱动的微小故障诊断方法综述.自动化学报, 2016, 42(9): 1285-1299 doi: 10.16383/j.aas.2016.c160105

    Wen Cheng-Lin, Lv Fei-Ya, Bao Zhe-Jing, Liu Mei-Qin. A review of data driven-based incipient fault diagnosis. Acta Automatica Sinica, 2016, 42(9): 1285-1299 doi: 10.16383/j.aas.2016.c160105
    [6] Yin S, Li X W, Gao H J, Kaynak O. Data-based techniques focused on modern industry: an overview. IEEE Transactions on Industrial Electronics, 2015, 62(1): 657-667 http://cn.bing.com/academic/profile?id=8bda8b6d4f3f65fc737e0b39f6cf54e2&encoded=0&v=paper_preview&mkt=zh-cn
    [7] Jiang Y C, Yin S. Recursive total principle component regression based fault detection and its application to vehicular cyber-physical systems. IEEE Transactions on Industrial Informatics, 2018, 14(4): 1415-1423 doi: 10.1109/TII.2017.2752709
    [8] Zhang K, Peng K X, Shardt Y A W. A comparison of different statistics for detecting multiplicative faults in multivariate statistics-based fault detection approaches. IEEE Access, 2018, 6: 43808-43823 doi: 10.1109/ACCESS.2018.2862940
    [9] Qi X, Luo R Y. Sparse principal component analysis in hilbert space. Scandinavian Journal of Statistics, 2015, 42(1): 270-289 doi: 10.1111/sjos.12106
    [10] Le Thi H A, Phan D N. DC programming and DCA for sparse Fisher linear discriminant analysis. Neural Computing and Applications, 2017, 28(9): 2809-2822 doi: 10.1007/s00521-016-2216-9
    [11] Zheng J, Song Z. Semisupervised learning for probabilistic partial least aquares regression model and soft sensor application. Journal of Process Control, 2018, 64: 123-131 doi: 10.1016/j.jprocont.2018.01.008
    [12] Ge Z Q, Xie L, Kruger U, Song Z H. Local ICA for multivariate statistical fault diagnosis in systems with unknown signal and error distributions. AIChE Journal, 2012, 58(8): 2357-2372 doi: 10.1002/aic.12760
    [13] 曹玉苹, 黄琳哲, 田学民.一种基于DIOCVA的过程监控方法.自动化学报, 2015, 41(12): 2072-2080 doi: 10.16383/j.aas.2015.c150058

    Cao Yu-Ping, Huang Lin-Zhe, Tian Xue-Min. A process monitoring method using dynamic input-output canonical variate analysis. Acta Automatica Sinica, 2015, 41(12): 2072-2080 doi: 10.16383/j.aas.2015.c150058
    [14] Ming A B, Zhang W, Qin Z Y, Chu F L. Fault feature extraction and enhancement of rolling element bearing in varying speed condition. Mechanical Systems and Signal Processing, 2016, 76-77: 367-379 doi: 10.1016/j.ymssp.2016.02.021
    [15] Yu J. Nonlinear bioprocess monitoring using multiway kernel localized fisher discriminant analysis. Industrial & Engineering Chemistry Research, 2011, 50(6): 3390-3402 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=8da00c7b51a00f2a44fa5711f9bafe08
    [16] 王晶, 刘莉, 曹柳林, 靳其兵.基于核Fisher包络分析的间歇过程故障诊断.化工学报, 2014, 65(4): 1317-1326 doi: 10.3969/j.issn.0438-1157.2014.04.023

    Wang Jing, Liu Li, Cao Liu-Lin, Jin Qi-Bing. Fault diagnosis based on kernel Fisher envelope surface for batch processes. CIESC Journal, 2014, 65(4): 1317-1326 doi: 10.3969/j.issn.0438-1157.2014.04.023
    [17] Zhang J P, Li S Z, Wang J. Manifold learning and applications in recognition. Intelligent Multimedia Processing with Soft Computing. Berlin, Heidelberg: Springer, 2005. 281-300
    [18] Zhong B, Wang J, Zhou J L, Wu H Y, Jin Q B. Quality-related statistical process monitoring method based on global and local partial least-squares projection. Industrial & Engineering Chemistry Research, 2016, 55(6): 1609-1622 http://cn.bing.com/academic/profile?id=ca4efe313af1ff8f640505725bbaeabc&encoded=0&v=paper_preview&mkt=zh-cn
    [19] Luo L J. Process monitoring with global-local preserving projections. Industrial & Engineering Chemistry Research, 2014, 53(18): 7696-7705 http://cn.bing.com/academic/profile?id=a4d644efa75500fa9e28a52cbae466bf&encoded=0&v=paper_preview&mkt=zh-cn
    [20] 苏祖强, 汤宝平, 邓蕾, 尹爱军.有监督LLTSA特征约简旋转机械故障诊断.仪器仪表学报, 2014, 35(8): 1766-1771 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=yqyb201408012

    Su Zu-Qiang, Tang Bao-Ping, Deng Lei, Yin Ai-Jun. Rotating machinery fault diagnosis with supervised-linear local tangent space alignment for dimension reduction. Chinese Journal of Scientific Instrument, 2014, 35(8): 1766-1771 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=yqyb201408012
    [21] Wang J, Zhong B, Zhou J L. Quality-relevant fault monitoring based on locality-preserving partial least-squares statistical models. Industrial & Engineering Chemistry Research, 2017, 56(24): 7009-7020 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=e8e68686669984bd3be064894dda9d73
    [22] Liu Z, Wang L Y, Zhang Y, Chen C L P. A SVM controller for the stable walking of biped robots based on small sample sizes. Applied Soft Computing, 2016, 38: 738-753 doi: 10.1016/j.asoc.2015.10.029
    [23] 阚英男.基于网格近似法的数控机床贝叶斯可靠性评估研究[博士学位论文], 吉林大学, 中国, 2015

    Kan Ying-Nan. Research on Bayesian Reliability Assessment for NC Machine Tools based on Grid Approximation[Ph. D. Dissertation], Jilin University, China, 2015
    [24] 赵孝礼, 赵荣珍, 孙业北, 何敬举.基于正则化核最大边界投影维数约简的滚动轴承故障诊断.振动与冲击, 2017, 36(14): 104-110 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=zdycj201714017

    Zhao Xiao-Li, Zhao Rong-Zhen, Sun Ye-Bei, He Jing-Ju. Fault diagnosis of rolling bearings based on the dimension reduction using the regularized kernel maximum margin projection. Journal of Vibration and Shock, 2017, 36(14): 104-110 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=zdycj201714017
    [25] Adil M, Abid M, Khan A Q, Mustafa G, Ahmed N. Exponential discriminant analysis for fault diagnosis. Neurocomputing, 2016, 171: 1344-1353 doi: 10.1016/j.neucom.2015.07.099
    [26] Wang R X, Wang J, Zhou J L, Wu H Y. An improved kernel exponential discriminant analysis for fault identification of batch process. In: Proceedings of the 6th Data Driven Control and Learning Systems. Chongqing, China: IEEE, 2017. 16-21
    [27] Han J W, Kamber M, Pei J. Data Mining: Concepts and Techniques (Third Edition). San Francisco: Morgan Kaufmann, 2011. 1-18
    [28] Chapelle O. Training a support vector machine in the primal. Neural Computation, 2007, 19(5): 1155-1178 doi: 10.1162/neco.2007.19.5.1155
    [29] Boutros T, Liang M. Detection and diagnosis of bearing and cutting tool faults using hidden Markov models. Mechanical Systems and Signal Processing, 2011, 25(6): 2102-2124 doi: 10.1016/j.ymssp.2011.01.013
    [30] Du J, Wang S P, Zhang H Y. Layered clustering multi-fault diagnosis for hydraulic piston pump. Mechanical Systems and Signal Processing, 2013, 36(2): 487-504 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=bcf4dcb0467db1182112f614189b8570
    [31] Yiakopoulos C T, Gryllias K C, Antoniadis I A. Rolling element bearing fault detection in industrial environments based on a K-means clustering approach. Expert Systems with Applications, 2011, 38(3): 2888-2911 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=2f731db23bb777aaf856a77635f47169
    [32] Cheng G, Cheng Y L, Shen L H, Qiu J B, Zhang S. Gear fault identification based on Hilbert-Huang transform and SOM neural network. Measurement, 2013, 46(3): 1137-1146 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=0af6ae4339a6d5b13f4c46596315b72c
    [33] 熊浩, 张晓星, 廖瑞金, 常涛, 孙才新.基于动态聚类的电力变压器故障诊断.仪器仪表学报, 2007, 28(3): 456-459 doi: 10.3321/j.issn:0254-3087.2007.03.014

    Xiong Hao, Zhang Xiao-Xing, Liao Rui-Jin, Chang Tao, Sun Cai-Xin. Fault diagnosis of power transformer using dynamic clustering algorithm. Chinese Journal of Scientific Instrument, 2007, 28(3): 456-459 doi: 10.3321/j.issn:0254-3087.2007.03.014
    [34] 范志鹏.基于小波与聚类分析相结合的旋转机械的故障诊断[硕士学位论文], 江西理工大学, 中国, 2011

    Fang Zhi-Peng. Fault Diagnosis of Rotating Machinery Based on Wavelet and Clustering Analysis[Master Thesis], Jiangxi University of Science and Technology, China, 2011
    [35] 高宇.基于SOM神经网络的风电电子装置故障诊断.电力系统及其自动化学报, 2010, 22(3): 142-145 doi: 10.3969/j.issn.1003-8930.2010.03.026

    Gao Yu. Fault diagnosis of wind turbine power electronic devices based on SOM neural network. Proceedings of the CSU-EPSA, 2010, 22(3): 142-145 doi: 10.3969/j.issn.1003-8930.2010.03.026
    [36] Wang R X, Wang J, Zhou J L, Wu H Y. Fault diagnosis based on the integration of exponential discriminant analysis and local linear embedding. The Canadian Journal of Chemical Engineering, 2018, 96(2): 463-483 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=10.1002/cjce.22921
    [37] Hu Z F, Pan G, Wang Y M, Wu Z H. Sparse principal component analysis via rotation and truncation. IEEE Transactions on Neural Networks and Learning Systems, 2016, 27(4): 875-890 http://cn.bing.com/academic/profile?id=707be0cd4a6c10ba73e8c3866b2d0b3d&encoded=0&v=paper_preview&mkt=zh-cn
    [38] Saxena A, Prasad M, Gupta A, Bharill N, Patel O P, Tiwari A, et al. A review of clustering techniques and developments. Neurocomputing, 2017, 267: 664-681 doi: 10.1016/j.neucom.2017.06.053
    [39] Roweis S T, Saul L K. Nonlinear dimensionality reduction by locally linear embedding. Science, 2000, 290(5500): 2323-2326 doi: 10.1126/science.290.5500.2323
    [40] Zhao H, Liu J W, Dong W, Sun X Y, Ji Y D. An improved case-based reasoning method and its application on fault diagnosis of Tennessee Eastman process. Neurocomputing, 2017, 249: 266-276 doi: 10.1016/j.neucom.2017.04.022
    [41] Yin S, Zhu X P, Kaynak O. Improved PLS focused on key-performance-indicator-related fault diagnosis. IEEE Transactions on Industrial Electronics, 2015, 62(3): 1651-1658 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=f7d63a5b33852ea6ad7ed8c01346803e
    [42] 惠振东. TE化工过程优化控制仿真系统研究[硕士学位论文], 北方工业大学, 中国, 2017

    Hui Zhen-Dong. Research on Simulation System of TE Chemical Process Optimization Control[Master Thesis], North China University of Technology, China, 2017
    [43] Wang Y Q, Zhang J P, Zeng F M, Wang N, Chen X P, Zhang B, et al. "Learning" can improve the blood glucose control performance for type 1 diabetes mellitus. Diabetes Technology & Therapeutics, 2017, 19(1): 41-48 http://cn.bing.com/academic/profile?id=17740f9aa67710d280b753d8599d45e9&encoded=0&v=paper_preview&mkt=zh-cn
    [44] Zhao D, Shen D, Wang Y Q. Fault diagnosis and compensation for two-dimensional discrete time systems with sensor faults and time-varying delays. International Journal of Robust and Nonlinear Control, 2017, 27(16): 3296-3320 doi: 10.1002/rnc.3742
  • 加载中
  • 图(10) / 表(3)
    计量
    • 文章访问数:  1818
    • HTML全文浏览量:  275
    • PDF下载量:  342
    • 被引次数: 0
    出版历程
    • 收稿日期:  2018-02-06
    • 录用日期:  2018-10-26
    • 刊出日期:  2020-08-26

    目录

    /

    返回文章
    返回