Quality-related Variable Division and Fault Detection Based on Quality-related Virtual Variable
-
摘要: 质量相关故障检测作为数据驱动的多元统计过程监测的重要研究内容, 是保障复杂装备或工业过程安全高效运行的关键技术, 而确定或划分质量相关变量是该方法的核心环节. 现有质量相关故障检测方法通常高度依赖于质量变量, 一旦质量变量不可测, 其有效性便受到严重挑战. 为解决这一挑战, 提出基于质量关联虚拟变量(Quality-related virtual variable, QRV)的质量相关变量划分方法, 基于此建立一种独立成分分析(Independent component analysis, ICA)质量相关故障检测模型, 并开展故障检测应用研究. 首先, 构造一个QRV, 以间接反映系统的质量特性; 其次, 基于该QRV, 利用假设检验将过程变量划分为质量相关和质量无关变量组; 随后, 将该划分结果应用于基于ICA的质量相关故障检测, 利用指数加权移动平均(Exponentially weighted moving average, EWMA)修正统计量, 并构造综合检测指标; 最后, 通过数值仿真和田纳西−伊斯曼过程(Tennessee-Eastman process, TEP)实验验证了所提方法的可行性和有效性.Abstract: Quality-related fault detection, as an important research content in data-driven multivariate statistical process monitoring, is a key technology for ensuring the safe and efficient operation of complex equipments or industrial processes. Determining or dividing quality-related variables is a core aspect of this method. Existing quality-related fault detection methods typically rely heavily on quality variables, and their effectiveness is severely challenged when quality variables are unmeasurable. To address this challenge, a quality-related variable division method based on quality-related virtual variable (QRV) is proposed. An independent component analysis (ICA)-based model for quality-related fault detection is established using this division method, and an application study on fault detection is conducted. First, a QRV is constructed to indirectly reflect the quality characteristics of systems; Second, based on this QRV, process variables are divided into quality-related and quality-unrelated variable groups by hypothesis testing; Subsequently, this division results are applied to the ICA-based quality-related fault detection, utilizing exponentially weighted moving average (EWMA) to modify statistics and construct comprehensive detection indices; Finally, the feasibility and effectiveness of the proposed method are verified through numerical simulations and Tennessee-Eastman process (TEP) experiments.
-
故障检测与诊断是保障复杂装备、工业过程安全稳定运行及产品质量的重要技术支撑[1]. 相较于传统依赖机理模型或专家知识的方法, 数据驱动的多元统计故障检测方法因其独特的优势而日益受到工程界和学术界的广泛关注, 成为故障检测领域的研究热点[2]. 该方法仅需利用系统运行时的离线和在线观测数据, 借助较成熟的多元统计分析方法, 特别适用于过程变量繁多且高度相关的系统.
质量相关故障检测是基于多元统计过程故障诊断的重要研究内容, 而测量变量之间的相关性分析是该方法的关键环节. 一般而言, 测量变量可分为两类: 过程变量和质量变量. 过程变量是指在复杂装备运行或工业生产过程中可以直接观测的物理量、化学量或操作参数, 如电压、电流、流量等, 这些变量反映装备运行或生产过程的实时状态. 质量变量是指与装备性能或生产质量指标相关的变量, 如火箭飞行姿态角, 轧钢或造纸的厚度、硬度等, 这些质量变量是评估装备性能或产品质量的依据.
需要指出的是, 由于复杂装备或工业过程结构复杂, 各组成部分之间高度耦合. 这些系统涉及的过程变量繁多, 且变量之间存在相关性. 但并非所有过程变量都与系统关键性能或产品质量密切相关. 在众多过程变量中, 通常只有部分变量的变化真正影响产品质量, 我们将这些变量称为质量相关变量, 而其余变量则被称为质量无关变量. 在故障检测中, 如果对所有过程变量进行建模, 质量无关变量的波动可能会导致故障检测指标超出控制限, 从而触发报警. 但这类故障并不直接影响产品质量, 我们称这类故障为质量无关故障. 由质量无关故障触发的报警不仅浪费资源和时间, 还可能误导操作人员对实际工况的判断, 大大影响生产效益. 为实现对生产过程的精准控制与优化, 确保产品质量和生产效益, 故障检测方法必须能够有效区分质量相关故障和质量无关故障.
一般情况下, 质量相关故障检测方法可以归纳为两大类: 一类为空间分解法, 另一类为变量划分法. 空间分解法, 也称为后分解法, 其主要思路是首先对所有过程变量建立模型, 形成投影空间, 随后将该投影空间分解为质量相关子空间和质量无关子空间. 这一类的典型方法包括全潜结构投影(Total projection to latent structures, T-PLS)[3]和改进偏最小二乘(Modified partial least squares, MPLS)[4], 这两种方法都建立在偏最小二乘(Partial least squares, PLS)模型的基础上, 对投影空间进行深入的分解和细化; 随后, 这两种方法的大量变体被相继提出[5−8]. 空间分解法不仅适用于PLS模型, 也被广泛应用于其他统计分析模型中, 如主成分分析(Principal component analysis, PCA)[9]、典型相关分析(Canonical correlation analysis, CCA)[10−11]、独立成分分析(Independent component analysis, ICA)[12] 和慢特征分析(Slow feature analysis, SFA)[13] 等. 例如, Wang等[14] 利用核主成分分析提取核主成分, 随后基于该核主成分和质量变量建立CCA模型. Liu等[15] 采用核独立成分对过程变量提取独立成分, 进一步建立独立成分与质量变量之间的回归模型, 提出修正的核独立成分回归(Modified kernel independent component regression, MKICR)模型. Zhang等[16] 提出一种基于质量相关修正正则化的SFA分布式故障检测方法, 以处理大规模时序过程中的动态、连接关系及异常值问题.
变量划分法根据过程变量与质量变量的相关性强弱, 将过程变量分为质量相关组和质量无关组. 随后, 对这两组变量分别建模实现质量相关故障检测. 典型的划分方法包括互信息(Mutual information, MI)[17−18], 最小冗余最大相关 (Minimal redundancy maximal relevance, mRMR)[19], 传递熵(Transfer entropy, TE)[20−21], 投影变量重要性(Variable importance in the projection, VIP)[22−23] 等. 例如, Guo等[24] 结合先验知识和测量变量建立时空拓扑图, 并利用MI划分变量构建质量相关子空间, 进行质量相关故障检测. Zhu等[25] 利用MI选择质量相关变量, 随后根据操作单元将整个过程分解为多个块, 分别在每个块中采用改进的卷积神经网络建立特征提取模型. Yu等[20] 利用TE计算变量间的因果关系, 对质量相关变量提取卷积特征, 建立质量相关故障检测模型.
上述空间分解法和变量划分法的应用均存在一个前提条件: 质量变量必须可测, 因为它们依赖质量变量来分解质量相关子空间或划分质量相关变量. 然而, 在实际工业过程中, 由于生产环境恶劣或测量技术的局限性, 某些关键的质量变量, 例如脱丁烷塔塔底丁烷浓度, 可能难以甚至无法通过现有的测量仪器准确测量. 这一情况对传统的质量相关故障检测方法构成严峻的挑战. 针对这一挑战, 本文提出一种基于质量关联虚拟变量(Quality-related virtual variable, QRV)的质量相关变量划分方法, 建立一种基于QRV的ICA质量相关故障检测模型(QRV-based ICA, QRVICA). 值得注意的是, QRV的构造过程仅使用过程变量, 不依赖质量变量. 然而, 该QRV仍保持与质量变量较强的相关性, 并能够有效追踪质量变量的变化趋势. 因此, QRV可作为一种虚拟量间接反映系统的质量特性.
与现有质量相关故障检测方法相比, 本文的主要贡献可归纳为: 1) 针对工业过程中质量变量不可测的情况, 提出一种质量关联虚拟变量构造方法. 该虚拟变量可间接反映系统的质量特性, 为变量间的相关性分析提供一种新方案. 2) 基于所构造的QRV, 提出一种基于假设检验和滑动窗口的质量相关变量划分方法, 为后续故障检测奠定基础, 有效克服传统质量相关故障检测对质量变量的直接依赖. 3) 设计一套完整的故障检测策略, 通过指数加权移动平均(Exponentially weighted moving average, EWMA)将历史样本信息融入当前样本的检测指标构造中, 实现兼具最低误报率和最高检测率的质量相关故障检测.
1. 基于ICA的故障检测
本节简要介绍基于ICA的故障检测. 给定标准化训练数据矩阵$ X\in {{\bf{R}}^{n\times m}} $, 其中$ n $和$ m $分别表示样本数和变量数. ICA的核心思想是$ m $维的测量数据可以表示为$ d $维($ d\le m $) 独立成分的线性组合:
$$X = SA+E $$ (1) 式中, $ S = [{{\boldsymbol{s}}_{1}},\; \cdots\; ,\;{{\boldsymbol{s}}_{d}}] $为独立成分矩阵; $ A $和$ E $分别为混合矩阵和残差矩阵. ICA的关键是由已知数据矩阵$ X $估计混合矩阵$ A $和独立成分矩阵$ S $, 该问题可转化为寻求混解矩阵$ W $, 使得$ S = XW $中各独立分量彼此独立. 为消除变量间的相关性, 对矩阵$ X $进行白化. 首先对$ X $的协方差矩阵$ {{S}_{F}} $进行特征值分解:
$${{S}_{F}} = \frac{1}{{n}-1}{{X}^{\text{T}}}X = U{\Lambda}{{U}^{\text{T}}} $$ (2) 其中, $ {\Lambda } $和$ U $分别为特征值矩阵和特征向量矩阵. 经白化后的数据矩阵可表示为:
$$ Z = XR\approx SAR = SC $$ (3) 式中$ R = U{{\Lambda }^{-1/2}} $为白化矩阵; $ C = AR $为正交矩阵. 这样, 独立成分矩阵$ S $的估计可转化为:
$$ S = Z{{C}^{\text{T}}} = XR{{C}^{\text{T}}} $$ (4) 至此, 混解矩阵$ W $可表示为:
$$ W = R{{C}^{\text{T}}} $$ (5) 通常采用快速ICA (FastICA)求解上述混解矩阵, 以最大化负熵为准则函数, 负熵采用非二次函数$ G(\cdot) $近似, 则目标函数可表示为:
$$ \begin{split} &J({{\boldsymbol{c}}_{i}}) = \underset{{{\boldsymbol{c}}_{i}}\in C}{\mathop{\max }}\,\;{{\left[\text{ E}\big\{ G(Z{\boldsymbol{c}}_{i}^{\text{T}}) \right\}- \text{ E}\left\{G({\boldsymbol{v}}) \big\} \right]}^{2}} \\ &\text{s.t.}\quad\text{E}\big\{ {{\left( Z{\boldsymbol{c}}_{i}^{\text{T}} \right)}^{2}} \big\} = 1\; \end{split} $$ (6) 式中, $ \text{E}\{\cdot\} $代表期望; $ Z{\boldsymbol{c}}_{i}^{\text{T}} = {{\boldsymbol{s}}_{i}} $是第$ i $个独立成分; $ {\boldsymbol{v}} $表示零均值单位方差的高斯随机变量. 具体推导和求解过程可参考文献[26].
为监测系统运行状态, 通常采用$ {{I}^{2}} $统计量监测独立成分空间的变化, 用$ Q $统计量监测残差空间的变化. 对于样本$ {\boldsymbol{x}} $, 其统计量可计算如下:
$$ {{I}^{2}({\boldsymbol{x}})} = {{{\boldsymbol{s}}}}{\boldsymbol{s}}^{\text{T}} $$ (7) $$Q({\boldsymbol{x}}) = {{{\boldsymbol{e}}}}{\boldsymbol{e}}^{\text{T}}$$ (8) 式中, $ {\boldsymbol{s}} = {\boldsymbol{x}}W $为样本$ {\boldsymbol{x}} $的独立成分得分; $ {\boldsymbol{e}} = {\boldsymbol{x}}\;- {\boldsymbol{s}}A $为样本残差. 考虑到$ {\boldsymbol{s}} $和$ {\boldsymbol{e}} $可能无法满足高斯分布, 采用核密度估计(Kernel density estimation, KDE)计算其相应的控制限$ I_{\lim }^{2} $和$ {{Q}_{\lim }} $.
2. 质量相关变量划分方法
在复杂装备或工业过程中, 由于系统内部物料、能量及信息间的传递和反馈控制的存在, 质量相关变量之间形成错综复杂的相互作用和依赖关系[2]. 因此, 这些质量相关变量在系统运行过程中往往表现出协同变化的趋势, 而质量无关变量的变化趋势可能与质量相关变量缺乏明显的关联性. 当质量变量难以直接测量时, 是否存在一个虚拟变量 (我们称之为“质量关联虚拟变量”, QRV), 该变量能够与所有的质量相关变量均展现出明显的相关性, 而与那些质量无关变量则没有显著关联? 如果这样的QRV确实存在, 它便可作为表征系统质量特性的综合指标, 有效克服质量相关变量划分对质量变量的依赖. 这样, 通过评估各过程变量与QRV之间的相关性强度, 我们便可准确地划分质量相关变量. 按照上述思路, 本文所提基于QRV的质量相关变量划分方法的整体框架如图1所示.
2.1 质量关联虚拟变量的构造
给定复杂系统正常工况下的过程变量矩阵$ X\in {{\bf{R}}^{n\times m}} $如下:
$$ \begin{equation} \begin{aligned} X& = [{{\boldsymbol{x}}_{1}};\; \cdots\; ;\;{{\boldsymbol{x}}_{n}}] = [{{\boldsymbol{x}}^{1}},\; \cdots\; ,\;{{\boldsymbol{x}}^{m}}] \\ \end{aligned} \end{equation} $$ (9) 式中$ {{\boldsymbol{x}}_{i}} $表示$ i $时刻的采样样本; $ {{\boldsymbol{x}}^{j}} $表示第$ j $个过程变量的时序数据. 假设$ X $已经标准化 (即具有零均值单位方差). 构造质量关联虚拟变量$ {\boldsymbol{\alpha}} \in {{\bf{R}}^{n\times 1}} $, 目标函数为最大化其与所有过程变量的内积平方和:
$$ \begin{split} &\underset{{}}{\mathop{{\boldsymbol{\alpha}} = \arg \max }}\,\; \sum\limits_{j = 1}^{m}{{{\left( \frac{({{\boldsymbol{x}}^{j}})^{\text{T}}{{\boldsymbol{\alpha}}}}{n-1} \right)}^{2}}} \\ &\text{s.t.} \quad {{\boldsymbol{\alpha}}}^{\text{T}}{\boldsymbol{\alpha}} = n-1 \end{split} $$ (10) 利用拉格朗日乘子法, 上述目标函数可转化为:
$$L({{\boldsymbol{\alpha}} }) = \sum\limits_{j = 1}^{m}{{{\left( \frac{({{\boldsymbol{x}}^{j}})_{{}}^{\text{T}}{{\boldsymbol{\alpha}} }}{n-1} \right)}^{2}}}+\lambda (n-1-{{{\boldsymbol{\alpha}} }^{\text{T}}}{{\boldsymbol{\alpha}} })$$ (11) 式中, $ {\lambda} $为拉格朗日算子, 对$ L({{\boldsymbol{\alpha}} }) $求导可得:
$$ \begin{split} \frac{\partial L({\boldsymbol{\alpha}})}{\partial {{\boldsymbol{\alpha}}} } =\ & \frac{2}{{(n-1)}^{2}}{\sum\limits_{j = 1}^{m}({{\boldsymbol{x}}^{j}})_{{}}^{\text T}{{\boldsymbol{\alpha}}} {{\boldsymbol{x}}^{j}}}-2\lambda{{\boldsymbol{\alpha}}}=\\ & \frac{2\left[({{\boldsymbol{x}}^{1}})_{{}}^{\text T}{{\boldsymbol{\alpha}}}{{\boldsymbol{x}}^{1}}+\cdots +({{\boldsymbol{x}}^{m}})_{{}}^{\text T}{{\boldsymbol{\alpha}}}{{\boldsymbol{x}}^{m}} \right]}{{{(n-1)}^{2}}}-2\lambda{{\boldsymbol{\alpha}}} \end{split} $$ (12) 令$ \frac{\partial L({{\boldsymbol{\alpha}} })}{\partial {{\boldsymbol{\alpha}}}} = 0 $, 对式(12)进行化简, 式(10)优化问题可转化为如下特征值分解问题:
$$ \frac{X{{X}^{\text{T}}}{{\boldsymbol{\alpha}} }}{{{(n-1)}^{2}}} = \lambda {{\boldsymbol{\alpha}} } $$ (13) 选择最大特征值对应的特征向量$ {\boldsymbol{\alpha}} $作为QRV.
2.2 质量相关变量的划分
基于所构造QRV, 将那些与QRV相关度高的过程变量确定为质量相关变量, 而将与QRV相关度低的过程变量确定为质量无关变量. 为综合考虑变量对之间的局部相关性, 采用窗口宽度为$ M $的滑窗将时序数据截取为$ n-M+1 $个子块, 如图2所示, 图中第$ i $个子块记作:
$$ \begin{split} {{\overset{ \frown}{X}}}_{i} =\ & [{{\boldsymbol{x}}}_{i};\;{{\boldsymbol{x}}}_{i+1};\; \cdots\; ;\;{{\boldsymbol{x}}}_{i+M-1}] =\\ & [{{\overset{ \frown}{\boldsymbol{x}}}}_{i}^{1},\;{{\overset{ \frown}{\boldsymbol{x}}}}_{i}^{2},\; \cdots\; ,\;{{\overset{ \frown}{\boldsymbol{x}}}}_{i}^{m}] \end{split} $$ (14) 同理, QRV的第$ i $个子块记作:
$$ {{{\overset{ \frown}{{\boldsymbol{\alpha}} }}}_{i}} = [{{\alpha }_{i}},\;{{\alpha }_{i+1}},\; \cdots\; ,\;{{\alpha }_{{i+M-1}}}]^{\text{T}} $$ (15) 由$ {{\overset{ \frown}{X}}_{i}} $和$ {{{\overset{ \frown}{{\boldsymbol{\alpha}} }}}_{i}}\; (i\in [1,\;n-M+1]) $ 组成子块对, 在每个子块对中计算各过程变量与QRV的相关度, 最后利用假设检验确定过程变量是否为质量相关变量. 在第$ i $个子块对$ {{\overset{ \frown}{X}}_{i}} $和$ {{{\overset{ \frown}{{\boldsymbol{\alpha}} }}}_{i}}\; (i\in [1,\;n- M+1]) $中, 第$ j $ 个变量$ {\overset{ \frown}{\boldsymbol{x}}}_{i}^{j} $与$ {{{\overset{ \frown}{{\boldsymbol{\alpha}} }}}_{i}} $的相关系数为:
$$ {r}_{i}^{j} = \frac{\sum\limits_{{k} = 1}^{M}{\left({\overset{ \frown}{x}}_{i,\;k}^{j}-{\bar{x}}_{i}^{j} \right)\left( {{{{\overset{ \frown}{\alpha }}}}_{i,\;k}}-{{{{\bar{\alpha }}}}_{i}} \right)}}{\sqrt{\sum\limits_{{k} = 1}^{M}{{{\left({\overset{ \frown}{x}}_{i,\;k}^{j}-{\bar{x}}_{i}^{j} \right)}^{2}}}}\sqrt{\sum\limits_{{k} = 1}^{M}{{{\left( {{{{\overset{ \frown}{\alpha }}}}_{i,\;k}}-{{{{\bar{\alpha }}}}_{i}} \right)}^{2}}}}} $$ (16) 式中, $ {\overset{ \frown}{x}}_{i,\;k}^{j} $表示向量$ {{\overset{ \frown}{\boldsymbol{x}}}_{i}^{j}} $的第$ k $个元素; $ {\bar{x}}_{i}^{j} $表示向量$ {{\overset{ \frown}{\boldsymbol{x}}}_{i}^{j}} $的均值; $ \overset{ \frown}{\alpha }_{i,\;k} $表示向量 $ {{{\overset{ \frown}{{\boldsymbol{\alpha}} }}}_{i}} $的第$ k $个元素; $ \bar{\alpha }_{i} $表示向量$ {{{\overset{ \frown}{{\boldsymbol{\alpha}} }}}_{i}} $的均值. 构造$ t $统计量:
$$ t_{i}^{j} = {r}_{i}^{j}\sqrt{\frac{M-2}{1-{{({r}_{i}^{j})}^{2}}}} $$ (17) 取原假设和备择假设分别为:
$$ \begin{cases} & {{\text{H}}_0}:{r}_{i}^{j} = 0,\;{\text{ 即两变量相关度为0}}\\ & {{\text{H}}_{1}}:{r}_{i}^{j}\ne 0,\;{\text{ 即两变量相关度不为0}} \end{cases} $$ (18) 采用双尾检验计算$ {r}_{i}^{j} $对应的$ p $值, 记作$ {p}_{i}^{j} $. 分别计算$ n-M+1 $个子块的$ p $值并组成检验矩阵:
$$ P = \begin{bmatrix} p_{1}^{1} & \ldots & p_{1}^{m} \\ p_{2}^{1} & \ldots & p_{2}^{m} \\ \vdots & \ddots & \vdots \\ p_{n-M+1}^{1} & \ldots & p_{n-M+1}^{m} \end{bmatrix} \in {{\bf{R}}^{(n-M+1)\times m}} $$ (19) 对矩阵$ P $按列求均值$ \bar{\boldsymbol{P}} = [{\bar{p}}_{{}}^{1},\;\cdots,\;{\bar{p}}_{{}}^{m}] $, 根据上述假设, 取显著性水平为0.05. 如果$ {\bar{p}}_{{}}^{j}<0.05 $, 则原假设$ {{\text {H}}_{0}} $不成立, 即过程变量$ {{\boldsymbol{x}}^{j}} $为质量相关变量, 否则为质量无关变量.
至此, 过程变量$ X $可被划分为质量相关变量组$ {{X}_{r}} $和质量无关变量组$ {{X}_{u}} $.
3. 基于QRV的质量相关故障检测
本节在前述变量划分结果的基础上, 详述基于ICA的故障检测指标构建和故障检测策略.
按照式(1) ~ (6), 分别对质量相关变量组$ {{X}_{r}} $和质量无关变量组$ {{X}_{u}} $建立ICA模型:
$$ \begin{cases} X_{r} = S_{r}A_r + E_{r} \\ X_{u} = S_{u} A_{u}+ E_{u} \end{cases} $$ (20) $$ \begin{cases} S_{r} = X_{r} W_{r} \\ S_{u} = X_{u} W_{u} \end{cases} $$ (21) 式中, $ {{A}_{r}} $和$ {{A}_{u}} $为混合矩阵; $ {{W}_{r}} $和$ {{W}_{u}} $为混解矩阵; $ {{S}_{r}} $和$ {{S}_{u}} $为独立成分; $ {{E}_{r}} $和$ {{E}_{u}} $则表示残差; 下标 $ {r} $和$ {u} $分别表示质量相关空间和质量无关空间.
3.1 综合检测指标的构建
对于$ t $时刻样本$ {{\boldsymbol{x}}_{t}} $, 由质量相关变量和质量无关变量组成的向量分别记作$ {{\boldsymbol{x}}_{t,\;r}} $和$ {{\boldsymbol{x}}_{t,\;u}} $. 则样本$ {{\boldsymbol{x}}_{t}} $的质量相关统计量按照式(7)和(8)可表示为:
$$ I_{r}^{2}({{\boldsymbol{x}}_{t}}) = {\boldsymbol{s}}{{_{t,\;r}^{{}}}}{\boldsymbol{s}}_{t,\;r}^{\text{T}} $$ (22) $$ {{Q}_{r}}({{\boldsymbol{x}}_{t}}) = {{\boldsymbol{e}}_{t,\;r}}{\boldsymbol{e}}_{t,\;r}^{\text{T}} $$ (23) 式中$ {\boldsymbol{s}}_{t,\;r}^{{}} = {{\boldsymbol{x}}_{t,\;r}}{{W}_r} $和$ {{\boldsymbol{e}}_{t,\;r}} = {{\boldsymbol{x}}_{t,\;r}}-{\boldsymbol{s}}_{t,\;r}^{{}}{{A}_r} $分别表示$ {{\boldsymbol{x}}_{t}} $在质量相关空间的独立成分和残差. 同理可求得$ {{\boldsymbol{x}}_{t}} $的质量无关统计量 $ I_u^{2}({{\boldsymbol{x}}_{t}}) $ 和$ {{Q}_u}({{\boldsymbol{x}}_{t}}) $. 采用KDE分别求得$ I_r^{2}({{\boldsymbol{x}}_{t}}) $, $ {{Q}_r}({{\boldsymbol{x}}_{t}}) $, $ I_u^{2}({{\boldsymbol{x}}_{t}}) $和$ {{Q}_{u}}({{\boldsymbol{x}}_{t}}) $的控制限, 记作$ I_{{\text{r}}\_\text{lim}}^{2} $, $ Q_{{\text{r}}\_\text{lim}}^{{}} $, $ I_{{\text{u}}\_\text{lim}}^{2} $和$ Q_{{\text{u}}\_\text{lim}}^{{}} $.
复杂系统运行中, 由于环境变化、电磁干扰, 测量变量会发生波动. 为克服这种波动给检测结果带来的负面影响, 本文采用EWMA对统计量进行修正:
$$ \begin{cases} \overset{ \frown}{I_r^{2}}({{\boldsymbol{x}}_{t}}) = \gamma I_r^{2}({{\boldsymbol{x}}_{t}})+\; (1- \gamma)\overset{ \frown}{I_r^{2}}({{\boldsymbol{x}}_{t-1}}) \\ \overset{ \frown}{Q}_r({{\boldsymbol{x}}_{t}}) = \gamma Q_r^{{}}({{\boldsymbol{x}}_{t}})+\; (1- \gamma )\overset{ \frown}{Q}_r({{\boldsymbol{x}}_{t-1}}) \end{cases} $$ (24) $$ \begin{cases} \overset{ \frown}{I_u^{2}}({{\boldsymbol{x}}_{t}}) = \gamma I_u^{2}({{\boldsymbol{x}}_{t}})+(1- \gamma )\overset{ \frown}{I_u^{2}}({{\boldsymbol{x}}_{t-1}})\\ \overset{ \frown}{Q}_u({{\boldsymbol{x}}_{t}}) = \gamma Q_u^{{}}({{\boldsymbol{x}}_{t}})+(1 - \gamma )\overset{ \frown}{Q}_u({{\boldsymbol{x}}_{t-1}}) \end{cases} $$ (25) 式中, $ \gamma \in [0,\;1] $为遗忘因子, 其值越小表示记忆深度越深. 初值$ \overset{ \frown}{I_r^{2}}({{\boldsymbol{x}}_{0}}) 、$$ \overset{ \frown}{Q}_r({{\boldsymbol{x}}_{0}})、 $$ \overset{ \frown}{I_u^{2}}({{\boldsymbol{x}}_{0}}) $和$ \overset{ \frown}{Q}_u({{\boldsymbol{x}}_{0}}) $用全部训练样本统计量的均值代替.
为简化诊断逻辑, 用统计量的最大变化率来构建综合检测指标:
$${{\varphi }_{r}}({{\boldsymbol{x}}_{t}}) = \max \left[ \frac{\overset{ \frown}{I_{r}^{2}}({{\boldsymbol{x}}_{t}})} {I_{\text{r}\_\text{lim}}^{2}}, \; \frac{{{{\overset{ \frown}{Q}}}_{r}}({{\boldsymbol{x}}_{t}})}{Q_{\text{r}\_\text{lim}}^{{}}} \right] $$ (26) $$ {{\varphi }_{u}}({{\boldsymbol{x}}_{t}}) = \max \left[ \frac{\overset{ \frown}{I_{u}^{2}}({{\boldsymbol{x}}_{t}})}{I_{\text{u}\_\text{lim}}^{2}},\; \frac{{{{\overset{ \frown}{Q}}}_{u}}({{\boldsymbol{x}}_{t}})}{Q_{\text{u}\_\text{lim}}^{{}}} \right] $$ (27) 式中, $ {{\varphi }_{r}}({{\boldsymbol{x}}_{t}}) $和$ {{\varphi }_{u}}({{\boldsymbol{x}}_{t}}) $分别表示质量相关和质量无关空间的综合检测指标, 它们的控制限均为1.
3.2 故障检测策略
为方便理解所提QRVICA质量相关故障检测方法, 详细的离线建模和在线检测步骤总结如下:
离线建模:
1) 将正常工况过程变量矩阵$ X $标准化为零均值单位方差;
2) 按照式(13)进行特征值分解, 求解得质量关联虚拟变量$ {{\boldsymbol{\alpha}}} $;
3) 按照图2和式(14) ~ (15)对$ X $和$ {{\boldsymbol{\alpha}}} $进行分块;
4) 按照式(16)分别计算每个子块对中各变量$ {\overset{ \frown}{\boldsymbol{x}}}_{i}^{j} $与$ {{{\overset{ \frown}{{\boldsymbol{\alpha}}}}}_{i}} $的相关系数$ {r}_{i}^{j} $;
5) 按照式(17)计算$ t $统计量$ t_{i}^{j} $, 并利用双尾检验求得对应的$ p $值$ {p}_{i}^{j} $;
6) 对式(19)所示矩阵$ P $按列求均值向量$ \bar{\boldsymbol{P}} = [{\bar{p}}_{{}}^{1},\;{\bar{p}}_{{}}^{2},\;\cdots,\;{\bar{p}}_{{}}^{m}] $;
7) 利用假设检验, 将$ X $划分为质量相关变量组$ {{X}_r} $和质量无关变量组$ {{X}_{u}} $;
8) 分别对$ {{X}_{r}} $和$ {{X}_{u}} $建立ICA模型, 计算控制限.
在线检测:
1) 对$ t $时刻样本$ {{\boldsymbol{x}}_{t}} $进行标准化;
2) 根据变量划分结果, 将$ {{\boldsymbol{x}}_{t}} $划分为$ {{\boldsymbol{x}}_{t,\;r}} $和$ {{\boldsymbol{x}}_{t,\;u}} $;
3) 将$ {{\boldsymbol{x}}_{t,\;r}} $和$ {{\boldsymbol{x}}_{t,\;u}} $分别投影到ICA模型中, 并求得相应的统计量$ \overset{ \frown}{I_r^{2}}({{\boldsymbol{x}}_{t}}) $, $ {{\overset{ \frown}{Q}}_r}({{\boldsymbol{x}}_{t}}) $, $ \overset{ \frown}{I_u^{2}}({{\boldsymbol{x}}_{t}}) $和$ {{\overset{ \frown}{Q}}_u}({{\boldsymbol{x}}_{t}}) $;
4) 按照式(26) ~ (27)求得综合检测指标$ {{\varphi }_r}({{\boldsymbol{x}}_{t}}) $和$ {{\varphi }_u}({{\boldsymbol{x}}_{t}}) $;
5) 如果$ {{\varphi }_r}({{\boldsymbol{x}}_{t}})>1 $, $ {{\boldsymbol{x}}_{t}} $为质量相关故障样本; 如果$ {{\varphi }_r}({{\boldsymbol{x}}_{t}})\le 1 $且$ {{\varphi }_u}({{\boldsymbol{x}}_{t}})>1 $, $ {{\boldsymbol{x}}_{t}} $为质量无关故障样本; 如果$ {{\varphi }_r}({{\boldsymbol{x}}_{t}})\le 1 $且$ {{\varphi }_u}({{\boldsymbol{x}}_{t}})\le 1 $, $ {{\boldsymbol{x}}_{t}} $为正常样本.
基于QRVICA的质量相关故障检测方法流程如图3所示.
4. 实验仿真
本节通过数值仿真和田纳西−伊斯曼过程 (Tennessee-Eastman process, TEP)工业基准案例验证所提方法的有效性. 实验主要包括质量相关变量划分、相关性分析和故障检测. 在质量相关变量划分实验中, 选择互信息法[17]作为对比方法. 在故障检测实验中, 为全面评估所提方法的故障检测性能, 我们选择4种质量相关故障检测方法做对比实验, 其中MI-KPCA[17] 为基于变量划分的方法, MKICR[15]和OMDPLS[7] 为基于空间分解的方法, 而VIP-DCPLS[22] 则结合变量划分和空间分解法. 此外, 为验证EWMA在所提QRVICA方法中的作用, 我们进行消融实验, 即去除QRVICA方法中的EWMA部分 (设置遗忘因子$ \gamma = 1 $), 记为QRVICA-without-EWMA. 文献[22]中, VIP-DCPLS通过支持向量数据描述 (Support vector data description, SVDD)整合质量相关和质量无关空间的10个统计量, 形成综合检测指标$ d $, 但该指标$ d $无法区分故障是否与质量相关. 为方便性能对比, 本实验中对VIP-DCPLS进行简单修改: 分别用SVDD处理质量相关空间的5个统计量得到质量相关指标$ {{d}_r} $, 对质量无关空间的5个统计量构建质量无关指标$ {{d}_u} $. 所有方法中控制限的置信限设置为0.95[15], 根据交叉验证设置遗忘因子$ \gamma = 0.2 $. 采用误报率(False alarm rate, FAR)和故障检测率(Fault detection rate, FDR)定量评估各方法的检测性能. 具体计算公式如下:
$$ \begin{split}&\text{FAR} = \\ &\;\;\;\;\begin{cases} \dfrac{\text{Num}\left\{ {{\varphi }_{r}}({\boldsymbol{x}})>1\left| \boldsymbol{x}\in \text{Normal} \right. \right\}}{\text{Num}\{{\boldsymbol{x}}\in \text{Normal}\}}, &\text{质量相关故障}\\ \dfrac{\text{Num}\left\{ {{\varphi }_{r}}({\boldsymbol{x}})>1 \right\}}{\text{Num}\{{\boldsymbol{x}}\}}, & \text{质量无关故障} \end{cases}\end{split} $$ (28) $$ \begin{split} &\text{FDR} =\\ &\;\;\;\;\begin{cases} \dfrac{\text{Num}\left\{ {{\varphi }_{r}}({\boldsymbol{x}})>1\left| {\boldsymbol{x}}\in \text{Fault} \right. \right\}}{\text{Num}\{{\boldsymbol{x}}\in \text{Fault}\}}, & \text{质量相关故障} \\ \dfrac{\text{Num}\left\{ {{\varphi }_{u}}({\boldsymbol{x}})>1\left| {\boldsymbol{x}}\in \text{Fault} \right. \right\}}{\text{Num}\{{\boldsymbol{x}}\in \text{Fault}\}}, & \text{质量无关故障} \end{cases} \end{split} $$ (29) 式中, $ \text{Num}\left\{{{\varphi }_{r}}(\boldsymbol{x}) > 1\left| \boldsymbol{x}\in \text{Normal} \right. \right\} $是$ {{\varphi }_{r}}(\boldsymbol{x}) > 1 $的正常样本个数; $ \text{Num}\{{{\varphi }_{r}}(\boldsymbol{x}) > 1\left| \boldsymbol{x}\in \text{Fault} \right.\} $ 是$ {{\varphi }_{r}}(\boldsymbol{x}) > 1 $的故障样本的个数; $ \text{Num}\{ {{\varphi }_{u}}(\boldsymbol{x}) > 1\left| \boldsymbol{x}\in \text{Fault}\right.\} $表示$ {{\varphi }_{u}}(\boldsymbol{x}) > 1 $的故障样本的个数; ${\mathrm{Num}}\{x\} $表示所有样本(包括正常样本和故障样本)的个数; $ \text{Num}\{ \boldsymbol{x}\in \text{Normal}\} $和$ \text{Num}\{\boldsymbol{x}\in \text{Fault}\} $则分别表示正常和故障样本的个数.
一般情况下FAR越低越好, FDR越高越好. 在质量相关故障检测中, 注意以下两点:
1) 对于质量相关故障, 聚焦于质量相关检测指标. 理想的检测方法的质量相关检测指标需大于对应的控制限, 从而确保对质量相关故障的敏感捕捉与及时响应, 即高FDR.
2) 对于质量无关故障, 需同时评估质量相关与质量无关两个检测指标. 理想的检测方法应实现以下平衡: 一方面, 质量相关检测指标大于控制限的情形属于误报警, 质量相关检测指标需保持在控制限以下, 以最小化误报, 即低FAR; 另一方面, 质量无关检测指标需高于控制限, 确保对非质量因素导致的潜在问题亦能进行有效预警, 即高FDR.
4.1 数值仿真
按照式(30)建立数值仿真模型[3]:
$$ \begin{cases} {{\boldsymbol{x}}_{t}} = {{\boldsymbol{z}}_{t}}A+{{\boldsymbol{e}}_{t}}\\ {{\boldsymbol{y}}_{t}} = {{\boldsymbol{x}}_{t}}C+{{\boldsymbol{v}}_{t}} \end{cases} $$ (30) 式中, $ A = {\begin{bmatrix} 1&3&4&4&0&0&0 \\ 3&1&1&4&1&1&1 \\ 1&1&3&0&0&2&3 \end{bmatrix}} $; $ C = [2\quad 3\quad 1\quad 1 0\quad 0\quad 0]^{\text{T}} $; $ {{\boldsymbol{x}}_{t}} $为过程变量; $ {{\boldsymbol{y}}_{t}} $为质量变量; $ {{\boldsymbol{z}}_{t}}\sim \text{U}(0,\;1) $; $ {{\boldsymbol{e}}_{t}} \sim \text{N}(0,\;{{0.05}^{2}}) $和 $ {{\boldsymbol{v}}_{t}} \sim \text{N}(0,\;{{0.01}^{2}}) $表示随机噪声. $ {{\boldsymbol{x}}^{1}} \sim {{\boldsymbol{x}}^{4}} $为质量相关变量, 而$ {{\boldsymbol{x}}^{5}} \sim {{\boldsymbol{x}}^{7}} $为质量无关变量.
4.1.1 质量相关变量划分实验
按照式(30)生成500个正常样本, 采用互信息法[17]作为对比方法验证所提方法的有效性, 实验结果如图4. 图中用橙色标记质量相关变量, 用蓝色标记质量无关变量. 在互信息法中, 计算各过程变量与式(30)中质量变量$ {\boldsymbol{y}}_t $之间的互信息值, 图4(a)中红色虚线表示控制限, 当某一变量与$ {\boldsymbol{y}}_t $的互信息值高于控制限, 该变量被划分为质量相关变量; 在所提方法中设置窗口宽度$ M = 10 $, 按照第2.2节计算所构造QRV与各过程变量之间的相关度, 图4(b)中红色虚线为显著性水平. 按照式(18)假设, 当某一变量的$ p $值低于显著性水平, 则该变量为质量相关变量.
由图4可知, 所提基于QRV的质量相关变量划分方法与互信息法的实验结果一致, 均表明$ {{\boldsymbol{x}}^{1}}\sim {{\boldsymbol{x}}^{4}} $为质量相关变量, 而$ {{\boldsymbol{x}}^{5}}\sim {{\boldsymbol{x}}^{7}} $为质量无关变量, 该结果与实际情况一致. 该一致性说明, 即便在不使用质量变量的情况下, 利用本文所提基于QRV的划分方法, 仍能准确地将过程变量划分为质量相关变量和质量无关变量.
4.1.2 相关性分析实验
为进一步阐释所构造QRV可反映质量特性, 我们采用4阶Butterworth低通滤波器分别提取式(30)中质量变量$ {{\boldsymbol{y}}_t} $和质量关联虚拟变量$ {\boldsymbol{\alpha}} $的包络线如图5所示, 以此来直观查看信号随时间的变化趋势. 由图5可知, 两个信号的包络线在时间轴上呈现出近乎一致的变化轨迹, 这意味着QRV可有效跟踪$ {{\boldsymbol{y}}_t} $的变化.
此外, 为定量分析质量变量$ {{\boldsymbol{y}}_t} $及质量关联虚拟变量$ {\boldsymbol{\alpha}} $与各过程变量之间的相关性, 我们计算这些变量之间的皮尔逊相关系数, 并将结果展示如图6. 图中对应元素的值表示两变量之间的相关系数, 如第二行第一列的值表示过程变量$ {{\boldsymbol{x}}^{1}} $与虚拟变量$ {\boldsymbol{\alpha}} $之间的相关系数为0.912 8. 图6结果表明, 质量变量$ {\boldsymbol{y}}_t $与变量 $ {{\boldsymbol{x}}^{1}}\sim {{\boldsymbol{x}}^{4}} $的相关系数均高于其与$ {{\boldsymbol{x}}^{5}}\sim {{\boldsymbol{x}}^{7}} $的相关系数, 这一规律在QRV也同样存在. 该结果与仿真模型(30)的实验设置相符. 更重要的是, 质量变量$ {\boldsymbol{y}}_t $与质量关联虚拟变量$ {\boldsymbol{\alpha}} $的相关系数高达0.930 8, 这一结果充分表明两者之间具有较强的相关性.
4.1.3 故障检测实验
在模型(30)基础上注入故障如下:
$$ {\boldsymbol{x}}_{t}^{} = {\boldsymbol{x}}_{t}^{*}+{{\boldsymbol{\xi}}}$$ (31) 故障1 $ {{\boldsymbol{\xi}}} = {\begin{bmatrix}3&2&4&3&0&0&0\end{bmatrix}} $;
故障2 $ {{\boldsymbol{\xi}}} = {\begin{bmatrix}0&0&0&0&1&2&1\end{bmatrix}} $.
式(31)中$ {\boldsymbol{x}}_{t}^{*} $表示正常样本; $ {\boldsymbol{\xi}} $表示故障分量. 显然, 故障1为质量相关故障, 而故障2为质量无关故障. 每种故障生成1 000个测试样本: 前300个为正常样本, 后700个为故障样本. 用相同的实验数据, 分别采用MI-KPCA, MKICR, VIP-DCPLS, OMDPLS, QRVICA-without-EWMA和QRVICA进行故障检测, 结果如图7和图8所示, 图中$ {{\hat{T}}^{2}} $, $ {{\hat{I}}^{2}} $, $ {{d}_r} $, $ {{T}^{2}} $和$ {{{\varphi}}_r} $表示质量相关统计量, 而$ {{\tilde{T}}^{2}} $, $ {{\tilde{I}}^{2}} $, $ {{d}_u} $, $ {{Q}} $ 和$ {{{\varphi}}_u} $表示质量无关统计量.
由图7可知, QRVICA在故障注入之前 (即采样点$ 1\sim300 $), 样本的检测指标均低于控制限, 而故障注入后 (即采样点$ 301 \sim 1\; 000 $), 样本的检测指标均高于控制限. 而其他方法均存在不同程度的误报和漏报. 据统计, MI-KPCA, MKICR, VIP-DCPLS, OMDPLS及QRVICA-without-EWMA对故障1的FDR分别为84.71%, 76.86%, 75.50%, 77.51% 和90.00%.
由图8可知, MI-KPCA和MKICR中部分故障样本的质量无关检测指标低于控制限, 即存在漏报; 而MKICR, VIP-DCPLS, OMDPLS及QRVICA-without-EWMA中一些正常样本的质量相关统计量高于控制限, 导致误报. 相比之下, QRVICA方法对质量相关和质量无关故障均保持零误报率和100% 的FDR. 结合图4可知, 尽管MI-KPCA和QRVICA的变量划分结果一致, 但基于ICA的QRVICA的FDR高于基于PCA的MI-KPCA的FDR. 作为另一种ICA的变体, 基于空间分解的MKICR的FAR高于基于变量划分的QRVICA的FAR, 而FDR低于QRVICA的FDR. 对比图7(e)和图7(f)以及图8(e)和图8(f)可知, 引入EWMA后质量相关和质量无关故障的检测性能均有显著提升.
综上, QRVICA具有优越检测性能的原因主要包括以下几点: 1) QRVICA作为ICA的变体, 能够充分利用数据的高阶统计信息; 2) QRVICA是基于变量划分思想的质量相关故障检测方法, 其从根本上 (即从建模变量的选择开始) 实现质量相关与质量无关信息的有效分离; 3) EWMA技术通过融入历史样本信息, 显著提升故障检测性能.
4.2 TEP实验
TEP是Eastman公司根据实际化工反应过程开发的仿真平台, 其被广泛用于测试复杂工业过程的故障检测和诊断模型[27]. TEP包含41个测量变量XMEAS (1 ~ 41) 和11个操纵变量XMV (1 ~ 11). 在本实验中, 选择XMEAS (1 ~ 22) 和XMV (1 ~ 11) 组成33个过程变量, XMEAS (35) (主要产物G的浓度) 作为质量变量$ {\boldsymbol{y}} $. 训练集包含500个正常样本, 每种故障的测试样本中前160个为正常样本, 后800个为故障样本.
4.2.1 质量相关变量划分实验
按照第2.2节所述质量相关变量划分方法将过程变量划分为质量相关变量组$ {{X}_r} $和质量无关变量组$ {{X}_u} $. 设置窗口宽度$ M = 200 $, 划分结果如图9所示, 图中用橙色标记质量相关变量, 用蓝色标记质量无关变量. 由图9可知, 质量相关变量由测量变量XMEAS (1, 3, 7, 10, 11, 13, 16, 18, 19, 20) 和操纵变量XMV (2, 3, 5, 6, 9) 组成. 文献[17] 计算过程变量与$ {\boldsymbol{y}} $之间的MI值, 据此得出质量相关变量由测量变量XMEAS (1, 7, 10, 11, 13, 16, 18, 19, 20) 和操纵变量XMV (3, 5, 6, 9) 组成. 两种方法中31个变量的划分结果一致, 这表明利用QRV进行变量划分与直接使用$ {\boldsymbol{y}} $的划分结果高度吻合.
TEP共包括15种已知故障模式, 分别记作IDV (1) ~ IDV (15). 按照文献[6] 的分类准则, IDV (1, 2, 5 ~ 8, 10, 12, 13) 为质量相关故障; IDV (3, 4, 9, 11, 14, 15) 为质量无关故障, 其中IDV (3, 9, 15) 中由于变量的波动幅值很小, 大多数常规方法难以检测到故障, 本文不做讨论.
为进一步验证变量划分结果的准确性, 本文以IDV (5)为例, 分别用$ {{X}_r} $和$ {{X}_u} $对质量变量$ {\boldsymbol{y}} $进行最小二乘回归, 回归结果如图10, 图中蓝色线条$ {\boldsymbol{y}} $表示产物G浓度的真实变化趋势, 红色线条$ {{\hat{{\boldsymbol{y}}}}_r} $和绿色线条$ {{\hat{{\boldsymbol{y}}}}_u} $分别表示用$ {{X}_r} $和$ {{X}_u} $进行回归的预测值. 由图可知, $ {{\hat{{\boldsymbol{y}}}}_{r}} $紧密跟随$ {\boldsymbol{y}} $的变化趋势, 这表明$ {{X}_r} $可有效预测$ {\boldsymbol{y}} $; 相反, $ {{\hat{{\boldsymbol{y}}}}_u} $与$ {\boldsymbol{y}} $之间存在显著偏离, 这表明$ {{X}_u} $无法准确预测$ {\boldsymbol{y}} $的变化, 即$ {{X}_u} $与$ {\boldsymbol{y}} $的相关性较小. 这一结果间接验证了变量划分结果的准确性.
4.2.2 故障检测实验
1) 质量相关故障检测结果分析
利用MI-KPCA, MKICR, VIP-DCPLS, OMDPLS, QRVICA-without-EWMA和QRVICA方法, 我们对质量相关故障进行故障检测, 结果如表1所示. 对于质量相关故障, 一般更关注质量相关检测指标, 因此表1中FAR和FDR都是对质量相关检测指标的统计结果. 此外, 表1中所有方法对IDV (5)和IDV (7)的检测率均较低, 这是因为这两种故障属于短期故障. 其特点为故障发生后, 质量变量会出现短暂的波动; 随后, 在容错控制器的负反馈作用下, 质量变量会逐渐恢复到正常状态[14, 17]. 因此, 对于IDV (5)和IDV (7), 并非检测率越高越好, 而是需要在保证检测准确性的同时避免过度检测.
表 1 质量相关故障的FARs和FDRs (%)Table 1 FARs and FDRs of the quality-related faults (%)算法
故障编号MI-KPCA MKICR VIP-DCPLS OMDPLS QRVICA-without-EWMA QRVICA FAR ($\hat T^2$) FDR (${{\hat{T}}^{2}}$) FAR ($\hat I^2$) FDR (${{\hat{I}}^{2}}$) FAR (${{d}_{r}}$) FDR (${{d}_{r}}$) FAR ($T^2$) FDR ($T^2$) FAR (${\varphi }_r$) FDR (${\varphi }_r$) FAR (${\varphi }_r$) FDR (${\varphi }_r$) 1 0.30 99.62 0.63 69.13 0.00 99.75 2.50 99.63 0.00 99.75 0.00 99.75 2 0.00 98.50 0.63 96.88 0.00 96.50 0.63 97.75 0.00 98.25 0.00 98.50 5 0.00 24.12 0.63 20.62 0.63 24.00 1.25 19.25 0.00 24.13 0.00 25.12 6 0.00 99.75 0.00 100.00 0.00 100.00 3.13 98.75 0.00 100.00 0.00 100.00 7 0.00 40.75 0.63 35.13 0.00 40.88 1.87 64.50 0.00 37.00 0.00 37.62 8 2.40 97.62 3.75 76.00 1.25 97.75 1.25 88.13 0.00 97.63 0.00 97.50 10 0.00 79.87 0.00 63.38 0.00 55.63 0.63 54.00 0.63 80.63 0.00 84.88 12 1.25 98.88 21.88 74.13 0.00 98.75 1.25 83.88 0.00 99.25 0.00 99.62 13 0.00 94.63 1.25 85.38 0.00 95.25 0.63 93.75 0.00 93.75 0.00 94.75 平均 0.44 81.53 3.27 68.96 0.21 78.72 1.46 77.74 0.07 81.15 0.00 81.97 表1中, 除QRVICA外, 所有其他方法均存在不同程度的误报. 而QRVICA不仅在所有故障中实现零误报, 且在大多数故障中的FDR均达到最高水平. 具体而言, 相较于MI-KPCA, MKICR, VIP-DCPLS, OMDPLS及QRVICA-without-EWMA, QRVICA的平均FDR分别提高0.44, 13.01, 3.25, 4.23和0.82个百分点. 这一优势在IDV (10) 中尤为明显, 如图11所示. 为清晰展示检测结果, 图中对关键区域进行局部放大处理 (如绿色虚线框内所示). 由图11可知, 采用QRVICA方法时仅有少量故障样本的检测指标低于控制限. 而采用其他方法时较多故障样本的检测指标低于控制限, 导致这些方法对IDV (10) 的故障检测率较低. 对比图11(e)和图11(f)可知, 引入EWMA可有效提升故障检测性能, FAR从0.63% 降低至0.00%, 而FDR从80.63% 提高至84.88%.
2) 质量无关故障检测结果分析
对于质量无关故障, 我们分别利用MI-KPCA, MKICR, VIP-DCPLS, OMDPLS, QRVICA-without-EWMA和QRVICA方法进行故障检测, 结果如表2所示, 其中粗体表示最佳性能. 分析表2可知, 在处理质量无关故障时, 相较于基于空间分解的MKICR和OMDPLS方法, 基于变量划分的MI-KPCA, VIP-DCPLS和QRVICA方法表现出更低的FAR. 这主要是因为基于空间分解的方法首先建立过程变量和质量变量之间的回归关系, 然后通过对回归矩阵进行奇异值分解 (Singular value decomposition, SVD), 将空间划分为质量相关子空间和质量无关子空间. 这类方法涉及的环节较多, 包括回归关系的建立、SVD分解、故障检测策略等. 任一环节的偏差都可能影响故障检测的精度. 而基于变量划分的方法从建模时便实现质量相关与质量无关信息的有效分离, 只要变量划分足够准确, 就能够有效降低误报率. 所提QRVICA方法在对IDV (4), IDV (11) 和IDV (14) 的检测中零误报, 同时具有最高的故障检测率, 其平均FDR相较其他五种方法分别提高4.62, 0.04, 6.08, 1.45和3.29个百分点.
表 2 质量无关故障的FARs和FDRs (%)Table 2 FARs and FDRs of the quality-unrelated faults (%)算法
故障编号MI-KPCA MKICR VIP-DCPLS OMDPLS QRVICA-without-EWMA QRVICA FAR ($\hat T^2$) FDR (${{\tilde{T}}^{2}}$) FAR ($\hat I^2$) FDR (${{\tilde{I}}^{2}}$) FAR (${{d}_{r}}$) FDR (${{d}_{u}}$) FAR ($T^2$) FDR ($Q$) FAR (${\varphi }_{r}$) FDR (${\varphi }_{u}$) FAR (${\varphi }_{r}$) FDR (${\varphi }_{u}$) 4 0.10 100.00 3.75 100.00 1.25 99.00 13.00 100.00 0.10 100.00 0.00 100.00 11 2.40 69.87 12.00 83.63 2.62 66.50 17.88 79.50 0.31 73.88 0.00 83.75 14 0.00 100.00 17.88 100.00 0.37 100.00 99.38 99.88 0.21 100.00 0.00 100.00 平均 0.83 89.96 11.21 94.54 1.41 88.50 43.42 93.13 0.21 91.29 0.00 94.58 为更直观地展示检测效果, 图12展示6种方法对IDV (11)的检测结果. 从图中可以看出, 除QRVICA外其他方法中部分样本的质量相关检测指标超过控制限, 导致对质量无关故障的误报, 从而可能引发不必要的停机. 而所提QRVICA方法的质量相关检测指标$ {\varphi }_r $显著低于控制限, 且大多数故障样本的质量无关检测指标$ {\varphi }_u $ 则高于控制限. 实验结果验证了QRVICA在故障检测中的优越性.
5. 结束语
针对工业过程中质量变量难以直接测量的情况, 本文提出一种基于QRV的质量相关变量划分方法. 该方法通过构造一个QRV作为中间量实现过程变量的划分, 能有效克服传统方法对质量变量的依赖. 所提方法特别适用于那些质量变量难以直接测量情况下的质量相关故障检测. 此外, 该方法也适用于存在多个质量变量的场景, 避免传统方法中需逐一评估每对过程变量和质量变量间关系的繁琐过程, 进而简化计算流程. 将所提质量相关变量划分方法应用到故障检测, 实验结果表明, 无论是针对质量相关还是质量无关的故障场景, 所提QRVICA方法均展现出优越的故障检测性能, 不仅能够有效抑制误报率, 而且在提升故障检测准确率上具有显著优势, 这进一步验证了所提变量划分方法的有效性和可靠性. 这一研究为复杂装备或工业过程的质量相关故障检测提供一种新的可行性方案.
值得注意的是, 所提方法适用于线性系统, 如何将其扩展到非线性系统尚待研究. 鉴于非线性系统的复杂性和多样性, 未来的研究方向可聚焦于如何将互信息等非线性分析工具有效融入本方法中.
-
表 1 质量相关故障的FARs和FDRs (%)
Table 1 FARs and FDRs of the quality-related faults (%)
算法
故障编号MI-KPCA MKICR VIP-DCPLS OMDPLS QRVICA-without-EWMA QRVICA FAR ($\hat T^2$) FDR (${{\hat{T}}^{2}}$) FAR ($\hat I^2$) FDR (${{\hat{I}}^{2}}$) FAR (${{d}_{r}}$) FDR (${{d}_{r}}$) FAR ($T^2$) FDR ($T^2$) FAR (${\varphi }_r$) FDR (${\varphi }_r$) FAR (${\varphi }_r$) FDR (${\varphi }_r$) 1 0.30 99.62 0.63 69.13 0.00 99.75 2.50 99.63 0.00 99.75 0.00 99.75 2 0.00 98.50 0.63 96.88 0.00 96.50 0.63 97.75 0.00 98.25 0.00 98.50 5 0.00 24.12 0.63 20.62 0.63 24.00 1.25 19.25 0.00 24.13 0.00 25.12 6 0.00 99.75 0.00 100.00 0.00 100.00 3.13 98.75 0.00 100.00 0.00 100.00 7 0.00 40.75 0.63 35.13 0.00 40.88 1.87 64.50 0.00 37.00 0.00 37.62 8 2.40 97.62 3.75 76.00 1.25 97.75 1.25 88.13 0.00 97.63 0.00 97.50 10 0.00 79.87 0.00 63.38 0.00 55.63 0.63 54.00 0.63 80.63 0.00 84.88 12 1.25 98.88 21.88 74.13 0.00 98.75 1.25 83.88 0.00 99.25 0.00 99.62 13 0.00 94.63 1.25 85.38 0.00 95.25 0.63 93.75 0.00 93.75 0.00 94.75 平均 0.44 81.53 3.27 68.96 0.21 78.72 1.46 77.74 0.07 81.15 0.00 81.97 表 2 质量无关故障的FARs和FDRs (%)
Table 2 FARs and FDRs of the quality-unrelated faults (%)
算法
故障编号MI-KPCA MKICR VIP-DCPLS OMDPLS QRVICA-without-EWMA QRVICA FAR ($\hat T^2$) FDR (${{\tilde{T}}^{2}}$) FAR ($\hat I^2$) FDR (${{\tilde{I}}^{2}}$) FAR (${{d}_{r}}$) FDR (${{d}_{u}}$) FAR ($T^2$) FDR ($Q$) FAR (${\varphi }_{r}$) FDR (${\varphi }_{u}$) FAR (${\varphi }_{r}$) FDR (${\varphi }_{u}$) 4 0.10 100.00 3.75 100.00 1.25 99.00 13.00 100.00 0.10 100.00 0.00 100.00 11 2.40 69.87 12.00 83.63 2.62 66.50 17.88 79.50 0.31 73.88 0.00 83.75 14 0.00 100.00 17.88 100.00 0.37 100.00 99.38 99.88 0.21 100.00 0.00 100.00 平均 0.83 89.96 11.21 94.54 1.41 88.50 43.42 93.13 0.21 91.29 0.00 94.58 -
[1] 董洁, 张伟, 彭开香, 马亮. 一种面向工业过程的质量异常检测与故障量化评估方法. 自动化学报, 2022, 48(10): 2406−2415Dong Jie, Zhang Wei, Peng Kai-Xiang, Ma Liang. A novel method of quality abnormality detection and fault quantitative assessment for industrial processes. Acta Automatica Sinica, 2022, 48(10): 2406−2415 [2] 彭开香, 马亮, 张凯. 复杂工业过程质量相关的故障检测与诊断技术综述. 自动化学报, 2017, 43(3): 349−365Peng Kai-Xiang, Ma Liang, Zhang Kai. Review of quality-related fault detection and diagnosis techniques in complex industrial processes. Acta Automatica Sinica, 2017, 43(3): 349−365 [3] Zhou D H, Li G, Qin S J. Total projection to latent structures for process monitoring. AIChE Journal, 2010, 56(1): 168−178 doi: 10.1002/aic.11977 [4] Ding S X, Yin S, Peng K X, Hao H Y, Shen B. A novel scheme for key performance indicator prediction and diagnosis with application to an industrial hot strip mill. IEEE Transactions on Industrial Informatics, 2013, 9(4): 2239−2247 doi: 10.1109/TII.2012.2214394 [5] Jiao J F, Zhao N, Wang G, Yin S. A nonlinear quality-related fault detection approach based on modified kernel partial least squares. ISA Transactions, 2017, 66: 275−283 doi: 10.1016/j.isatra.2016.10.015 [6] Peng K X, Zhang K, Li G. Quality-related process monitoring based on total kernel PLS model and its industrial application. Mathematical Problems in Engineering, 2013, 2013: Article No. 707953 [7] Hu C H, Luo J Y, Kong X Y, Xu Z Y. Orthogonal multi-block dynamic PLS for quality-related process monitoring. IEEE Transactions on Automation Science and Engineering, 2024, 21(3): 3421−3434 doi: 10.1109/TASE.2023.3279575 [8] Si Y B, Wang Y Q, Zhou D H. Key-performance-indicator-related process monitoring based on improved kernel partial least squares. IEEE Transactions on Industrial Electronics, 2021, 68(3): 2626−2636 doi: 10.1109/TIE.2020.2972472 [9] Wang G, Luo H, Peng K X. Quality-related fault detection using linear and nonlinear principal component regression. Journal of the Franklin Institute, 2016, 353(10): 2159−2177 doi: 10.1016/j.jfranklin.2016.03.021 [10] Chen Q, Wang Y Q. Key-performance-indicator-related state monitoring based on kernel canonical correlation analysis. Control Engineering Practice, 2021, 107: Article No. 104692 doi: 10.1016/j.conengprac.2020.104692 [11] 宋冰, 郑城风, 侍洪波, 陶阳, 谭帅. 基于VAE-OCCA的质量相关故障检测方法研究. 化工学报, 2023, 74(4): 1630−1638Song Bing, Zheng Cheng-Feng, Shi Hong-Bo, Tao Yang, Tan Shuai. Research on quality-related fault detection method based on VAE-OCCA. CIESC Journal, 2023, 74(4): 1630−1638 [12] Du W, Fan Y, Zhang Y, Zhang J. Fault diagnosis of non-Gaussian process based on FKICA. Journal of the Franklin Institute, 2017, 354(6): 2573−2590 doi: 10.1016/j.jfranklin.2016.11.012 [13] Dong J, Wang Y, Peng K. A novel fault detection method based on the extraction of slow features for dynamic nonstationary processes. IEEE Transactions on Instrumentation and Measurement, 2022, 71: Article No. 3500611 [14] Wang G, Yang J H, Qian Y C, Han J S, Jiao J F. KPCA-CCA-based quality-related fault detection and diagnosis method for nonlinear process monitoring. IEEE Transactions on Industrial Informatics, 2023, 19(5): 6492−6501 doi: 10.1109/TII.2022.3204555 [15] Liu M Z, Kong X Y, Luo J Y, Yang L. Fault detection and diagnosis in a non-Gaussian process with modified kernel independent component regression. The Canadian Journal of Chemical Engineering, 2023, 102(2): 781−802 [16] Zhang X Y, Ma L, Peng K X, Zhang C F. A quality-related distributed fault detection method for large-scale sequential processes. Control Engineering Practice, 2022, 127: Article No. 105308 doi: 10.1016/j.conengprac.2022.105308 [17] Huang J P, Yan X F. Quality relevant and independent two block monitoring based on mutual information and KPCA. IEEE Transactions on Industrial Electronics, 2017, 64(8): 6518−6527 doi: 10.1109/TIE.2017.2682012 [18] Huang J, Yang X, Peng K. Double-layer distributed monitoring based on sequential correlation information for large-scale industrial processes in dynamic and static states. IEEE Transactions on Industrial Informatics, 2021, 17(9): 6419−6428 doi: 10.1109/TII.2020.3019499 [19] Fan H P, Lai X Z, Du S, Yu W K, Lu C D, Wu M. Distributed monitoring with integrated probability PCA and mRMR for drilling processes. IEEE Transactions on Instrumentation and Measurement, 2022, 71: Article No. 3516213 [20] Yu W K, Zhao C H, Huang B, Xie M. Intrinsic causality embedded concurrent quality and process monitoring strategy. IEEE Transactions on Industrial Electronics, 2024, 71(11): 15111−15121 doi: 10.1109/TIE.2024.3370955 [21] Jiao J F, Zhen W T, Zhu W X, Wang G. Quality-related root cause diagnosis based on orthogonal kernel principal component regression and transfer entropy. IEEE Transactions on Industrial Informatics, 2021, 17(9): 6347−6356 doi: 10.1109/TII.2020.2989810 [22] Yang J, Wang J Y, Sha J L, Dai H Q, Liu H B. Quality-related monitoring of distributed process systems using dynamic concurrent partial least squares. Computers & Industrial Engineering, 2022, 164: Article No. 107893 [23] Yang J, Wang J Y, Ye Q L, Xiong Z X, Zhang F S, Liu H B. A novel fault detection framework integrated with variable importance analysis for quality-related nonlinear process monitoring. Control Engineering Practice, 2023, 141: Article No. 105733 doi: 10.1016/j.conengprac.2023.105733 [24] Guo L, Shi H B, Tan S, Song B, Tao Y. A knowledge-driven spatial-temporal graph neural network for quality-related fault detection. Process Safety and Environmental Protection, 2024, 184: 1512−1524 doi: 10.1016/j.psep.2024.02.070 [25] Zhu J Z, Shi H B, Song B, Tao Y, Tan S. Convolutional neural network based feature learning for large-scale quality-related process monitoring. IEEE Transactions on Industrial Informatics, 2022, 18(7): 4555−4565 doi: 10.1109/TII.2021.3124578 [26] Lee J M, Yoo C, Lee I B. Statistical process monitoring with independent component analysis. Journal of Process Control, 2004, 14(5): 467−485 doi: 10.1016/j.jprocont.2003.09.004 [27] Downs J, Vogel E F. A plant-wide industrial process control problem. Computers and Chemical Engineering, 1993, 17(3): 245−255 doi: 10.1016/0098-1354(93)80018-I -