-
摘要: 针对工业过程中故障发生源与故障信息在传播过程中的差异性问题, 提出了一种基于不同故障传播路径差异化(Fault propagation path-aware network, FPPAN)的故障诊断方法. 该方法分别从故障源邻域信息关系和故障信息传播两个角度出发, 设计了基于k近邻筛选(k-nearest-neighbor, k-NN) 和基于剪枝的k跳可达路径选择 (Pruning-based k-hop reachable path selection, k-PHop) 的两种故障源图的构建方式, 构建“故障源图”. 从故障在变量间的差异化表现着手, 将基于特征的分类问题转换为基于结构关系的图匹配问题, 利用该结构化信息优化过程特征, 提升模型故障诊断性能. 最后, 通过田纳西−伊斯曼 (Tennessee-Eastman, TE)过程和某海底盾构掘进施工过程进行仿真验证, 实验结果证明了所提方法的有效性.Abstract: In order to address the issue of variability of fault sources and fault information in the propagation process in industrial processes, this paper proposes a fault diagnosis method based on fault propagation path-aware network (FPPAN). The method is based on two perspectives of fault source neighbourhood information relationship and fault information propagation, and designs two ways of constructing fault source graphs based on k-nearest-neighbour (k-NN) filtering and pruning-based k-hop reachable path selection (k-PHop) to construct a “fault source graph”. Based on the differentiation of faults among variables, the feature-based classification problem is viewed as a graph matching problem based on structural relationships, and the structural information is used to optimise the process features and improve the fault diagnosis performance of the model. Finally, the simulation is verified by the Tennessee-Eastman (TE) process and a submarine shield boring construction process, and the experimental results prove the effectiveness of the proposed method.
-
Key words:
- Fault diagnosis /
- graph neural network /
- fault source graph /
- fault root cause /
- fault propagation path
-
随着现代工业过程向着规模化和复杂化的方向发展, 工业生产的自动化和数字化程度越来越高. 由于系统的高耦合性, 当单一设备局部发生异常, 不仅会影响自身性能, 导致生产运行伴随着高能耗和高成本, 甚至会造成控制回路失效, 引起经济损失和安全风险[1−5]. 因此, 需要采取高效且准确的故障检测与诊断方法, 保障生产安全和产品质量稳定.
伴随着传感器技术的多样化发展, 暗含过程生产运行信息的海量数据得以被高效采集, 基于数据驱动的故障诊断方法受到广泛关注[6−9]. 深度学习方法由于其高维非线性数据的处理能力, 已经成为基于数据驱动方法中的一个重要分支[10−12]. 故障分类作为一种解决故障诊断问题的有效手段, 由于当下深度学习方法的海量提出, 已经成为当下研究热点. 该方法的核心思想是通过构造非线性映射网络, 提取深度可分的故障类特征, 实现故障诊断目的. Wu等[13]提出了一个深度卷积神经网络(Deep convolutional neural network, DCNN)模型用于化工过程故障诊断. Chen等[14]提出了一个基于一维卷积自编码器的多变量过程诊断模型, 降低DCNN建模时带来的时间成本. 褚菲等[15]通过构建一种基于综合经济指标驱动的稀疏降噪自编码器模型, 提取指标相关的过程特征, 丰富了特征提取的维度, 扩展了对过程异常的评价层次. Li等[16]提出的融合自编码器的字典学习模型, 引入类别信息结构化约束, 保留了数据的空间结构, 在解决少样本数据问题的同时, 强化了模型的非线性处理能力. Gao等[17]提出了一个层次化训练卷积神经网络, 通过引入有效数重采样策略来解决故障类别样本不平衡问题, 同时利用伪聚类中心距离约束解决故障类特征重叠问题. 而这些方法往往从数据样本角度出发, 考虑样本维和变量维的多重关系, 从乱序中寻找故障特征, 缺乏过程信息的先验知识指导, 模型可解释性不强.
样本维和变量维的信息可以通过抽象为图, 以结构化建模的方式, 按照图结构指定的规则, 直接参与到特征提取过程中. 这种抽象实体而形成的图是一种由节点和边构成的数据结构. 近些年来, 基于图神经网络(Graph neural networks, GNNs)的故障诊断方法正在渐渐成为研究热点, 图神经网络是完全为用于图结构数据而生的深度学习方法, 其基本思想是充分考虑图结构中所指示的信息流向, 聚合节点邻域的实体特征, 以更具可解释性的特征提取方法来描述图结构数据对象的深度信息. 就工业过程而言, 过程运作包含多个生产设备, 设备功能各异且相互耦合, 借由管道连接形成一个天然的图结构. 通过将监测变量等实体当作节点, 借此建立实体与虚拟图的对应关系, 以低代价引入过程机理信息, 不仅可以有指向性地引导模型训练, 更通过这种虚实对应的结构关系提升了模型的可解释性. Wu等[18]提出了过程拓扑卷积网络(Process topology convolutional network, PTCN), 根据过程的P&ID将过程变量、控制器、设备等设定为节点, 借助管道等物理连接以及控制回路抽取过程拓扑关系, 将故障诊断任务转化为图级分类任务进行学习. 在此基础上, Wu等[19]考虑到监测变量的动态性, 在引入动态权重矩阵做特征预提取的同时, 采用多通道动态图卷积神经网络, 改善网络层数加深带来的特征平滑问题. 同样是利用机理知识构建图, Wan等[20]考虑到有标签样本获得难的问题, 利用半监督学习思想, 充分利用互信息最大化约束实现无标签样本信息的知识蒸馏, 提升模型的分类效果. Chen等[21]考虑到变量之间包含多种复杂的交互性, 提出交互感知图神经网络(Interaction-aware graph neural networks, IAGNNs), 通过自适应地构建多个交互图, 以特征融合的方式进行图分类任务.
尽管上述方法已经充分考虑到过程机理信息, 却忽略了故障发生源与故障传播信息在生产流程中传播的差异性. 工业过程故障往往发生在局部, 经由设备间的信息传递得以传播, 然而伴随着控制回路的补偿作用, 这些故障信息会被掩盖甚至被淹没, 导致故障类别差异区分难, 故障传播推断不足. 故障传播推断作为过程监测流程中的一个环节, 与故障诊断环节相互独立, 常常在故障检测的后置阶段发挥作用. 为了充分发挥故障发生源和故障传播路径等故障信息在以故障分类作为建模主线解决故障诊断问题中的作用, 本文将故障传播路径辨识提前至故障诊断的数据预处理阶段, 利用数据样本之间的相关性差异, 进行简化的故障传播路径辨识.
故障传播推断包含故障根源诊断和故障路径识别两个环节, 可以直观地提供故障根源定位和故障传播影响等信息, 为操作人员快速做出补救措施提供支撑信息[3]. 格兰杰因果分析[22]、传递熵[23]等因果分析方法常常用来推理故障传播路径、定位故障根源, 前者通过分析过程变量在时间维度上的领先与滞后关系构建因果拓扑图, 后者则依赖信息熵借助不确定性方向测度构建因果关系矩阵. 然而, 由于当前现场决策的快速性、准确性需要, 这两种方法使用受限. 近些年来, 研究者们充分利用深度学习方法进行因果发现, 建模过程变量之间的因果关系[24-28]. 唐鹏等[24]设计了一种深度因果图建模方法, 通过联合稀疏惩罚项, 为每个过程变量建立一组多对一的因果关系自检测模型, 并融合多变量综合监测指标实现故障检测与诊断的一体化建模. 针对故障影响传播导致的故障源被模糊的问题, Wang等[25]所提出的方法在利用时序特征挖掘网络实现预测的同时, 借助该网络的可解释性提供因果延时信息, 并利用置换重要性因果验证网络在无需先验知识的情况下验证因果顺序, 基于此共同实现对故障源的准确定位和对故障传播路径的推断. 针对工业过程中各单元耦合性强带来的故障传播和演化的问题, Dong等[26]提出一种基于层次因果图的故障溯源和传播路径辨识方法, 引入传递熵对因果关系进行修正, 利用最小二乘拟合设计斜率和扰动率, 评估原因和效应变量之间的影响, 从而定位故障传播路径. 针对过程非平稳特性下故障表现可能被覆盖的问题, Zhang等[27]所提出的根因诊断因果分析框架, 结合两种单根检验法评估过程的非平稳性, 利用Gonzalo-Granger分解平稳因子, 借助基于注意力的门控神经网络进行动态因果分析. 综合来看, 现有的故障溯源方法从数据信息中的异常对比差异着手, 分析各变量信息在故障影响上的迟滞表现, 将故障传播路径识别作为异常检测的下游任务, 需要为路径辨识模块进行额外的参数学习和网络训练.
针对目前故障诊断方法中存在的问题, 本文提出了一种基于不同故障传播路径差异化(Fault propagation path-aware network, FPPAN)的故障诊断方法. 该方法省去故障特征被捕获的传播代价, 通过对故障建立传播源图, 将故障诊断问题转化为局部子图匹配问题, 实现高效可靠的过程故障诊断. 具体而言, 本文分别从故障源邻域关系和故障信息传播两种角度出发, 对应设计了基于k近邻筛选和基于剪枝的k跳可达路径选择的两种故障源图的构建方式. 通过在过程图数据上进行故障源图的对应采样, 通过结构化建模, 获取辅助校验的融合特征. 在分类条件的约束以及重构信息的完整性保障下, 该特征与原始过程数据的全局特征一道实现对故障的准确判别. 不同于传统的故障诊断方法, 本文所提出方法充分融合变量间的结构相关性, 以有向的信息交互作为特征挖掘指导, 确保故障相关特征的结构化提取. 同时该方法引入故障描述信息, 将故障检测后的故障传播路径辨识环节提前至故障诊断的数据预处理阶段, 建立了新的故障诊断模式. 本文的主要贡献如下:
1)提出了一种基于不同故障传播路径差异化的故障诊断方法. 通过构建故障源图, 利用子图采样和特征匹配方法, 实现故障类特征的富集, 使得所提取的故障特征更显著.
2)提出了故障源图构建方式. 充分考虑故障发生源和故障传播路径的差异, 将故障描述信息作为先决条件引入, 生成具备可解释性的故障传播机制可视化结构图.
3)通过对故障建立传播源图, 本文所提出的方法在进行故障类别诊断时, 可以准确定位故障根源, 为工作人员提供可操作的故障调控点.
论文的结构如下: 第1节主要是问题描述和相关知识介绍. 第2节提出不同故障传播路径差异化的故障诊断框架. 第3节利用不同的对象对所提出的模型进行有效性验证. 第4节给出结论与展望.
1. 问题描述与相关知识
在本节中, 为了便于更好地理解本文, 对研究的问题进行了描述, 并介绍了涉及到的相关知识.
1.1 问题描述
本文将图结构数据样本表示为$ G(X,\; A,\; \{{v}_{G}\}) $, 后称为过程原图, 其中节点特征矩阵$ X\in {{\mathbf{R}}^{N\times F}} $, 邻接矩阵$ A\in {{\mathbf{R}}^{N\times N}} $, $ N $为图的节点(变量)个数, $ F $为节点的特征维度. $ G $的节点集由$ \{{v}_{G}\} $表示, 且$ |{{v}_{G}}|=N $. 选择$ F $作为滑动时间窗大小, 对过程观测样本进行分割构成节点特征矩阵$ X $. 考虑到变量间结构关系的指向性和相互影响程度不一, 本文采用权重邻接矩阵$ A=\{{{a}_{ij}}: {{a}_{ij}}\in [0,\; 1]\} $表明信息从节点$ j $流入节点$ i $的影响程度. 定义故障源图为$ {{G}_{s}}({{X}_{s}},\; {{A}_{s}},\; \{{v}_{{{G}_{s}}}\}) $, 其中$ {{X}_{s}}\in {{\mathbf{R}}^{N'\times F}} $为故障源图的节点特征矩阵, $ {{A}_{s}}\in {{\mathbf{R}}^{N'\times N'}} $为故障源图的权重邻接矩阵, $ \{{v}_{{{G}_{s}}}\} $为故障源节点和故障影响变量构成的节点集. 因为构图时仅考虑故障源和故障相关传播路径, 因此$ {{G}_{s}} $的节点个数$ |{{v}_{{{G}_{s}}}}|=N'< N $.
给定一组带标签的图样本集$ D=\{(G,\; y)\} $, 通过图过滤机制保留关键故障源和故障传播路径信息, 获得故障源图集合$ S=\{({{G}_{s}},\; y)\} $, 其中$ y\in \mathcal{Y} $是$ G\in \mathcal{G} $和$ {G}_{s}\in {{\mathcal{G}}_{s}} $的类别标签. 本文研究问题的目标是学习一个预测函数$ f: \mathcal{G} + {{\mathcal{G}}_{s}}\to \mathcal{Y} $, 通过联合过程全局信息和故障源图辅助对齐信息, 将图结构样本数据映射到与其对应的标签上.
需要注意的是, 考虑到所提出模型的普适性, 本文并不限制图结构构建的具体方式, 即过程原图$ A $的获取方式. 可采用基于距离度量的方法, 如欧氏距离、余弦距离、马氏距离等, 也可以采用自学习的方法构图, 如自注意力机制的方法、特征映射相似度衡量的方法等. 本文以普遍采用的欧氏距离的方法为例进行后续的研究, 两个节点之间相关性的计算方式如下:
$$ \begin{aligned} {{a}_{ij}}=\left\| {{x}_{i}}-{{x}_{j}} \right\| \end{aligned}$$ (1) 其中, $ {{x}_{i}}、{{x}_{j}}$分别表示节点i、节点j的特征向量. 采用最大最小值归一化的方式, 对各节点的流入信息进行标准化处理.
1.2 图神经网络
GNN是一种可以有效提取结构化信息表征数据对象特征的手段, 它的提出是为了拓展深度学习方法在非欧氏数据上的应用, 以应对当下复杂的应用场景. 非欧氏数据常常以图的形式来描述, GNN的主要思想是利用节点所表现出的社区结构, 通过聚合邻域节点以及自身的节点信息实现对节点特征的迭代更新. 因此该网络的一般框架可以被归纳为2个关键步骤: 1)聚合: 聚合邻域节点的特征信息, 2)更新: 通过当前节点自身的特征信息以及邻域的聚合信息实现对自我的更新[29]. 图神经网络的一般框架表达如下:
$$ \begin{aligned} z _{v}^{k}=AGGREGAT{{E}^{k}}\{h_{u}^{k-1}: u\in N(v)\} \end{aligned}$$ (2) $$ \begin{aligned} h_{v}^{k}=UPDATE\{h_{v}^{k-1},\; z _{v}^{k}\} \end{aligned}$$ (3) 其中, $ N(v) $代表节点$ v $的邻域节点集合, $ z_{v}^{k} $表示邻域节点信息的聚合特征, $ h_{v}^{k} $表示第k层的节点特征信息. 不难看出, GNN必不可少的两个成分是图的构建以及节点特征的选取. 对于节点级任务而言, 可直接基于最终的节点表示$ h_{v}^{k} $进行后续学习处理. 对于图级任务而言, 需要通过池化操作进一步聚合所有节点的特征式(4), 获得相应的图表示特征$ {h}_{g} $进行后续的学习处理.
$$ \begin{aligned} {{h}_{g}}=Readout\{h_{v}^{k}\} \end{aligned}$$ (4) 2. 基于不同故障传播路径差异化的故障诊断模型
本节将详细介绍所提出的FPPAN模型, 图1给出了模型的整体框架. 该模型由“故障源图字典构建”、“故障源图类特征保留机制”、“子图采样与辅助类特征对齐机制” 3部分组成. 故障源图字典的构建为后续进行子图特征对齐提供可靠的图结构基础, 故障源图类特征保留机制则确保了子图特征对齐−故障源图侧的类特征可分性, 第三部分则从子图特征对齐−过程原图侧出发, 以图匹配形式感知故障信息, 用于优化全局特征, 提高特征的类可分离性.
2.1 故障源图构建
故障源图构建的目的是通过一种图过滤机制$ Filter(G,\; y)\xrightarrow{Filter}({{G}_{s}},\; y) $, 抽取故障源和故障传播路径, 实现过程原图$ G $有效简化和细化, 依赖保留的节点索引$ \{{v}_{{{G}_{s}}}\} $过滤节点特征$ F $, 形成故障信息集中的故障源图$ {G}_{s} $. 本文分别从故障源的邻域信息感知和故障信息的传播路径感知出发, 提出了基于k近邻(k-nearest-neighbor, k-NN)筛选和基于剪枝的k跳可达路径选择(Pruning-based k-hop reachable path selection, k-PHop)的故障源图构建方式. 两种故障源图构建方式均围绕故障源处的观测变量展开, 可选择其直接对应的可检测变量作为故障源节点$ {{v}_{root}} $, 或将现场工程师消除该故障表现所调控的操作变量作为故障源节点$ {{v}_{root}} $. 两种方法的具体描述如下:
k-NN故障源图. 对于给定的样本$ (G,\; y) $, 结合故障现象所确定的故障源处的监测变量$ {{v}_{root}} $, 以该变量为中心, 通过权重邻接矩阵$ A $, 选择信息流出权重最大的k个变量, 形成故障影响变量集$ \{{{v}_{impact}}\} $, 构成$ \{{v}_{{{G}_{s}}}\} $. 根据这些被选出的节点变量, 在过程原图上进行边过滤, 同步截取变量节点对应的特征, 至此形成了故障源图$ {{G}_{s}}({{X}_{s}},\; {{A}_{s}},\; \{{{v}_{G_s}}\}) $. 以某种故障为例, 假设$ k=3 $, 具体构建过程如图2所示. 第一步通过了解这个故障的故障信息描述和过程机理信息, 定位故障源为节点3; 第二步根据该节点流出信息的影响权重, 选择排名前3的邻域节点0、2、5, 与故障源一起形成 {0, 2, 3, 5} 节点集; 第三步根据节点索引进行权重邻接矩阵和节点特征的筛选, 构成$ {{G}_{s}}({{X}_{s}},\; {{A}_{s}},\; \{{{v}_{{G}_{s}}}\}) $, $ |{{v}_{{{G}_{s}}}}|=4 $.
k-PHop故障源图. 对于给定的样本$ (G,\; y) $, 会设定两个经验参数: 边过滤的累计信息占比$ p $和信息传播半径k. 首先利用流入信息占比进行全图剪枝实现初次过滤, 具体而言, 对于权重连接矩阵$ A $的每一行影响关系, 根据数值大小进行排序, 从大到小逐个相加, 直到找到累计信息占比大于等于设定阈值$ p $的第一个索引, 即初次过滤的信息边界, 未被计算到累计信息内的边则会被清除, 获得过滤后的权重连接矩阵$ A' $. 接下来会进行k次迭代的路径传播剪枝和节点特征保留. 在第一次迭代时, 同样是以故障现象所确定的故障源节点$ {{v}_{root}} $为信息出发点, 选择信息流出的一阶邻域(一跳可达的节点), 构成$ \{{{v}_{impact-1}}\} $, 并且保留信息途经的边$ \{{{e}_{path-1}}\} $. 在第k次迭代, 即查找信息传播k次到达的变量, 则是以$ \{{{v}_{impact-(k-1)}}\} $为信息出发点, 逐个查找各自的一阶邻域, 构成$ \{{{v}_{impact-k}}\} $, 并且保留信息途经的边$ \{{{e}_{path-k}}\} $. 直到查找结束, 收集每次查找的影响变量集$ \{{{v}_{impact-i}}\}_{i=1}^{N} $和途经的边集$ \{{{e}_{path-i}}\}_{i=1}^{N} $, 则有 $ \{{{v}_{G_s}}\}=Unique(\{{{v}_{root}}\}, \{{{v}_{impact-i}}\}_{i=1}^{N}) $, 其中$ Unique(\cdot) $用于保证收集节点的唯一性, $ {{A}_{s}}=\{{{a}_{ij}}: {{a}_{ij}}\in Unique(\{{{e}_{path-i}}\}_{i=1}^{N})\} $. 根据被收集的$ \{{{v}_{G_s}}\} $实现对节点特征的截取, 至此形成了故障源图$ {{G}_{s}}({{X}_{s}},\; {{A}_{s}},\; \{{{v}_{G_s}}\}) $. 以某种故障为例, 假设$ p=0.7 $, $ k=2 $, 具体构建过程如图3所示. 第一步进行权重连接矩阵$ A $的初次过滤, 以节点5为例, 它的信息流入权重为[0.31, 0, 0, 0.5, 0.77, 0, 0], 排序后的流入权重为[0.77(4), 0.5(3), 0.31(0), 0(1), 0(2), 0(5), 0(6)], 根据阈值0.7的筛选, 保留节点4、3对于节点5的信息影响, 初次过滤后的信息流入权重为[0, 0, 0, 0.5, 0.77, 0, 0]. 第二步进行k次迭代的路径传播剪枝和节点特征保留. 首先$ k=1 $时, 分析故障源节点3的一阶邻域, 得到 {0, 2, 5} 和$ \{{{e}_{30}},\; {{e}_{32}},\; {{e}_{35}}\} $的节点集和边集. $ k=2 $时, 依次分析上一步节点集的一阶邻域, 得到 {4, 3, 6}和$ \{{{e}_{04}},\; {{e}_{53}},\; {{e}_{56}}\} $的节点集和边集. 因为已经达到中止条件, 对所有收集到的集合进行分析, 得到$ \{{{v}_{G_s}}\}=Unique(\{3\},\; \{0,\; 2,\; 5\},\; \{4,\; 3,\; 6\})= \{0, $ $ 23, 4,\; 5,\; 6\} $, $ {{A}_{s}}\;=\;\{{{a}_{ij}}: {{a}_{ij}}\,\in\, \{{{e}_{04}},\; {{e}_{30}},\; {{e}_{32}}, \; {{e}_{35}}, \; {{e}_{53}}, $ $ {{e}_{56}}\}\} $. 第三步根据节点索引$ \{{{v}_{G_s}}\} $进行节点特征的筛选, 构成$ {{G}_{s}}({{X}_{s}},\; {{A}_{s}},\; \{{{v}_{G_s}}\}) $, $ |{{v}_{{{G}_{s}}}}|=6 $.
本文所提出的两种构图机制, 前者的主要思路是通过节点的过滤从而获得剪枝的边, 基于该方法所获得的故障源图, 在有限的节点个数内可以获得更丰富的信息双向传递路径, 有利于信息双向建模推理, 但是会带来过拟合的问题. 后者则通过边的剪枝根据是否可达获得过滤的节点, 基于该方法所获得的故障源图, 最贴合实际故障传播, 有利于推理故障信息传播影响, 但由于信息传播半径的限制, 会丢失部分控制回路的补偿信息, 导致欠拟合, 影响故障分类精度. 虽然二者均可满足故障源图精简化的需求, 但需要根据使用场景的不同选择合适的构图机制.
2.2 故障源图类特征学习
在故障源图字典集确定后, 故障源和故障传播路径的差异化以图结构数据的形式保存下来, 然而结构关系差异化和节点特征的差异化是两个不同维度的评价信息, 需要以统一的度量方式对其进行融合, 并确保所提取的不同类别的故障源图具备可分性. 这样, 就可以进一步对过程信息进行补充和优化.
因此本文设计了故障源图类特征学习(Fault source graph class feature learning, FSG-CFL)模块, 实现故障源图之间结构关系差异化和节点特征差异化的联合表示. 对于收集到的故障源图集$ S= \{({{G}_{s}},\; y)\} $, 充分利用GNN的信息聚合性, 通过故障传播路径的直接指导, 有指向性地聚合节点邻域特征. 借助该网络获得的图级深度特征, 既是对结构关系差异化的间接体现, 也蕴含着节点特征差异化的信息. 图卷积神经网络[30] (Graph convolutional network, GCN)已经广泛应用在很多领域内, 并展现出了强有力的特征提取能力. 因此, 本文采用GCN作为特征提取网络, 实现对故障源图类特征的学习. 需要注意的是, GCN并非是唯一选择, 其他通用的GNN方法, 如图注意力网络(Graph attention network, GAT)[31]、图采样与聚合算法 (Graph sample and aggregate, GraphSAGE)[32]以及图同构网络(Graph isomorphism network, GIN)[29]也供选择. 标准的GCN卷积层可以表述如下:
$$ \begin{aligned} {{H}^{l}}={GCN}(A,\; {{H}^{l-1}})=\sigma ({{\tilde{D}}^{-\frac{1}{2}}}\tilde{A}{{\tilde{D}}^{\frac{1}{2}}}{{H}^{l-1}}{{W}^{l}}) \end{aligned}$$ (5) 其中, $ \tilde{A}\in{\mathbf{R}^{N \times N}} $是对$ A $添加了自连接边的邻接矩阵, $ \tilde{D}\in{\mathbf{R}^{N \times N}} $是与之对应的度矩阵, $ {{W}^{l}}\in{\mathbf{R}^{{f^{l-1}}\times {f^l}}} $表示第$ l $层的可学习参数矩阵, $ {{H}^{l}}\in{\mathbf{R}^{{N} \times {f^{l}}}} $则为第$ l $层的节点特征, 初始情况下$ {{H}^{0}} = X $为输入, $ \sigma (\cdot ) $为激活函数. 该卷积网络依赖$ A $描述的信息传播矩阵(即结构关系), 沿着各个节点信息流入方向, 将经过特征变换的节点邻域特征和自身特征进行融合, 实现当前节点特征的更新. 通过不断迭代地进行特征提取与融合, 最终可获得节点级的深度结构化特征提取. 在故障源图类特征学习模块中, 使用一个两层的GCNs特征提取网络${FSG\text{-}CFL}(\cdot )$来学习深度特征表示:
$$ \begin{split} Z_{s}^{i}=\;&{FSG\text{-}CFL}(A_{s}^{i},\; X_{s}^{i})=\\ &{GCN}(A_{s}^{i},\; {GCN}(A_{s}^{i},\; X_{s}^{i})) \end{split}$$ (6) 其中, $ (A_{s}^{i},\; X_{s}^{i}) $表示故障源图集$ S $中第$ i $类故障源图的权重邻接矩阵和节点特征, $ Z_{s}^{i}\in{\mathbf{R}^{{N'} \times {F'}}}= \{z_{s}^{i(n)}\} $表示第$ i $类故障源图的节点级结构化特征矩阵, $ z_{s}^{i(n)}\in{\mathbf{R}^{{F'}}} $表示节点$ n\in {{\{{{v}_{G_s}}\}}^{i}} $的特征向量. 需要利用池化操作获得图级别的特征表示, 为了结合节点各属性的全局平均信息和局部最大信息, 将池化函数定义为节点特征的平均池化和最大池化的拼接:
$$ \begin{aligned} h_{{{G}_{s}}}^{i}={CONCAT}\{z_{s}^{i\text-mean},\; z_{s}^{i\text-max}\} \end{aligned}$$ (7) 其中, $ {h_{{{G}_{s}}}^{i}}\in{\mathbf{R}^{{2F'}}} $为第$ i $类故障源图的图级特征表示, $ {z_{s}^{i\text{-}mean}}\in{\mathbf{R}^{{F'}}} $和$ {z_{s}^{i\text{-}max}}\in{\mathbf{R}^{{F'}}} $分别为经由平均池化和最大池化得到的特征表示, 计算如下:
$$ \begin{aligned} z_{s}^{i\text-mean}=\frac{1}{|v_{{{G}_{s}}}^{i}|}\sum\limits_{n\in {{\{{v}_{{{G}_{s}}}\}}^{i}}}{z_{s}^{i(n)}} \end{aligned}$$ (8) $$ \begin{aligned} z_{s}^{i\text-max}=\underset{n\in {{\{{v}_{{{G}_{s}}}\}}^{i}}}{\mathop{\max }}\,\; z_{s}^{i(n)} \end{aligned}$$ (9) 为了确保这些故障源图的图级特征表示具有可分性, 在这些特征表示$ \{{{h}_{{{G}_{s}}}}\} $上应用全连接层(Fully connected layer, FC), 并使用$ {\mathrm{softmax}}(\cdot) $作为激活函数, 作为分类层, 输出不同故障类型的概率. 使用交叉熵损失函数对参数进行训练, 表示如下:
$$ \begin{aligned} {{\mathcal{L}}_{cls\text{-}FSG}}=\sum\limits_{{{G}_{s}}\in S}{y\ln (\hat{y})} \end{aligned} $$ (10) 2.3 子图采样与辅助类特征对齐机制
通过构建故障源图, 故障诊断问题可以视作子图匹配问题, 通过在过程原图上查找与故障源图一致的局部子图, 借助子图的有无来定义过程是否发生对应的故障类型. 本文将这个查找过程分为两个阶段, 即子图采样阶段和类特征对齐阶段. 在子图采样阶段查找子图结构, 通过类特征对齐来衡量特征之间的一致性, 将该对齐特征提供的子图匹配信息添加到全局信息中, 辅助提升分类效果.
为了确保类特征对齐的效果, 首先要对过程原图样本集$ (G,\; y) $进行初次信息过滤和深度特征提取. 与故障源图类特征学习一致, 同样采用两层的GCNs作为特征提取网络获得节点表示$ H $和图级的全局特征$ {{h}_{{{g}_{G}}}} $:
$$ \begin{aligned} H={G\text{-}En}(A,\; X)={GCN}(A,\; {GCN}(A,\; X)) \end{aligned}$$ (11) $$ \begin{aligned} {{h}_{{{g}_{G}}}}={CONCAT}\{{{h}^{mean}},\; {{h}^{max}}\} \end{aligned}$$ (12) $$ \begin{aligned} {{h}^{mean}}=\frac{1}{N}\sum\limits_{n\in N}{{{h}^{(n)}}} \end{aligned}$$ (13) $$ \begin{aligned} {{h}^{max}}=\underset{n\in N}{\mathop{\max }}\,\; {{h}^{(n)}} \end{aligned}$$ (14) 在子图采样阶段, 根据故障源图集$ S=\{({{G}_{s}}, y)\} $中的$ \{{{v}_{G_s}}\} $作为节点标识, 选择对应节点间的连接关系以及节点特征在$ A $与$ H $上进行采样, 得到 ${{D}_{G\text{-}sub}}=\{({{G}_{sub}},\; y)\}$, 其中采样子图为$ {{G}_{sub}}({{H}_{sub}}, {{A}_{sub}}, \; \{{{v}_{G_s}}\})$, $ {{{H}_{sub}}}\in{\mathbf{R}^{{N'}\times{F'}}} $为采样子图后节点特征表示矩阵. 在类特征对齐环节, 首先对于采样子图的节点表示$ \{{{H}_{sub}}\} $借助式(7) ~ (9)获得用于表示该子图的子图级特征$ \{{{h}_{{{G}_{sub}}}}\} $. 其次, 对$ \{{{h}_{{{G}_{s}}}}\} $和$ \{{{h}_{{{G}_{sub}}}}\} $之间成对的类特征进行拼接得到$ \{{{h}_{S\text{-}concat}}\} $:
$$ \begin{aligned} h_{S\text-concat}^{i}={CONCAT}\{h_{{{G}_{s}}}^{i},\; h_{{{G}_{sub}}}^{i}\} \end{aligned}$$ (15) 其中, $ h_{{{G}_{sub}}}^{i}\in{\mathbf{R}^{{2F'}}} $为第$ i $类采样子图的图级特征表示, $ h_{S\text{-}concat}^{i}\in{\mathbf{R}^{{4F'}}} $为第$ i $类故障的故障源图图级特征和对应采样子图图级特征的特征拼接.
将所有类的特征统一拼接, 用于对齐网络${Ali\text{-}En}(\cdot )$学习辅助特征$ {{h}_{g_{G}^{sub}}}\in{\mathbf{R}^{{2F'}}} $, 为全局分类特征提供证据支持:
$$ \begin{split} {{h}_{g_{G}^{sub}}}=\; & {Ali\text{-}En}(\{{{h}_{S\text-concat}}\})=\\ & { max} ({CONCAT}\{\{{{h}_{S\text-concat}}\}\}) \end{split}$$ (16) 其中, $ max (\cdot ) $是一个带有非线性激活函数的多层感知器(Multilayer perceptron, MLP). 因此全局的图表示特征经过子图对齐辅助优化后表示如下:
$$ \begin{aligned} h_{{g}_{G}}'={Trans}({CONCAT}\{{{h}_{{{g}_{G}}}},\; {{h}_{g_{G}^{sub}}}\}) \end{aligned}$$ (17) 其中, ${Trans}(\cdot )$为变换函数, 本文中同样采用MLP网络, $ h_{{{g}_{G}}}' $为优化后的图表示. 为了达到故障分类的目的, 同样在优化后的图表示上应用带有$ {\mathrm{softmax }}$函数的全连接层作为分类层, 给出预测的样本类别标签, 使用最常用的交叉熵损失来监督模型参数训练:
$$ \begin{aligned} {{\mathcal{L}}_{cls}}=\sum\limits_{G\in D}{y\ln (\hat{y})} \end{aligned} $$ (18) 此外, 为了确保该图表示特征可以充分表征过程运行状态, 添加一个MLP作为解码网络${De}(\cdot )$, 通过重构原始全局信息对特征学习进行约束:
$$ \begin{aligned} {{\hat{h}}_{{{g}_{G}}}}={De}(h_{{g}_{G}}') \end{aligned}$$ (19) $$ \begin{aligned} {{\mathcal{L}}_{res}}=\sum\limits_{G\in D}{|{{{\hat{h}}}_{{{g}_{G}}}}-{{h}_{{{g}_{G}}}}|} \end{aligned}$$ (20) 因此, 所提出的FPPAN模型的总损失定义为$ \mathcal{L} $:
$$ \begin{aligned} \mathcal{L}={{\mathcal{L}}_{cls}}+{{\mathcal{L}}_{cls\text{-}FSG}}+\rho \times{{\mathcal{L}}_{res}} \end{aligned}$$ (21) 其中, $ \rho $是用于平衡分类损失、类损失以及重构损失的超参数.
3. 案例研究
在本节中, 选择田纳西−伊斯曼(Tennessee-Eastman, TE)[33]过程和一个真实的某海底盾构施工过程数据集作为实验基准, 来评估所提出的FPPAN模型的有效性和可用性. 为了进行比较, 将所提出的FPPAN模型与现有的主流方法进行比较, 包含基于统计学习、基于深度学习和基于图的方法: 1)两阶段的故障提取网络(Principal component analysis and linear discriminant analysis, PCA + LDA): 首先利用PCA方法实现对原始数据的降维, 解决LDA的奇异性问题, 随后利用LDA对降维后的特征进行分类; 2)支持向量机(Support vector machine, SVM): 经典的机器学习分类方法; 3)深度卷积神经网络(DCNN): 利用深度卷积神经网络, 提取时间维和变量维的过程特征, 实现故障分类; 4)图卷积神经网络(GCN): 基于欧氏距离构建的图结构进行图卷积计算; 5)图注意力网络(GAT): 基于节点特征关系修正的图结构进行图卷积计算; 6)过程拓扑卷积网络(PTCN): 通过过程物理连接关系构建图结构, 利用GCN提取过程特征; 7)交互感知图神经网络(IAGNN): 基于自注意力机制自学习多种传感器间结构关系, 通过多关系的结构特征融合实现故障分类. 这些对比方法中, SVM的核函数选择径向基函数. GCN、GAT、PTCN、IAGNN作为消融对照组, GCN和GAT可以看作直接基于过程原图进行建模, 将该全局特征用于分类的网络, 前者与FPPAN采用相同距离度量的方式构建图, 后者则基于节点特征学习连接权重的方式对过程原图进行修正. PTCN基于自定义的稀疏先验图进行建模, IAGNN则基于多种自学习的结构图进行建模. 与传统的诊断方法和基于深度学习的方法相比, 可以说明图结构关系在过程建模和监测中的意义. 与基于图的方法进行对比, 可以说明图过滤机制和子图匹配模块在所提方法中的重要性. 所有方法的性能都采用常用的故障诊断准确率(ACC)作为指标进行评估.
3.1 TE过程
1)过程描述
TE过程利用四种反应物A、B、C和D, 通过五个操作单元(进料单元、反应器单元、分离器单元、汽提塔单元和压缩机单元), 生成产品G和H. 本文选择31个变量进行监测, 其中包括22个测量变量和9个操作变量. 在仿真过程中, 阀门位置压缩机回收、阀门位置剥离蒸汽和搅拌器的旋转是保持恒定的, 不涉及过程控制, 因此没有选择这些传感器进行监测. 分别在15种故障情况下进行实验仿真, 故障描述见表1, 故障仿真运行时间为48小时, 故障在第8小时引入, 并将采样间隔设置为3分钟, 收集每种故障数据800条样本. 设置时间窗长度为20对连续采样的样本进行切割, 按照7 : 3的比例划分训练和测试数据集. 采用网格搜索法确定的FPPAN方法的超参数设置如下: 学习率设置为0.003; 平衡损失的超参数设置为0.001; 批次大小为512; 最大训练轮次为300; 文中均采用两层的GCNs, 初始特征大小为20, GCNs的网络结构为14-6; 对齐网络结构为250-12, 变换函数结构为15-15.
表 1 TE过程故障信息Table 1 Fault information for the TE process序号 故障描述 类型 1 $A/C $ 进料流量比值变化, B含量不变 阶跃 2 B含量变化, $A/C $进料流量比值不变 阶跃 3 物料D温度发生变化 阶跃 4 反应器冷却水入口温度变化 阶跃 5 冷凝器冷却水入口温度变化 阶跃 6 物料A损失 阶跃 7 物料C压力损失 阶跃 8 物料A、B、C 的组成成分变化 随机 9 D进料温度变化 随机 10 C进料温度变化 随机 11 反应器冷却水入口温度变化 随机 12 冷凝器冷却水入口温度变化 随机 13 反应器动力学常数变化 缓慢漂移 14 反应器冷却水阀门 粘滞 15 冷凝器冷却水阀门 粘滞 2)实验结果分析
a) 故障分类表现
基于$ k $近邻筛选和基于剪枝的$ k $跳可达路径选择构图方式的FPPAN网络分别记作FPPAN-k-NN和FPPAN-k-PHop. 以TE为仿真对象, 各种方法对15种故障的诊断结果见表2. 本文所提出的FPPAN方法在其中13种故障类型上展现出了较优的分类效果, 尽管在另外2种故障中的表现略落后于其他对比方法, 但本文所提出的方法依然能够达到平均的分类效果. 具体分析, 本文所提出的FPPAN方法的优势体现在以下三点: 1) 与基准方法相比, FPPAN方法在TE上取得了不错的故障诊断效果, 平均分类精度分别达到79.8%和80.1%. 结果表明该模型可以通过挖掘故障源和故障传播路径的差异信息, 更好地表征过程故障运行状态. 2) 通过与DCNN的分类效果进行比较, 不难发现, 基于图的方法考虑到了变量之间的相关性, 通过数据量化这种关系, 可以有效地指导过程故障信息的提取. 因此有必要考虑变量之间的交互关系. 3) GCN单一从距离度量的方式考虑变量之间的关系, 构成了全连接图, 而GAT基于网络学习的方式会对边进行过滤. PTCN则是完全基于机理构图, 并引入了虚拟节点, 图结构上边占比只有2.36%. 根据构图方式可知GCN、GAT、PTCN这三个网络图结构逐渐稀疏, 而平均诊断精度不断提升, 表明在不引入稀疏操作的情况下会引入边噪声到故障特征中, 大大降低模型对于故障分类特征的学习. FPPAN方法为了保证模型的普适性, 则是完全使用了与GCN相同的基于距离度量的构图方式, 但在故障源图采样环节则对节点和连边都进行了筛选过滤, 确保了更细颗粒度的信息. 显而易见, 在引入了故障源图构建后, 通过子图采样提供的辅助对齐特征, 充分描述了故障的结构差异化, 为模型提供了故障信息指导, 保证了FPPAN方法的故障诊断性能. 以上结果证明, FPPAN模型能够学习到深度可分的过程故障特征, 并且故障源图可以提供具有判别性的辅助校验信息. 不可忽视的是, 对于根据故障描述无法推测故障根源邻近处的次故障根源变量的故障, 如故障3、8、9、10、13等, 本文所提出FPPAN故障诊断性能不佳, 即该方法受限于故障描述信息和过程监测变量.
表 2 不同方法在TE过程上的故障诊断表现Table 2 Fault diagnosis performance of different methods on TE process序号 PCA + LDA SVM DCNN GCN GAT PTCN IAGNN-CON IAGNN-AT FPPAN-k-NN FPPAN-k-PHop 1 1.000 1.000 0.997 0.973 0.983 1.000 0.960 0.880 1.000 1.000 2 1.000 1.000 1.000 0.864 1.000 1.000 0.987 0.997 1.000 1.000 3 0.103 0.541 0.439 0.355 0.362 0.329 0.280 0.319 0.331 0.561 4 0.747 1.000 0.997 0.997 0.963 1.000 0.917 0.953 1.000 1.000 5 0.547 0.938 0.970 0.613 0.240 0.963 0.346 0.452 0.975 0.961 6 1.000 1.000 1.000 0.973 1.000 1.000 1.000 1.000 1.000 1.000 7 1.000 1.000 1.000 0.678 0.924 1.000 0.960 0.983 1.000 1.000 8 0.464 0.613 0.674 0.243 0.452 0.681 0.465 0.475 0.731 0.728 9 0.139 0.159 0.073 0.206 0.021 0.050 0.342 0.213 0.199 0.262 10 0.084 0.047 0.792 0.352 0.472 0.498 0.508 0.375 0.827 0.694 11 0.046 0.284 0.967 0.967 0.781 0.977 0.960 0.970 1.000 1.000 12 0.269 0.853 0.714 0.595 0.664 0.867 0.631 0.671 0.883 0.869 13 0.450 0.362 0.621 0.173 0.011 0.794 0.090 0.123 0.711 0.739 14 0.058 0.997 1.000 1.000 1.000 0.967 1.000 1.000 1.000 1.000 15 0.151 0.177 0.212 0.276 0.193 0.301 0.282 0.279 0.312 0.196 平均值 0.471 0.665 0.764 0.618 0.604 0.762 0.649 0.646 0.798 0.801 b) 故障源图
TE过程中3种故障的故障源图见图4 ~ 图6, 图中节点大小表示该节点在信息传递中的重要性, 连边的粗细表示相关性权重. 尽管缺乏统一的故障传播拓扑结构用于定量分析故障源图构建的准确与否, 但可结合过程机理和相关文献分析故障源图的可解释性.
故障1为$A/C $进料流量比值发生阶跃变化, 即A、C进料处异常, 因此在实验中设置A进料监测量($ v_1 $)和C进料监测量($ v_4 $)为该故障的根源变量. 由于这两个气体反应物分别进入反应器和汽提塔参与这个放热的化学反应, 因此会对两个操作单元中的压力($ v_7 $, $ v_{13} $)、温度($ v_9 $, $ v_{18} $)、液位($ v_8 $, $ v_{12} $)产生影响. 反应物的进料关乎着产物质量, 同时该塔底产物流量($ v_{17} $, $ v_{29} $)将借由比例控制器控制进料阀门($ v_{25} $, $ v_{26} $)的开度, 实现对故障的补偿调控. 由于反应器内温度发生变化, 因此反应器的冷却水温度($ v_{21} $)也会受到影响. 从图4(a)和图4(b)不难看出, 本文所提出的两种故障源图构建方法基本都提取到了故障相关变量且建立了故障传播影响关系. 相比而言, 基于k-PHop的方法更直观地呈现了故障的传播影响, 而基于k-NN的方法包含更丰富的故障影响与补偿关系, 如塔底产物流量对进料阀门的调控($ v_{29} $→$ v_{26} $)、进料阀门开度变化对反应器内各变量的影响($ v_{25} $→$ \{v_7,\; v_8,\; v_9\} $).
故障4和故障11均为反应器冷却水入口温度发生变化, 该故障无直接监测的传感器, 但该故障会直接表现在反应器冷却水出口温度($ v_{21} $), 因此在实验中设置$ v_{21} $为该故障的根源变量. 由于该生产反应为放热反应, 冷却水的温度异常会影响其正常吸热, 导致反应器内监测变量均发生异常($ v_6 $, $ v_7 $, $ v_8 $, $ v_9 $). 同时, 反应器内温度的异常变化将直接影响对应冷却水处的阀门开度($ v_{30} $)对故障进行补偿. 而反应器内压力的变化也会影响压缩机功率($ v_{20} $), 进而影响下游气液分离($ v_{12} $, $ v_{13} $)和多余气体的排放. 从图5和图6中不难发现, 基于k-PHop的方法涵盖更多的故障传播影响, 而基于k-NN的方法由于近邻个数的限制, 只保留了故障相关性强的关键影响变量, 提供了更多的故障相互影响关系.
就故障1和故障3而言, 这两种故障的故障发生源不同, 因此所形成的故障源图在故障发生源和故障传播路径上均表现各异. 故障4和故障11均为反应器冷却水入口温度异常, 即故障发生源相同, 但是由于这两种故障的故障效果不一, 即前者为阶跃故障后者为随机故障, 对相关联变量的影响程度不一, 因此在经过节点筛选和连边过滤后, 保留的故障影响变量集不一. 操作人员可以根据故障源图提供的故障源和故障传播信息, 对故障源和故障影响变量形成的变量集进行逐级调控. 对比k-NN源图和k-PHop源图不难发现, 在有限的故障可达半径内, k-NN构图覆盖了故障传播和系统反馈的关键信息传递, 前者保留的信息更为丰富, k-PHop则保留了主要的故障传播信息. 不可忽略的是, 由于本文基于距离的角度进行过程原图的构建, 因此基于该图抽取得到的故障源图仍受限于距离度量方法的劣势, 变量间真正的因果关系被相关性所掩盖, 导致各种故障下均存在不同程度的间接故障传播路径和影响变量被包含在故障源图中, 如图4 ~ 图6中的塔底产物流量($ v_{17} $, $ v_{29} $)等间接影响变量也被提取在内.
由于故障源图更多地表现的是异常情况下变量间的影响关系, 无法提供更细颗粒度的故障传播信息, 因此在FPPAN诊断出故障类别后, 可通过计算故障源图与正常情况下过程原图上边的相对变化的方式, 保留两个变量之间双向影响中相对变化较大的一侧, 实现对故障源图的修建, 保留更为精细的传播影响. 以故障4为例, 基于FPPAN方法、基于神经网络的格兰杰因果分析方法(Neural network architecture-based Granger causality analysis, NN-GC)[28]和基于深度因果图方法(Deep causality graph, DCG)[24]构建的故障传播路径图见图7. 通过对比可直观地发现, DCG错误地将反应器温度($ v_9 $)确定为该反应器冷却水入口温度发生变化的故障根源, 却将真正的故障根源($ v_{21} $) 推断为影响传播变量. 与NN-GC相比, FPPAN方法不仅推断出了直接相关的冷却水处的阀门开度($ v_{30} $)和反应器内监测变量($ v_7 $, $ v_9 $), 也展示了对下游汽提塔单元($ v_{13} $)和回路反馈补偿环节($ v_{20} $)的故障传播影响. 综上分析, 本文所提供的故障传播路径可以提供更为丰富的故障由因及果的传播影响关系.
c) 参数敏感性分析
这一部分, 主要分析i)故障源图构建时, $ k $近邻选择; ii)故障源图构建时边过滤的累计信息占比$ p $和信息传播半径$ k $; iii)用于平衡分类损失、类损失以及重构损失的超参数$ \rho $, 这三者对于模型分类效果的影响.
为了探究故障源图构建时, $ k $近邻选择对FPPAN的影响, 本文分别选择了5、10、15、20、31作为近邻个数构图, FPPAN在TE上的平均分类准确率见图8. 从图中可以直观地看出, 当近邻个数选择5时, 取得了最佳的分类效果. 但是随着近邻个数的增加, 带来的是节点个数的增加以及边的扩张, 更多的干扰信息被考虑在内, 显著降低了模型的分类效果. 这表明, 选择合适的近邻个数可以在保证故障源图稀疏性的同时, 充分捕获故障信息的差异化表现, 从而提高模型的性能.
为了探究故障源图构建时, 边过滤的累计信息占比$ p $和信息传播半径$ k $对FPPAN的影响, 本文在$ k $取值 {1, 2, 5, 11} 的情况下模拟了$ p $取值从0.1到1对应的模型分类效果, 见图9. 首先, 可以观察到在$ k $选择1且保留20%的边信息情况下, FPPAN取得了最佳的分类效果. 其次, 模型的分类效果在$ p $取值小于等于30%上的表现整体优于在$ p $大于30%上的表现. 原因在于, $ p $越小, 剪枝的数目越多, 意味着构建的故障源图仅仅保留了故障传播的关键边, 只抓取了重要信息. 此外, 随着$ k $的增加, 虽然所捕获的故障传播路径加深, 但边缘节点受到的故障影响较弱, 会引入干扰信息, 导致模型的分类效果下降. 同时, 由于剪枝的前置约束, 故障传播步长是有限的. 随着$ k $的增加, 模型的平均分类准确率趋于稳定, 模型能力的提升已经达到饱和. 以上分析表明$ p $与$ k $是一组相互补充的参数设定, 影响着故障信息传播和边的稀疏程度, 共同确保故障源图构建的准确性以及精简化, 合适的取值有利于FPPAN取得更好的诊断效果.
本文进一步探究了$ \rho $的不同选择在FPPAN-k-NN和FPPAN-k-PHop两种模型上的性能表现. 图10展示了两个FPPAN的平均分类准确率, 两个模型均在$ \rho $为0.1时达到了最佳水平. 但是过分关注全局特征优化前后特征的一致性, 反而会大幅度影响模型的分类表现, 给故障特征的学习带来了负担. 随着$ \rho $的减小, 模型的分类效果趋于稳定, 即一旦达到理想的性能水平, 所提出的FPPAN对重构损失不会过于敏感. 综合两种构图方式进行分析, k-NN在$ k=5 $时取得最佳性能, k-PHop在$ k=1 $且$ p=0.2 $时取得最佳性能. 而k-NN方式可以被认为是选择了故障源1跳半径范围内的相关性前5个节点进行节点筛选, 只保留这6个节点之间的所有互联关系. k-NN构图的优势也恰好体现在此处, 在同等的半径范围内, k-NN容纳了节点之间的相互影响关系, 在特征提取时融合了信息的交互与反馈. k-PHop则单一考虑了信息的流出, 缺乏反馈信息的补偿. 两种方法各有优劣, 在选择故障源图构建方式时, 需要根据使用场景充分考虑故障信息的传播与过程反馈的综合作用, 从而建立合适的FPPAN模型.
3.2 盾构施工过程
1)过程描述
城市隧道掘进工程所处的地质环境极其复杂, 掘进施工过程中易发生各种故障, 这不仅拖延施工进度, 更会带来许多潜在安全风险, 因此加强盾构机的运行监测及故障诊断, 成为施工过程中最重要的任务之一. 盾构机由多个相互协作的系统组成, 其中控制系统保证各个系统的协调运行, 切削系统和推进系统完成地层的掘进和推进, 注浆系统加固地层和控制地表沉降, 泥水处理系统处理盾构过程中产生的泥浆和废水. 盾构机的内部结构示意图见图11. 盾构机在推进阶段中的任务是通过推进模式和拼装模式两种模式的轮回和交替来完成的, 由此挖掘并组装管片, 从而建造整个隧道. 本文所基于的某海底隧道盾构施工工程, 包含461个监测变量, 通过分析盾构掘进环间特性, 选择其中82个变量进行实验. 分别在4种故障情况下进行故障诊断实验对比分析, 故障描述见表3, 收集每种故障数据
6500 条, 以时间窗长度为24对收集到的样本进行切分, 按照7 : 3的比例划分训练和测试数据集. 采用网格搜索法确定的FPPAN方法的超参数设置如下: 学习率设置为0.001; 平衡损失的超参数设置为0.001; 批次大小为1024 ; 最大训练轮次为300; 文中均采用两层的GCNs, 初始特征大小为24, GCNs的网络结构为16-9; 对齐网络结构为300-18, 变换函数结构为15-4.表 3 盾构施工故障信息Table 3 Fault information for the shield tunneling construction序号 故障描述 1 刀盘结泥饼 2 泥浆管路漏浆 3 刀盘驱动故障 4 推进系统故障 2)实验结果分析
a)故障分类表现
以该盾构施工数据作为实验基准, 各种方法对4种故障的诊断结果见表4. 由表4可知, 本文所提出的FPPAN方法在4种故障上展现出了最佳的分类效果, 平均诊断精度达到99.9%. 随着图结构关系的引入和图结构的不断稀疏化, GCN、GAT和PTCN方法的诊断精度不断提升. PTCN方法通过对盾构机各个子系统构建虚拟节点, 结合机理先验知识, 实现对盾构机整个信息结构的完整抽象, 基于此获得了不错的诊断性能. 与之相比, 本文所提出的FPPAN方法弱化了对过程机理信息的高成本获取依赖, 只需根据故障表现推测故障源邻近范围内的次故障根源节点, 即可实现最佳的诊断性能. 此外, 相较于依赖于数据自学习的多故障属性图的IAGNN方法而言, 本文所提出的FPPAN方法可以只依赖单一确定性的故障源图进行辅助对齐监测, 具有更佳的诊断性能且降低了模型复杂度. 总而言之, 在实际工程上的诊断性能进一步验证了本文所提出的FPPAN方法的有效性.
表 4 不同方法在盾构施工上的故障诊断表现Table 4 Fault diagnosis performance of different methods for the shield tunneling construction序号 PCA + LDA SVM DCNN GCN GAT PTCN IAGNN-CON IAGNN-AT FPPAN-k-NN FPPAN-k-PHop 1 0.853 1.000 1.000 0.751 0.976 1.000 0.835 0.923 1.000 1.000 2 0.741 0.802 1.000 0.664 0.936 1.000 0.785 0.889 1.000 1.000 3 0.579 0.631 0.931 0.875 0.756 0.944 0.823 0.845 1.000 1.000 4 0.601 0.629 0.900 0.520 0.892 0.961 0.717 0.803 0.994 0.996 平均值 0.694 0.770 0.958 0.703 0.890 0.976 0.790 0.865 0.999 0.999 b) 故障源图
盾构施工过程中故障1的故障源图见图12. 该故障为盾构机结泥饼, 会直接表现在推进油缸推力($ v_6 $)大为增加上, 因此在实验中设置$ v_6 $为根源变量. 该故障将进一步导致刀盘扭矩先增后降至无速度($ v_2 $), 引发刀盘中心体温升加快甚至达到高温, 刀盘贯入度($ v_{37} $)大为减少, 掘进速度降低($ v_8 $, $ v_9 $, $ v_{13} $). 同时泥饼的形成会改变设备内部的重量分布, 导致设备重心发生变化, 引起倾角变化($ v_{75} $), 影响设备平稳运行. 而主驱动放扭油缸($ v_{15} $)为防止主驱动系统在操作过程中由于扭矩波动或不均匀负载而产生的旋转或扭动, 将通过液压系统提供反向力来平衡扭矩不均匀偏移. 从图12中对比发现, 基于k-PHop的方法包含更多的故障影响变量, 而基于k-NN的方法则包含丰富的故障相互影响. 综合来看, 在实际工程上的故障源图表现也证明了所提出的两种故障源图构建的可解释性.
4. 结束语
由于故障往往发生在局部, 异常要经由多级传播才能被放大并被捕获到, 导致故障类别差异区分难, 故障传播推断不足. 考虑到故障发生源与故障信息在生产流程中传播的差异性, 本文提出了一种基于不同故障传播路径差异化(FPPAN)的故障诊断方法. 首先, 从故障源邻域关系和故障信息传播两种角度出发, 设计了基于k近邻筛选和基于剪枝的k跳可达路径选择的两种故障源图的构建方式, 通过对各种故障建立病源字典, 将故障诊断问题转化为局部子图匹配问题. 其次, 通过在过程原图数据上进行故障源图的对应采样, 通过辅助类特征对齐机制, 获取辅助校验的融合特征. 最后, 利用优化后的全局特征信息进行故障分类. 在TE仿真案例和某海底隧道盾构施工工程上的实验表明FPPAN模型具有较好的诊断效果, 同时也验证了两种故障源图构建方式的有效性. 由于仅仅从距离度量的角度考虑变量之间的相关性进行构图, 所确定的相关性与实际变量间的因果关系有差别, 并且缺乏对于图结构稀疏度的衡量. 因此在后期的研究中, 将考虑进行深度因果图建模, 并融入先验知识指导, 获得更加精准的网络结构, 提升故障诊断性能.
-
表 1 TE过程故障信息
Table 1 Fault information for the TE process
序号 故障描述 类型 1 $A/C $ 进料流量比值变化, B含量不变 阶跃 2 B含量变化, $A/C $进料流量比值不变 阶跃 3 物料D温度发生变化 阶跃 4 反应器冷却水入口温度变化 阶跃 5 冷凝器冷却水入口温度变化 阶跃 6 物料A损失 阶跃 7 物料C压力损失 阶跃 8 物料A、B、C 的组成成分变化 随机 9 D进料温度变化 随机 10 C进料温度变化 随机 11 反应器冷却水入口温度变化 随机 12 冷凝器冷却水入口温度变化 随机 13 反应器动力学常数变化 缓慢漂移 14 反应器冷却水阀门 粘滞 15 冷凝器冷却水阀门 粘滞 表 2 不同方法在TE过程上的故障诊断表现
Table 2 Fault diagnosis performance of different methods on TE process
序号 PCA + LDA SVM DCNN GCN GAT PTCN IAGNN-CON IAGNN-AT FPPAN-k-NN FPPAN-k-PHop 1 1.000 1.000 0.997 0.973 0.983 1.000 0.960 0.880 1.000 1.000 2 1.000 1.000 1.000 0.864 1.000 1.000 0.987 0.997 1.000 1.000 3 0.103 0.541 0.439 0.355 0.362 0.329 0.280 0.319 0.331 0.561 4 0.747 1.000 0.997 0.997 0.963 1.000 0.917 0.953 1.000 1.000 5 0.547 0.938 0.970 0.613 0.240 0.963 0.346 0.452 0.975 0.961 6 1.000 1.000 1.000 0.973 1.000 1.000 1.000 1.000 1.000 1.000 7 1.000 1.000 1.000 0.678 0.924 1.000 0.960 0.983 1.000 1.000 8 0.464 0.613 0.674 0.243 0.452 0.681 0.465 0.475 0.731 0.728 9 0.139 0.159 0.073 0.206 0.021 0.050 0.342 0.213 0.199 0.262 10 0.084 0.047 0.792 0.352 0.472 0.498 0.508 0.375 0.827 0.694 11 0.046 0.284 0.967 0.967 0.781 0.977 0.960 0.970 1.000 1.000 12 0.269 0.853 0.714 0.595 0.664 0.867 0.631 0.671 0.883 0.869 13 0.450 0.362 0.621 0.173 0.011 0.794 0.090 0.123 0.711 0.739 14 0.058 0.997 1.000 1.000 1.000 0.967 1.000 1.000 1.000 1.000 15 0.151 0.177 0.212 0.276 0.193 0.301 0.282 0.279 0.312 0.196 平均值 0.471 0.665 0.764 0.618 0.604 0.762 0.649 0.646 0.798 0.801 表 3 盾构施工故障信息
Table 3 Fault information for the shield tunneling construction
序号 故障描述 1 刀盘结泥饼 2 泥浆管路漏浆 3 刀盘驱动故障 4 推进系统故障 表 4 不同方法在盾构施工上的故障诊断表现
Table 4 Fault diagnosis performance of different methods for the shield tunneling construction
序号 PCA + LDA SVM DCNN GCN GAT PTCN IAGNN-CON IAGNN-AT FPPAN-k-NN FPPAN-k-PHop 1 0.853 1.000 1.000 0.751 0.976 1.000 0.835 0.923 1.000 1.000 2 0.741 0.802 1.000 0.664 0.936 1.000 0.785 0.889 1.000 1.000 3 0.579 0.631 0.931 0.875 0.756 0.944 0.823 0.845 1.000 1.000 4 0.601 0.629 0.900 0.520 0.892 0.961 0.717 0.803 0.994 0.996 平均值 0.694 0.770 0.958 0.703 0.890 0.976 0.790 0.865 0.999 0.999 -
[1] Ge Z Q. Review on data-driven modeling and monitoring for plant-wide industrial processes. Chemometrics and Intelligent Laboratory Systems, 2017, 171: 16−25 doi: 10.1016/j.chemolab.2017.09.021 [2] Yu J B, Zhang Y. Challenges and opportunities of deep learning-based process fault detection and diagnosis: A review. Neural Computing & Applications, 2023, 35(1): 211−252 [3] 马亮, 彭开香, 董洁. 工业过程故障根源诊断与传播路径识别技术综述. 自动化学报, 2022, 48(7): 1650−1663Ma Liang, Peng Kai-Xiang, Dong Jie. Review of root cause diagnosis and propagation path identification techniques for faults in industrial processes. Acta Automatica Sinica, 2022, 48(7): 1650−1663 [4] Huo M Y, Luo H, Cheng C, Li K, Yin S, Kaynak O, et al. Subspace-aided sensor fault diagnosis and compensation for industrial systems. IEEE Transactions on Industrial Electronics, 2023, 70(9): 9474−9482 doi: 10.1109/TIE.2022.3215823 [5] Tao Y, Shi H B, Song B, Tan S. A supervised multisegment probability density analysis method for incipient fault detection of quality indicator. Journal of Process Control, 2022, 116: 53−63 doi: 10.1016/j.jprocont.2022.04.006 [6] Yang G, Zhao Y L, Gu X H. A novel Bayesian framework with enhanced principal component analysis for chemical fault diagnosis. IEEE Transactions on Instrumentation and Measurement, 2021, 70: 1−9 [7] Yu J B. Local and global principal component analysis for process monitoring. Journal of Process Control, 2012, 22(7): 1358−1373 doi: 10.1016/j.jprocont.2012.06.008 [8] Drucker H, Burges C, Kaufman L, Smola A, Vapnik V. Support vector regression machines. In: Proceedings of the 9th International Conference on Neural Information Processing Systems. Cambridge, USA: 1997. 155−161 [9] Si Y B, Wang Y Q, Zhou D H. Key-performance-indicator-related process monitoring based on improved kernel partial least squares. IEEE Transactions on Industrial Electronics, 2021, 68(3): 2626−2636 doi: 10.1109/TIE.2020.2972472 [10] Yan T T, Wang D, Wang Y. Discrimination- and sparsity-driven weight-oriented optimization model for interpretable initial fault detection and fault diagnosis. IEEE Transactions on Instrumentation and Measurement, 2023, 73: 1−13 [11] Zhou K, Tong Y F, Li X T. Exploring global attention mechanism on fault detection and diagnosis for complex engineering processes. Process Safety and Environmental Protection, 2023, 170: 660−669 doi: 10.1016/j.psep.2022.12.055 [12] Li C J, Li S B, Wang H, Gu F H, Ball D A. Attention-based deep meta-transfer learning for few-shot fine-grained fault diagnosis. Knowledge-based Systems, 2023, 264: Article No. 110345 doi: 10.1016/j.knosys.2023.110345 [13] Wu H, Zhao J S. Deep convolutional neural network model based chemical process fault diagnosis. Computers & Chemical Engineering, 2018, 115: 185−197 [14] Chen S M, Yu J, Wang S. One-dimensional convolutional auto-encoder-based feature learning for fault diagnosis of multivariate processes. Journal of Process Control, 2020, 87: 54−67 doi: 10.1016/j.jprocont.2020.01.004 [15] 褚菲, 傅逸灵, 赵旭, 王佩, 尚超, 王福利. 基于ISDAE模型的复杂工业过程运行状态评价方法及应用. 自动化学报, 2021, 47(4): 849−863 doi: 10.16383/j.aas.c200475Chu Fei, Fu Yi-Ling, Zhao Xu, Wang Pei, Shang Chao, Wang Fu-Li. Operating performance assessment method and application for complex industrial process based on ISDAE model. Acta Automatica Sinica, 2021, 47(4): 849−863 doi: 10.16383/j.aas.c200475 [16] Li Y X, Chai Y, Yin H P. Autoencoder embedded dictionary learning for nonlinear industrial process fault diagnosis. Journal of Process Control, 2021, 101: 24−34 doi: 10.1016/j.jprocont.2021.02.002 [17] Gao Y P, Gao L, Li X Y, Cao S Y. A hierarchical training-convolutional neural network for imbalanced fault diagnosis in complex equipment. IEEE Transactions on Industrial Informatics, 2022, 18(11): 8138−8145 doi: 10.1109/TII.2022.3177662 [18] Wu D Y, Zhao J S. Process topology convolutional network model for chemical process fault diagnosis. Process Safety and Environmental Protection, 2021, 150: 93−109 doi: 10.1016/j.psep.2021.03.052 [19] Wu P, Wang Y X, Gao J F, Zhang X J, Luo S W, Yang C J. Multichannel dynamic graph convolutional network-based fault diagnosis and its application in blast furnace ironmaking process. IEEE Sensors Journal, 2023, 23(23): 29293−29302 doi: 10.1109/JSEN.2023.3325353 [20] Wan W Q, Chen J L, Xie J S. MIM-Graph: A multi-sensor network approach for fault diagnosis of HSR Bogie bearings at the IoT edge via mutual information maximization. ISA Transactions, 2023, 139: 574−585 doi: 10.1016/j.isatra.2023.04.033 [21] Chen D Y, Liu R N, Hu Q H, Ding S X. Interaction-aware graph neural networks for fault diagnosis of complex industrial processes. IEEE Transactions on Neural Networks and Learning Systems, 2021, 34(9): 6015−6028 [22] 尹进田, 谢永芳, 陈志文, 彭涛, 杨超. 基于故障传播与因果关系的故障溯源方法及其在牵引传动控制系统中的应用. 自动化学报, 2020, 46(1): 47−57Yin Jin-Tian, Xie Yong-Fang, Chen Zhi-Wen, Peng Tao, Yang Chao. Fault tracing method based on fault propagation and causality with its application to the traction drive control system. Acta Automatica Sinica, 2020, 46(1): 47−57 [23] Zhu Q X, Luo Y, He Y L. Novel multiblock transfer entropy based Bayesian network and its application to root cause analysis. Industrial & Engineering Chemistry Research, 2019, 58(12): 4936−4945 [24] 唐鹏, 彭开香, 董洁. 一种新颖的深度因果图建模及其故障诊断方法. 自动化学报, 2022, 48(6): 1616−1624Tang Peng, Peng Kai-Xiang, Dong Jie. A novel method for deep causality graph modeling and fault diagnosis. Acta Automatica Sinica, 2022, 48(6): 1616−1624 [25] Wang S, Zhao Q, Han Y H, Wang J K. Root cause diagnosis for process faults based on multisensor time-series causality discovery. Journal of Process Control, 2023, 122(9): 27−40 [26] Dong J, Cao K R, Peng K X. Hierarchical causal graph-based fault root cause diagnosis and propagation path identification for complex industrial process monitoring. IEEE Transactions on Instrumentation and Measurement, 2023, 72: Article No. 3513911 [27] Zhang H J, Peng K X, Ma L. A systematic nonstationary causality analysis framework for root cause diagnosis of faults in manufacturing processes. Control Engineering Practice, 2023, 131: Article No. 105404 doi: 10.1016/j.conengprac.2022.105404 [28] Ma L, Dong J, Peng K X. A novel key performance indicator oriented hierarchical monitoring and propagation path identification framework for complex industrial processes. ISA Transactions, 2020, 96: 1−13 doi: 10.1016/j.isatra.2019.06.004 [29] Xu K, Hu W H, Leskovec J, Jegelka S. How powerful are graph neural networks. In: Proceedings of the 7th International Conference on Learning Representations. New Orleans, USA: 2019. [30] Kipf T N, Welling M. Semi-supervised classification with graph convolutional networks. In: Proceedings of the 5th International Conference on Learning Representations. Toulon, France: 2017. [31] Veličković P, Cucurull G, Casanova A, Romero A, Liò P, Bengio Y. Graph attention networks. In: Proceedings of the 6th International Conference on Learning Representations. Vancouver, Canada: 2018. [32] Hamilton W, Ying Z, Leskovec J. Inductive representation learning on large graphs. In: Proceedings of the 31st Conference on Neural Information Processing Systems. Long Beach, USA: 2017. 1025−1035 [33] Downs J J, Vogel E F. A plant-wide industrial process control problem. Computers & Chemical Engineering, 1993, 17(3): 245−255 -