Multiple Navigation Sensor Fault Diagnose Research Based on Multi-stage Attention Mechanism
-
摘要: 导航传感器在使用过程中容易发生故障, 针对传统方法对其间歇性和渐变性故障识别率低的问题提出了一种基于多阶段注意力机制的多传感器故障识别算法. 该算法采用基于长短期记忆神经网络和注意力机制的编码器−解码器结构, 根据多类导航传感器数据之间的空间相关性和时间相关性来进行多传感器的故障互判. 经验证, 该算法对多种类传感器的故障识别率高达97.5%, 可以高效地实现故障的检测和分类. 该方法可以准确识别出故障传感器和故障类型, 具有很强的工程应用价值.Abstract: Since navigation sensors may malfunction in use, a multi-sensor fault diagnosis algorithm based on multi-stage attention mechanism is proposed to solve the problem of low diagnosis rate of intermittent defect and gradual fault. An encoder-decoder structure based on the long short term memory (LSTM) neural network and attention mechanism is adopted in the algorithm, and fault mutual diagnosis between multiple navigation sensors is based on spatial and time correlation between the data of multiple navigation sensors. It is verified that the fault diagnosis rate of the algorithm for multi-type sensors is as high as 97.5%. Besides, sensor faults can be detected and classified effectively by this algorithm. This method which has a strong engineering application value can accurately identify the fault sensor and fault type.
-
全源导航系统中传感器种类和数量繁多, 在进行导航时要使用多个传感器的数据来进行组合导航. 如果传感器发生故障, 那么将会引起导航解算错误. 因此, 在进行导航解算前, 必须先对传感器进行故障检测.
故障检测方向一直有许多学者研究, 主要分为两种方法. 一种方法是建立对应的数学模型, 根据系统状态量之间的关系来判断传感器是否发生故障. 如张绍杰等[1]、Avram等[2]、汤文涛等[3]、Sadeghzadeh-Nokhodberiz等[4]都是先建立系统的数学模型, 然后对系统的误差特性进行分析, 进而实现故障诊断. 该方法比较复杂, 需要了解系统的工作原理, 但实际中许多系统难以抽象出数学模型, 因此应用范围比较小.
另一种方法是基于人工智能方法, 其采用特征工程与机器学习方法或深度学习进行故障诊断. Yan等[5]、Swischuk等[6]和郑晓飞等[7]先采用特征工程进行信息提取, 然后采用机器学习方法进行识别; Jing等[8]和Guo等[9]采用深度学习的方法对原始数据进行故障检测. 一方面特征工程比较复杂; 另一方面这些方法都侧重于对单个传感器数据的故障诊断, 且难以准确识别出间歇性故障和渐变性故障.
针对以上研究中出现的问题, 本文基于导航数据预处理平台[10], 提出了一种基于多阶段注意力机制的编码器−解码器(Encoder-decoder)模型算法, 该算法可以利用多类传感器数据之间的关系进行传感器的状态互检测, 不仅可以准确检测出故障传感器, 并且可以检测出其故障类型.
1. 问题研究
1.1 问题分析
全源导航系统中有多类型、多数量的传感器, 如光纤陀螺、加速度计、GPS接收机、高度计、磁力罗盘、相机和激光雷达等, 每个传感器都会产生出大量的数据, 如加速度、相对速度、绝对速度、角速率、位移、经纬度和高度等.
在载体坐标系下, 载体的加速度、相对速度、绝对速度、位移、经度、纬度和高度存在着一定的关系. 根据组合导航基本原理[11], 多数导航系统都是以惯性导航传感器为主, 与其余类型传感器组合进行导航. 因此, 当一个传感器出现故障时, 可以利用其余的传感器数据来进行辅助判断. 本文的研究目的是根据多个传感器数据的输入进行故障互检测, 不仅要检测出故障传感器, 也要识别出其故障类型.
1.2 数据说明
假设有
$n$ 个传感器数据, 每个传感器数据经过时间同步后在单位时间内产生等数量的数据. 本文中设输入${\boldsymbol{x}} = {\left( {{x^1},{x^2}, \cdots ,{x^n}} \right)^ {{\rm{T}}} } = \left( {{x_1},{x_2}, \cdots ,{x_T}} \right) \in$ ${{\bf{R}}^{n \times T}},$ 其中$T$ 为时间窗口, 表示每一类传感器数据的个数. 本文采用${{\boldsymbol{x}}^k} = \left( {x_1^k,x_2^k, \cdots ,x_T^k} \right) \in {{\bf{R}}^T}$ 表示同一类传感器数据在$T$ 时间段内的数据, 采用${{\boldsymbol{x}}_t} = $ $ \left( {x_t^1,x_t^2, \cdots ,x_t^n} \right) \in {{\bf{R}}^n}$ 表示在同一时刻的$n$ 个传感器数据.对于目标传感器数据的状态, 本文利用其余传感器数据来判断其数据是否出错. 即对于输入
$x ,$ 要判断这组输入数据的状态$\hat y$ :$$\hat y = f({x_1},{x_2}, \cdots, {x_T})$$ (1) 其中,
$f(\cdot )$ 是要学习的非线性关系.传感器数据是时间序列数据, 在时间维度上存在相互依赖性, 而循环神经网络(Recurrent neural network, RNN)具有记忆性, 可以高效地捕捉序列数据在时间上的相互依赖性, 进而对序列数据的非线性特征进行学习, 因此采用循环神经网络来拟合其非线性关系.
2. 基于循环神经网络的故障诊断分析
循环神经网络是一类以序列数据为输入, 在序列的演进方向进行递归且所有循环单元按链式连接的递归神经网络. 循环神经网络具有记忆性, 且可以参数共享和图灵完备, 因此能以很高的效率对序列的非线性特征进行学习.
传统的循环神经网络具有长期依赖问题, 无法捕捉长时间跨度的非线性关系. 长短期记忆网络(Long-short-term memory, LSTM)[12]增加了3个控制单元来对输入数据进行非线性变换, 解决了传统循环神经网络单元会出现的长期依赖问题.
针对本文的多传感器故障诊断任务, 其故障类型有间歇型、渐变型和阶跃型三种故障类型. 其中间歇型故障没有明确的模式和频率, 随机地出现和消失; 渐变型故障对数据的影响随着时间推移而增大, 在故障早期难以发现. LSTM单元虽然可以准确地捕捉传感器数据在时间上的相互依赖性, 从而判断出数据状态; 但由于间歇型和渐变型故障的复杂性, 仅仅使用LSTM单元会造成一定程度的误判. 为了解决该问题, 本文采用基于注意力机制[13]的编码器−解码器(Encoder-decoder)[14]结构.
一方面, 采用注意力机制可以捕捉到输入数据在空间维度和时间维度上的内在关系, 从而对输入进行重构, 使模型可以更好地学习输入数据之间的相互关系; 另一方面, 编码器−解码器结构中编码器将输入数据编码成状态向量, 解码器将状态向量解码后传输给多层感知机[15]进行分类处理, 该结构在产生每一个输出的时候, 能够充分利用输入序列携带的信息, 可以降低过拟合现象, 提高模型的整体性能.
综上分析, 对于多传感器故障诊断任务, 本文采用基于注意力机制的编码器−解码器结构来实现, 该结构以LSTM为基本单元, 采用多阶段的注意力机制来构建数据之间的相互关系, 其输出经过多层感知机进行分类, 进而判断出传感器的数据状态.
3. 多阶段注意力机制研究
对于多传感器故障诊断任务, 本文从传感器的空间维度和时间维度来研究. 在传感器的空间维度上, 每种类型的传感器数据在同一时刻具有相互依赖性; 在时间维度上, 每一类的传感器数据在不同时间段的数据对其余时间段的数据的状态贡献程度不一样; 因此可以从这两个角度来判断传感器的数据状态. 本文设计的基于多阶段注意力的编码器−解码器结构如图1所示. 首先, 将多传感器的数据传送给局部注意力和全局注意力机制, 用于捕捉传感器数据在空间和时间维度上的相互依赖性; 然后将数据传输给带有时间注意力机制的编码器—解码器模型, 其中编码器−解码器用于对数据进行状态编码和状态解码, 时间注意力机制是为了防止编码器−解码器模型的性能会随着输入数据的长度而急剧衰减; 将解码后的状态信息传输给多层感知机进行分类, 根据分类结果就可以确定出故障传感器和故障类别.
3.1 局部注意力研究
对于所有的传感器数据, 每个传感器数据在
$t$ 时刻的数据不仅与其在$\left[ {t,t + T} \right]$ 时间段的数据具有相关性, 且与其余传感器数据在$t$ 时刻的数据存在空间相关性. 例如$t$ 时刻的位移数据与其在$\left[ {t,t + T} \right]$ 时间段内的数据具有相互依赖性, 且与$t$ 时刻的速度和加速度数据具有一定的关系. 根据该特性, 本节从空间维度上出发, 通过引入编码器模块中LSTM单元对应输入的前一个时刻的隐藏态${{\boldsymbol{h}}_{t - 1}}$ 和细胞态${{\boldsymbol{s}}_{t - 1}},$ 构建局部注意力机制来捕捉传感器数据序列之间的空间相关性. 局部注意力机制的结构如图2所示.如图2所示, 其中
$e_t^k$ 和$\alpha _t^k$ 的计算式为$$e_t^k = {\boldsymbol{v}}_e^ {{\rm{T}}} {\rm{tanh}}\left( {{{\boldsymbol{w}}_e}\left[ {{{\boldsymbol{h}}_{t - 1}}:{{\boldsymbol{s}}_{t - 1}}} \right] + {{\boldsymbol{u}}_e}{x^k} + {{\boldsymbol{b}}_e}} \right)$$ (2) $$\alpha _t^k = \frac{{{\rm{exp}}\left( {e_t^k} \right)}}{{\displaystyle\mathop \sum \limits_{i = 1}^n {\rm{exp}}\left( {e_t^i} \right)}}$$ (3) 其中,
${{\boldsymbol{v}}_e} \in {{\bf{R}}^T},{{\boldsymbol{w}}_e} \in {{\bf{R}}^{T \times 2H}},{{\boldsymbol{u}}_e} \in {{\bf{R}}^{T \times T}},{{\boldsymbol{b}}_e} \in {{\bf{R}}^T}$ 都是待训练的参数, 其中$H$ 表示LSTM中的隐藏单元数,${{\boldsymbol{v}}_e},{{\boldsymbol{w}}_e},{{\boldsymbol{u}}_e}$ 表示对状态量和输入做线性变换,${{\boldsymbol{b}}_e}$ 表示载体对传感器数据状态造成的影响.$e_t^k$ 表示第$k$ 个输入特征在$t$ 时刻的特征权重, 其经过softmax函数归一化后成为$\alpha _t^k,$ 即所有传感器数据在同一时刻内的权重之和为1. 因此, 局部注意力机制构建出的新的输入为$${\boldsymbol{x}}_t^{e1} = {(\alpha _t^1x_t^1,\alpha _t^2x_t^2, \cdots ,\alpha _t^nx_t^n)^{\rm{T}}},\;\;t \in [0,T]$$ (4) 3.2 全局注意力研究
当对传感器的数据状态进行判断时, 不同时间段内的传感器数据对整体的数据状态贡献是不一样的. 例如当判断
$\left[ {t + {{3T} / 4},t + T} \right]$ 时间段内的数据是否正常时,$\left[ {t + {{2T} / 4},t + {{3T} / 4}} \right]$ 时间段内的数据对其贡献程度比较大, 而$\left[ {t,t + {T / 4}} \right]$ 之内的数据状态对其贡献相对较小, 即每个时间段内的数据对其余时间段内数据状态的贡献程不一样. 根据该特性, 本节从时间维度出发, 通过引入上一个时刻编码器模块中LSTM单元对应输入的的隐藏态${{\boldsymbol{h}}_{t - 1}}$ 和细胞态${{\boldsymbol{s}}_{t - 1}}$ 来为每一时刻的输入分配权重. 全局注意力机制的结构如图3所示.如图3所示, 其中
${{\boldsymbol{g}}_t}$ 和${{\boldsymbol{\beta}} _t}$ 的计算式为$${{\boldsymbol{g}}_t} = {{\boldsymbol{v}}_g}{\rm{tanh}}\left( {{{\boldsymbol{w}}_g}\left[ {{{\boldsymbol{h}}_{t - 1}}:{{\boldsymbol{s}}_{t - 1}}} \right] + {{\boldsymbol{u}}_g}\left[ {{{\boldsymbol{x}}_t}:{{\boldsymbol{b}}_g}} \right]} \right)$$ (5) $${{\boldsymbol{\beta}} _t} = \frac{{{\rm{exp}}\left( {{{\boldsymbol{g}}_t}} \right)}}{{\mathop \sum \limits_{j = 1}^T {\rm{exp}}\left( {{{\boldsymbol{g}}_t}} \right)}}$$ (6) 其中,
${{\boldsymbol{v}}_g} \in {{\bf{R}}^n},{{\boldsymbol{w}}_g} \in {{\bf{R}}^{n \times 2H}},{{\boldsymbol{u}}_g} \in {{\bf{R}}^{1 + T}},{{\boldsymbol{b}}_g} \in {{\bf{R}}^{n \times T}}$ 都是待训练的参数, 其中${{\boldsymbol{v}}_g},{{\boldsymbol{w}}_g},{{\boldsymbol{u}}_g}$ 表示对状态量和输入做线性变换,${{\boldsymbol{b}}_g}$ 表示每类传感器数据的误差特性对数据状态的影响.${{\boldsymbol{g}}_t}$ 表示$t$ 时刻输入数据的特征权重, 即${{\boldsymbol{x}}_t}$ 的特征权重, 其经过softmax函数归一化后成为$\beta _t^k,$ 即所有传感器数据在$T$ 时刻内的权重之和为1. 因此, 全局注意力机制构建出的输入为$${{\boldsymbol{x}}^{e2}} = ({{\boldsymbol{\beta}} _1}{{\boldsymbol{x}}_1},{{\boldsymbol{\beta}} _2}{{\boldsymbol{x}}_2}, \cdots ,{{\boldsymbol{\beta}} _T}{{\boldsymbol{x}}_T})$$ (7) 对于编码器模块, 本文将局部注意力机制和全局注意力机制构建出的输入进行维度拼接后做为其新的输入, 即
$${\tilde {\boldsymbol{x}}_t} = [{{\boldsymbol{x}}^{e1}}:{{\boldsymbol{x}}^{e2}}],\;\;{\tilde {\boldsymbol{x}}_t} \in {{\bf{R}}^{n \times 2T}}$$ (8) 3.3 时间注意力机制
为了判断传感器数据在
$T$ 时间段内的数据状态, 本文采用解码器模块解码来自编码器模块的编码信息. 由于编码器−解码器模型的性能会随着输入数据的长度而急剧衰减, 因此需要在解码器模型前引入时间注意力机制[16], 使其可以动态地选择编码器模块的相关输出序列并赋予不同的权重, 从而对其进行准确的解码. 本文的时间注意力机制如图4所示.如图4所示,
$j_t^i$ 和$\gamma _t^i$ 的计算式为$$j_t^i = {{\boldsymbol{v}}_d}{\rm{tanh}}\left( {{{\boldsymbol{w}}_d}\left[ {{\boldsymbol{h}}_{t - 1}':{\boldsymbol{s}}_{t - 1}'} \right] + {{\boldsymbol{u}}_d}{{\boldsymbol{h}}_t}} \right)\;\;\;\;$$ (9) $$\gamma _t^i = \frac{{{\rm{exp}}\left( {j_t^i} \right)}}{{\displaystyle\mathop \sum \limits_{j = 1}^H {\rm{exp}}\left( {j_t^j} \right)}}\qquad\qquad\qquad\qquad\;$$ (10) 其中,
${{\boldsymbol{v}}_d} \in {{\bf{R}}^H},{{\boldsymbol{w}}_d} \in {{\bf{R}}^{H \times 2H}},{{\boldsymbol{u}}_d} \in {{\bf{R}}^{H \times 2T}}$ 都是待训练的参数,${{\boldsymbol{h}}'_{t - 1}}$ 和${{\boldsymbol{s}}'_{t - 1}}$ 是解码器模块的$t - 1$ 时刻的隐藏态和细胞态,${{\boldsymbol{h}}_t} = (h_t^1,h_t^2, \cdots ,h_t^H)$ 是编码器模块在$t$ 时刻的输出,$\gamma _t^i$ 为$t$ 时刻第$i$ 个隐藏态$h_t^i$ 其对应的权重.解码器模型的输入为
$${\boldsymbol{x}}_t^d = (\gamma _t^1h_t^1,\gamma _t^2h_t^2, \cdots ,\gamma _t^{2H}h_t^{2H})$$ (11) 当采用解码器模型进行解码后, 将其输出传送给多层感知机, 对其进行非线性变化, 再采用softmax函数进行分类, 根据softmax输出则可以判断出传感器的数据状态.
4. 实验设计
4.1 实验数据
在导航系统中, 无论载体是飞机、汽车或者轮船, 其传感器数据都具有空间相关性和时间相关性, 只是载体运动规律不同, 其故障诊断的方法几乎都是一样的. 因此, 为了验证本文设计的基于多阶段注意力机制的故障诊断算法, 实验数据采用对MIT的开源车载数据[17]进行预处理之后的数据, 即对其开源车载数据注入故障. 该开源数据由一辆装配多种导航传感器的汽车在城市进行采集的, 并且已经进行了传感器的数据对准. 本文选取其中四个传感器的数据, 即陀螺仪、加速度计、GPS接收机和相机, 其对应的导航量为三轴角速率、三轴加速度、经度、纬度、高度、速度和双轴光流速度, 共12类传感器数据, 且每类传感器的数据个数为221280.
当传感器发生故障时, 一般是由于其温度、工作环境和元器件老化等多种原因造成的, 且该故障对传感器数据造成的影响很难用具体的数学模型来描述. 与工业系统相似, 许多研究学者将其故障模型抽象和理想化为阶跃响应、斜坡响应和加速度响应等数学模型. 因此, 对于本文研究的3种传感器故障, 即间歇型故障、渐变型故障和阶跃型故障, 采用理想化的数学模型, 如式(12)~(14)所示.
$$ y = \left\{ {\begin{aligned} &{k_1},&{t_1} < t < {t_2}\quad\;\,\\ &0,& t \le {t_1}{\text{或}}\;t \ge {t_2} \end{aligned}} \right. $$ (12) $$ y = \left\{ {\begin{aligned} &{k_2}t + b,& t > {t_3}\\ &0,&t \le {t_3} \end{aligned}} \right. $$ (13) $$ y = \left\{ {\begin{aligned} &{k_3},&t > {t_3}\\ &0,& t \le {t_3} \end{aligned}} \right. $$ (14) 考虑到各种故障类型的特性, 模型中参数的取值如下: 其中
$0 < {k_1} < {k_2} < T,\;0 < {k_3} < T,\;{k_1}$ 和${k_3}$ 取每类传感器数据在一个时间段$T$ 内的均值的0.1倍,${k_2}$ 取0.1,${t_1}$ 取$T/4,{t_2}$ 取$T/2,{t_3}$ 取$3T/4$ .为了模拟故障的传感器数据, 一方面需要对正常的传感器进行数据预处理; 另一方面需要列出所有可能的传感器故障组合. 首先, 从同一时间段内传感器故障数量的角度上将传感器的故障类型分为两大类, 即单故障和多故障. 单故障是指同一时间段内只有一个传感器数据发生故障, 多故障是指同一时间段内有多个传感器数据发生故障.
对于单故障类型的数据, 对每类传感器数据在不同时刻分别添加这3种故障, 即在一个时间段内, 只有一个传感器发生故障, 且为3种故障中的一种, 则预处理的传感器数据如图5所示.
对于多故障数据, 由于传感器的故障类型有3种, 传感器数据有12种, 若使多个传感器发生不同类型的故障, 对其进行一一列举, 则整体传感器的数据状态会达到上百种, 会对训练网络带来一定的难度, 主要体现在实验平台的计算力上. 因此, 为了避免过多的传感器数据状态对训练网络带来的困难, 本文设多故障数据中传感器的故障数量为3, 其故障类型为间歇性、渐变性和阶跃性故障, 则多故障数据如图6所示.
如图5和图6所示, 输入
${\boldsymbol{x}} = {({{\boldsymbol{x}}^1},{{\boldsymbol{x}}^2}, \cdots ,{{\boldsymbol{x}}^n})^{\rm{T}}} =$ $({{\boldsymbol{x}}_1},{{\boldsymbol{x}}_2}, \cdots ,{{\boldsymbol{x}}_T}) \in {{\bf{R}}^{n \times T}}$ 共有47种数据状态, 即46种故障状态和1种正常状态. 本文根据时间窗口$T$ 的大小, 将预处理的数据集按照8 : 1 : 1分为训练集、验证集和测试集, 每个数据集中每种状态的数据个数应基本相等, 其中训练集和验证集用来训练和验证模型, 测试集用来评估最终的模型性能.4.2 参数确定
本文中有多个参数需要确定. 对于数据集的时间窗口
$T$ , 设其区间设置为$T=$ {64, 96, 128, 144, 168, 196}; 对于编码器和解码器模块中的LSTM单元, 设其数目相同且将其范围设置为$H=$ {64, 96, 128, 192, 256}; 对于多层感知机, 设其每层隐藏单元数相等且设范围为$h=$ {3, 5, 7, 9}. 此外, 采用多层LSTM单元来增强模型的性能, 设其层数为$q.$ 最后, 经过网格搜索调参, 本文选取$T=144,\;H= $ $ 128,\; h=7,\; q=2$ .对模型进行训练时, 本文采用Adam优化器, 初始学习率为0.001, 每训练1 200步学习率减小为原来的0.8, Dropout取0.7, 批大小选择128, 训练20个Epochs, 采用交叉熵作为损失函数.
4.3 实验对比
此处将本文设计出来的多阶段注意力机制故障诊断算法称为FDRNN (Fault diagnosis recurrent neural network). 为了验证多阶段注意力机制对故障识别准确率的提升, 本文对FDRNN的子模型进行如下定义:
FDRNN-N1: 表示无局部注意力机制的网络;
FDRNN-N2: 表示无全局注意力机制的网络;
FDRNN-N3: 表示无时间注意力机制的网络.
对FDRNN及三个子模型、深度置信网络(Deep belief network, DBN)[7]和深度卷积神经网络(Deep convolutional neural network, DCNN)[8]进行对比实验, 结果如表1所示.
表 1 不同模型的实验对比Table 1 Comparison of experimental results of different models方法 准确率 (%) 召回率 (%) FDRNN 97.5 96.6 FDRNN-N1 83.4 81.5 FDRNN-N2 81.2 79.4 FDRNN-N3 74.3 72.1 DBN 80.5 78.9 DCNN 84.7 83.6 如表1所示, FDRNN的准确率可以达到97.5%, 召回率可以达到96.6%. 当没有局部注意力机制时, 其准确率和召回率会出现下降, 其主要原因是未将同一时刻不同传感器数据之间的空间相关性结合起来, 仅仅依靠单个传感器的数据对其数据状态做出判断, 因此准确率比较低. 当没有全局注意力机制时, 其准确率和召回率也会降低, 其原因在进行数据的状态判断时未考虑数据在时间维度上的前后相关性. 而当没有时间注意力时, 其准确率和召回率也会出现较大程度的下降, 关键原因是随着时间步的增长, 编码器的特征向量的语义信息会降低且解码器无法动态地从编码器模块中提取有用信息, 从而会降低模型的性能. 对于DBN而言, 其采用DBN网络对传感器数据进行在线估计, 根据估计值与真实值之间的残差来判断是否故障, 其结果很大程度上受残差阈值的影响, 且对多传感器故障的在线估计比较差, 因此仅有80.5%的准确率和78.9%的召回率. 对于DCNN而言, 其准确率可达84.7%, 召回率可以达到83.6%, 其原因是卷积网络中的卷积层和池化层一定程度上可以捕捉到多传感器数据之间的空间相关性和时间相关性, 但是其捕捉是基于随机搜索, 缺乏指导性, 所以其故障识别率相对于有多重注意力机制的编码器−解码器模型较低. 因此, 针对多传感器故障诊断任务, FDRNN可以准确地识别出故障传感器数据和故障类型.
本文构建出的FDRNN通过引入多阶段注意力机制将多个传感器数据在空间维度和时间维度之间的相互依赖性联系起来, 采用编码器−解码器结构对多传感器数据进行编码和解码, 再采用多层感知机进行分类. 该结构不仅可以准确识别出故障传感器, 并且可以识别出故障类型.
5. 结束语
本文提出的基于多阶段注意力机制的编码器−解码器模型在空间维度和时间维度上采用编码器来提取多传感器数据之间的空间相关性和时间相关性, 采用带有时间注意力机制的解码器来解码来自编码器的输出, 并采用多层感知机来判断时间窗口内数据的状态信息. 该方法通过多阶段注意力机制来捕捉多类传感器数据之间的关系, 采用多个传感器数据来辅助判断目标传感器, 形成多传感器之间的故障互检测, 不仅可以准确地检测出故障的传感器数据, 并且可以识别出其故障类型. 对比实验证明, 每阶段注意力机制都对判断数据的状态信息都具有非常重要的作用. 因此, 针对本文的多传感器故障诊断任务, FDRNN可以准确地进行故障检测.
-
表 1 不同模型的实验对比
Table 1 Comparison of experimental results of different models
方法 准确率 (%) 召回率 (%) FDRNN 97.5 96.6 FDRNN-N1 83.4 81.5 FDRNN-N2 81.2 79.4 FDRNN-N3 74.3 72.1 DBN 80.5 78.9 DCNN 84.7 83.6 -
[1] 张绍杰, 吴雪, 刘春生. 执行器故障不确定非线性系统最优自适应输出跟踪控制. 自动化学报, 2018, 44(12): 2188-2197Zhang Shao-Jie, Wu Xue, Liu Chun-Sheng. Optimal adaptive output tracking control for a class of uncertain nonlinear systems with actuator failures. Acta Automatica Sinica, 2018, 44(12): 2188-2197 [2] Avram R C, Zhang X D, Muse J. Quadrotor actuator fault diagnosis and accommodation using nonlinear adaptive estimators. IEEE Transactions on Control Systems Technology, 2017, 25(6): 2219-2226 doi: 10.1109/TCST.2016.2640941 [3] 汤文涛, 王振华, 王烨, 沈毅. 基于未知输入集员滤波器的不确定系统故障诊断. 自动化学报, 2018, 44(9): 1717-1724Tang Wen-Tao, Wang Zhen-Hua, Wang Ye, Shen Yi. Fault diagnosis for uncertain systems based on unknown input set-membership filters. Acta Automatica Sinica, 2018, 44(9): 1717-1724 [4] Sadeghzadeh-Nokhodberiz N, Poshtan J. Distributed interacting multiple filters for fault diagnosis of navigation sensors in a robotic system. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2017, 47(7): 1383-1393 doi: 10.1109/TSMC.2016.2598782 [5] Yan Rui, Ma Zhen-Jun, Zhao Yang, Kokogiannakis G. A decision tree based data-driven diagnostic strategy for air handling units. Energy and Buildings, 2016, 133: 37-45 doi: 10.1016/j.enbuild.2016.09.039 [6] Swischuk R, Allaire D. A machine learning approach to aircraft sensor error detection and correction. Journal of Computing and Information Science in Engineering, 2019, 19(4): Article No. 041009 [7] 郑晓飞, 郭创, 姚斌, 冯华鑫. 基于深度学习的航空传感器故障诊断方法. 计算机工程, 2017, 34(7): 281-287 doi: 10.3969/j.issn.1000-3428.2017.07.047Zheng Xiao-Fei, Guo Chuang, Yao Bin, Feng Hua-Xin. Fault diagnosis method for aerial sensor based on deep learning. Computer Engineering, 2017, 34(7): 281-287 doi: 10.3969/j.issn.1000-3428.2017.07.047 [8] Jing L Y, Wang T Y, Zhao M, Wang P. An adaptive multi-sensor data fusion method based on deep convolutional neural networks for fault diagnosis of planetary gearbox. Sensors, 2017, 17(2): Article No. 414 doi: 10.3390/s17020414 [9] Guo D F, Zhong M Y, Ji H Q, Liu Y, Yang R. A hybrid feature model and deep learning based fault diagnosis for unmanned aerial vehicle sensors. Neurocomputing, 2018, 319: 155-163 doi: 10.1016/j.neucom.2018.08.046 [10] 谢超, 赵伟, 王亚朝, 赖际舟, 刘建业. 多导航传感器数据实时并行采集处理与传输系统的研制. 电子测量技术, 2018, 41(21): 67-70Xie Chao, Zhao Wei, Wang Ya-Zhao, Lai Ji-Zhou, Liu Jian-Ye. Development of real-time parallel acquisition, processing and transmission system for multi navigation sensor data. Electronic Measurement Technology, 2018, 41(21): 67-70 [11] 刘建业, 曾庆化, 赵伟, 熊智. 导航系统理论与应用. 西安: 西北工业大学出版社, 2010. 386−396Liu Jian-Ye, Zeng Qing-Hua, Zhao Wei, Xiong Zhi. Theory and Application of Navigation System. Xi'an: Northwestern Polytechnical University Press, 2010. 386−396 [12] Hochreiter S, Schmidhuber J. Long short-term memory. Neural Computation, 1997, 9(8): 1735-1780 doi: 10.1162/neco.1997.9.8.1735 [13] Vaswani A, Shazeer N, Parmar N, Uszkoreit J, Jones L, Gomez A N, et al. Attention is all you need. In: Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach, USA: NIPS, 2017. 6000−6010 [14] Sutskever I, Vinyals O, Le Q V. Sequence to sequence learning with neural networks. In: Proceedings of the 27th International Conference on Neural Information Processing Systems. Montreal, Canada: NIPS, 2014. 3104−3112 [15] 李航. 统计学习方法. 北京: 清华大学出版社, 2012. 25−33Li Hang. Statistical Learning Methods. Beijing: Tsinghua University Press, 2012. 25−33 [16] Cho K, van Merriënboer B, Gulcehre C, Bahdanau D, Bougares F, Schwenk H, et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation. In: Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing. Doha, Qatar: Association for Computational Linguistics, 2014. 1724−1734 [17] Fridman L, Brown D E, Angell W, Abdic I, Reimer B, Noh H Y. Automated synchronization of driving data using vibration and steering events. Pattern Recognition Letters, 2016, 75: 9-15 doi: 10.1016/j.patrec.2016.02.011 期刊类型引用(5)
1. 马晓琴,薛晓慧,罗红郊. 基于大数据分析技术的关口表计量故障识别方法研究. 微型电脑应用. 2024(06): 109-113 . 百度学术
2. 李斌,文莉莉,邬满,刘画宁,许贵林. 基于注意力机制的SK-YOLOv5海洋目标检测分类算法. 广西科学. 2023(01): 132-138 . 百度学术
3. 刘尧. 基于迭代学习的地铁车辆速度传感器故障识别. 自动化与仪表. 2023(04): 107-111 . 百度学术
4. 王力,金辉. 基于多头自注意力机制的大气数据系统多故障识别. 江苏大学学报(自然科学版). 2023(04): 444-451 . 百度学术
5. 郭祥云,连京华,李慧敏,孙凯. 基于双阶段注意力机制和LSTM的鸡舍氨气浓度预测算法. 中国农业大学学报. 2021(06): 187-195 . 百度学术
其他类型引用(9)
-