Gas Recognition and Concentration Estimation Model for Bionic Olfactory Perception System
-
摘要: 常用气体检测模型需要使用气体传感器阵列响应信号的稳态值对气体进行种类识别和浓度估计, 而在实际环境 中, 气体一般处于动态变化的状态, 气体传感器阵列响应信号难以达到稳态值或长时间维持稳定状态. 针对上述问题, 提出 一种由动态小波残差卷积神经网络(Dynamic wavelet residual convolutional neural network, DWRCNN)子模型和权重 信号自注意力(Weighted signal self-attention, WSSA)子模型组成的气体检测模型. 该模型可以直接使用气体传感器阵列 的原始动态响应信号对动态变化的气体进行成分识别, 并进一步对每种成分气体的浓度在线估计. 通过搭建的仿生嗅觉感 知系统对模型的性能进行评估, 实验结果表明, 与常用气体识别模型相比, DWRCNN能获得接近 100%气体识别准确率, 且在线训练时间短, 收敛速度快; 与常用气体浓度估计模型相比, WSSA浓度估计模型能够大幅提高气体浓度估计精度, 并 能同时对不同气体都保持较高气体浓度估计精度, 解决了动态环境中仿生嗅觉感知系统需要针对不同气体选择不同最优气 体浓度估计模型问题.Abstract: Conventional gas detection models require the use of steady-state values of the response signals of gas sensor arrays for gas recognition and gas concentration estimation, whereas in real environments, gases are typically in a state of dynamic change, making it difficult or time-consuming to achieve steady-state values for the response signals from gas sensor arrays. To address the aforementioned issues, a gas detection model consisting of dynamic wavelet residual convolutional neural networks (DWRCNN) sub-model and weighted signal self-attention (WSSA) sub-model is proposed. The model can directly identify the components of dynamically changing gases using the raw dynamic response signals from the gas sensor array, and it can also online estimate the concentration of each component gas. The performance of the model is evaluated by the self-built bionic olfactory perception system. The results demonstrate that DWRCNN achieves nearly 100% gas recognition accuracy in comparison to other prevalent gas recognition models, with a short online training time and a rapid convergence speed; The problem of selecting different optimal gas concentration estimation models for different gases in a dynamic environment for bionic olfactory perception systems is solved by the WSSA concentration estimation model, which can significantly improve the gas concentration estimation accuracy while simultaneously maintaining a very high gas concentration estimation accuracy for different gases.
-
仿生嗅觉感知系统也被称为电子鼻, 是一种模拟生物嗅觉感知系统的气体/气味分析系统[1-2]. 电子鼻主要由一系列气体传感器阵列和模式识别系统组成, 可以对气体/气味进行定性分析和定量估计[3-5]. 电子鼻在医疗诊断[6-7]、食品质量检测[8-9]、环境监测[10-11]和公共安全[12-13] 等许多应用领域中, 都发挥着重要作用. 影响电子鼻检测结果的主要因素有2个: 1)气体传感器阵列器件本身对目标气体的敏感性和选择性, 以及传感器阵列输出信号作为输入的气体识别; 2)浓度估计模型.
为了提高电子鼻对气体或气味识别的准确率, 国内外学者对搭建的气体传感器阵列器件本身进行研究. Liao等[14]使用基于聚噻吩的薄膜晶体管作为气体传感器, 可以根据蒸汽分子的大小和分子排列来识别不同种类的气体. Hu等[15]使用石墨烯等离子检测气体分子的旋转振动模式, 从而对它们进行无标签识别, 能够实时、快速识别出不同气体, 这种新方法在医疗保健和公共安全等领域发挥着关键作用, 但该研究工作不涉及气体的定量估计. Qian等[16]将传统的电子鼻技术与挥发性有机化合物预浓缩技术相结合, 设计一种基于共形传感腔的多传感器电子鼻, 能够有效提高电子鼻对VOCs气体的识别能力. Hu等[17]设计一种基于薄膜体声波谐振器传感器阵列的新型小型气相色谱检测器, 该微机电系统化学传感器具有传感性能高、尺寸小型化、功耗低等特点. 孟凡利等[18]提出一种温度调制的动态测试方法, 来提高金属氧化物传感器的选择性, 该方法能够有效改善二氧化锡传感器动态响应信号的品质.
为了提高电子鼻的性能, 学者们对气体检测模型进行了大量的研究. Xiong等[19]提出一种基于卷积尖峰神经网络的气味识别模型, 该模型结合了残差卷积神经网络的特征提取能力和尖峰神经网络的计算效率, 能够有效识别出食品中的腐败气味. Wang等[20]提出一种基于卷积神经网络和多层感知机的气体识别模型, 该模型能够达到95%的气体分类准确率. 实际工业现场获取大量异常气味数据的代价昂贵且不易收集, 一般气体检测模型对异常气味的检测会失去效果, 文献[21]介绍了基于自我表达模型和基于极端学习机的自我表达模型两种异常气味检测模型. He等[22]提出一种基于字典学习的方法来提高电子鼻的气体识别能力, 与常用气体识别模型对比, 该模型的复杂度显著降低, 且在气体识别任务中获得了较高识别准确率. Sun等[23]证明了Wilks统计量、马氏距离、线性判别分析和遗传算法可以在减少气体传感器阵列中传感器数量的同时, 获得较高气体识别准确率. Liu等[24]提出一种用于气味识别的小尺度卷积神经网络模型, 该模型无需进行数据预处理和特征降维, 对6种中国白酒的分类准确率可以达到96%. 然而, 这些模型都难以达到100%的气体识别准确率. 为了解决电子鼻中的传感器漂移问题, Zhang等[25]提出基于知识自适应的机器学习模型, 该模型的气体识别准确率达到了98%, 但这项研究工作只涉及气体定性识别, 并未进一步提出定量估计模型.
目前, 多数气体识别模型的信号预处理步骤复杂, 依赖于人工选择输入特征[26], 并且仅使用气体传感器阵列响应信号的稳态值作为输入特征, 而现实环境中气体一般是动态变化的、无规律的, 多数情况下气体传感器阵列的响应信号难以达到稳态值或保持稳态. 针对上述问题, 本文提出动态小波残差卷积神经网络(Dynamic wavelet residual convolutional neural network, DWRCNN)子模型和权重信号自注意力(Weighted signal self-attention, WSSA)子模型组成的气体检测模型DWRCNN-WSSA (Dynamic wavelet residual con-volutional neural network-weighted signal self-attention), 该模型由动态小波残差卷积神经网络气体识别子模型和权重信号自注意力(Self-attention, SA)气体浓度估计子模型组成. DWRCNN气体识别子模型直接将传感器阵列的动态响应信号转换成64 × 64像素的小波系数图像作为神经网络的输入进行气体种类识别; WSSA气体浓度估计子模型直接使用传感器阵列的动态响应信号估计各成分气体的浓度值. 该模型的气体检测流程如图1 所示, 对于未知种类的气体, 首先, 通过DWRCNN气体识别子模型对气体成分进行识别; 然后, 通过WSSA气体浓度估计子模型, 对已识别出的各成分气体进行浓度估计.
本文主要贡献如下:
1)传统的气体检测模型需要对传感器阵列动态响应信号做复杂的信号预处理步骤, 以及人工自主提取稳态信号特征作为模型的输入, 忽略大量能提高气体识别准确率和浓度估计精度的动态特征. 本文提出的DWRCNN-WSSA气体检测模型直接使用气体传感器阵列原始的动态响应信号进行气体检测, 简化了信号预处理过程, 充分利用了气体传感器阵列响应信号中丰富的动态特征信息.
2)本文提出的WSSA气体浓度估计子模型能根据气体传感器对不同气体的敏感性存在差异, 自动赋予不同传感器信号不同权重, 提高了模型的鲁棒性和浓度估计精度; 该模型使用自注意力机制作为特征提取器, 能够并行化处理数据, 加快模型的训练速度, 并从根本上解决了常用模型使用循环神经网络(Recurrent neural network, RNN)及其各种变体形式的神经网络作为特征提取器处理长时序序列存在的远距离信息丢失的问题, 提高了模型的浓度估计精度.
3)本文提出的DWRCNN-WSSA气体检测模型既能对气体进行定性识别, 又能进一步对已识别出的成分气体进行定量估计. 其中, DWRCNN气体识别子模型仅需更少训练时间就能达到接近100%的气体识别准确率; 同时, WSSA气体浓度估计子模型能够对单一气体和混合气体都保持较高浓度精度, 解决了动态环境中传统仿生嗅觉感知系统需要针对不同气体选择不同最优气体浓度估计模型问题. 2个模型都仅需要少量的标签数据即可在线使用, 降低了收集标签数据的成本.
1. 仿生嗅觉感知系统及数据采集
1.1 仿生嗅觉感知系统
为了验证本文提出的气体检测模型性能, 搭建了一个仿生嗅觉感知系统. 如图2(a)所示, 该系统主要由8个不同型号的金属氧化物半导体型气体传感器、8通道12 位A/D信号采集板和 +5 V供电电源、Labview信号采集界面组成. 其中, 气体传感器阵列详细信息见表1.
表 1 气体传感器阵列详细信息Table 1 Gas sensor array details通道编号 传感器型号 公司名称 敏感的主要气体种类 通道0 MQ135 Winsen NH3、H2S、C6H6 通道1 TGS813 FIGARO CH4、CH3CH2CH3 通道2 TGS2611 FIGARO CH4 通道3 TGS2610 FIGARO CH3CH2CH3、C4H10 通道4 TGS2620 FIGARO C2H6O、有机溶剂 通道5 TGS2600 FIGARO H2、C2H6O 通道6 TGS2602 FIGARO VOC、NH3、H2S、CH2O 通道7 MP503 Winsen C2H6O、C4H10、CH2O 系统采用STM32单片机内部自带的8通道12位A/D转换器对传感器阵列动态响应信号进行实时采样, 最大量程为10 V, 最小分辨率为2 mV, 输入阻抗为1 M$ \Omega $. 信号接口共有10个引脚, 其中2个引脚为数据采集卡与每个传感器间的共同接地引脚, 8个引脚分别为A/D转换的通道0 ~ 通道7, 它们通过USB转串口线连接计算机, 实时将传感器阵列动态响应信号传入Labview信号采集界面. 实验信号采样频率为10 Hz. 在Labview信号采集界面, 设置采样频率为10 Hz、显示精度为4位有效数字, 为了采集传感器的原始动态响应信号, 信号滤波设置为无, 该界面可以实时显示8个气体传感器的采样电压值.
为了确保实验的准确性, 搭建一个仿生嗅觉感知系统标准实验平台如图2(b)所示, 该实验平台主要由气腔控制柜及电源、15升气腔、高精度温湿度传感器、气腔环境配置软件和气源组成. 气源为100%的CO、5%的H2和95%的N2为载气的混合气体. 除此之外, 还有容积为2 L、5 L、10 L的气体采样袋和容积为10 mL、20 mL、100 mL、200 mL和500 mL的注射器以及抽气泵等实验装置, 气体采样袋主要用于收集标准气源中的气体, 注射器主要用于抽取气体采样袋中的标准气体, 并注入气腔中.
1.2 气体样本收集
在本文实验中, 气腔的温度和湿度保持在25 ℃和60%. 数据采集实验步骤如下.
1)目标气体计算. 由于实验所需的气体体积较小, 本实验采取注射器配气法. 注射器注射入气腔的目标气体体积$ V_{target} $为:
$$ \begin{equation} V_{target} = \frac{C_{target}\times V_{cavity}}{\alpha} \end{equation} $$ (1) 式中, $ C_{target} $为目标气体浓度, $ V_{cavity} $为气腔体积, $ \alpha $为目标气体和载气百分比系数.
2)实验环境配置. 将气腔的温度设置为25 ℃, 湿度设置为60%, 采样频率设置为10 Hz.
3)气体基线采集. 当气腔的温度和湿度达到设定值, 打开仿生嗅觉感知系统电源, 采集传感器阵列在当前环境下的基线响应信号5 ~ 10 s.
4)目标气体注入. 将气源中的气体通过减压阀收集到集气袋中, 然后根据式(1)计算出的$ V_{target} $, 使用注射器从集气袋中抽取相应体积的目标气体并注入气腔中, 同时打开气腔内部的风扇, 吹扫10 s后关闭.
5)实验数据采集. 气体注入时, 启动仿生嗅觉感知系统, 采集气体传感器阵列信号235 ~ 255 s.
6)腔体环境清洗. 当前数据采集完成后, 使用抽气泵抽取气腔中的环境气体, 直到传感器阵列的信号恢复到基线状态.
7)重复上述步骤4) ~ 6), 直至实验数据全部采集完成.
图3为当CO浓度为140 ppm时, CO传感器阵列的动态响应信号曲线. 在每组实验中, 气体传感器阵列信号的采集时间为235 ~ 255 s, 每个气体传感器能够采样2350 ~ 2550个信号点. 在浓度范围为0 ~ 1000 ppm 的CO气体中, 随机采样117组不同浓度下传感器阵列动态响应信号, 得到(2350 ~ 2550) × 8 × 117个CO样本数据; 在浓度范围为0 ~ 1000 ppm的H2气体中, 随机采样115组不同浓度下传感器阵列动态响应信号, 得到 (2350 ~ 2550) × 8 × 115个H2样本数据; 在浓度范围为0 ~ 500 ppm的CO气体和0 ~ 200 ppm的H2气体的混合气体中, 随机采样120组不同浓度下传感器阵列动态响应信号, 得到 (2350 ~ 2550) × 8 × 120 个CO和H2混合气体样本数据.
2. DWRCNN气体识别模型
DWRCNN气体识别模型主要由2部分组成: 1)把气体传感器阵列的动态响应信号转换成小波系数图像, 根据Mallat塔式算法, 对传感器阵列动态响应信号进行5层小波变换, 获取第5层低频系数和5层高频系数; 然后等间隔提取小波系数, 并填入64 × 64像素矩阵中, 形成64 × 64像素的小波系数图像. 2)将转换获得的小波系数图像作为DWRCNN模型的输入, 识别各气体成分.
2.1 动态响应信号转换成小波系数图像
在实际应用中, 气体传感器采集到的信号会受到各种噪声的影响, 这些噪声直接影响着气体识别的准确率. 小波变换具有抗干扰能力强、非平稳信号特征提取能力强等特点, 所以本文采用小波变换对信号进行特征提取. 小波函数有尺度参数a和平移量b两个参数, 尺度对应于频率, 平移量对应于时间, 所以小波函数的一般形式为:
$$ \begin{equation} \psi_{a, b}(t) = a^{-\frac{1}{2}}\psi\left(\frac{t-b}{a}\right) ,\;a, b\in{{\bf{R}}, a\neq0} \end{equation} $$ (2) 离散信号可以使用多分辨分析(Multi-resolution analysis, MRA)方法离散化参数a和b, 使得 $a=2 ^j$和$b= 2^jk$, 得到离散小波函数:
$$ \begin{equation} \psi_{j, k}(n) = 2^{-\frac{j}{2}}\psi\left(\frac{n-2^{j}k}{2^{j}}\right),\;j, k\in{\bf{Z}} \end{equation} $$ (3) 所以, 离散信号$f(n) $的离散小波变换系数$C _{\psi{(j, k)}} $的计算公式为:
$$ \begin{equation} C_{\psi(j, k)} = \sum\limits_{n \in {\bf{Z}}}f(n)2^{-\frac{j}{2}}\psi\left(\frac{n-2^{j}k}{2^{j}}\right) \end{equation} $$ (4) 其重构公式为:
$$ \begin{equation} f(n) = \sum\limits_{j\in {\bf{Z}}}\sum\limits_{k\in {\bf{Z}}}C_{\psi(j, k)}2^{-\frac{j}{2}}\psi\left(\frac{n-2^{j}k}{2^{j}}\right) \end{equation} $$ (5) 气体传感器阵列的动态响应信号通过小波变换, 可以分解成低频近似信号和高频细节信号. 图4是传感器阵列动态响应信号小波分解过程, 本文选用db5小波为基小波, $g(n) $和$h(n) $分别表示低通滤波器和高通滤波器, $c _i $为低频系数, $d _i $为高频系数, $i $表示小波分解层数.
图5是TGS2610在140 ppm CO下的动态响应信号曲线和相应的5层低频小波系数曲线. 可以看出, 当信号经过5层小波变换后, 其低频系数曲线可以很好地表示信号趋势, 减轻噪声的影响, 所以选择对信号做5层小波变换, 并将第5层的低频小波系数作为神经网络的输入之一. 同时, 为了不丢失动态响应信号的细节信息, 将5层高频小波系数也作为神经网络的输入. 气体传感器阵列动态响应信号$ S_{gas}(n) $可表示为:
$$ \begin{equation} S_{gas}(n) = \sum\limits_{i = 1}^{5}d_{i}(n)+c_{5}(n) \end{equation} $$ (6) 将气体传感器阵列的动态响应信号转换成小波系数图像的过程如图6所示, 具体步骤如下.
1)对气体传感器阵列采集到的动态响应信号做5层小波变换, 每个气体传感器采集到的动态响应信号可通过小波变换得到2470个高频系数和低频系数, 高频系数分别为84个$ d_5 $、160个$ d_4 $、311个$ d_3 $、613个$ d_2 $和1218个$ d_1 $, 低频系数为84个$ c_5 $, 气体传感器阵列可获得 2470 × 8个小波系数.
2)从每个气体传感器采集到的动态响应信号通过小波变换得到的2470个原始小波系数中, 等间隔提取512个新小波系数, 其中高频系数分别为21个$ d^{new}_5 $、41 个$ d^{new}_4 $、78个$ d^{new}_3 $、154个$ d^{new}_2 $ 和 197个$ d^{new}_1 $, 低频系数为21个$ c^{new}_5 $. 气体传感器阵列可获得512 × 8个新小波系数.
3)将512 × 8个新小波系数依次填入64 × 64 像素的矩阵中, 形成64 × 64像素的小波系数图像.
4)重复步骤1) ~ 3), 直至所有气体样本数据都转换成小波系数图像.
气体样本数据量为(2350 ~ 2550) × 8 × 352个, 可转换成352幅64 × 64像素的小波系数图像.
2.2 DWRCNN模型的结构及气体识别过程
DWRCNN模型的神经网络部分主要由分块卷积模块、三卷积模块、残差卷积模块和全连接模块组成. 分块卷积模块将图片分成16个16 × 16像素的图像块, 每个图像块都含有部分全局信息; 三卷积模块中含有3个卷积层, 可以逐步提取含有丰富信息的高级特征; 残差卷积模块可以获取更深层的特征并解决网络退化的问题[27]; 全连接模块可以将网络提取的特征聚集起来并解码输出最终的分类结果. DWRCNN气体识别模型结构如图7所示, 首先, 气体传感器阵列动态响应信号通过小波变换转换成小波系数图像; 然后, 小波系数图像作为神经网络的输入, 经过模型识别, 输出气体种类. 气体种类用3位二进制数来表示, 其中[0, 0, 1]表示CO, [0, 1, 0]表示H2, [1, 0, 0]表示CO和H2的混合气体. DWRCNN的具体参数和气体识别过程如下.
1)输入通道数为1、大小为64 × 64像素的小波系数图像, 经过分块卷积模块, 将图像分成16个16 × 16像素的含有部分全局信息的图像块. 在分块卷积模块中, 卷积层的卷积核大小为4 × 4, 输入通道数为1, 输出通道数为16, 步长设置为4.
2) 16个16 × 16像素的图像块进入三卷积模块, 图像块的数量、大小均保持不变, 3个卷积层的卷积核大小均为3 × 3, 输入和输出通道数均为16, 步长均设置为1, 填充方式均设置为相同填充.
3)经过三卷积模块后, 16个16 × 16像素的图像块进入残差卷积模块, 图像块的数量、大小均保持不变. 残差卷积模块中卷积层的卷积核大小为3 × 3, 输入和输出通道数均为16, 步长设置为1, 填充方式均设置为相同填充.
4)图像块被展开成一维序列, 序列长度为8196, 进入双全连接模块. 双全连接模块由2个全连接层组成, 其中第1个全连接层有1024个神经元, 第2个全连接层有3个神经元.
5)通过softmax函数, 输出气体识别结果.
3. WSSA气体浓度估计模型
3.1 自注意力机制
常用基于深度学习的气体浓度估计模型一般使用RNN及其各种变体形式的神经网络作为特征提取器提取序列的特征, 这些神经网络采取线性序列结构, 不断从前向后收集输入信息, 容易造成梯度消失、梯度爆炸和远距离信息丢失等问题. 本文提出的WSSA模型使用自注意力机制作为特征提取器, 它可以并行化处理整个输入序列, 从而减少训练时间, 并能解决RNN及其变体形式的神经网络对长时序序列进行特征提取时, 由于长期依赖性而导致的远距离信息丢失问题[28].
给定一个矩阵$x \in {\bf{R}}^{N\times d}$, 将$ x $与可学习的权重矩阵$ W_Q $、$ W_K $、$W_V \in {\bf{R}}^{d\times d}$相乘, 得到矩阵$ Q $、$ K $、$ V $$ \in $${\bf{R}}^{N\times N}$. 此时, 矩阵$ x $的第$ i $行经过自注意力机制计算后的输出为:
$$ \begin{equation} \mathcal{O}_i = \frac{\sum\limits_{j = 1}^{N}{\rm{Sim}}(Q_i, K_j)V_{j}}{\sum\limits_{j = 1}^{N}{\rm{Sim}}(Q_i, K_j)} \end{equation} $$ (7) 式中, $ i, j = 1,\cdots, N $. ${\rm{Sim}}(\cdot, \cdot)$为相似度函数, 用于计算矩阵$ Q $中每一个行向量之间的相似度. 在原始的自注意力机制中, 使用的相似度函数为:
$$ \begin{equation} {\rm{Sim}}(Q, K) = {\rm exp}(QK^{\rm T}) \end{equation} $$ (8) 将式(8)代入式(7), 可得原始自注意力(Original self-attention, OSA)机制计算的输出为:
$$ \begin{split} \mathcal{O}_i & = \frac{\sum\limits_{j = 1}^{N} {\rm exp}(Q_{i}K_j)V_{j}}{\sum\limits_{j = 1}^{N}{\rm exp}(Q_{i}K_{j})}= {\rm softmax}({Q_{i}K^{\rm T}})V \end{split} $$ (9) 根据式(9), 可以得到如图8(a)所示的原始自注意力机制计算复杂度图解. 由图8可以看出, 原始自注意力机制计算复杂度为$ {\rm O}(N^{2}d+N^{2}d) $, 当矩阵长度$ N $远大于矩阵宽度$ d $时, $ {\rm O}(N^{2}d+N^{2}d) $可近似为$ {\rm O}(N^{2}) $, 此时模型的计算复杂度与矩阵的长度$ N $呈二次增长的关系.
原始自注意力机制对长矩阵进行特征提取的计算复杂度过高. 为了降低计算复杂度, 可以采用线性自注意力机制代替原始自注意力机制. 线性自注意力机制使用可分解的相似度函数为:
$$ \begin{equation} {\rm{Sim}}(Q_{i}, K_{j}) = \phi(Q_{i})\phi^{\rm T}(K_{j}) \end{equation} $$ (10) 式中, $ \phi(\cdot) $是核函数. 则式(7)可用核函数的形式表示为:
$$ \begin{equation} \mathcal{O}_i = \frac{\sum\limits_{j = 1}^{N}(\phi(Q_i)\phi^{\rm T}(K_j))V_{j}}{\sum\limits_{j = 1}^{N} \phi(Q_i)\phi^{\rm T}(K_j)} \end{equation} $$ (11) 通过矩阵乘积特性, 可知:
$$ \begin{equation} \sum\limits_{j = 1}^{N}(\phi(Q_i)\phi^{\rm T}(K_j))V_{j} = \phi(Q_i)\left(\sum\limits_{j = 1}^{N}\phi^{\rm T}(K_j)V_{j}\right) \end{equation} $$ (12) 这使得可先计算$\phi^{\rm T}(K)V$$ \in $${\bf{R}}^{d\times d}$, 再用$ \phi(Q) $$ \in $${\bf{R}}^{N\times d}$和$\phi^{\rm T}(K)V$的计算结果相乘. 如图8(b)所示, 当矩阵长度$ N $远大于矩阵宽度$ d $时, 自注意力机制的计算复杂度与矩阵长度为线性增长的关系, 计算复杂度为$ {\rm O}(N) $.
由于本文使用气体传感器阵列的动态响应信号作为气体浓度估计模型的输入, 其中输入矩阵的长度为传感器阵列采样的信号点个数, 输入矩阵的宽度为传感器阵列中气体传感器的个数, 使得输入矩阵长度远大于输入矩阵宽度. 使用原始自注意力机制会造成计算复杂度较高问题, 所以本文采用一种线性自注意力机制 —— cos自注意力机制, 来提取序列的特征. cos自注意力机制能在降低计算复杂度的同时, 保持良好的特征提取性能[29]. cos自注意力机制使用了以下相似度函数:
$$ {\rm{Sim}}(Q_{i}, K_{j}) = \phi(Q_{i})\phi^{\rm T}(K_{j}){\rm cos}\left(\frac{\pi}{2}\times \frac{i-j}{M}\right) $$ (13) 式中, $ M\ge N $, $ \phi(\cdot) $是ReLU函数.
令$Q_{i}^{ c} \;= \;\phi(Q_{i}){\rm cos}(\frac{\pi i}{2M})$, $Q_{i}^{ s} \;=\; \phi(Q_{i}){\rm sin}(\frac{\pi i}{2M})$, $K_{i}^{ c} = \phi(K_{i}){\rm cos}(\frac{\pi i}{2M})$, $K_{i}^{ s} = \phi(K_{i}){\rm sin}(\frac{\pi i}{2M})$, 将式(13)代入式(7), 可得矩阵$ x $的第$ i $行经过cos 自注意力机制计算后的输出:
$$ \begin{equation} \mathcal{O}_i = \frac{Q_{i}^{ s}\left(\sum\limits_{j = 1}^{N}(K_{j}^{ s})^{\rm T}V_{j}\right)+Q_{i}^{ c}\left(\sum\limits_{j = 1}^{N}(K_{j}^{ c})^{\rm T}V_{j}\right)} {Q_{i}^{ s}\left(\sum\limits_{j = 1}^{N}(K_{j}^{ s})^{\rm T}\right)+Q_{i}^{ c}\left(\sum\limits_{j = 1}^{N}(K_{j}^{ c})^{\rm T}\right)} \end{equation} $$ (14) 根据式(14), 可得矩阵$ x $经过cos自注意力机制计算后的总输出为:
$$ \begin{equation} \mathcal{O} = Q^{ s}((K^{ s})^{\rm T}V)+Q^{ c}((K^{ c})^{\rm T}V) \end{equation} $$ (15) 由式(15)可以看出, cos自注意力机制可以实现线性的计算复杂度.
3.2 WSSA模型的结构及气体浓度估计过程
WSSA模型由权重分配模块、特征提取模块和全连接模块构成. 由于不同气体传感器对气体的灵敏度不同, 所以不同气体传感器的响应信号对气体浓度估计的影响也不同. 为了提高模型的气体浓度估计精度, 采用权重分配模块, 使模型自动赋予不同气体传感器获取响应信号不同权重. 权重分配模块由线性层、sigmoid非线性函数、softmax非线性函数和乘法器组成, 其中线性层和sigmoid函数可以增强模型的泛化能力, 提高模型的鲁棒性; softmax函数可以对经过线性变换和非线性变换后的信号进行归一化处理, 获得权重矩阵; 传感器阵列响应信号矩阵与权重矩阵做哈达玛积, 得到带有权重的信号矩阵. 特征提取模块由cos自注意力机制和残差连接组成, cos自注意力机制可以提取序列的特征, 残差连接可以解决模型训练时梯度消失的问题. 全连接模块由2个全连接层组成, 它可以将提取到带有权重的特征映射到样本标记空间, 并解码获得最终的气体浓度估计结果. WSSA气体浓度估计模型的结构如图9所示, 气体浓度估计过程如下.
1)输入1800个时刻的气体传感器阵列动态响应信号, 输入数据可表示为$X\in{\bf{R}}^{1\,800\times8}$. 为了降低计算复杂度, 按时间顺序, 每隔9个信号选取1个信号作为神经网络的输入, 形成输入矩阵$S\in {\bf{R}}^{180\times8}$.
2)将$ S $输入到权重分配模块, 经过线性层的线性变换、sigmoid函数非线性变换和softmax函数归一化处理, 得到一个权重矩阵$W\in{\bf{R}}^{180\times8}$, $ S $与$ W $做内积, 形成带有权重的信号矩阵$ S^{\prime} $$\in{\bf{R}}^{180\times8}$, 具体计算公式如下:
$$ \begin{equation} S^{\prime} = {\rm softmax}\left( \frac{1}{1+{\rm exp}(-(W_{L}S+b_{L}))}\right)S \end{equation} $$ (16) 式中, $ W_{L} $为权重矩阵, $ b_{L} $为偏置矩阵.
3)将权重信号矩阵$ S^{\prime} $输入到特征提取模块, 通过cos自注意力机制进行特征提取; 然后将提取的特征与$ S^{\prime} $通过加法器相连, 形成残差连接, 得到特征矩阵$ S^{\prime \prime} $$\in{\bf{R}}^{180\times8}$, 由图10和式(15)所示, 可得$ S^{\prime \prime} $的计算公式为:
$$ \begin{split} S^{\prime \prime} & = Q^{ s}((K^{ s})^{\rm T}V)+Q^{ c}((K^{ c})^{\rm T}V)+ S^{\prime}= \\ & \;\;\;\; Q^{\prime}(K^{\prime})^{\rm T}V + S^{\prime} \end{split} $$ (17) 式中, $ Q^{\prime} $为矩阵$Q^{ s}$和$Q^{ c}$在第2个维度上连接后的结果; $ (K^{\prime})^{\rm T} $为矩阵$(K^{ s})^{\rm T}$和$(K^{ c})^{\rm T}$在第1个维度上连接后的结果.
4)将$ S^{\prime \prime} $展开为1个长度为1440的特征序列, 输入到全连接模块中, 经过2层全连接解码, 得到气体浓度值. 其中, 第1个全连接层有8个神经元, 第2个全连接层的神经元个数与气体种类数相等.
4. 实验结果及常用方法对比
4.1 数据集
实验数据集含有352组不同气体的传感器阵列动态响应信号, 其中CO的传感器阵列动态响应信号117组, H2的传感器阵列动态响应信号115组, CO和H2混合气体的传感器阵列动态响应信号120组. 在气体识别实验中, 从352组不同气体的传感器阵列动态响应信号中, 随机选取211组作为训练集, 141组作为测试集. 训练集和测试集的比例约为3:2; 在气体浓度估计实验中, 从117组CO的传感器阵列动态响应信号中, 随机选取80组作为训练集, 37组作为测试集; 从115组H2的传感器阵列动态响应信号中, 随机选取80组作为训练集, 35组作为测试集; 从120组CO和H2混合气体的传感器阵列动态响应信号中, 随机选取80组作为训练集, 40组作为测试集. 3种气体的训练集与测试集的比例约为2:1. 2个模型的训练集与测试集的比例均低于传统模型常用4:1比例[30].
4.2 气体识别模型实验结果及常用方法对比
为了验证本文提出的DWRCNN气体识别模型的优越性, 将其与常用气体识别模型(如K最近邻(K-nearest neighbor, KNN)模型、支持向量机(Support vector machine, SVM)模型、随机森林(Random forests, RF) 模型、朴素贝叶斯(Naive Bayes, NB)模型)和基于深度学习的气体识别模型(如反向传播神经网络(Back propagation neural network, BPNN)模型、卷积神经网络(Convol-utional neural networks, CNN)模型[31]、胶囊网络(Capsule network, CapsNet)模型[32])进行对比. 其中KNN模型、SVM模型、RF模型、NB模型、BPNN模型的输入使用的是气体传感器阵列动态响应信号的稳态值, CNN模型和CapsNet模型的输入与DWRCNN模型相同, 是64$ \times $64像素的小波系数图像. KNN模型选择15个最近邻点, 选择径向基函数(Radial basis function, RBF)作为SVM模型的核函数, RF模型的最大迭代次数设置为15, BPNN模型的隐藏层神经元个数设置为100个.
由于气体传感器阵列采集到的信号会受到各种噪声的影响, 而小波变换具有抗干扰能力强、非平稳信号特征提取能力强等特点, DWRCNN模型采用小波变换将原始信号转换成小波系数, 能够减轻噪声对气体识别准确率的影响, 提高模型的气体识别准确率. 不同模型气体识别的混淆矩阵和准确率分别如图10和表2所示, 常用气体识别模型和BPNN模型的气体识别准确率难以达到100%. CNN和CapsNet模型的气体识别准确率虽然能够接近甚至达到100%, 但由图11可以看出, CNN和CapsNet模型的收敛速度远不如DWRCNN模型, CNN和CapsNet模型都需要训练400轮后才能获得较高气体识别准确率, 并且准确率波动较大, 而DWRCNN模型仅需要训练200轮左右即可获得100%的气体识别准确率, 并且准确率波动不大. 这表明DWRCNN模型的收敛速度更快, 准确率的稳定性更高.
表 2 不同模型的气体识别准确率 (%)Table 2 Gas recognition accuracy of different models (%)方法 KNN SVM RF NB 准确率 95.74 96.45 95.74 92.91 方法 BPNN CNN CapsNet DWRCNN 准确率 97.87 99.29 100.00 100.00 4.3 气体浓度估计模型实验结果及常用方法对比
为了验证本文提出的WSSA模型的优越性, 将其与常用气体浓度估计模型(如贝叶斯岭(Bayesian ridge, BR)模型、SVM模型、决策树(Decision tree, DT)模型、KNN模型、RF模型、Adaboost模型、梯度提升决策树(Gradient boosting decision tree, GBDT)模型、Bagging模型、XGBoost模型)和基于深度学习的气体浓度估计模型(如长短期记忆(Long short-term memory, LS-TM)模型)进行对比. 其中, LSTM模型和WSSA模型的输入是气体传感器阵列动态响应信号, 其他气体浓度估计模型是将气体传感器阵列动态响应信号经过复杂的预处理后作为输入, 处理过程可分为3个步骤: 1)从气体传感器阵列动态响应信号中提取出稳态值, 并对稳态值进行归一化; 2)使用主成分分析(Principal component analysis, PCA)对归一化后的数据进行降维, 降维结果如图12所示; 3)选择第1个和第2个主成分值作为模型的输入. RF、Adaboost、GBDT和XGBoost模型使用100个决策树, SVM模型的核函数设置为RBF. LSTM模型有2个隐藏层, 每个隐藏层有600个神经元.
为定量评估各模型的性能, 使用平均绝对误差(Mean absolute error, MAE)、均方根误差(Root mean square error, RMSE)、解释方差(Explained variance, EV)和R2作为模型评估指标. 其中, MAE和RMSE值越小、EV和R2值越接近1.000, 说明模型的气体浓度估计性能越好.
表3 ~ 表6分别给出不同气体浓度估计模型对CO、H2、气体混合物中的CO和气体混合物中的H2的浓度估计的MAE、RMSE、EV和R2值. 可以看出, 对于单一气体浓度估计, WSSA和LS-TM模型的MAE、RMSE值都低于常用气体浓度估计模型, EV和R2值也比常用气体浓度估计模型更加接近1.000, 而且WSSA模型对CO和H2浓度估计的EV和R2值都能够达到0.990以上, 而LSTM模型对CO和H2的浓度估计的EV和R2值均小于0.990. 对于混合气体中CO的浓度估计, WSSA 模型的MAE和RMSE值都小于10.000, EV和R2值都能达到0.956; 而常用气体浓度估计模型的MAE和RMSE值都接近20.000, EV和R2值约在0.500左右, 远小于1.000; LSTM模型的MAE和RMSE值都略大于10.000, EV和R2值都接近0.850. 对于混合气体中H2的浓度估计, WSSA模型也取得了更低的MAE、RMSE值和更接近1.000的EV、R2值. 在常用气体浓度估计模型中, SVM模型对CO和H2的浓度估计精度最高, XGBoost模型对混合气体中CO的浓度估计精度最高, KNN模型对混合气体中H2的浓度估计精度最高, 所有的常用气体浓度估计模型对混合气体中CO的浓度估计精度都非常低, 这反映了仿生嗅觉感知系统很难实现用一个最优的气体浓度估计模型来估计不同气体浓度, 需要统一模型, 来减少对不同气体浓度估计的误差. 本文提出的WSSA模型解决了这个问题, 它能够同时对不同气体保持较高浓度估计精度, 并且仅需要使用较少的标记数据. 为了进一步验证本文提出的WSSA模型对不同气体的浓度估计误差较小, 将不同模型的气体浓度估计值和气体浓度的实际值归一化后画出了相应的误差箱式图, 图13(a) ~ 13(d)分别为不同模型对CO、H2、混合气体中的CO和混合气体中的H2的浓度估计误差箱式图. 可以看出, 无论对哪种气体, WSSA模型的最大误差和误差整体水平在所有模型中都是最小的.
表 3 CO浓度估计指标Table 3 Metrics of CO concentration estimation方法 MAE RMSE EV ${\rm{R}}^2$ BR 6.552 8.094 0.943 0.942 SVM 4.258 7.015 0.963 0.957 DT 5.472 8.039 0.949 0.943 KNN 5.033 7.075 0.958 0.956 RF 4.713 7.074 0.959 0.956 Adaboost 5.477 7.643 0.950 0.949 GBDT 4.817 7.019 0.960 0.957 Bagging 4.760 7.061 0.959 0.956 XGBoost 4.672 7.035 0.961 0.960 OSA 3.630 4.229 0.987 0.986 LSTM 2.934 3.845 0.988 0.988 WS-LSTM 2.350 3.035 0.993 0.993 SA 2.916 3.756 0.989 0.989 WSSA 2.090 2.646 0.995 0.994 表 4 H2浓度估计指标Table 4 Metrics of H2 concentration estimation方法 MAE RMSE EV ${\rm{R}}^2$ BR 16.097 18.284 0.683 0.638 SVM 5.034 6.976 0.955 0.947 DT 5.206 8.987 0.921 0.913 KNN 6.312 8.865 0.931 0.915 RF 5.073 7.157 0.951 0.945 Adaboost 5.441 7.209 0.952 0.944 GBDT 5.687 8.444 0.931 0.923 Bagging 5.346 7.667 0.940 0.936 XGBoost 5.512 8.724 0.937 0.935 OSA 4.155 5.343 0.977 0.977 LSTM 4.264 5.305 0.974 0.973 WS-LSTM 3.781 4.457 0.985 0.984 SA 4.156 5.560 0.975 0.975 WSSA 2.360 3.028 0.993 0.992 表 5 混合气体中CO浓度估计指标Table 5 Metrics of CO concentration estimation in the gas mixture方法 MAE RMSE EV R2 BR 20.134 24.487 0.530 0.526 SVM 20.009 24.657 0.519 0.519 DT 20.537 25.746 0.515 0.476 KNN 21.236 26.701 0.443 0.436 RF 18.529 23.614 0.581 0.559 Adaboost 19.950 25.019 0.526 0.505 GBDT 20.830 26.193 0.481 0.457 Bagging 19.608 25.288 0.531 0.494 XGBoost 15.931 20.101 0.619 0.592 OSA 10.909 13.589 0.860 0.859 LSTM 10.439 14.050 0.856 0.849 WS-LSTM 7.958 11.188 0.911 0.904 SA 9.209 12.958 0.872 0.872 WSSA 6.014 7.616 0.956 0.956 表 6 混合气体中H2浓度估计指标Table 6 Metrics of H2 concentration estimation in the gas mixture方法 MAE RMSE EV R2 BR 9.956 12.378 0.897 0.897 SVM 8.008 10.106 0.931 0.931 DT 11.326 15.503 0.842 0.838 KNN 7.297 9.641 0.937 0.937 RF 7.852 10.823 0.922 0.921 Adaboost 9.120 11.582 0.915 0.909 GBDT 7.763 10.622 0.924 0.924 Bagging 8.019 11.394 0.915 0.912 XGBoost 7.840 10.089 0.932 0.931 OSA 8.886 11.720 0.912 0.910 LSTM 7.783 8.848 0.949 0.949 WS-LSTM 5.095 6.878 0.969 0.969 SA 5.906 7.776 0.960 0.960 WSSA 4.318 6.362 0.974 0.973 4.4 自注意力机制对比及权重分配模块消融实验
自注意力模型的各种变体形式往往会以牺牲模型部分性能为代价, 来降低模型的计算复杂度. 本文使用的自注意力模型利用基于余弦的距离重加权机制, 代替了原始自注意力模型中的softmax重加权机制, 为了验证该方法在降低计算复杂度的同时, 是否能够保持模型的性能, 使用OSA模型与SA模型进行对比. 由图13和表3 ~ 表6可以看出, 对于单一气体, SA模型与OSA模型的浓度估计精度相当; 对于混合气体, SA模型的浓度估计精度甚至高于OSA模型. 由此可知, 本文使用的自注意力模型能够在降低计算复杂度的同时, 保持与原始的自注意力模型相当甚至更高的性能.
为了验证本文提出的权重分配模块的有效性, 做了权重分配模块的消融实验, 使用不含权重分配模块的SA模型, 与含有权重分配模块的WSSA模型进行实验对比. 两种模型的气体浓度估计散点图如图14所示, 可以看出, 无论是混合气体, 还是单一气体, WSSA模型都比SA模型的浓度估计值与实际值更加吻合. 由图13、图14和表3 ~ 表6可以看出, WSSA模型比SA模型的气体浓度估计误差更小且精度更高, 特别是对于混合气体中CO的浓度估计. 进一步, 为了验证权重分配模块对其他基于深度学习的气体浓度估计模型是否也有效, 将LSTM模型与加权重分配模块的权重信号长短期记忆(Weighted signal long short-term memory, WS-LSTM)模型进行实验对比. 由图13、图14和表3 ~ 表6可以看出, WS-LSTM模型比LSTM模型的气体浓度估计误差更小且精度更高, 并且对混合气体中CO的浓度估计精度有了显著的提高. 由以上对比结果可以看出, 在基于深度学习的气体浓度估计模型中, 加上权重分配模块, 可以有效提高模型的气体浓度估计精度. 由图14还可以看出, WSSA模型对混合气体难以达到与单一气体相近的浓度估计精度, 这是由于传感器阵列中每个传感器的测量信号是环境中气体共同作用的结果, 当多种气体同时存在时, 就会造成气体识别和测量的误差较大. 所有模型的气体浓度估计精度都难以达到100%, 这是因为实验仪器存在误差、气源浓度存在误差、配气时气体吸附作用、A/D转换器进行信号转换时的误差和注入气体的时间与速率等都会对采集到的动态响应信号产生影响, 从而导致模型的气体浓度估计存在误差.
4.5 模型抗外界因素干扰能力实验
由于受到进气口位置和传感器阵列摆放位置等影响, 实验所采集到的动态响应信号除了含有气体的种类、浓度等特征外, 还会包含一些噪声, 所以气体检测模型需要有较强抗外界因素干扰能力. 图15(a)为气腔进气口位置示意图, 其中A、B、C为气腔底端的进气口, D为传感器摆放位置; 图15(b)为传感器阵列高度示意图, 其中E为气腔最底部, F距气腔最底部10 cm, G距气腔最底部20 cm. 为了验证模型的抗外界因素干扰能力, 本文改变了气腔进气口位置和传感器阵列在气腔中的摆放高度, 并采集相应的动态响应信号进行气体检测, 实验结果如表7 ~ 表11所示. 可以看出, 当改变气腔进气口位置或传感器阵列在气腔中的摆放高度时, 模型的气体识别准确率仍能够达到100%, 气体浓度估计精度仍能够保持较高水平, 这表明模型的抗外界因素干扰能力较强.
表 7 气体识别准确率 (%)Table 7 Gas recognition accuracy (%)气腔进气口位置 A B C 准确率 100 100 100 传感器阵列摆放高度 E F G 准确率 100 100 100 表 8 气腔进气口位置不同时单一气体浓度估计的指标Table 8 Metrics for concentration estimation of single gas with different gas cavity inlet positions进气口位置 气体种类 MAE RMSE EV R2 A CO 2.090 2.646 0.995 0.994 H2 2.360 3.028 0.993 0.992 B CO 2.326 3.017 0.994 0.994 H2 2.287 2.898 0.994 0.994 C CO 2.185 2.812 0.995 0.994 H2 2.419 3.177 0.992 0.992 表 9 气腔进气口位置不同时混合气体浓度估计的指标Table 9 Metrics for concentration estimation of mixed gases with different gas cavity inlet positions进气口位置 气体种类 MAE RMSE EV R2 A CO 6.014 7.616 0.956 0.956 H2 4.318 6.362 0.974 0.973 B CO 5.679 6.899 0.963 0.962 H2 4.562 6.713 0.973 0.973 C CO 5.878 7.256 0.961 0.961 H2 4.785 6.896 0.972 0.972 表 10 传感器阵列摆放高度不同时单一气体浓度估计指标Table 10 Metrics for concentration estimation of single gas with different sensor array placement heights高度 气体种类 MAE RMSE EV R2 E CO 2.090 2.646 0.995 0.994 H2 2.360 3.028 0.993 0.992 F CO 2.283 2.878 0.994 0.994 H2 2.226 2.873 0.994 0.994 G CO 2.375 3.122 0.993 0.993 H2 2.451 3.163 0.992 0.992 表 11 传感器阵列摆放高度不同时混合气体浓度估计指标Table 11 Metrics for concentration estimation of mixed gases with different sensor array placement heights高度 气体种类 MAE RMSE EV R2 E CO 6.014 7.616 0.956 0.956 H2 4.318 6.362 0.974 0.973 F CO 6.323 8.012 0.955 0.955 H2 4.619 6.992 0.972 0.972 G CO 6.225 7.896 0.956 0.955 H2 4.673 7.105 0.972 0.972 4.6 模型的长期稳定性实验
用气体传感器阵列对气体进行检测时, 传感器测量信号中夹杂着漂移干扰, 直接影响气体检测的精度. 导致传感器漂移的因素有很多, 主要包括环境温湿度的改变和气敏材料的老化等, 其中, 气敏材料的老化对模型的长期稳定性具有较大影响. 为了测试模型的长期稳定性, 在相同的温度和湿度条件下, 进行了3次重复性信号采集实验, 每次信号采集实验时间间隔为30天.
本文模型的气体检测实验结果如表12 ~ 表14所示, 可以看出, 随着时间的增长, 模型仍能保持较高气体识别准确率, 使用第3次采集的动态响应信号进行气体识别时, 准确率能达到99.29%, 但模型的气体浓度估计精度略有降低. 总之, 气敏元件的老化会在一定程度上影响模型的气体检测性能, 但本文模型的气体检测精度仍然较高, 表明模型的长期稳定性较高.
表 12 本文模型的气体识别准确率 (%)Table 12 Gas recognition accuracy of our model (%)信号采集 第1次 第2次 第3次 准确率 100.00 100.00 99.29 表 13 单一气体浓度估计指标Table 13 Metrics for concentration estimation of single gas信号采集 气体种类 MAE RMSE EV R2 第1次 CO 2.090 2.646 0.995 0.994 H2 2.360 3.028 0.993 0.992 第2次 CO 2.512 3.283 0.992 0.992 H2 2.814 3.684 0.991 0.991 第3次 CO 2.985 3.872 0.989 0.989 H2 3.350 4.115 0.988 0.987 表 14 混合气体浓度估计指标Table 14 Metrics for concentration estimation of mixed gases信号采集 气体种类 MAE RMSE EV R2 第1次 CO 6.014 7.616 0.956 0.956 H2 4.318 6.362 0.974 0.973 第2次 CO 6.711 8.813 0.941 0.940 H2 5.157 6.972 0.967 0.967 第3次 CO 7.016 9.437 0.934 0.934 H2 5.815 7.654 0.962 0.962 5. 结束语
本文提出一种由DWRCNN气体识别子模型和WSSA气体浓度估计子模型组成的气体检测模型. 与传统的气体检测模型不同, 该模型无需对气体传感器阵列动态响应信号进行处理, 直接使用原始动态响应信号进行气体识别和气体浓度估计. 该模型使用少量的标签数据训练, 就可以获得接近100%的气体识别准确率和较高气体浓度估计精度.
在气体识别任务中, DWRCNN气体识别模型能将传感器阵列的动态响应信号直接转换成64$ \times $64像素的小波系数图像, 进行气体识别. 该模型仅训练200轮左右, 就能够达到100%的气体识别准确率并保持稳定; 在气体浓度估计实验中, 首先, WSSA气体浓度估计模型通过权重分配模块自动赋予不同传感器获取的动态响应信号不同权重; 然后, 使用自注意力机制提取权重信号特征; 最后, 通过全连接模块解码气体浓度值. 该模型对单一气体和混合气体都能达到较高浓度估计精度. 实验验证了本文提出的权重分配模块同样适用于其他基于深度学习的气体浓度估计模型, 能够提高气体浓度估计精度, 并且模型的抗外界因素干扰能力较强, 长期稳定性较高.
-
表 1 气体传感器阵列详细信息
Table 1 Gas sensor array details
通道编号 传感器型号 公司名称 敏感的主要气体种类 通道0 MQ135 Winsen NH3、H2S、C6H6 通道1 TGS813 FIGARO CH4、CH3CH2CH3 通道2 TGS2611 FIGARO CH4 通道3 TGS2610 FIGARO CH3CH2CH3、C4H10 通道4 TGS2620 FIGARO C2H6O、有机溶剂 通道5 TGS2600 FIGARO H2、C2H6O 通道6 TGS2602 FIGARO VOC、NH3、H2S、CH2O 通道7 MP503 Winsen C2H6O、C4H10、CH2O 表 2 不同模型的气体识别准确率 (%)
Table 2 Gas recognition accuracy of different models (%)
方法 KNN SVM RF NB 准确率 95.74 96.45 95.74 92.91 方法 BPNN CNN CapsNet DWRCNN 准确率 97.87 99.29 100.00 100.00 表 3 CO浓度估计指标
Table 3 Metrics of CO concentration estimation
方法 MAE RMSE EV ${\rm{R}}^2$ BR 6.552 8.094 0.943 0.942 SVM 4.258 7.015 0.963 0.957 DT 5.472 8.039 0.949 0.943 KNN 5.033 7.075 0.958 0.956 RF 4.713 7.074 0.959 0.956 Adaboost 5.477 7.643 0.950 0.949 GBDT 4.817 7.019 0.960 0.957 Bagging 4.760 7.061 0.959 0.956 XGBoost 4.672 7.035 0.961 0.960 OSA 3.630 4.229 0.987 0.986 LSTM 2.934 3.845 0.988 0.988 WS-LSTM 2.350 3.035 0.993 0.993 SA 2.916 3.756 0.989 0.989 WSSA 2.090 2.646 0.995 0.994 表 4 H2浓度估计指标
Table 4 Metrics of H2 concentration estimation
方法 MAE RMSE EV ${\rm{R}}^2$ BR 16.097 18.284 0.683 0.638 SVM 5.034 6.976 0.955 0.947 DT 5.206 8.987 0.921 0.913 KNN 6.312 8.865 0.931 0.915 RF 5.073 7.157 0.951 0.945 Adaboost 5.441 7.209 0.952 0.944 GBDT 5.687 8.444 0.931 0.923 Bagging 5.346 7.667 0.940 0.936 XGBoost 5.512 8.724 0.937 0.935 OSA 4.155 5.343 0.977 0.977 LSTM 4.264 5.305 0.974 0.973 WS-LSTM 3.781 4.457 0.985 0.984 SA 4.156 5.560 0.975 0.975 WSSA 2.360 3.028 0.993 0.992 表 5 混合气体中CO浓度估计指标
Table 5 Metrics of CO concentration estimation in the gas mixture
方法 MAE RMSE EV R2 BR 20.134 24.487 0.530 0.526 SVM 20.009 24.657 0.519 0.519 DT 20.537 25.746 0.515 0.476 KNN 21.236 26.701 0.443 0.436 RF 18.529 23.614 0.581 0.559 Adaboost 19.950 25.019 0.526 0.505 GBDT 20.830 26.193 0.481 0.457 Bagging 19.608 25.288 0.531 0.494 XGBoost 15.931 20.101 0.619 0.592 OSA 10.909 13.589 0.860 0.859 LSTM 10.439 14.050 0.856 0.849 WS-LSTM 7.958 11.188 0.911 0.904 SA 9.209 12.958 0.872 0.872 WSSA 6.014 7.616 0.956 0.956 表 6 混合气体中H2浓度估计指标
Table 6 Metrics of H2 concentration estimation in the gas mixture
方法 MAE RMSE EV R2 BR 9.956 12.378 0.897 0.897 SVM 8.008 10.106 0.931 0.931 DT 11.326 15.503 0.842 0.838 KNN 7.297 9.641 0.937 0.937 RF 7.852 10.823 0.922 0.921 Adaboost 9.120 11.582 0.915 0.909 GBDT 7.763 10.622 0.924 0.924 Bagging 8.019 11.394 0.915 0.912 XGBoost 7.840 10.089 0.932 0.931 OSA 8.886 11.720 0.912 0.910 LSTM 7.783 8.848 0.949 0.949 WS-LSTM 5.095 6.878 0.969 0.969 SA 5.906 7.776 0.960 0.960 WSSA 4.318 6.362 0.974 0.973 表 7 气体识别准确率 (%)
Table 7 Gas recognition accuracy (%)
气腔进气口位置 A B C 准确率 100 100 100 传感器阵列摆放高度 E F G 准确率 100 100 100 表 8 气腔进气口位置不同时单一气体浓度估计的指标
Table 8 Metrics for concentration estimation of single gas with different gas cavity inlet positions
进气口位置 气体种类 MAE RMSE EV R2 A CO 2.090 2.646 0.995 0.994 H2 2.360 3.028 0.993 0.992 B CO 2.326 3.017 0.994 0.994 H2 2.287 2.898 0.994 0.994 C CO 2.185 2.812 0.995 0.994 H2 2.419 3.177 0.992 0.992 表 9 气腔进气口位置不同时混合气体浓度估计的指标
Table 9 Metrics for concentration estimation of mixed gases with different gas cavity inlet positions
进气口位置 气体种类 MAE RMSE EV R2 A CO 6.014 7.616 0.956 0.956 H2 4.318 6.362 0.974 0.973 B CO 5.679 6.899 0.963 0.962 H2 4.562 6.713 0.973 0.973 C CO 5.878 7.256 0.961 0.961 H2 4.785 6.896 0.972 0.972 表 10 传感器阵列摆放高度不同时单一气体浓度估计指标
Table 10 Metrics for concentration estimation of single gas with different sensor array placement heights
高度 气体种类 MAE RMSE EV R2 E CO 2.090 2.646 0.995 0.994 H2 2.360 3.028 0.993 0.992 F CO 2.283 2.878 0.994 0.994 H2 2.226 2.873 0.994 0.994 G CO 2.375 3.122 0.993 0.993 H2 2.451 3.163 0.992 0.992 表 11 传感器阵列摆放高度不同时混合气体浓度估计指标
Table 11 Metrics for concentration estimation of mixed gases with different sensor array placement heights
高度 气体种类 MAE RMSE EV R2 E CO 6.014 7.616 0.956 0.956 H2 4.318 6.362 0.974 0.973 F CO 6.323 8.012 0.955 0.955 H2 4.619 6.992 0.972 0.972 G CO 6.225 7.896 0.956 0.955 H2 4.673 7.105 0.972 0.972 表 12 本文模型的气体识别准确率 (%)
Table 12 Gas recognition accuracy of our model (%)
信号采集 第1次 第2次 第3次 准确率 100.00 100.00 99.29 表 13 单一气体浓度估计指标
Table 13 Metrics for concentration estimation of single gas
信号采集 气体种类 MAE RMSE EV R2 第1次 CO 2.090 2.646 0.995 0.994 H2 2.360 3.028 0.993 0.992 第2次 CO 2.512 3.283 0.992 0.992 H2 2.814 3.684 0.991 0.991 第3次 CO 2.985 3.872 0.989 0.989 H2 3.350 4.115 0.988 0.987 表 14 混合气体浓度估计指标
Table 14 Metrics for concentration estimation of mixed gases
信号采集 气体种类 MAE RMSE EV R2 第1次 CO 6.014 7.616 0.956 0.956 H2 4.318 6.362 0.974 0.973 第2次 CO 6.711 8.813 0.941 0.940 H2 5.157 6.972 0.967 0.967 第3次 CO 7.016 9.437 0.934 0.934 H2 5.815 7.654 0.962 0.962 -
[1] Jing Y Q, Meng Q H, Qi P F, Cao M L, Zeng M, Ma S G. A bioinspired neural network for data processing in an electronic nose. IEEE Transactions on Instrumentation and Measurement, 2016, 65(10): 2369−2380 doi: 10.1109/TIM.2016.2578618 [2] Persaud K, Dodd G. Analysis of discrimination mechanisms in the mammalian olfactory system using a model nose. Nature, 1982, 299(5881): 352−355 doi: 10.1038/299352a0 [3] Jiang X, Jia P F, Luo R D, Deng B, Duan S K, Jia Y. A novel electronic nose learning technique based on active learning: EQBC-RBFNN. Sensors and Actuators B: Chemical, 2017, 249: 533−541 doi: 10.1016/j.snb.2017.04.072 [4] Zhang L, Zhang D. Efficient solutions for discreteness, drift, and disturbance (3D) in electronic olfaction. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2018, 48(2): 242−254 doi: 10.1109/TSMC.2016.2597800 [5] Zhang L, Tian F C, Kadri C, Guang S P, Li H J, Pan L. Gases concentration estimation using heuristics and bio-inspired optimization models for experimental chemical electronic nose. Sensors and Actuators B: Chemical, 2011, 160(1): 760−770 doi: 10.1016/j.snb.2011.08.060 [6] Buma A I, Muller M, de Vries R, Sterk P J, van der Noort V, Wolf-Lansdorf M, et al. eNose analysis for early immunotherapy response monitoring in non-small cell lung cancer. Lung Cancer, 2021, 160: 36−43 doi: 10.1016/j.lungcan.2021.07.017 [7] Lee J M, Choi E J, Chung J H, Lee K W, Lee Y, Kim Y J, et al. A DNA-derived phage nose using machine learning and artificial neural processing for diagnosing lung cancer. Biosensors and Bioelectronics, 2021, 194: Article No. 113567 doi: 10.1016/j.bios.2021.113567 [8] Xu M, Wang J, Zhu L. Tea quality evaluation by applying E-nose combined with chemo-metrics methods. Journal of Food Science and Technology, 2021, 58: 1549−1561 doi: 10.1007/s13197-020-04667-0 [9] Sanaeifar A, Li X L, He Y, Huang Z X, Zhan Z H. A data fusion approach on confocal Raman micro-spectroscopy and electronic nose for quantitative evaluation of pesticide residue in tea. Biosystems Engineering, 2021, 210: 206−222 doi: 10.1016/j.biosystemseng.2021.08.016 [10] Ari D, Alagoz B B. An effective integrated genetic programming and neural network model for electronic nose calibration of air pollution monitoring application. Neural Computing and Applications, 2022, 34(15): 12633−12652 doi: 10.1007/s00521-022-07129-0 [11] 高月, 宿翀, 李宏光. 一类基于非线性PCA和深度置信网络的混合分类器及其在PM2.5浓度预测和影响因素诊断中的应用. 自动化学报, 2018, 44(2): 318−329 doi: 10.16383/j.aas.2018.c160045Gao Yue, Su Chong, Li Hong-Guang. A kind of deep belief networks based on nonlinear features extraction with application to PM2.5 concentration prediction and diagnosis. Acta Automatica Sinica, 2018, 44(2): 318−329 doi: 10.16383/j.aas.2018.c160045 [12] Patil S J, Duragkar N, Rao V R. An ultra-sensitive piezoresistive polymer nano-composite micro-cantilever sensor electronic nose platform for explosive vapor detection. Sensors and Actuators B: Chemical, 2014, 192: 444−451 doi: 10.1016/j.snb.2013.10.111 [13] Yan K, Zhang D. Improving the transfer ability of prediction models for electronic noses. Sensors and Actuators B: Chemical, 2015, 220: 115−124 doi: 10.1016/j.snb.2015.05.060 [14] Liao F, Yin S, Toney M F, Subramanian V. Physical discrimination of amine vapor mixtures using polythiophene gas sensor arrays. Sensors and Actuators B: Chemical, 2010, 150: 254−263 doi: 10.1016/j.snb.2010.07.006 [15] Hu H, Yang X X, Guo X D, Khaliji K, Biswas S R, Javier García de Abajo F, et al. Gas identification with graphene plasmons. Nature Communication, 2019, 10(1): 1−7 doi: 10.1038/s41467-018-07882-8 [16] Qian J H, Tian F C, Luo Y, Lu M C, Zhang A L. A novel multi-sensor detection system design for low concentrations of volatile organic compounds. IEEE Transactions on Industrial Electronics, 2021, 69(5): 5314−5324 [17] Hu J Z, Qu H M, Chang Y, Pang W, Zhang Q K, Liu J, et al. Miniaturized polymer coated film bulk acoustic wave resonator sensor array for quantitative gas chromatographic analysis. Sensors and Actuators B: Chemical, 2018, 274: 419−426 doi: 10.1016/j.snb.2018.07.162 [18] 孟凡利, 季瀚洋, 苑振宇, 张华, 王稼鹏. 二氧化锡传感器对挥发性有机物的动态测试方法研究. 自动化学报, 2022, 48(3): 926−934Meng Fan-Li, Ji Han-Yang, Yuan Zhen-Yu, Zhang Hua, Wang Jia-Peng. Study on dynamic testing method of volatile organic compounds by tin dioxide sensor. Acta Automatica Sinica, 2022, 48(3): 926−934 [19] Xiong Y Z, Chen Y T, Chen C M, Wei X W, Xue Y Y, Wan H, et al. An odor recognition algorithm of electronic noses based on convolutional spiking neural network for spoiled food identification. Journal of the Electrochemical Society, 2021, 168(7): Article No. 077519 doi: 10.1149/1945-7111/ac1699 [20] Wang S H, Chou T I, Tang K T. Using a hybrid deep neural network for gas classification. IEEE Sensors Journal, 2021, 21(5): 6401−6407 doi: 10.1109/JSEN.2020.3038304 [21] Zhang L, Deng P L. Abnormal odor detection in electronic nose via self-expression inspired extreme learning machine. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2017, 49(10): 1922−1932 [22] He A X, Wei G F, Yu J, Tang Z N, Lin Z H, Wang P J. A novel dictionary learning method for gas identification with a gas sensor array. IEEE Transactions on Industrial Electronics, 2017, 64(12): 9709−9715 doi: 10.1109/TIE.2017.2748034 [23] Sun H, Tian F C, Liang Z F, Sun T, Yu B, Yang S X, et al. Sensor array optimization of electronic nose for detection of bacteria in wound infection. IEEE Transactions on Industrial Electronics, 2017, 64(9): 7350−7358 doi: 10.1109/TIE.2017.2694353 [24] Liu Y J, Meng Q H, Zhang X N. Data processing for multiple electronic noses using sensor response visualization. IEEE Sensors Journal, 2018, 18(22): 9360−9369 doi: 10.1109/JSEN.2018.2871599 [25] Zhang L, Zhang D. Domain adaptation extreme learning machines for drift compensation in E-nose systems. IEEE Transactions on Instrumentation and Measurement, 2014, 64(7): 1790− 1801 [26] Liu Y J, Meng Q H, Qi P F, Sun B, Zhu X S. Using spike-based bio-inspired olfactory model for data processing in electronic noses. IEEE Sensors Journal, 2017, 18(2): 692−702 [27] He K M, Zhang X Y, Ren S Q, Sun J. Deep residual learning for image recognition. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA: IEEE, 2016. 770−778 [28] Vaswani A, Shazeer N, Parmar N, Uszkoreit J, Jones L, Gomez A N, et al. Attention is all you need. In: Proceedings of the 35th International Conference on Neural Information Processing Systems. Long Beach, USA: NIPS, 2017. 5998−6008 [29] Qin Z, Sun W X, Deng H, Li D X, Wei Y S, Lv B H, et al. cosFormer: Rethinking softmax in attention. In: Proceedings of the 10th International Conference on Learning Representations. Virtual Event: 2022. [30] Crowther P S, Cox R J. A method for optimal division of data sets for use in neural networks. In: Proceedings of the 9th International Conference on Knowledge-based and Intelligent Information and Engineering Systems. Melbourne, Australia: Springer, 2005. 1−7 [31] Zhang W W, Wang L, Chen J, Xiao W X, Bi X. A novel gas recognition and concentration detection algorithm for artificial olfaction. IEEE Transactions on Instrumentation and Measurem-ent, 2021, 70: 1−14 [32] Zhang W W, Xiang H T, Wang Y X, Bi X, Zhang Y Z, Zhang P J, et al. A signal response visualization gas recognition algorithm based on a wavelet transform coefficient map-capsule network for artificial olfaction. IEEE Sensors Journal, 2022, 22(15): 14717−14726 doi: 10.1109/JSEN.2022.3184963 -