一种基于概率关联的局部高斯过程回归算法

肖文鑫; 张文文

doi:10.16383/j.aas.c190445

一种基于概率关联的局部高斯过程回归算法

doi: 10.16383/j.aas.c190445

肖文鑫^1,,
张文文^2,

1.
北京大学计算机学院北京 100871
2.
同济大学电子与信息工程学院上海 201804

详细信息

作者简介:
肖文鑫：北京大学计算机学院博士研究生. 主要研究方向为软件工程和机器学习. E-mail: wenxin.xiao@stu.pku.edu.cn

张文文：同济大学电子与信息工程学院博士研究生. 主要研究方向为传感器检测技术与测量系统. 本文通信作者. E-mail: zhangwenwen_1203@163.com

计量
- 文章访问数: 747
- HTML全文浏览量: 292
- PDF下载量: 293
- 被引次数: 0
出版历程
- 收稿日期: 2019-06-17
- 录用日期: 2019-10-16
- 网络出版日期: 2022-07-08
- 刊出日期: 2022-06-01

A Local Gaussian Regression Algorithm Based on Probability Association

XIAO Wen-Xin^1
,,
ZHANG Wen-Wen^2
,

1.
School of Computer Science, Peking University, Beijing 100871
2.
College of Electronics and Information Engineering, Tongji University, Shanghai 201804

More Information

Author Bio:
XIAO Wen-Xin　Ph.D. candidate at the School of Computer Science, Peking University. His research interest covers software engineering and machine learning

ZHANG Wen-Wen　Ph.D. candidate at the College of Electronic and Information Engineering, Tongji University. His research interest covers sensor detection technology and measurement system. Corresponding author of this paper

摘要

摘要: 在针对控制和机器人的机器学习任务中, 高斯过程回归是一种常用方法, 具有无参数学习技术的优点. 然而, 它在面对大量训练数据时存在计算量大的缺点, 因此并不适用于实时更新模型的情况. 为了减少这种计算量, 使模型能够通过实时产生的大量数据不断更新, 本文提出了一种基于概率关联的局部高斯过程回归算法. 与其他局部回归模型相比, 该算法通过对多维局部空间模型边界的平滑处理, 使用紧凑支持的概率分布来划分局部模型中的数据, 得到了更好的预测精度. 另外, 还对更新预测矢量的计算方法进行了改进, 并使用k-d树最近邻搜索减少数据分配和预测的时间. 实验证明, 该算法在保持全局高斯过程回归预测精度的同时, 显著提升了计算效率, 并且预测精度远高于其他局部高斯过程回归模型. 该模型能够快速更新和预测, 满足工程中的在线学习的需求.
- 机器学习 /
- 概率模型 /
- 大数据量 /
- 实时更新
Abstract: Gaussian regression is a common method in machine learning tasks for control and robotics, with the advantage of being a parametric learning technique. However, it has the disadvantage of being computationally intensive when faced with a large amount of training data, and thus is not suitable for the case of updating the model in real time. In order to reduce this amount of computation and realize the continuous updating of the model using a large amount of data generated in real time, this paper proposes a local regression algorithm based on probability correlation. Compared with other local regression models, the algorithm uses the tightly supported probability distribution to divide the data in the local model by smoothing the boundary of the multi-dimensional local space model and obtains better prediction accuracy. In addition, the calculation method of updating the prediction vector is improved, and the k-d tree nearest neighbor search is used to reduce the time of data allocation and prediction. Experiments show that the proposed algorithm improves the computational efficiency while maintaining the global regression prediction accuracy, and the prediction accuracy is much higher than other local regression models.
- Machine learning /
- probabilistic models /
- large data volumes /
- real-time update

HTML全文

在雾天采集到的图像会出现对比度降低、颜色退化、细节丢失等问题, 严重影响目标检测、自动驾驶、视频监控和遥感等户外计算机视觉系统的性能. 因此, 雾天图像复原具有重要的研究意义.

随着图像去雾方法不断发展, 可将现有方法分为基于图像增强的方法、基于图像复原的方法和基于深度学习的方法. 基于图像增强的去雾方法不考虑雾天图像退化机理, 仅仅是从空域或频域对图像进行处理, 来增强图像的对比度或对图像进行颜色校正. 常见方法有直方图均衡化^[1]、Retinex算法^[2]、同态滤波^[3]算法等. 以上方法均未考虑图像退化原因, 直接对有雾图进行处理, 会出现颜色失真、去雾不彻底等问题.

基于图像复原的方法以大气散射模型为基础, 把图像去雾转化为估计模型参数. He等^[4]提出暗通道先验理论, 能实现简单、快速去雾; Tarel等^[5]借助中值滤波估计透射率, 并通过大气散射模型得到去雾图像. Zhu等^[6]提出颜色衰减先验理论, 学习线性函数来预测有雾图像的深度. Berman等^[7]提出一种非局部先验去雾方法. 张小刚等^[8]结合双区域滤波和图像融合提出一种去雾算法, 可有效减少晕轮效应. 汪云飞等^[9]借助超像素分割提高了透射率估计精度. 该类方法虽然取得了一定的效果, 但在先验假设不成立的情况下, 难以准确恢复无雾图像.

基于深度学习的方法通过在大规模数据集上训练卷积神经网络(Convolutional neural networks, CNN)来估计无雾图像. Cai等^[10]和Ren等^[11]构建CNN估计透射率, 并代入成像模型得到复原图像. 但其将大气光设置为全局常量, 去雾后的图像易出现伪影和颜色失真等问题. Zhang等^[12]构建一种密集连接金字塔网络, 可同时估计透射率和大气光值. Li等^[13]将透射率和大气光组合为一个变量K, 构建一种轻量级网络AODNet估计K. 上述方法均基于物理模型构建CNN估计变量, 这在一定程度上会限制网络的学习能力. Chen等^[14]在引入平滑扩张卷积的基础上, 提出了一种端到端的门控上/下文聚合网络, 可融合不同层次的特征. Liu等^[15]构建了一种基于注意力机制的多尺度网格网络, 该网络采用并行多尺度机制, 解决了串行多尺度网络中普遍存在的误差传递问题, 但该网络忽略了非相邻尺度之间的联系. Dong等^[16]基于大气散射模型设计了一种特征去雾单元, 但物理模型的限制仍会在一定程度上削弱网络的学习能力. Yang等^[17]通过聚合多尺度特征图来重建无雾图像, 但该网络结构较简单且需对原图进行多次下采样, 易造成图像细节丢失. 此类端到端方法可以不受物理模型的限制, 直接学习有雾−无雾图像之间的映射关系, 但仍存在感受野有限、结构信息丢失等问题, 网络聚合不同尺度特征信息的能力有待加强.

为了增大网络感受野以充分提取图像空间上/下文信息, 进而实现对目标图像更精准的预测, 多尺度端到端网络得到了广泛应用. 但现有多尺度去雾网络往往忽略了子网络感受野大小不同导致的特征信息差异, 直接将低分辨率特征与高分辨率特征进行融合. Liu等^[15]采用一种注意力机制, 将各级子网络特征图由低分辨率子网络向高分辨率子网络进行逐级相加. Deng等^[18]将相邻子网络生成的特征图直接相加, 再输入到基础模块进行融合. 可以发现, 该类方法直接合并各级特征图后, 小尺度网络提取到的信息在融合特征中的占比减小, 削弱了小尺度网络感受野较大的优势, 造成图像结构信息丢失, 无法准确识别较大特征目标, 出现去雾不彻底和颜色失真现象.

基于此, 本文提出一种基于误差回传机制的多尺度去雾网络. 首先, 为了提高网络识别大尺度特征目标的准确性, 设计误差回传模块(Error-backward block, EB)生成包含丰富结构信息和上/下文信息的误差图, 并用其指导大尺度子网络训练, 增大结构信息在合并特征中的占比. 现有直接融合策略和本文基于误差回传策略的多尺度网络结构如图1所示. 可以看出, 误差回传模块通过生成误差图, 实现各子网络之间的交互. 同时, 考虑到真实有雾图像雾气分布不均匀等特点, 本文设计一种雾霾感知单元(Haze aware unit, HAU), 将密集残差块与雾浓度自适应检测块(Haze density adaptive detection block, HDADB)相结合, 可识别浓雾区域和薄雾区域并据此调整去雾强度, 实现自适应去雾. 另外, 为了灵活高效复用各子网络特征, 使用门控融合模块(Gated fusion module, GFM)抑制噪声干扰, 这也是首次尝试将门控网络用于多尺度去雾特征图融合.

图 1 直接融合策略和误差回传策略示意图

Fig. 1 Illustration of direct-integration strategy and error-backward strategy for multi-scale network

下载: 全尺寸图片幻灯片

1. 本文方法

本文提出的基于误差回传机制的多尺度去雾网络结构如图2所示. 网络包括误差回传多尺度去雾组(Error-backward multi-scale dehazing group, EMDG)、 GFM和优化模块. EMDG共有3个不同尺度的子网络, 各子网络以HAU为核心, 并设计EB实现各子网络之间的交互; 门控融合模块用于融合所有子网络的输出; 优化模块采用Unet^[19]结构, 将初步去雾结果进一步优化.

图 2 基于误差回传机制的多尺度去雾网络

Fig. 2 Architecture of multi-scale dehazing network based on error-backward mechanism

下载: 全尺寸图片幻灯片

1.1 误差回传模块

为了补充大尺度网络缺失的结构信息和上/下文信息, 本文设计了误差回传模块, 将小尺度网络提取的信息回传至大尺度网络. 如图2所示, 各尺度子网络均包含三个串联的雾霾感知单元, 除最小尺度子网络外, 所有雾霾感知单元的输出都由EB进行修正.

EB模块具体结构如图3所示. 首先计算高/低分辨率特征图之间的差值生成误差图, 并将误差图向上回传, 将之与高分辨率特征图进行合并, 实现对结构信息和空间上/下文信息的复用. 另外, 图2网络中每列雾霾感知单元工作的前提是其前一列单元均已完成特征提取任务, 这在增加网络深度的同时, 也可避免小尺度网络中间特征信息丢失. EB模块具体算法可表示为:

图 3 误差回传模块结构

Fig. 3 Architecture of the error-backward block

下载: 全尺寸图片幻灯片

$$ X = {X_1} + {\text{Up}}[{\text{Down}}({X_1}) - {X_2}] $$

(1)

式中, $ {X_1} $代表大尺度子网络特征图, $ {X_2} $代表小尺度子网络特征图, $ {X_2} $的大小是$ {X_1} $的1/2. 如图3所示, ${\text{Down}}$表示下采样操作, 由图3中的Conv1和Conv2完成对特征图$ {X_1} $进行1/2下采样. 计算${\text{Down}}({X_1})$与$ {X_2} $的差值并将其记作误差图, 误差图中包含了大尺度子网络中缺失的特征信息. 随后, 使用${\text{Up}}$对误差图上采样, ${\text{Up}}$由Deconv3和Conv4组成, 将${\text{Up}}$输出结果反馈给大尺度子网络, 指导大尺度子网络训练. $ X $为修正后的输出, 此过程可实现对大尺度子网络所缺失的结构信息进行及时补充.

1.2 雾霾感知单元

真实场景中雾气分布通常是不均匀的, 若能区分出浓雾和薄雾区域, 便可实现高效灵活去雾. 为此, 本文设计一种雾霾感知单元, 具体结构如图4所示. HAU由残差密集块(Residual dense block, RDB)和HDADB组成. RDB采用密集连接和残差学习机制, 能够多次连接浅层和深层特征, 充分提取图像的细节特征和局部特征. HDADB通过识别某区域的雾浓度大小并据此决定对该区域的去雾强度, 可彻底地去除浓雾区域的雾气, 同时能够有效避免对薄雾区域进行过度去雾.

图 4 雾霾感知单元结构

Fig. 4 The structure of the haze aware unit

下载: 全尺寸图片幻灯片

1.2.1 残差密集块

残差密集块由5个卷积层密集连接组成, 具体结构如图5所示. 密集连接机制可实现对浅层特征的多次复用, 同时也利于加快网络收敛. 前4个卷积层用来提取图像中包含的大量信息, 均采用3 × 3的卷积核; 最后一个卷积层用于改变特征图的通道数, 采用1 × 1的卷积核, 输出通道数为16. 所有卷积层步长均设置为1.

图 5 残差密集块结构

Fig. 5 The structure of the residual dense block

下载: 全尺寸图片幻灯片

1.2.2 雾浓度自适应检测块

雾浓度自适应检测块包括雾浓度逐通道检测和逐像素检测, 如图6所示. 在模块前端, 逐通道检测雾浓度分布. 针对浓雾通道, 增大其特征图复用程度, 对薄雾通道则减少其复用. 具体运算过程如下:

图 6 雾浓度自适应检测块结构

Fig. 6 The structure of the haze density adaptive detection block

下载: 全尺寸图片幻灯片

首先, 输入特征图$ {F_0} $, 使用Conv1和Conv2分别对其进行预处理, 得到特征图$ {F_1} $和$ {F_2} $:

$$ {F_1} = {\rm{Conv}}1(\delta ({F_0})) $$

(2)

$$ {F_2} = {\rm{Conv}}2(\delta ({F_0})) $$

(3)

式中, $ \delta $表示ReLU激活函数层. 随后将特征图$ {F_2} $大小由$C \times H \times W $压缩至$C \times 1 \times 1 $, 并经过非线性处理, 得到各通道权重图$ {W_C} $:

$$ {W_C} = \sigma ({\rm{Conv}}3({\text{GAP}}({F_2}))) $$

(4)

式中, $ \sigma $表示Sigmoid激活函数层, GAP (Global average pooling)表示全局平均池化.

网络训练完成后, 将各通道的权值与预处理后的$ {F_1} $逐元素相乘, 得通道加权后的特征图:

$$ {F_C} = {F_1} \times {W_C} $$

(5)

然后, 在模块后端进行逐像素雾浓度检测, 实现空域自适应去雾. 首先, 对特征图$ {F_C} $进一步提取特征, 得到:

$$ {F_4} = \delta ({\rm{Conv}}4({F_C})) $$

(6)

最后, 将尺寸为$C \times H \times W $的特征图$ {F_4} $在空间域上压缩, 其压缩后可生成尺寸为$1 \times H \times W $的权重图$ {W_S} $:

$$ {W_S} = \sigma ({\rm{Conv}}6(\delta ({\rm{Conv}}5({F_4})))) $$

(7)

网络训练的目标是使浓雾区域处的权重$ {W_S} $的值较大, 薄雾区域处权重$ {W_S} $的值较小. 使用$ {W_S} $对特征图$ {F_4} $进行加权, 可实现网络对浓雾区域重点去雾, $ {F_S} $为雾浓度自适应检测块的最终输出:

$$ {F_S} = {F_4} \times {W_S} $$

(8)

1.3 门控融合模块

不同于现有的多尺度融合方法对有效信息和干扰信息无差别对待, 本文设计的门控融合模块融合了3个不同尺度的子网络得到输出特征图, 可实现对有效信息的复用, 减少冗余信息.

如图2所示, 门控融合模块通过学习各子网络特征图的最优权重, 再对其进行加权融合, 实现对干扰信息的过滤. 将3个子网络特征图从上到下分别记为$ {J_0} $、$ {J_1} $和$ {J_2} $. 由于各尺度特征图的尺寸不同, 先利用上采样模块对$ {J_1} $和$ {J_2} $进行上采样得$ {J_1} \uparrow $和$ {J_2} \uparrow $. 上采样模块由一个步长为2的转置卷积层和一个步长为1的卷积层组成, 可将各尺度特征图恢复至相同尺寸, 并进一步提炼信息. 然后, 堆叠预处理后的特征图, 通过卷积操作逐像素判断各特征图中的干扰信息, 学习对应于$ {J_0} $、$ {J_1} \uparrow $和$ {J_2} \uparrow $的权重图$ {W_0} $、$ {W_1} $和$ {W_2} $. 特征图包含的有效信息越多, 其权重图的权值越大. 多尺度特征门控融合运算可表示为:

$$ J = {J_0} \times {W_0} + {J_1} \uparrow \times {W_1} + {J_2} \uparrow \times {W_2} $$

(9)

1.4 损失函数

本文采用了平滑L₁损失和感知损失^[20]. 平滑L₁损失可以计算网络恢复的无雾图像与清晰图像之间的像素差值, 其在零点附近使用了平方函数, 解决了零点处导数不唯一的问题. 平滑L₁损失函数可表示为:

$$ {L_S} = \frac{1}{N}\sum\limits_{x = 1}^N {\sum\limits_{i = 1}^3 {{F_S}((G{{(I))}_i}(x) - {J_i}(x))} } $$

(10)

$$ {F_S}(e) = \left\{ \begin{aligned} &0.5{e^2},&{\rm{}}\;\left| e \right| < 1\; \\ &\left| e \right| - 0.5,&{\rm{否则}}\quad \end{aligned} \right. $$

(11)

式中, $ G(I) $表示网络恢复的无雾图像, $ J $表示清晰图像, $ x $表示像素点位置, $ N $表示像素个数, $i=1, 2,3$分别表示R、G、B三通道.

特征图中包含大量的语义特征和全局结构等高层信息. 本文加载ImageNet^[21]预训练的VGG-16^[22]网络模型, 从去雾图像和清晰图像中分别提取特征图, 将特征图间的差值作为感知损失, 借此量化去雾图像与清晰图像间的视觉误差. 感知损失函数$ {L_P} $可表示为:

$$ {L_P} = \sum\limits_{j = 1}^3 {\frac{1}{{{C_j}{H_j}{W_j}}}\left\| {{\varphi _j}(G(I)) - {\varphi _j}(J)} \right\|_2^2} $$

(12)

式中, $ J $为真实清晰图像, $ G(I) $为恢复的无雾图像, $ \varphi $为VGG-16特征提取操作, $j$为VGG网络特征图的索引标号, $ C $、$ H $和$ W $分别为图像的通道数、高度和宽度.

因此, 总损失函数为:

$$ L = {L_S} + \lambda {L_P} $$

(13)

式中, $ \lambda $为权重系数, 可以调节两个损失函数所占的比例.

2. 实验与结果分析

2.1 数据集

本文分别在RESIDE公共数据集^[23]和NTIRE (New trends in image restoration and enhancement) 2018去雾挑战赛提出的O-Haze数据集^[24]上训练和测试网络.

RESIDE数据集包含大量的室内有雾图像和室外有雾图像, 本文选用室内训练集(Indoor training set, ITS)和室外训练集(Outdoor training set, OTS). 其中ITS包含由1399张室内清晰图像合成的13990张室内有雾图像, OTS包含由8477张室外清晰图像合成的296695张室外有雾图像. 测试集选用SOTS (Synthetic objective testing set)测试集和HSTS (Hybird subjective testing set)合成测试集. 其中SOTS测试集包含500张室内有雾图像和500张室外有雾图像, HSTS合成测试集包含10张室外有雾图像.

O-Haze数据集共包含45张室外有雾图像及其对应的无雾图像. 根据NTIRE 2018去雾挑战赛的挑战协议, 本文选用35张有雾图像做训练集, 10张有雾图像做测试集.

为了更加客观地评价本文所提网络的去雾性能, 本文在合成数据集上计算了恢复图像与清晰图像之间的峰值信噪比(Peak signal to noise ratio, PSNR)和结构相似性(Structural similarity, SSIM).

2.2 实验设置

本文提出的去雾方法基于Pytorch框架实现, 在Win10环境下使用NVIDIA 1080Ti GPU加速网络的训练. 从每张训练图像中随机截取$220 \times 220 $像素的图像块, 作为网络的输入. 网络采用动量衰减指数$ {\beta _1}{\text{ = }}0.9 $、$ {\beta _2}{\text{ = }}0.999 $的适应性矩估计(Adaptive moment estimation, ADAM)优化器进行优化, 初始学习率设置为0.001, 在ITS上训练160个训练周期, 每20个训练周期学习率减半; 在OTS上训练10个训练周期, 每2个训练周期学习率减半; 在O-Haze上训练100个训练周期, 每10个训练周期学习率减半. 训练时的批量大小设置为8, 损失函数$ {L_P} $的权重因子$ \lambda $设置为0.04.

2.3 在合成数据集上实验

为了验证本文方法的去雾性能, 与现有的优势去雾算法进行实验对比. 将ITS中包含的全体无雾−有雾图像对用作室内训练集, 从OTS中随机选取2500张清晰图像及其对应的有雾图像作室外训练集. 随后, 采用SOTS测试集包含的500张室内有雾图像和500张室外有雾图像对模型进行测试.

在SOTS室内测试集上进行去雾评价, 并与其他方法进行对比, 结果如表1所示. 可以看出, 相比于深度学习方法, 传统暗通道先验(Dark channel prior, DCP)^[4]方法去雾效果较差, PSNR和SSIM值最小; DehazeNet^[10]、AODNet^[13]和基于多尺度卷积神经网络(Multi-scale convolutional neural networks, MSCNN)^[14]的去雾方法利用网络估计去雾模型参数, 其PSNR和SSIM较DCP有小幅提升; 增强型Pix2pix去雾网络(Enhanced Pix2pix dehazing network, EPDN)^[25]、门控上/下文聚合网络(Gated context aggregation network, GCANet)^[14]、GridDehazeNet^[15]、基于物理模型的特征去雾网络(Physics-based feature dehazing networks, PFDN)^[26]和多尺度增强去雾网络(Multi-scale boosted dehazing network, MSBDN)^[26]以及本文方法均为端到端去雾网络, 评价指标有了显著提升; YNet^[17]因为网络过浅, 不能充分提取图像特征, 所以表现并不突出. 在SOTS室外测试集上进行去雾评价, 结果如表2所示. 在O-Haze数据集上进行去雾评价, 结果如表3所示. 由表1、表2和表3可以看出, 相比于其他端到端网络, 本文提出的网络在几个测试集均取得了最高的PSNR值和较高的SSIM值. 其中MSBDN和GridDehazeNet因网络较深, 对SOTS测试集的拟合能力较强, 其SSIM指标略高于本文网络. 但二者对空间上/下文信息的复用程度较低, 导致其在实际去雾过程中无法准确估计大尺度特征, 在真实场景下的去雾效果并不理想.

表 1 SOTS室内测试集去雾结果的定量比较

Table 1 Qualitative comparisons of dehazing results on SOTS indoor test-set

方法	DCP	DehazeNet	AODNet	EPDN	GCANet
PSNR (dB)	16.62	21.14	19.06	25.06	30.23
SSIM	0.8179	0.8472	0.8504	0.9232	0.9800
方法	GridDehazeNet	PFDN	YNet	MSBDN	本文方法
PSNR (dB)	32.16	32.68	19.04	33.79	33.83
SSIM	0.9836	0.9760	0.8465	0.9840	0.9834

下载: 导出CSV

| 显示表格

表 2 SOTS室外测试集去雾结果的定量比较

Table 2 Qualitative comparisons of dehazing results on SOTS outdoor test-set

方法	DCP	DehazeNet	MSCNN	AODNet
PSNR (dB)	19.13	22.46	22.06	20.29
SSIM	0.8148	0.8514	0.9078	0.8765
方法	EPDN	GridDehazeNet	YNet	本文方法
PSNR (dB)	22.57	30.86	25.02	31.10
SSIM	0.8630	0.9819	0.9012	0.9765

下载: 导出CSV

| 显示表格

表 3 O-Haze数据集去雾结果定量比较

Table 3 Qualitative comparisons of dehazing results on O-Haze data-set

方法	DCP	MSCNN	AODNet	EPDN	GCANet	GridDehazeNet	本文方法
PSNR (dB)	16.78	17.26	15.03	16.00	16.28	18.92	19.28
SSIM	0.6530	0.6501	0.5394	0.6413	0.6450	0.6721	0.6756

下载: 导出CSV

| 显示表格

此外, 本文从SOTS室内测试集和室外测试集中, 分别选取4张有雾图进行主观质量评价, 各方法去雾效果如图7所示. 其中, 上面4行是室内图像去雾结果, 下面4行是室外图像去雾结果. 由于DCP方法利用暗通道先验估计透射率, 其去雾图像整体颜色偏暗, 尤其当图像中存在大面积的天空区域或白色物体时, 会出现伪影和颜色失真现象(如图7(b)中的白色桌面和天空区域). 经DehazeNet和AODNet去雾后的图像中, 仍有大量雾气残留(如图7(c)中的红色墙壁和蓝色天空), 原因是所用网络太浅, 不能充分学习图像特征. 另外, GCANet由于下采样会丢失部分高频信息(如图7(e)的桌子纹理和物体边缘), 在蓝色天空区域也会出现局部过暗的情况. 与之相似, 图7(g)中物体边缘和纹理出现模糊现象. GridDehazeNet和本文网络均可取得较好的去雾效果, 但对比图7(f)和图7(h)可以发现, 本文方法可以更好地保持图像结构信息和细节信息.

图 7 与现有方法在SOTS测试集上去雾结果对比

Fig. 7 Comparisons of dehazing results with state-of-the-art methods on SOTS

下载: 全尺寸图片幻灯片

表4给出了本文算法与对比方法在HSTS测试集上的比较结果. 可以看出, DCP去雾效果最差, 依赖颜色投射的图像去雾(Color cast dependent image dehazing, CCDID)^[27]评价指标有一定提升, 但并不显著, 本文算法取得最优PSNR和SSIM值. 图8给出了HSTS测试集中3个有雾场景下各方法的去雾结果, 其中, DCP、AODNet和EPDN产生较严重的颜色失真, DehazeNet和YNet去雾不够彻底. 相比之下, 本文算法去雾结果更接近清晰图像, 具有更好的颜色保持能力, 这是更加关注小尺度网络提取的特征信息带来的优势.

表 4 HSTS测试集去雾结果的定量比较

Table 4 Qualitative comparisons of dehazing results on HSTS test-set

方法	DCP	DehazeNet	MSCNN	AODNet	EPDN	YNet	CCDID	本文方法
PSNR (dB)	14.84	24.48	18.64	20.55	23.38	18.37	17.22	30.07
SSIM	0.7609	0.9153	0.8168	0.8973	0.9059	0.4725	0.8218	0.9658

下载: 导出CSV

| 显示表格

图 8 HSTS测试集上与现有方法去雾结果对比

Fig. 8 Comparisons of dehazing results with state-of-the-art methods on HSTS

下载: 全尺寸图片幻灯片

2.4 在真实数据集上实验

为了验证本文提出的网络在真实场景下的适用性, 在真实有雾图像上, 对网络模型进行了测试. 由于真实数据集没有标签图像, 本文挑选了4幅真实有雾图像进行主观视觉评估, 图9给出了本文方法与目前的几种优势算法的去雾结果. 如图9(b)所示, DCP在处理包含大面积天空区域的图像时, 暗通道先验失效, 导致图像颜色失真. 如图9(d)所示, AODNet受物理模型的限制, 易导致处理后的图像饱和度过高, 恢复图像的颜色相比于原图像过于鲜艳. 同时, GCANet在恢复一些真实有雾图像的过程中, 也会产生失真现象, 例如图9(e)中第2、3幅图像的蓝色天空区域出现颜色失真以及第4幅图像远景区域过亮等. 相比于前几种方法, DehazeNet能较好地保持原图中物体的颜色, 但其对远景部分的去雾能力不足, 如图9(c)中的远山区域仍有白色雾气残留. 另外, 放大图9(f)的远景区域(如图9(f)第2幅图像的远山部分和第4幅图像远处的草地), 可以看出, GridDehazeNet处理后的图像在远景处出现一定的颜色失真. 由图9(g)可以看出, YNet因连续下采样操作, 恢复出的无雾图像部分高频信息丢失(如图9(g)第1幅图中的人脸五官不够清晰).

图 9 与现有方法在真实有雾图像上去雾结果对比

Fig. 9 Comparisons of dehazing results with state-of-the-art methods on real hazy images

下载: 全尺寸图片幻灯片

由于采用了雾霾感知单元和误差回传机制, 本文算法可有效保持原图中丰富的结构信息和颜色信息, 尤其是对远景雾气去除效果更佳. 对比图9第4幅图像的去雾结果, 可以明显看出, 图9(b) ~ 图9(g)所示算法均不能有效去除远景雾气, 红色方框内草地上方仍有大量雾霾残留. 本文算法(见图9(h))可有效解决现有方法存在的远景区域雾气较难去除的问题, 恢复图像更为清晰自然.

2.5 消融实验和分析

为了进一步验证本文提出网络结构的合理性和各模块的必要性, 针对网络中的不同模块, 分别进行消融实验. 消融实验主要考虑的因素有: 1)每个子网络包含的RDB模块的总个数; 2)是否使用GFM模块对3个子网络的特征图进行加权融合; 3)是否使用误差回传机制, 利用低分辨率子网络改善高分辨率子网络提取特征; 4)是否使用雾浓度自适应检测块对RDB提取的特征进行逐通道雾浓度测量和逐像素雾浓度测量.

为了分析上述各因素对网络性能的影响, 以向网络中递增添加各模块的方式进行消融实验. 在ITS数据集上训练不同配置的网络(实验设置与第2.2节设置相同), 随后在SOTS室内测试集上测试模型. 测试结果的PSNR值如表5所示, 其中“√”表示包含对应该行的第1列网络模块. 表5最后一行给出了采取不同配置时, 网络在SOTS室内测试集上取得的PSNR值. 其中, 右边5列分别对应5种不同的网络配置. A列表示每个尺度子网络仅包含5个RDB模块, 各个子网络特征图直接相加; B列表示每个子网络包含5个RDB, 但采用了门控融合方法融合各子网络特征图; C列表示将每个子网络包含的RDB数量由5个变为9个; D列表示在C列配置的基础上加入了误差回传模块EB; E列较前一列加入了本文雾浓度自适应检测块HDADB, 此时网络取得的PSNR值最高, 去雾性能最佳.

表 5 基于不同模块的网络性能比较

Table 5 Comparisons of network performance based on different modules

模块名称	A	B	C	D	E
5个RDB	√	√	—	—	—
9个RDB	—	—	√	√	√
GFM	—	√	√	√	√
EB	—	—	—	√	√
HDADB	—	—	—	—	√
PSNR (dB)	28.79	29.52	31.53	32.45	33.83

下载: 导出CSV

| 显示表格

2.6 运行时间分析

为了评估本文方法的复杂性和计算效率, 在包含500张$620 \times 460$像素图像的SOTS室内测试集上进行了实验, 比较了本文算法与其他主流算法的平均运行时间, 统计结果如表6所示. 其中DCP、DehazeNet、MSCNN^[14]方法在CPU上实现, 其他基于深度学习的方法在GPU上实现. 本文方法处理尺寸为$ 620 \times 460$像素图像大约需要0.73 s. 结合表6和前述实验结果可以看出, 本文方法较特征融合注意网络(Feature fusion attention network, FFANet)^[28]效率显著提升, 与GridDehazeNet方法效率相当, 但去雾性能有较大提升.

表 6 各方法平均运行时间对比

Table 6 Average computing time comparison of various methods

方法	CPU/GPU	时间 (s)
DCP	CPU	25.08
DehazeNet	CPU	2.56
MSCNN	CPU	2.45
AODNet	GPU	0.24
GridDehazeNet	GPU	0.59
FFANet^[28]	GPU	1.23
本文方法	GPU	0.73

下载: 导出CSV

| 显示表格

2.7 算法局限性分析

通过实验可以看出, 本文算法取得了较好的去雾效果. 但本文网络在处理亮度较低的图像时, 有一定概率会出现图像部分区域色度偏暗的现象, 具体情况如图10所示. 今后, 将针对这一问题, 对网络进行进一步改进.

图 10 部分区域色度偏暗的去雾图

Fig. 10 Dehazed images with some darker areas

下载: 全尺寸图片幻灯片

3. 结束语

本文提出一种基于误差回传机制的多尺度去雾网络, 该网络通过构造误差回传模块, 补充高分辨率特征图缺失的结构信息和上/下文信息, 同时设计雾霾感知单元, 实现针对雾浓度的自适应去雾, 并使用门控融合模块, 以避免干扰信息对图像结构和细节的破坏, 再经优化模块, 得到最终复原图像. 在合成有雾图像和真实有雾图像上的大量实验结果表明, 本文方法恢复的图像更接近清晰图像, 解决了现有去雾方法易产生颜色失真和远景去雾不彻底的问题.

图 1 一维局部模型激活函数示意图

Fig. 1 Schematic diagram of one-dimensional local model activation function

下载: 全尺寸图片幻灯片

图 2 二维局部模型分布示意图

Fig. 2 Schematic diagram of two-dimensional local model distribution

下载: 全尺寸图片幻灯片

图 3 局部模型参数对边界约束模型性能的影响

Fig. 3 Influence of local model parameters on performance of boundary constraint model

下载: 全尺寸图片幻灯片

图 4 对一维测试集的预测结果

Fig. 4 Prediction results for one-dimensional test sets

下载: 全尺寸图片幻灯片

图 5 更新时间随数据量增长的变化趋势

Fig. 5 The trend of update time as data increases

下载: 全尺寸图片幻灯片

图 6 预测时间随数据量增长的变化趋势

Fig. 6 The trend of prediction time as the data increases

下载: 全尺寸图片幻灯片

图 7 预测误差随数据量增长的变化趋势

Fig. 7 The trend of prediction error as data increases

下载: 全尺寸图片幻灯片

图 8 预设和实际运动轨迹的参数

Fig. 8 Preset and actual motion trajectory parameters

下载: 全尺寸图片幻灯片

图 9 运动轨迹误差

Fig. 9 Motion track error

下载: 全尺寸图片幻灯片

表 1 3种方法的性能对比

Table 1 Performance comparison of three methods

全局 GPR 硬边界 LGPR 边界约束 LGPR

预测误差 $ 1.281\times10^{-4}$ $ 97.775\times 10^{-4}$ $ 1.953\times10^{-4}$
更新时间 (ms) 132.753 0.929 1.230
预测时间 (ms) 2.190 2.371 1.342

下载: 导出CSV

参考文献(27)

[1]	Schneider M, Ertel W. Robot learning by demonstration with local Gaussian process regression. In: Proceedings of the 2010 IEEE/RSJ International Conference on Intelligent Robots and Systems. Taipei, China: IEEE, 2010. 255−260
[2]	Hoefling F, Franosch T. Anomalous transport in the crowded world of biological cells. Reports on Progress in Physics, 2013, 76(4): 046602 doi: 10.1088/0034-4885/76/4/046602
[3]	Qiu L, Yuan S F, Chang F K, Bao Q, Mei H F. Online updating Gaussian mixture model for aircraft wing spar damage evaluation under time-varying boundary condition. Smart Materials and Structures, 2014, 23(12): 125001 doi: 10.1088/0964-1726/23/12/125001
[4]	Gramacy R B, Apley D W. Local Gaussian process approximation for large computer experiments. Journal of Computational and Graphical Statistics, 2015, 24(2): 561-578 doi: 10.1080/10618600.2014.914442
[5]	Bishop C M. Pattern Recognition and Machine Learning. Berlin: Springer-Verlag, 2006. 306−311
[6]	Candela J Q, Rasmussen C E. A unifying view of sparse approximate Gaussian process regression. Journal of Machine Learning Research, 2005, 6(Dec): 1939-1959
[7]	Rasmussen C E. The infinite Gaussian mixture model. Advances in neural information processing systems, 2000, 12: 554-560
[8]	Plagemann C. Gaussian Processes for Flexible Robot Learning [Ph.D. dissertation], Albert Ludwig University of Freiburg, Germany, 2008.
[9]	夏嘉欣, 陈曦, 林金星, 李伟鹏, 吴奇. 基于带有噪声输入的稀疏高斯过程的人体姿态估计. 自动化学报, 2019, 45(4): 693-705 Xia Jia-Xin, Chen Xi, Lin Jin-Xing, Li Wei-Peng, Wu Qi. Sparse Gaussian process with input noise for human pose estimation. Acta Automatica Sinica, 2019, 45(4): 693-705
[10]	乔少杰, 韩楠, 丁治明, 金澈清, 孙未未, 舒红平. 多模式移动对象不确定性轨迹预测模型. 自动化学报, 2018, 44(4): 608-618 Qiao Shao-Jie, Han Nan, Ding Zhi-Ming, Jin Che-Qing, Sun Wei-Wei, Shu Hong-Ping. A multiple-motion-pattern trajectory prediction model for uncertain moving objects. Acta Automatica Sinica, 2018, 44(4): 608-618
[11]	王传云, 秦世引. 动态场景红外图像的压缩感知域高斯混合背景建模. 自动化学报, 2018, 44(7): 1212-1226 Wang Chuan-Yun, Qin Shi-Yin. Background modeling of infrared image in dynamic scene with Gaussian mixture model in compressed sensing domain. Acta Automatica Sinica, 2018, 44(7): 1212-1226
[12]	Da B S, Ong Y S, Gupta A, Feng L, Liu H T. Fast transfer Gaussian process regression with large-scale sources. Knowledge-Based Systems, 2019, 165: 208-218 doi: 10.1016/j.knosys.2018.11.029
[13]	Liu X, Ma Z M. Discriminant analysis with local gaussian similarity preserving for feature extraction. Neural Processing Letters, 2018, 47(1): 39-55 doi: 10.1007/s11063-017-9630-6
[14]	Binois M, Gramacy R B, Ludkovski M. Practical heteroscedastic Gaussian process modeling for large simulation experiments. Journal of Computational and Graphical Statistics, 2018, 27(4): 808-821 doi: 10.1080/10618600.2018.1458625
[15]	任志刚, 梁永胜, 张爱民, 庞蓓. 基于一般二阶混合矩的高斯分布估计算法. 自动化学报, 2018, 44(4): 635-645 Ren Zhi-Gang, Liang Yong-Sheng, Zhang Ai-Min, Pang Bei. A Gaussian estimation of distribution algorithm using general second-order mixed moment. Acta Automatica Sinica, 2018, 44(4): 635-645
[16]	Sarkar D, Osborne M A. Prediction of tidal currents using Bayesian machine learning. Ocean Engineering, 2018, 158: 221-231. doi: 10.1016/j.oceaneng.2018.03.007
[17]	Nguyen-Tuong D, Seeger M, Peters J. Model learning with local Gaussian process regression. Advanced Robotics, 2009, 27(13): 1003-1012
[18]	Berg M D, Cheong O, Kreveld M V, Overmars M. Computational Geometry: Algorithms and Applications. Berlin: Springer-Verlag, 2008. 99−105
[19]	Rasmussen C E. Gaussian Processes in Machine Learning. Berlin: Springer-Verlag, 2003. 7−31
[20]	Nocedal J, Wright S. Numerical Optimization. Berlin: Springer-Verlag, 2006. 101−133
[21]	Bentley J L. Multidimensional binary search trees used for associative searching. Communications of the ACM, 1975, 18(9): 509-517 doi: 10.1145/361002.361007
[22]	Freidman J, Bentley J L, Finkel R A. An algorithm for finding best matches in logarithmic expected time. ACM Transactions on Mathematical Software, 1977, 3(3): 209-226 doi: 10.1145/355744.355745
[23]	Otair M. Approximate k-nearest neighbour based spatial clustering using k-d tree. International Journal of Database Management Systems, 2013, 5(1): 1-12 doi: 10.5121/ijdms.2013.5101
[24]	Park C, Huang J H Z. Efficient computation of Gaussian process regression for large spatial data sets by patching local Gaussian processes. Journal of Machine Learning Research, 2016, 17(1): 6071-6099
[25]	Fang G, Wang X M, Wang K, Lee K H, Ho J D L, Fu H C, Fu D K C, Kwok K W. Vision-based online learning kinematic control for soft robots using local Gaussian process regression. IEEE Robotics and Automation Letters, 2019, 4(2): 1194-1201 doi: 10.1109/LRA.2019.2893691
[26]	Alcala-Fdez J, Fernandez A, Luengo J. KEEL data-mining software tool: data set repository, integration of algorithms and experimental analysis framework. Journal of Multiple-Valued Logic and Soft Computing, 2011, 17(2-3): 255-287
[27]	Beckers T, Umlauft J and Hirche S. Stable model-based control with Gaussian process regression for robot manipulators. IFAC-PapersOnLine, 2017, 50(1): 3877-3884 doi: 10.1016/j.ifacol.2017.08.359

施引文献

资源附件(0)

访问统计

图(9) / 表(1)

计量

文章访问数: 747
HTML全文浏览量: 292
PDF下载量: 293
被引次数: 0

1. 本文方法
1.1 误差回传模块
1.2 雾霾感知单元
1.3 门控融合模块
1.4 损失函数
2. 实验与结果分析
2.1 数据集
2.2 实验设置
2.3 在合成数据集上实验
2.4 在真实数据集上实验
2.5 消融实验和分析
2.6 运行时间分析
2.7 算法局限性分析
3. 结束语

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

一种基于概率关联的局部高斯过程回归算法

doi: 10.16383/j.aas.c190445

计量

A Local Gaussian Regression Algorithm Based on Probability Association

1. 本文方法

1.1 误差回传模块

1.2 雾霾感知单元

1.2.1 残差密集块

1.2.2 雾浓度自适应检测块

1.3 门控融合模块

1.4 损失函数

2. 实验与结果分析

2.1 数据集

2.2 实验设置

2.3 在合成数据集上实验

2.4 在真实数据集上实验

2.5 消融实验和分析

2.6 运行时间分析

2.7 算法局限性分析

3. 结束语

计量

目录

1. 本文方法

1.1 误差回传模块

1.2 雾霾感知单元

1.3 门控融合模块

1.4 损失函数

2. 实验与结果分析

2.1 数据集

2.2 实验设置

2.3 在合成数据集上实验

2.4 在真实数据集上实验

2.5 消融实验和分析

2.6 运行时间分析

2.7 算法局限性分析

3. 结束语

	全局 GPR	硬边界 LGPR	边界约束 LGPR
预测误差	$ 1.281\times10^{-4}$	$ 97.775\times 10^{-4}$	$ 1.953\times10^{-4}$
更新时间 (ms)	132.753	0.929	1.230
预测时间 (ms)	2.190	2.371	1.342

留言板

一种基于概率关联的局部高斯过程回归算法

doi: 10.16383/j.aas.c190445

计量

出版历程

A Local Gaussian Regression Algorithm Based on Probability Association

1. 本文方法

1.1 误差回传模块

1.2 雾霾感知单元

1.2.1 残差密集块

1.2.2 雾浓度自适应检测块

1.3 门控融合模块

1.4 损失函数

2. 实验与结果分析

2.1 数据集

2.2 实验设置

2.3 在合成数据集上实验

2.4 在真实数据集上实验

2.5 消融实验和分析

2.6 运行时间分析

2.7 算法局限性分析

3. 结束语

计量

出版历程

目录

1. 本文方法

1.1 误差回传模块

1.2 雾霾感知单元

1.3 门控融合模块

1.4 损失函数

2. 实验与结果分析

2.1 数据集

2.2 实验设置

2.3 在合成数据集上实验

2.4 在真实数据集上实验

2.5 消融实验和分析

2.6 运行时间分析

2.7 算法局限性分析

3. 结束语