2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于雾气浓度估计的图像去雾算法

鞠铭烨 张登银 纪应天

张毅, 颜博, 王可佳. 混响环境下基于倒谱BRIR的双耳互相关声源定位算法. 自动化学报, 2016, 42(10): 1562-1569. doi: 10.16383/j.aas.2016.c150828
引用本文: 鞠铭烨, 张登银, 纪应天. 基于雾气浓度估计的图像去雾算法. 自动化学报, 2016, 42(9): 1367-1379. doi: 10.16383/j.aas.2016.c150525
ZHANG Yi, YAN Bo, WANG Ke-Jia. Sound Source Localization Algorithm Based on Cepstral BRIR Binaural Cross-correlation in Reverberant Environment. ACTA AUTOMATICA SINICA, 2016, 42(10): 1562-1569. doi: 10.16383/j.aas.2016.c150828
Citation: JU Ming-Ye, ZHANG Deng-Yin, JI Ying-Tian. Image Haze Removal Algorithm Based on Haze Thickness Estimation. ACTA AUTOMATICA SINICA, 2016, 42(9): 1367-1379. doi: 10.16383/j.aas.2016.c150525

基于雾气浓度估计的图像去雾算法

doi: 10.16383/j.aas.2016.c150525
基金项目: 

江苏省高校自然科学研究重大项目 15KJA510002

国家自然科学基金 61571241

江苏省产学研前瞻性联合研究项目 BY2014014

详细信息
    作者简介:

    鞠铭烨南京邮电大学物联网学院博士研究生.主要研究方向为图像去雾与图像增强.E-mail:2014070245@njupt.edu.cn

    纪应天南京邮电大学物联网学院硕士研究生.主要研究方向为图像处理, 压缩感知和分布式视频编码.E-mail:jiyingtian@foxmail.com

    通讯作者:

    张登银南京邮电大学物联网学院教授.主要研究方向为信号与信息处理, 网络信息安全技术.本文通信作者.E-mail:zhangdy@njupt.edu.cn

Image Haze Removal Algorithm Based on Haze Thickness Estimation

Funds: 

Key University Science Research Project of Jiangsu Province 15KJA510002

National Natural Science Foundation of China 61571241

Prospective Joint Research Project of Jiangsu Province BY2014014

More Information
    Author Bio:

    Ph. D. candidate at the School of Internet of Things, Nanjing University of Posts and Telecommunications. His research interest covers image dehazing and image enhancement

    Master student at the School of Internet of Things, Nanjing University of Posts and Telecommunications. His research interest covers image processing, compressed sensing, and distributed video coding

    Corresponding author: ZHANG Deng-Yin Professor at the School of Internet of Things, Nanjing University of Posts and Telecommunications. His research interest covers signal and information processing, networking technique and information security. Corresponding author of this paper
  • 摘要: 根据雾气浓度的视觉特征,提出一种雾气浓度估计模型.在此基础上,结合大气散射模型,提出一种新的图像去雾算法.首先,基于雾气浓度估计模型计算出雾气浓度量化图,利用模糊聚类算法在量化图中识别出雾气最浓区域并估计出全球光; 然后,对量化图中的“非雾气最浓”区域再次进行聚类处理,根据文中所提最优透射率评价指标估计出每个聚类单元的透射率,将全球光与透射图以及有雾图像导入散射模型,便可达到去雾的目的; 最后,针对去雾后图像较实际场景偏暗,提出一种基于小波域的多尺度锐化算法进行增强处理,以改善其主观视觉质量.实验结果表明,本文算法与现有主流算法相比,具有更好的去雾效果,并且其计算速度也相对较快.
  • 混响环境下的声源定位技术在很多领域有着广泛并且极其重要的应用, 例如, 在室内服务机器人或者视频会议系统中, 语音识别、语音增强和助听器装置等方面的应用.

    在各种复杂环境下, 人耳都能精确地进行声源定位.这一事实表明可以通过模仿人耳听觉系统的机制, 实现有效的人工双耳声源定位[1-2].基于生理科学以及物理科学的研究都表明, 听觉定位中的全部线索形成于声波从声源到鼓膜之间的传递过程之中[3].主要的定位线索是声波到达双耳时的时间差(Interaural time difference, ITD)、强度差(Interaural level difference, ILD)以及声波中包含的频率成分[4-5], 这些要素可以统一用头部相关传递函数(Headrelated transfer function, HRTF)来描述.定位所包含的信息形成是在耳膜以前完成的, 因而HRTF包含了所有物理上的定位信息[6].头部脉冲响应(Headrelated impulse response, HRIR)是HRTF的时域表示.混响环境下, 双耳房间脉冲响应(Binaural room impulse response, BRIR)是通过HRIR与房间脉冲响应(Room impulse response, RIR)卷积获取, 表示从声源到左右耳接收信号的脉冲响应.目前有很多定位算法都是通过最大化双耳互相关值[7], 或者是ITD/ILD估计来确定声源的位置[8-9].虽然这些方法在无干扰环境下有很好的定位效果, 但是在混响环境下的定位性能急剧下降[10-12].Stèphenne等[13]提出在提取ITD前采用倒谱预滤波方法, 有效地减少了混响对声源定位的影响.该算法对接收信号进行最小相位分解消去混响分量[14], 提高了双耳声源定位方法对混响的鲁棒性.Mosayyebpour等[15]在Stèphenne的基础上改进了广义互相关算法提取ITD.然而, 接收信号的倒谱参数主要体现语音的基音和共振峰特性, 大多用于语音识别中, 并不能反映HRTF方位信息的特征[16], 而且在倒谱域中会丢失相位信息, 以致丢失ITD的信息, 造成声源定位误差.

    本文提出了一种基于倒谱BRIR的双耳互相关声源定位算法.仿真实验证明, 该算法在混响环境下具有更好的定位效果.

    在混响环境下, 左右耳接收到的信号在离散时间域表示为

    ${{x}_{l}}\left( n \right)=s\left( n \right)*{{h}_{l}}\left( n \right)+{{n}_{l}}\left( n \right)$

    (1)

    ${{x}_{r}}\left( n \right)=s\left( n \right)*{{h}_{r}}\left( n \right)+{{n}_{r}}\left( n \right)$

    (2)

    式中, ${h_i}\left( n \right)$为双耳房间脉冲响应, 包含了所有的混响成分, $s\left( n \right)$表示声源信号, ${n_i}\left(n \right)$表示加性噪声, 通常为一个与源信号不相关的、零均值的平稳高斯随机噪声.

    离散信号$x\left( n \right)$的倒谱形式表示为

    $\hat{x}\left( k \right)={{F}^{-1}}\left\{ \log X\left( W \right) \right\}$

    (3)

    式中, $X\left( W \right)$为$x\left( n \right)$的傅里叶变换, ${F^{ -1}}\left\{ \cdot\right\}$为反傅里叶变换, $\log$是对数运算, $k$是倒谱域变量.在时域中, 信号的卷积在倒谱域相当于信号相加.

    ${{\hat{x}}_{i}}\left( k \right)={{\hat{h}}_{i}}\left( k \right)+{{\hat{n}}_{i}}\left( k \right)+\hat{s}\left( k \right)$

    (4)

    式中, ${\widehat h_i}\left( k \right)$和$\widehat s\left( k\right)$分别是脉冲响应和声源信号的倒谱. ${\widehat n_i}\left( k\right)$是加性噪声的倒谱, 可表示为

    \begin{align} {\widehat n_i}\left( k \right) = {F^{ - 1}}\left\{ {\log \left\{ {1 + \frac{{{N_i}\left( W \right)}}{{{H_i}\left( W \right)S\left( W \right)}}} \right\}} \right\} \end{align}

    (5)

    式中, ${N_i}(W)$, ${H_i}(W)$和$S(W)$分别为${n_i}(n)$, ${h_i}(n)$和$s(n)$的傅里叶变换.为后文分析方便, 假设背景噪声足够低, 忽略噪声的影响.但在评价定位性能时包括噪声的影响.

    在倒谱域中, 脉冲响应${\widehat h_i}\left( k\right)$可由一个最小相位分量(Minimum-phase component, MPC)${\widehat h}_{i,mpc}\left( k \right)$和一个全通分量${{\hat{h}}_{i,apc}}\left( k \right)$级联组成.式(4)可以表示为

    \begin{align} {\widehat x_i}\left( k \right) = {\widehat h}_{i,mpc}\left( k \right) + {\widehat h}_{i,apc}\left( k \right) + {\widehat n_i}\left( k \right)+ \widehat s\left( k \right) \end{align}

    (6)

    倒谱滤波是在每一帧的基础上进行的, 假设声源信号的倒谱MPC是在帧与帧之间变化的, 而且均值为零.信道倒谱MPC是缓慢变化的, 可以通过时间平均获取.

    为了避免倒谱法的不足以及接收信号倒谱对定位的作用, 并且充分体现HRTF中的定位信息, 本文在文献[13]中Stèphenne算法的基础上提出基于倒谱BRIR的双耳互相关声源定位算法.

    基于倒谱BRIR的双耳互相关声源定位的基本步骤为:

    步骤1.在接收信号${x_l}\left( n \right)$和${x_r}\left(n \right)$的每一帧上加上指数窗$\omega \left( n \right) = {\alpha^n}$, $0 \le n \le K - 1$, 其中$K$是窗长, $0 < \alpha \le 1$;

    步骤2.对各信号进行倒谱处理, 并计算倒谱域接收信号和BRIR的最小相位分量

    \begin{align} {\widehat h}_{i,mpc}\left( k \right) = \begin{cases} 0,&k < 0\\ {{\widehat h}_i}\left( 0 \right),&k = 0\\ {{\widehat h}_i}\left( k \right) + {{\widehat h}_i}\left({- k} \right),&k > 0 \end{cases} \end{align}

    (7)

    步骤3.通过连续信号帧递归获得估计的混响分量, 即${\overline h _{i,mpc}}\left({k;m} \right)$

    \begin{align} {\overline h _{i,mpc}}\left( {k;m} \right) = \begin{cases} {{\widehat x}_{i,mpc}}\left( {k;m} \right),\qquad\qquad~~~m = 1\\ \left( {1 - \mu } \right){\widehat h}_{i,mpc}\left( k;m - 1 \right)+\\ \qquad \mu {{\widehat x}_{i,mpc}}\left( k;m \right),\quad~~~~~m >1 \end{cases} \end{align}

    (8)

    其中, $0 < \mu < 1$, $m$表示帧数.

    步骤4.从倒谱BRIR中减去混响分量, 得到去混后的倒谱BRIR, 即${\widetilde {{h}}_i}\left( {k;m} \right)$

    \begin{align} {\widetilde {{h}}_i}\left( {k;m} \right) = {\widehat h_i}\left( {k;m} \right) - {\overline h _{i,mpc}}\left( {k;m} \right) \end{align}

    (9)

    步骤5.将${\widetilde {{h}}_i}\left( {k;m}\right)$变换到时域${h_{ei}}\left( n \right)$, 并与已知数据库中HRIR${h_i}\left( n \right)$进行互相关运算;

    步骤6.设置适当的互相关阈值, 其中最大互相关值相对应的方位角即为所求.

    为了得到有效的倒谱预处理效果, 在倒谱预处理前, 为将$X\left( W\right)$的零极点移动到单位圆内, 在每一帧上加上一个指数窗函数.指数窗的目的是尽可能地集中最小相位分量, 以便尽可能多地减去混响分量, 减少混响对声源定位的影响.针对Stèphenne算法中接收信号的倒谱参数并不能反映HRTF方位信息的特征的问题, 在基于倒谱BRIR的互相关定位算法中得到${\widetilde {h}_i}\left( {k;m}\right)$后, 反变换到时域${h_{ei}}\left( n \right)$, 与数据库中选择的HRIR ${h_i}\left( {n,\theta }\right)$进行互相关运算.

    $P\left( \theta \right)={{h}_{ei}}\left( n \right)\oplus {{h}_{i}}\left( n,\theta \right)$

    (10)

    $\begin{align} & {{h}_{ei}}\left( n \right)=[{{h}_{el}}\left( {{n}_{a}} \right),\cdots ,{{h}_{el}}\left( {{n}_{b}} \right),\\ & {{h}_{er}}\left( {{n}_{a}} \right),\cdots ,{{h}_{er}}\left( {{n}_{b}} \right)] \\ \end{align}$

    (11)

    $\begin{align} & {{h}_{i}}\left( n,\theta \right)=[{{h}_{l}}\left( {{n}_{a}},\theta \right),\cdots ,{{h}_{l}}\left( {{n}_{b}},\theta \right),\\ & {{h}_{r}}\left( {{n}_{a}},\theta \right),\cdots ,{{h}_{r}}\left( {{n}_{b}},\theta \right)] \\ \end{align}$

    (12)

    其中, $n \in \left\{ {{n_a},\cdots,{n_b}} \right\}$, $ \oplus $为互相关运算符号, 因此声源方位角为

    $\hat{\theta }=\arg \underset{\theta }{\mathop{\max }} \left\{ P\left( \theta \right)\ge \gamma \right\}$

    (13)

    $\gamma =\max \left\{ 0.95\cdot \max \left\{ P\left( \theta \right) \right\},0.5 \right\}$

    (14)

    考虑到噪声的影响, 选择阈值来确定频谱的峰值及相关声源位置.

    本研究描述的系统直接引用CIPIC数据库中subject003仰角为0时的各个方位角的HRTF数据库, 其中采样率为44.1 kHz.使用PASCAL CHiMESpeech Separation and Recognition Challenge的语音信号建立语音库, 采样率为16 kHz, 16 bit的信号.双耳信号则为源信号与RIR和HRIR相卷积所得.

    经验值数据如下: $\mu=0.08$, $\alpha$的取值取决于窗长$K$的值, $K=1 024$, 同时相对应的经验值$\alpha=0.994$.本实验分别在混响时间RT为0 s, 0.30 s, 0.50 s, 0.70 s, 0.90 s的混响环境下, 同时在信噪比(Signal noise ratio, SNR)为20 dB的环境下进行仿真实验.图 1~5是在不同混响时间下, 三种声源定位算法在方位角${15^\circ}$时的定位效果比较.其中, 图(a)表示的是文献[13]倒谱滤波后基于互相关时延估计定位法(CEP-CC-ITD), 图(b)表示的是文献15]倒谱滤波后基于广义互相关时延估计定位法(CEP-GCC-ITD), 图(c)表示基于倒谱BRIR的双耳互相关声源定位法(CEP-BRIR-CC).横坐标表示方位角, 纵坐标表示时间, 灰度深浅表示归一化互相关值的大小.${0^\circ}$表示声源在正前方, 正角度表示声源在右边, 负角度表示声源在左边.

    图 1  RT=0 s时, 三种算法对方位角${{15}^{{}^\circ }}$定位
    Fig. 1  Three algorithms for positioning the azimuth ${{15}^{{}^\circ }}$ when RT=0 s
    图 2  RT=0.30 s时, 三种算法对方位角${{15}^{{}^\circ }}$定位
    Fig. 2  Three algorithms for positioning the azimuth ${{15}^{{}^\circ }}$ when RT=0.30 s
    图 3  RT=0.50 s时, 三种算法对方位角${{15}^{{}^\circ }}$定位
    Fig. 3  Three algorithms for positioning the azimuth ${{15}^{{}^\circ }}$ when RT=0.50 s
    图 4  RT=0.70 s时, 三种算法对方位角${{15}^{{}^\circ }}$定位
    Fig. 4  Three algorithms for positioning the azimuth ${{15}^{{}^\circ }}$ when RT=0.70 s
    图 5  RT=0.90 s时, 三种算法对方位角${{15}^{{}^\circ }}$定位
    Fig. 5  Three algorithms for positioning the azimuth ${{15}^{{}^\circ }}$ when RT=0.90 s

    图 1~5可以看出, 在不同混响时间下, CEP-BRIR-CC声源定位法较CEP-CC-ITD和CEP-GCC-ITD声源定位法的图像能更突出地显示出方位角的位置.此外, 随着混响时间的增大, 图像显示越来越模糊, 定位精度有所降低, 但CEP-BRIR-CC声源定位法的图像依然比较稳定, 具有一定的鲁棒性.这是由于CEP-BRIR-CC声源定位法的互相关运算是比较两个脉冲响应的相似性, 克服了倒谱法中丢失ITD的缺点, 稳定性比较好, 而且避开了接收信号倒谱对定位的作用, 充分利用HRTF中的定位信息, 提高了在混响环境中的定位性能.

    图 6所示为声源方位角${15^\circ }$时, 混响时间分别为0 s, 0.30 s, 0.50 s, 0.70 s, 0.90 s时, CEP-BRIR-CC、CEP-CC-ITD和CEP-GCC-ITD声源定位法的均方值误差图.从图 6可以看出, CEP-BRIR-CC声源定位法的均方值误差小于CEP-CC-ITD和CEP-GCC-ITD声源定位法的均方值误差, 表明CEP-BRIR-CC声源定位法估计的方位角与实际方位角的偏差更小, 具有更好的定位精度.

    图 6  方位角为${{15}^{{}^\circ }}$不同混响时间下的RMSE比较
    Fig. 6  RMSE comparison of azimuth for ${{15}^{{}^\circ }}$ in different reverberation time

    表 1是混响时间分别为0 s, 0.3 s, 0.5 s, 目标声源在方位角为${0^\circ }$, ${10^\circ }$, ${15^\circ}$, ${20^\circ }$, ${30^\circ }$和${35^\circ }$时, CEP-BRIR-CC、CEP-GCC-ITD和CEP-CC-ITD声源定位法的声源方位估计和绝对定位误差实验数据.由表 1中可知, CEP-BRIR-CC声源定位法在混响时间分别为0 s, 0.3 s, 0.5 s时的绝对定位误差平均值分别为0.165, 0.842, 1.17.CEP-GCC-ITD声源定位法在混响时间分别为0 s, 0.3 s, 0.5 s时的绝对定位误差平均值分别为0.553, 1.707, 2.728.CEP-CC-ITD声源定位法在混响时间分别为0 s, 0.3 s, 0.5 s时的绝对定位误差平均值分别为0.78, 1.94, 3.385.

    表 1可以看出, 在不同混响环境下, 两种方法的定位绝对误差随着混响时间的增大而增大; 在相同的混响环境下, CEP-BRIR-CC声源定位法定位误差相对较小.同时CEP-BRIR-CC声源定位法估计的声源方位角度的绝对误差都在${2^\circ}$范围以内.因为CEP-CC-ITD和CEP-GCC-ITD声源定位法都涉及到接收信号的倒谱和时延估计的互相关计算, 会对定位造成一定的影响.而CEP-BRIR-CC声源定位法很好地避免了这些问题, 具有更准确的定位精度和更好的鲁棒性.

    表 1  在不同混响时间下三种定位方法的声源方位估计
    Table 1  Sound source azimuth estimation of three location methods in different reverberation time
    实际角度(°) 0 10 15 20 30 35
    CEP-BRIR-CC
    声源定位法
    RT=0s 估计角度(°) 0.08 10.24 15.06 20.23 30.15 35.23
    绝对误差(°) 0.08 0.24 0.06 0.23 0.15 0.23
    RT=0.3s 估计角度(°) 0.17 9.03 14.82 21.09 30.25 36.39
    绝对误差(°) 0.17 0.97 1.18 1.09 0.25 1.39
    RT=0.5s 估计角度(°) -0.29 8.79 13.67 18.69 30.69 36.87
    绝对误差(°) 0.29 1.21 1.33 1.31 0.69 1.87
    CEP-GCC-ITD
    声源定位法
    RT=0s 估计角度(°) -0.08 10.67 15.92 20.86 30.42 35.37
    绝对误差(°) 0.08 0.67 0.92 0.86 0.42 0.37
    RT=0.3s 估计角度(°) 0.39 8.11 12.81 17.23 28.85 33.14
    绝对误差(°) 0.39 1.89 2.19 2.77 1.14 1.86
    RT=0.5s 估计角度(°) -1.69 7.06 11.91 16.14 28.15 32.06
    绝对误差(°) 1.69 2.94 3.09 3.86 1.85 2.94
    CEP-CC-ITD
    声源定位法
    RT=0s 估计角度(°) 0.07 10.73 15.95 21.46 30.85 35.62
    绝对误差(°) 0.07 0.73 0.95 1.46 0.85 0.62
    RT=0.3 s 估计角度(°) 0.63 8.68 12.78 23.06 27.62 32.97
    绝对误差(°) 0.63 1.32 2.22 3.06 2.38 2.03
    RT=0.5s 估计角度(°) -2.06 6.12 11.66 15.89 26.85 38.77
    绝对误差(°) 2.06 3.88 3.34 4.11 3.15 3.77
    下载: 导出CSV 
    | 显示表格

    为验证算法的实际性能, 用两个麦克风连接同一计算机采集语音进行场景测试. 图 7为实验环境示意图.实验房间大小为2.2 m $\times$ 2.2 m $\times$ 3 m, 两个麦克风位置分别为$(0.8,0.5,1.3)$和$(1.04,0.5,1.3)$, 声源位置距离两麦克风连线中点1 m, 测试角度为$- {75^\circ}$~${75^\circ }$, 测试间隔为${15^\circ }$, 声源与麦克风在同一水平面上并且位于麦克风前方, 此房间的混响时间大约0.3 s.使用Adobe Audition进行语音采集, 信号采样率为16 kHz/s.

    图 7  实验环境示意图
    Fig. 7  Schematic diagram of experimental environment

    实验中对三种方法分别进行了多次测试, 统计的平均结果如表 2所示.从表 2可以看出, CEP-BRIR-CC、CEP-GCC-ITD和CEP-CC-ITD声源定位法在实际场景中的平均定位误差分别为${4.38^\circ}$, ${7.42^\circ }$和${8.72^\circ }$.CEP-BRIR-CC定位法的定位误差相对较小, 能够进行更准确的定位, 这一结论与理论计算趋势是一致的.与仿真结果相比, 真实场景下各定位法的定位误差都相对较大, 这是由于测试并非是在纯净环境下进行的, 实际环境中的信噪比问题有可能对实验造成一定的影响.

    表 2  三种定位方法的统计结果
    Table 2  The statistical results of three localization methods
    角度
    方法
    —60° —15° 30° 45°
    估计值 误差 估计值 误差 估计值 误差 估计值 误差 估计值 误差
    CEP-BRIR-CC —54.8° 5.2° —19.6° 4.6° —3° 35.2° 5.2° 41.1° 3.9°
    CEP-GCC-ITD —67.6° 7.6° —22.3° 7.3° 7.5° 7.5° 36.9° 6.9° 52.8° 7.8°
    CEP-CC-ITD —50.9° 9.1° —23.5° 8.5° 8.8° 8.8° 22.0° 8.0° 54.2° 9.2°
    下载: 导出CSV 
    | 显示表格

    本文研究了一种在混响环境中声源定位方法, 在仿真和真实场景中建立了一个完整的声源定位系统模型.与CEP-GCC-ITD和CEP-CC-ITD声源定位法相比, 本文的CEP-BRIR-CC声源定位法有较高的定位精度, 且鲁棒性较好.然而, 如何在强混响环境下精确定位仍然是个难点.本文提出的方法虽然在混响环境下有一定的定位效果, 但计算量比较大, 还有很多可以改进的地方.同时该模型在如何进行运动声源定位和多源定位以及三维定位方面仍需继续探索研究.

  • 图  1  现有去雾算法的局限性((a), (e), (i)有雾图像; (b)Tan算法; (c)Nishino算法; (f)Fattal算法; (g)He算法; (j)Tarel算法; (k)Pang算法; (d), (h), (l)本文算法)

    Fig.  1  The limitations of the existing algorithms ((a), (e), (i) Hazy image; (b) Tan; (c) Nishino; (f) Fattal; (g) He; (j) Tarel; (k) Pang; (d), (h), (l) Proposed)

    图  2  雾气浓度估计((a)有雾图像; (b)粗糙雾气浓度量化图; (c)雾气浓度量化图)

    Fig.  2  Haze thickness estimation ((a) Hazy images; (b) Rough haze thickness quantitative maps; (c) Refined haze thickness quantitative maps)

    图  3  全球光定位中间过程((a)有雾图像; (b)雾气浓度量化图; (c)预选区域; (d)平坦分布图; (e)候选区域)

    Fig.  3  The intermediate process of global light localization ((a) Hazy image; (b) Refined haze thickness quantitative map; (c) Pre-selected region; (d) Flat distribution map; (e) Candidate region)

    图  4  不同全球光对应的去雾效果比较((a)位置示意图; (b) Namer算法; (c) He算法; (d) Kim算法; (e)本文算法)

    Fig.  4  Dehazed images by different global light estimation methods ((a) Location schematic diagram; (b) Namer; (c) He; (d) Kim; (e) Proposed)

    图  5  卫星图像去雾实验((a)有雾图像; (b)对比度最大; (c)本文所提指标Ψ)

    Fig.  5  Satellite image dehazing experiment ((a) Hazy image; (b) Maximum contrast; (c) Index Ψ)

    图  6  标准差、饱和度以及指标Ψ的变化曲线

    Fig.  6  The curves of standard deviation, saturation, and index Ψ

    图  7  识别天空准确率

    Fig.  7  Sky recognition accuracy

    图  8  对比分析((a)基于指标Ψ与邻域估计法得到的透射图; (b)基于指标Ψ与聚类估计法得到的透射图; (c)透射图(a)对应的去雾效果; (d)透射图(b)对应的去雾效果; (e)基于黑色通道先验与邻域估计法得到的透射图; (f)基于黑色通道先验与聚类估计法得到的透射图; (g)透射图(e)对应的去雾效果; (h)透射图(f)对应的去雾效果)

    Fig.  8  Comparative analysis ((a) Transmission map with neighborhood and index Ψ; (b) Transmission map with cluster unit and index Ψ; (c) Dehazed image using (a); (d) Dehazed image using (b); (e) Transmission map with neighborhood and dark channel prior; (f) Transmission map with cluster unit and dark channel prior; (g) Dehazed image using (e); (h) Dehazed image using (f))

    图  9  各后处理算法的增强效果对比((a), (e)去雾后的图像; (b), (f) Yan算法; (c), (g)张登银算法; (d), (h)本文算法)

    Fig.  9  Comparison of enhanced images by different post-processing algorithms ((a), (e) Dehazed images; (b), (f) Yan; (c), (g) Zhang; (d), (h) Proposed)

    图  10  本文算法去雾效果(上:有雾图像; 中:透射图; 下:去雾效果)

    Fig.  10  Dehazed images by proposed method (Top: hazy images; Middle: transmission map; Bottom: dehazed images)

    图  11  综合比较

    Fig.  11  Comprehensive comparison

    图  12  计算速度曲线

    Fig.  12  The curves of computing speed

    图  13  失效例子

    Fig.  13  Failure case

    表  1  图像质量评价指标

    Table  1  Image quality evaluation parameters

    实验对象 Ancuti算法 Zhu算法 Tarel算法 Tan算法 He算法 Meng算法 本文算法
    评价指标 r S H r S H r S H r S H r S H r S H r S H
    Dolls 1.22 0.73 0.04 2.11 0.81 0.00 2.63 0.66 0.32 3.60 0.28 0.34 2.67 0.65 0.00 2.76 0.68 0.01 2.98 0.72 0.08
    Manhattan 1.52 0.80 0.33 1.32 0.82 0.01 1.98 0.60 0.03 3.17 0.73 0.00 1.76 0.84 0.01 2.12 0.78 0.28 1.97 0.81 0.04
    Cityscape 1.81 0.73 0.27 2.81 0.70 0.08 4.70 0.38 0.20 6.25 0.29 0.72 4.43 0.52 0.08 3.25 0.64 0.03 4.47 0.62 0.01
    Mountain 1.08 0.67 0.01 1.25 0.78 0.02 1.80 0.80 0.01 2.06 0.74 0.05 1.13 0.82 0.00 1.66 0.83 0.17 1.46 0.84 0.01
    Town 1.37 0.88 0.14 1.43 0.82 0.05 2.59 0.73 0.14 2.81 0.48 0.32 1.77 0.78 0.01 2.06 0.77 0.67 2.10 0.92 0.03
    Pizza 1.54 0.90 0.17 1.07 0.92 0.01 1.71 0.79 0.03 3.00 0.32 0.72 1.30 0.96 0.02 1.37 0.90 0.15 1.18 0.93 0.00
    下载: 导出CSV
  • [1] Yadav G, Maheshwari S, Agarwal A. Contrast limited adaptive histogram equalization based enhancement for real time video system. In: Proceedings of the 2014 International Conference on Advances in Computing, Communications, and Informatics. New Delhi, India: IEEE, 2014. 2392-2397
    [2] Ancuti C O, Ancuti C. Single image dehazing by multi-scale fusion. IEEE Transactions on Image Processing, 2013, 22(8): 3271-3282 doi: 10.1109/TIP.2013.2262284
    [3] Farid H. Blind inverse gamma correction. IEEE Transactions on Image Processing, 2001, 10(10): 1428-1433 doi: 10.1109/83.951529
    [4] 禹晶, 李大鹏, 廖庆敏.基于颜色恒常性的低照度图像视见度增强.自动化学报, 2011, 37(8): 923-931 http://www.aas.net.cn/CN/abstract/abstract17511.shtml

    Yu Jing, Li Da-Peng, Liao Qing-Min. Color constancy-based visibility enhancement of color images in low-light conditions. Acta Automatica Sinica, 2011, 37(8): 923-931 http://www.aas.net.cn/CN/abstract/abstract17511.shtml
    [5] 李建奇, 阳春华, 朱红求, 曹斌芳, 刘金平.基于改进方向波变换的泡沫图像增强新方法.中南大学学报(自然科学版), 2013, 44(3): 1030-1036 http://www.cnki.com.cn/Article/CJFDTOTAL-ZNGD201303028.htm

    Li Jian-Qi, Yang Chun-Hua, Zhu Hong-Qiu, Cao Bin-Fang, Liu Jin-Ping. A new bubble image enhancement algorithm based on improved directionlet transform. Journal of Central South UniversityScience and Technology), 2013, 44(3): 1030-1036 http://www.cnki.com.cn/Article/CJFDTOTAL-ZNGD201303028.htm
    [6] Tan R T. Visibility in bad weather from a single image. In: Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition. Anchorage, USA: IEEE, 2008. 1-8 http://www.oalib.com/references/16885065
    [7] Nishino K, Kratz L, Lombardi S. Bayesian defogging. International Journal of Computer Vision, 2012, 98(3): 263-278 doi: 10.1007/s11263-011-0508-1
    [8] Fattal R. Single image dehazing. ACM Transactions on Graphics, 2008, 27(3): Article No. 72 http://cn.bing.com/academic/profile?id=2028990532&encoded=0&v=paper_preview&mkt=zh-cn
    [9] Tarel J P, Hautiére N. Fast visibility restoration from a single color or gray level image. In: Proceedings of the 12th IEEE International Conference on Computer Vision. Kyoto, Japan: IEEE, 2009. 2201-2208
    [10] He K, Sun J, Tang X. Single image haze removal using dark channel prior. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(12): 2341-2353 doi: 10.1109/TPAMI.2010.168
    [11] Wang J B, He N, Zhang L L, Lu K. Single image dehazing with a physical model and dark channel prior. Neurocomputing, 2015, 149: 718-728 doi: 10.1016/j.neucom.2014.08.005
    [12] 陈书贞, 任占广, 练秋生.基于改进暗通道和导向滤波的单幅图像去雾算法.自动化学报, 2016, 42(3): 455-465 http://www.aas.net.cn/CN/abstract/abstract18833.shtml

    Chen Shu-Zhen, Ren Zhan-Guang, Lian Qiu-Sheng. Single image dehazing algorithm based on improved dark channel prior and guided filter. Acta Automatica Sinica, 2016, 42(3): 455-465 http://www.aas.net.cn/CN/abstract/abstract18833.shtml
    [13] 张小刚, 唐美玲, 陈华, 汤红忠.一种结合双区域滤波和图像融合的单幅图像去雾算法.自动化学报, 2014, 40(8): 1733-1739 http://www.aas.net.cn/CN/abstract/abstract18440.shtml

    Zhang Xiao-Gang, Tang Mei-Ling, Chen Hua, Tang Hong-Zhong. A dehazing method in single image based on double-area filter and image fusion. Acta Automatica Sinica, 2014, 40(8): 1733-1739 http://www.aas.net.cn/CN/abstract/abstract18440.shtml
    [14] 蒋建国, 侯天峰, 齐美彬.改进的基于暗原色先验的图像去雾算法.电路与系统学报, 2011, 16(2): 7-12 http://www.cnki.com.cn/Article/CJFDTOTAL-WJFZ201502002.htm

    Jiang Jian-Guo, Hou Tian-Feng, Qi Mei-Bin. Improved algorithm on image haze removal using dark channel prior. Journal of Circuits and Systems, 2011, 16(2): 7-12 http://www.cnki.com.cn/Article/CJFDTOTAL-WJFZ201502002.htm
    [15] 李加元, 胡庆武, 艾明耀, 严俊.结合天空识别和暗通道原理的图像去雾.中国图象图形学报, 2015, 20(4): 514-519 http://www.cnki.com.cn/Article/CJFDTOTAL-ZGTB201504008.htm

    Li Jia-Yuan, Hu Qing-Wu, Ai Ming-Yao, Yan Jun. Image haze removal based on sky region detection and dark channel prior. Journal of Image and Graphics, 2015, 20(4): 514-519 http://www.cnki.com.cn/Article/CJFDTOTAL-ZGTB201504008.htm
    [16] Koschmeider H. Theorie der horizontalen sichtweite. Beiträge zur Physik der Freien Atmosphäre, 1924, 12: 33-53
    [17] He K M, Sun J, Tang X O. Guided image filtering. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(6): 1397-1409 doi: 10.1109/TPAMI.2012.213
    [18] Namer E, Schechner Y Y. Advanced visibility improvement based on polarization filtered images. In: Proceedings of the 2005 Polarization Science and Remote Sensing II. San Diego, USA: SPIE, 2005. 36-45
    [19] Kim J H, Jang W D, Sim J Y, Kim C S. Optimized contrast enhancement for real-time image and video dehazing. Journal of Visual Communication and Image Representation, 2013, 24(3): 410-425 doi: 10.1016/j.jvcir.2013.02.004
    [20] Uchiyama T, Arbib M A. Color image segmentation using competitive learning. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1994, 16(12): 1197-1206 doi: 10.1109/34.387488
    [21] 常发亮, 刘静, 乔谊正.基于自组织神经网络的彩色图像自适应聚类分割.控制与决策, 2006, 21(4): 449-452 http://www.cnki.com.cn/Article/CJFDTOTAL-KZYC200604018.htm

    Chang Fa-Liang, Liu Jing, Qiao Yi-Zheng. Color image self-adapting clustering segmentation based on self-organizing feature map network. Control and Decision, 2006, 21(4): 449-452 http://www.cnki.com.cn/Article/CJFDTOTAL-KZYC200604018.htm
    [22] Duan Ming-Xiu. Research and Application of Hierarchical Clustering Algorithm [Master dissertation], Central South University, China, 2009

    段明秀.层次聚类算法的研究及应用[硕士学位论文], 中南大学, 中国, 2009.
    [23] Hartigan J A, Wong M A. A K-means clustering algorithm. Applied Statistics, 1979, 28(1): 100-108 doi: 10.2307/2346830
    [24] Bezdek J C, Ehrlich R, Full W. FCM: the fuzzy c-means clustering algorithm. Computers and Geosciences, 1984, 10(2-3): 191-203 doi: 10.1016/0098-3004(84)90020-7
    [25] Hautiére N, Tarel J P, Aubert D, Dumont E. Blind contrast enhancement assessment by gradient ratioing at visible edges. Image Analysis and Stereology, 2008, 27(2): 87-95 doi: 10.5566/ias.v27.p87-95
    [26] Xiao C X, Gan J J. Fast image dehazing using guided joint bilateral filter. The Visual Computer, 2012, 28(6-8): 713-721 doi: 10.1007/s00371-012-0679-y
    [27] Li J F, Zhang H, Yuan D, Sun M G. Single image dehazing using the change of detail prior. Neurocomputing, 2015, 156: 1-11 doi: 10.1016/j.neucom.2015.01.026
    [28] Burrus C S, Gopinath R A, Guo H T. Introduction to Wavelets and Wavelet Transforms. New Jersey: Prentice Hall, 1998.
    [29] Tian Y, Xia D, Xu Y P. Single foggy image restoration based on spatial correlation analysis of dark channel prior. Journal of Systems Engineering and Electronics, 2014, 25(4): 688-696 doi: 10.1109/JSEE.2014.00079
    [30] 张登银, 鞠铭烨, 王雪梅.一种基于暗通道先验的快速图像去雾算法.电子学报, 2015, 43(7): 1437-1443 http://www.cnki.com.cn/Article/CJFDTOTAL-DZXU201507029.htm

    Zhang Deng-Yin, Ju Ming-Ye, Wang Xue-Mei. A fast image daze removal algorithm using dark channel prior. Acta Electronica Sinica, 2015, 43(7): 1437-1443 http://www.cnki.com.cn/Article/CJFDTOTAL-DZXU201507029.htm
    [31] Zhu Q, Mai J, Shao L. A fast single image haze removal algorithm using color attenuation prior. IEEE Transactions on Image Processing, 2015, 24(11): 3522-3533 doi: 10.1109/TIP.2015.2446191
    [32] Meng G, Wang Y, Duan J, Xiang S, Pan C. Efficient image dehazing with boundary constraint and contextual regularization. In: Proceedings of the 2013 IEEE International Conference on Computer Vision. Sydney, Australia: IEEE, 2013. 617-624
    [33] Wang Z, Bovik A C, Sheikh H R, Simoncelli E P. Image quality assessment: from error visibility to structural similarity. IEEE Transactions on Image Processing, 2004, 13(4): 600-612 doi: 10.1109/TIP.2003.819861
    [34] Jobson D J, Rahman Z U, Woodell G A. Statistics of visual representation. In: Proceedings of the 2002 Visual Information Processing. Orlando, FL: SPIE, 2002. 25-35
    [35] Ling Z G, Li S T, Wang Y N, Shen H, Lu X. Adaptive transmission compensation via human visual system for efficient single image dehazing. Visual Computer, 2016, 32(5): 653-662 doi: 10.1007/s00371-015-1081-3
    [36] 刘海波, 杨杰, 吴正平, 张庆年, 邓勇.基于暗通道先验和Retinex理论的快速单幅图像去雾方法.自动化学报, 2015, 41(7): 1264-1273 http://www.aas.net.cn/CN/abstract/abstract18700.shtml

    Liu Hai-Bo, Yang Jie, Wu Zheng-Ping, Zhang Qing-Nian, Deng Yong. A fast single image dehazing method based on dark channel prior and Retinex theory. Acta Automatica Sinica, 2015, 41(7): 1264-1273 http://www.aas.net.cn/CN/abstract/abstract18700.shtml
  • 期刊类型引用(7)

    1. 吕建威,钱锋,韩昊男,张葆. 结合天空分割和雾气浓度估计的图像去雾. 光学精密工程. 2022(04): 464-477 . 百度学术
    2. 齐永锋,李占华. 一种基于多尺度卷积神经网络和分类统计的图像去雾霾方法. 红外技术. 2020(02): 190-197 . 百度学术
    3. 汤春明,董燕成,孙欣,林骏,廉政. 单幅夜间弱照度雾霾图像的复原算法. 计算机辅助设计与图形学学报. 2018(03): 459-467 . 百度学术
    4. 李尧羿,杜宇超,顾振飞. 结合天空区域识别的单幅图像去雾方法. 计算机工程与应用. 2018(19): 204-215 . 百度学术
    5. 顾振飞,李秋. 一种基于颜色衰减先验的航拍图像去雾方法. 信息化研究. 2017(01): 12-18 . 百度学术
    6. 吴颖斌. 基于HSV颜色模型的直方图均衡化图像去雾技术. 运城学院学报. 2016(06): 60-62 . 百度学术
    7. 刘万军,赵庆国,曲海成. 变差函数和形态学滤波的图像去雾算法. 中国图象图形学报. 2016(12): 1610-1622 . 百度学术

    其他类型引用(20)

  • 加载中
图(13) / 表(1)
计量
  • 文章访问数:  3904
  • HTML全文浏览量:  887
  • PDF下载量:  1116
  • 被引次数: 27
出版历程
  • 收稿日期:  2015-08-19
  • 录用日期:  2016-03-20
  • 刊出日期:  2016-09-01

目录

/

返回文章
返回