汪海龙 禹晶 肖创柏

Wang Hai-Long, Yu Jing, Xiao Chuang-Bai. Deep non-relaxing hashing based on point pair similarity. Acta Automatica Sinica, 2021, 47(5): 1077-1086 doi: 10.16383/j.aas.c180571
Citation: Wang Hai-Long, Yu Jing, Xiao Chuang-Bai. Deep non-relaxing hashing based on point pair similarity. Acta Automatica Sinica, 2021, 47(5): 1077-1086 doi: 10.16383/j.aas.c180571


北京市教育委员会科技计划 KM201910005029

北京市自然科学基金 4212014


    汪海龙  北京工业大学信息学部硕士研究生. 主要研究方向为图像处理与机器学习. E-mail: 18810815820@163.com

    禹晶  北京工业大学信息学部副教授. 2011年获清华大学电子工程系博士学位. 主要研究方向为图像处理与模式识别. E-mail: jing.yu@bjut.edu.cn


    肖创柏  北京工业大学信息学部教授. 主要研究方向为数字信号处理, 音视频信号处理与网络通信. 本文通信作者. E-mail: cbxiao@bjut.edu.cn

Deep Non-relaxing Hashing Based on Point Pair Similarity


Scientific Research Common Program of Beijing Municipal Commission of Education KM201910005029

Beijing Municipal Natural Science Foundation 4212014

More Information
    Author Bio:

    WANG Hai-Long  Master student at the Faculty of Information Technology, Beijing University of Technology. His research interest covers image processing and machine learning

    YU Jing  Associate professor at the Faculty of Information Technology, Beijing University of Technology. She received her Ph. D. degree from Tsinghua University in 2011. Her research interest covers image processing and pattern recognition

    Corresponding author: XIAO Chuang-Bai  Professor at the Faculty of Information Technology, Beijing University of Technology. His research interest covers digital signal processing, audio and video signal processing, and network communication. Corresponding author of this paper
  • 摘要: 哈希学习能够在保持数据之间语义相似性的同时, 将高维数据投影到低维的二值空间中以降低数据维度实现快速检索. 传统的监督型哈希学习算法主要是将手工设计特征作为模型输入, 通过分类和量化生成哈希码. 手工设计特征缺乏自适应性且独立于量化过程使得检索的准确率不高. 本文提出了一种基于点对相似度的深度非松弛哈希算法, 在卷积神经网络的输出端使用可导的软阈值函数代替常用的符号函数使准哈希码非线性接近-1或1, 将网络输出的结果直接用于计算训练误差, 在损失函数中使用$\ell_1$范数约束准哈希码的各个哈希位接近二值编码. 模型训练完成之后, 在网络模型外部使用符号函数, 通过符号函数量化生成低维的二值哈希码, 在低维的二值空间中进行数据的存储与检索. 在公开数据集上的实验表明, 本文的算法能够有效地提取图像特征并准确地生成二值哈希码, 且在准确率上优于其他算法.
    Recommended by Associate Editor ZHANG Min-Ling
    1)  本文责任编委 张敏灵
  • 图  1  ${\rm soft}\left({ x} \right) $的函数曲线

    Fig.  1  The function curve of the ${\rm soft}\left({ x} \right)$

    图  2  本文算法使用的网络模型

    Fig.  2  The network model of our algorithm

    图  3  不同正则项系数$\lambda$下准哈希码的分布

    Fig.  3  The distribution of hash code with different regularization coefficient $\lambda$

    图  4  参数$\eta$取不同值时准哈希码的分布

    Fig.  4  The distribution of hash code with different $\eta$

    表  1  各种算法在CIFAR-10上的MAP

    Table  1  The MAP of different algorithms on CIFAR-10

    算法12 bit24 bit32 bit48 bit
    表  2  各种算法在NUS-WIDE上的MAP

    Table  2  The MAP of different algorithms on NUS-WIDE

    算法12 bit24 bit32 bit48 bit
    表  3  $\ell_1$范数和软阈值函数约束在CIFAR-10上的MAP

    Table  3  The MAP of $\ell_1$-norm and soft threshold function constraint on CIFAR-10

    算法12 bit24 bit36 bit48 bit
    表  4  $\lambda$的不同取值对应的MAP

    Table  4  The MAP on different $\lambda$

