基于成对约束的偏标记数据消歧算法

征察; 吉立新; 高超; 李邵梅; 吴翼腾

doi:10.16383/j.aas.c170522

基于成对约束的偏标记数据消歧算法

doi: 10.16383/j.aas.c170522

征察^1, ,,
吉立新^1,,
高超^1,,
李邵梅^1,,
吴翼腾^1,

1.
国家数字交换系统工程技术研究中心郑州 450002

基金项目:

国家自然科学基金 61601513

详细信息

作者简介:
吉立新  国家数字交换系统工程技术研究中心研究员.主要研究方向为电信网信息关防, 信息安全. E-mail: jlx@ndsc.com.cn

高超  国家数字交换系统工程技术研究中心助理研究员.主要研究方向为计算机视觉. E-mail: chaosndsc@163.com

李邵梅  国家数字交换系统工程技术研究中心副研究员.主要研究方向为计算机视觉. E-mail: lishaomei may@126.com

吴翼腾  国家数字交换系统工程技术研究中心博士研究生.主要研究方向为网络大数据分析. E-mail: wuyiteng1992@163.com

通讯作者:
征察国家数字交换系统工程技术研究中心硕士研究生.主要研究方向为机器学习, 计算机视觉.本文通信作者. E-mail: zcpi31415926@163.com

计量
- 文章访问数: 1232
- HTML全文浏览量: 212
- PDF下载量: 129
- 被引次数: 1
出版历程
- 收稿日期: 2017-09-13
- 录用日期: 2018-04-16
- 刊出日期: 2020-07-24

Partial Label Data Disambiguation Algorithm Based on Pairwise Constraints

ZHENG Cha^{1
, ,},
JI Li-Xin^1
,,
GAO Chao^1
,,
LI Shao-Mei^1
,,
WU Yi-Teng^1
,

1.
National Digital Switching System Engineering & Technological R & D Center of China, Zhengzhou 450002

Funds:

National Natural Science Foundation of China 61601513

More Information

Author Bio:
JI Li-Xin   Professor at the China National Digital Switching System Engineering and Technological Research and Development Center. His research interest covers telecom network information gateway, and information security

GAO Chao   Assistant professor at the China National Digital Switching System Engineering and Technological Research and Development Center. His main research interest is computer vision

LI Shao-Mei   Associate professor at the China National Digital Switching System Engineering and Technological Research and Development Center. Her main research interest is computer vision

WU Yi-Teng   Ph. D. candidate at the China National Digital Switching System Engineering and Technological Research and Development Center. His main research interest is network big data analysis

Corresponding author: ZHENG Cha Master student at the China National Digital Switching System Engineering and Technological Research and Development Center. His research interest covers machine learning and computer vision. Corresponding author of this paper

摘要

摘要: 偏标记数据消歧是利用偏标记数据进行机器学习的基础.针对偏标记数据中广泛存在的数据不平衡问题, 以及现有消歧算法对样本间约束信息利用不足的问题, 本文提出一种基于成对约束的偏标记数据消歧算法.首先, 基于低秩表示, 推导出数据不平衡条件下样本低秩表示系数和样本相似度之间的关系; 其次, 基于推导结果, 分别构建基于样本间正约束和负约束的图模型, 通过最小化图模型的能量函数求解偏标记数据的标签.在5个公开数据集上的实验结果表明本文方法相对基准算法在消歧准确率上平均提高了2.9 % ~ 14.9 %.
- 偏标记数据 /
- 消歧 /
- 数据不平衡 /
- 低秩表示 /
- 成对约束
Abstract: Partial label data disambiguation is the basis of machine learning using partial label data. In order to solve the data imbalance problem widely existing in partial label data, and the problem that the existing disambiguation algorithms have insufficient utilization of constraints between samples, a partial label data disambiguation algorithm based on pairwise constraints is proposed in this paper. Firstly, the relation between low-rank representation coefficients and sample similarities in unbalanced datasets is deduced by utilizing low-rank representation. Secondly, according to the deduced results, two graphs are created based on positive constraint and negative constraint respectively. Finally, the labels of partial label data samples are obtained by minimizing energy functions based on graphs. Experimental results on five open datasets indicate that the proposed algorithm outperforms benchmark algorithms by 2.9 % ~ 14.9 % at disambiguation accuracy.
- Partial label data /
- disambiguation /
- imbalanced data /
- low-rank representation /
- pairwise constraints
Recommended by Associate Editor WANG Li-Wei
注释:

1) 本文责任编委王立威

HTML全文

基于生物特征(虹膜、人脸、步态、指纹等)的身份识别是个体身份鉴别的重要手段.近年来, 随着模式识别、机器学习、计算机视觉、人工智能、信息安全等领域的发展, 生物特征识别技术不断突破创新, 得到了国内外学术界, 产业界乃至政府部门的高度关注, 已经被推向一个研究高潮.相比传统身份识别方式(密码、身份证等), 生物特征具有防伪性高、不易丢失或遗忘、信息丰富的特点.在常用生物特征(指纹、人脸、虹膜等)中, 虹膜识别因为具有唯一性、稳定性、非接触性、高精度等优势, 是现阶段最安全可靠的生物特征识别技术, 现已成功应用于海关、机场、公安、金融等高安全需求的场合.但是, 最近研究表明, 现有的虹膜识别系统无法对采集端进行保护, 在遇到人造假体样本(打印虹膜、美瞳、义眼等)攻击时, 常见的数字证书加密、水印、数字签名等信息保护措施失效, 导致系统产生误识别^[1-3].为了准确辨别真实虹膜和人造假体虹膜, 提升虹膜识别系统的安全性和鲁棒性, 虹膜活体检测技术(Iris liveness detection)应运而生.该技术的基本原理是:与正常采集的虹膜图像相比, 人造假体虹膜图像在生成时会丢失信息, 同时也会附加额外的信息, 通过检测这两部分信息可以判断虹膜图像的真实性^[4].

根据检测信息方式的差异可以将虹膜活体检测方法分为两类:硬件法^[5-14]和软件法^[15-25].硬件法是指通过使用额外的硬件设备采集活体人眼特有的特征进行活体检测, 比如视线特征^[5-7]、虹膜立体结构特征^[8]、虹膜震颤(Hippus)特征^[9]等. Daugman^[10]提出了利用角膜和晶状体前后面对光照产生的普尔钦(Purkinje)反射进行虹膜活体检测的理论, Lee等^[11]基于该理论实现了虹膜活体检测.该方法通过控制一对近红外光源产生并拍摄普尔钦反射, 可以实现图片、美瞳、义眼等多种攻击类型的检测, 不过需要精确控制光源和瞳孔之间的角度, 对成像系统要求较高. Lee等^[12]通过测量不同近红外光照(750 nm和850 nm)条件下巩膜和虹膜之间反射率比的变化进行活体检测.该方法检测速度快, 但是需要分两次采集不同光照条件下的人眼图像, 大大降低了数据采集效率. Czajka等^[13]通过控制30 s内点光源的亮度变化, 根据瞳孔的动态变化(Pupil dynamics)和与瞳孔收缩模型的拟合情况区分真假虹膜样本.该方法精度较高, 但数据采集时间较长且采集时人眼舒适度低.

近年来, 光场成像技术以其多视角、多维度、多焦点成像的特点逐步应用于生物特征识别领域. Raghavendra等^[14]首次利用光场相机的固有特性进行虹膜活体检测.该方法首先利用Lytro Desktop软件对光场图像进行预处理并渲染得到十几张具有不同对焦深度的图像, 然后依次对这些图像进行预处理, 得到归一化虹膜图像序列, 最后通过离散小波变换(Discrete wavelet transform, DWT)方法计算图像序列的对焦能量变化量来区分真假虹膜样本.该方法数据采集方便, 但光场数据处理受软件限制, 局限性大; 由于采用阈值分类方法, 该方法只能应对单一攻击类型, 其应用面较窄, 无法同时应对多种攻击类型.

软件法是指在虹膜图像采集完成后通过对采集到的图像提取有区分性的特征进行虹膜活体检测. Daugman^[10]提出打印虹膜图像经过2D傅里叶分析会产生与真实虹膜图像不同的频域特征.真假虹膜图像不仅频谱特征不同, 纹理特征也存在差异.因此, 通过利用LBP (Local binary pattern)^[15]、BSIF (Binarized statistical image features)^[16-17]、GLCM (Gray level co-occurrence matrix)^[18]等局部特征描述子提取有区分性的局部特征, 可以准确检测多种人造假体虹膜类型(打印虹膜、美瞳、义眼等). Hu等^[19]和Kohli等^[20]通过融合多种局部特征取得了更好的活体检测结果. Gabally等^[21]基于“质量差异”的假设提出了基于图像质量评价(Image quality assessment)的活体检测方法.该方法通过专门设计多种针对虹膜图像的质量评价指标, 来区分真实虹膜和打印虹膜, 取得了较高的分类准确率.然后, Gabally等^[22]又使用25种常规图像质量评价方法来提取虹膜图像的质量特征, 既取得了较高的准确率又具有很好的泛化性能.随着深度学习浪潮的来临, 基于深度学习的虹膜活体检测方法^[23-25]也已经达到了与传统方法相当的准确率.

综上, 我们可知: 1)两类虹膜活体检测方法各有其优点与不足.硬件法能够采集更丰富的信息, 分类效果更好, 但是一般需要使用额外的成像设备, 自主搭建采集系统, 控制采集环境.因此硬件法操作复杂度高, 采集效率低, 无法便捷应用.软件法使用非接触方式采集图像, 运行速度快, 但是输入信息有限, 图像处理, 特征提取和活体检测算法易受图像质量影响. 2)目前使用的虹膜数据库几乎都是近距离采集(≤60 cm), 这样虽然能够得到高分辨率和高质量的虹膜图像, 但是成像环境和应用场景的光照、距离、视角、离焦、景深、噪声等变量需要严格受控, 无法进行复杂场景下的虹膜数据获取、活体检测、身份识别等任务的研究.

基于以上问题, 本文提出了基于计算光场成像的远距离虹膜活体检测方法, 通过软硬件结合的方式, 从数据获取源头创新, 利用计算光场成像技术充分挖掘高维光场信息, 通过特征融合实现准确有效的远距离虹膜活体检测.我们使用光场相机作为虹膜图像的采集设备, 操作简单, 使用方便.利用计算光场成像技术, 只需一次图像采集, 使用一张光场图像即可使用硬件法和软件法分别提取有区分性的特征进行虹膜活体检测.因此, 本方法既能够方便迅速地采集虹膜图像, 又能够记录更高维度、更丰富的有效信息, 取得更好的活体检测结果.虹膜活体检测是虹膜识别系统的关键预处理步骤, 对于虹膜识别系统来说, 识别距离越远, 识别景深范围越大, 用户体验越好.光场成像技术具有景深扩展的强大后处理能力, 利用实验室自主研发的光场相机进行光场成像的景深比传统成像的景深扩大5~10倍, 可以实现远距离大景深的虹膜活体检测, 有助于促进生物特征识别的研究发展与应用产业化.

本文受Raghavendra等^[14]方法的启发, 与其不同的是, 在本文提出方法的数据采集环节中, 采集距离更远, 采集设备更先进, 采集环境更复杂; 在数据处理环节中, 可以自由控制光场图像的预处理与渲染过程, 根据需要得到任意步长间隔的重对焦图像序列; 在对焦评价环节中, 本文针对远距离半受控的采集环境, 选择了对噪声更鲁棒的基于图像梯度的评价方法; 在虹膜分类环节中, 本文选择了比阈值分类方法适用范围更广、分类性能更强的分类器.文献[14]虽然利用光场相机的固有特性进行近距离虹膜活体检测并在单一攻击类型的数据库中取得了不错的结果, 但无法同时应对多种攻击类型.而本方法通过软硬件结合的方式, 使用光场相机采集光场虹膜图像; 利用计算光场成像技术, 以光场重对焦技术为切入点, 通过软硬件特征融合的方式在远距离、半受控、大景深的图像采集条件下仍然可以同时应对多种攻击类型, 进行高准确率的虹膜活体检测.本文首先利用重对焦技术提取眼睛区域的立体结构特征, 然后利用重对焦序列中最清晰图像提取虹膜的纹理特征, 在特征层融合后使用支持向量机(Support vector machine, SVM)分类器进行真假虹膜样本分类.为了验证本文方法的精度和有效性, 我们采集建立了目前为止第一个近红外远距离光场虹膜活体检测数据库, 包括打印虹膜(普通打印纸、高光相片纸)和屏显虹膜(iPad)两类共三种人造假体虹膜图像, 共504个有效样本(约5万张重对焦光场图像).实验结果表明本文提出的方法可以准确有效地检测并阻止打印虹膜和屏显虹膜对虹膜识别系统的攻击.

1. 光场虹膜活体检测技术

本文提出基于计算光场成像的虹膜活体检测方法, 如图 1所示.首先, 对采集的原始光场图像进行解码、标定、预处理, 获得四维光场数据$ L(u, v, x, y) $; 利用光场重对焦技术得到一组焦栈(Focal stack)图像.然后, 计算焦栈图像中眼睛区域的对焦能量值作为立体结构特征; 选取焦栈中最清晰的虹膜图像进行定位, 分割、归一化、提取LPQ (Local phase quantization)^[26]特征作为纹理特征.最后, 在特征层融合立体结构特征和纹理特征, 使用SVM分类器进行真实虹膜和人造假体虹膜分类.

图 1 光场虹膜活体检测方法流程图

Fig. 1 Flowchart of light-field iris liveness detection method

下载: 全尺寸图片幻灯片

1.1 光场焦栈渲染

1.1.1 光场图像预处理

光场通过表征空间中每一条光线的辐射亮度(Radiance), 描述了光在三维空间的辐射传输特性.光场成像是一种计算成像技术, 单次曝光即可同时捕获光线的能量和角度信息.因此, 基于光场成像技术设计的光场相机可以记录拍摄场景的光场.现阶段, 微透镜阵列广泛应用于光场调制过程.基于微透镜阵列的光场相机(Lytro, Raytrix等)是由主光学系统、微透镜阵列、图像传感器组成, 通过在传感器前放置微透镜阵列, 可以对不同视角的光线进行分离, 实现不同视角的快照式成像.

光场成像是一种编码成像, 不是“所见即所得”, 因此需要对获取的原始光场图像进行解码、标定和预处理, 才能得到图像的光场数据.本文采用Dansereau等^[27]提出的方法¹, 使用双平面表达模型对光场进行参数化描述, 通过使用白图像标定每个微透镜的中心坐标, 计算配准参数, 提取4D光场数据$ L (u, v, x, y) $.

¹http://www.mathworks.com/matlabcentral/fileexchange/49683

$ \begin{equation} I(x, y) = \iint L(u, v, x, y) \mathrm{d}u \mathrm{d}v \end{equation} $

(1)

计算光场成像模型如式(1)所示, 对光场矩阵$ L(u, v, x, y) $的$ uv $坐标积分, 即可得到传统光学成像结构采集的2D传统图像$ I(x, y) $.通过固定$ uv $坐标可以得到不同视角下的子孔径图像$ I(x, y)_{u, v} $, 由文献[28]可知, 子孔径图像所对应的光瞳尺寸是原始光瞳尺寸的$ {1}/{u} $, 因此, 理论上光场子孔径图像的景深是传统图像的$ u $倍.以我们实验室自主研制的光场相机为例, $ u = 13 $.

图 2为物方离焦分别为-10 cm、0 cm、+10 cm、+20 cm时传统图像$ I(x, y) $和对应距离采集的光场中心子孔径图像$ I(x, y)_{5, 5} $.第1行为传统图像, 第2行为与之对应的光场中心子孔径图像.比较两组图像可知, 在聚焦位置1.6 m处两幅图像都非常清晰, 没有明显视觉差异; 随着离焦量增大, 传统图像趋于模糊, 当离焦量较大时, 弥散效应非常明显, 虹膜数据已无法用于后续的数据处理, 而光场中心子孔径图像仍然可以清晰看到瞳孔中反射的光点.这说明光场成像的景深远大于传统成像的景深, 计算光场成像具有强大的景深扩展能力.

图 2 传统图像(上)与光场中心子孔径图像(下)比较

Fig. 2 Comparison between traditional images (up) and light-field sub-aperture images (down)

下载: 全尺寸图片幻灯片

传统成像技术一直存在景深与焦距(或孔径)的相互制约关系.利用传统相机拍摄远距离虹膜时必须选用长焦镜头, 若固定其他光学成像参数, 则焦距增大会导致景深变小, 使高质量清晰虹膜图像的采集变得非常困难, 需要参与者高度配合, 否则容易出现严重的离焦模糊, 为后续虹膜检测、分割、识别的研究带来巨大挑战.而光场成像技术具有“先拍摄, 后对焦”的优势, 在进行远距离虹膜图像采集时, 使用实验室自主研制的光场相机配合70 mm $ \sim $ 200 mm长焦镜头拍摄1.6 m远的虹膜时, 依然可以获得30 cm的有效景深范围, 有效解决了基于传统成像的虹膜图像采集的难题.因此, 使用光场成像方式可以实现对用户交互、应用场景、成像环境鲁棒的远距离、大景深、高质量光场虹膜图像采集.

1.1.2 光场重对焦

对焦是通过改变探测器像面与镜头之间的距离, 使拍摄物体在探测器像面上产生清晰图像的过程.在传统光学成像系统中, 对焦是通过手动或自动调整对焦环使离焦模糊的目标变清晰, 其实质是将光场重新投影到成像最清晰的像平面.基于微透镜阵列的光场相机能够同时对光线的能量和角度信息进行采样和成像, 记录四维光场数据.因此可以通过计算成像的方式改变光场的投影像平面, 实现数字重对焦(Digital refocusing).本文使用Ng等^[28]提出的重对焦方法, 重对焦计算公式为:

$ \begin{equation} L{'}(u, v, x{'}, y{'}) = L(u, v, \frac{x{'}}{\alpha}+u(1-\alpha), \frac{y{'}}{\alpha}+v(1-\alpha)) \end{equation} $

(2)

如图 3所示, 基于双平面表达模型对光场进行参数化描述, $ L{'}(u, v, x{'}, y{'}) $表示重对焦平面记录的光场, $ L(u, v, x, y) $表示原始成像平面记录的光场, $ \alpha $表示重对焦像平面与原始成像平面的相对位置, $ \alpha = {F{'}}/{F} $, $ F $和$ F{'} $分别表示重对焦前后主透镜平面到成像平面的距离.基于几何光学的光线传播理论, 光线在均匀介质中沿直线传播, 所以在式(2)中, 重对焦前后光场$ uv $坐标不变.因此, 重对焦图像可由原始光场子孔径图像线性平移后叠加获得.通过均匀改变$ \alpha $可以得到一组对焦在不同深度位置的焦栈图像.

图 3 重对焦示意图

Fig. 3 Refocusing demonstration

下载: 全尺寸图片幻灯片

图 4为一组虹膜焦栈图像中的部分图像, 可以直观地看到$ \alpha = 1.010 $时图像最清晰(计算焦栈图像的对焦能量值亦可验证), 在此基础上$ \alpha $减小或增大图像都逐渐模糊.

图 4 虹膜焦栈图像

Fig. 4 Iris focal stack images

下载: 全尺寸图片幻灯片

理论上在聚焦情况下, 当$ \alpha = 1 $时图像最清晰, 但因为本文实验数据是在半受控环境下采集, 实际拍摄中由于被采集者移动、姿态非对正、对焦目标是人脸等因素会导致虹膜的聚焦位置不是理想情况时的$ \alpha = 1 $.因此, 通过光场数字重对焦技术不仅可以利用硬件法提取焦栈图像眼睛区域的立体结构特征, 而且可以实现更准确对焦, 获取最清晰的虹膜图像, 从而利用软件法提取更有区分性、更鲁棒的纹理特征.虽然光场重对焦技术可以扩大图像景深, 但是仍然受到香农采样定理的制约, 偏离聚焦位置过大仍会导致图像模糊, 产生非精确对焦(Inexact refocusing)^[29].

1.2 立体结构特征描述

1.2.1 对焦评价函数

本文使用对焦评价函数对焦栈图像的清晰度进行度量评价, 从而得到焦栈图像的对焦能量值曲线, 以此构建眼睛区域的立体结构特征.由于采集距离远, 光照和离焦不断变化, 采集的虹膜图像存在不同程度的噪声, 因此本文采用对光照和噪声不敏感的基于图像梯度的对焦评价函数TGV (Tenengrad gradient variance)^[30], 以提升本方法的鲁棒性.

$ \begin{align} S(x, y) & = \sqrt{(I_{\rm{R}}(x, y)* S_{x})^{2}+{(I_{\rm{R}}(x, y)* S_{y})^{2}}} \end{align} $

(3)

$ \begin{align} \bar{S} & = \frac{1}{XY}\sum\limits_{x = 1}^X\sum\limits_{y = 1}^YS(x, y) \end{align} $

(4)

$ \begin{align} F_{\rm{SF}}(I_{\rm{R}}) & = \sum\limits_{x = 1}^X\sum\limits_{y = 1}^Y[S(x, y)-\bar{S}]^{2} , \text{ 若 }\; S(x, y)>T \end{align} $

(5)

由式(3) $ \sim $ (5)可知, TGV方法首先使用索贝尔算子(Sobel operator) $ S_{x} $和$ S_{y} $提取重对焦图像$ I_{\rm{R}}(x, y) $中的边缘信息, 然后计算每个像素的梯度强度$ S(x, y) $和整幅图像的平均梯度强度$ \bar{S} $, 设置阈值$ T $来滤除噪声产生的边缘像素, 使用梯度强度方差$ F_{\rm{SF}}(I_{\rm{R}}) $作为图像的对焦能量值. $ F_{\rm{SF}}(I_{\rm{R}}) $越大, 说明图像中边缘信息越丰富, 图像越清晰.

图 5展示的是相机对焦位置为1.6 m时, 对1.5 m (-10 cm)、1.6 m (0 cm)、1.7 m (+10 cm)、1.8 m (+20 cm)处的虹膜进行光场成像得到的对焦能量值曲线.横轴表示焦栈中图像的位置序号(Sequence number), 对应的重对焦区间为$ [0.5, 1.7] $.纵轴表示对焦能量值大小.可以发现, 随着采集距离增加, 对焦能量值达到峰值时所在焦栈图像中的位置逐渐后移, 与理论聚焦位置相符.对焦能量值曲线对应的峰值大小与离焦量有关, 在实际对焦位置1.6 m处离焦0 cm, 此时对焦能量值最大, 图像最清晰.当离焦-10 cm、+10 cm、+20 cm时, 虽然重对焦图像的清晰度提升很大, 但是因为重对焦图像是由原始光场子孔径图像经过线性平移后叠加得到, 这个过程相当于对图像进行了平滑滤波, 图像丢失了部分的高频信息, 边缘信息变少.因此, 重对焦位置偏离聚焦位置越远, 图像平滑越明显, 高频信息丢失越多, 图像对焦能量值越低.

图 5 不同拍摄距离(离焦量)时焦栈图像对焦能量值曲线

Fig. 5 Focus measure curves of focal stack images at different capturing distances (defocusing amount)

下载: 全尺寸图片幻灯片

1.2.2 立体结构特征构建

由于我们采集的是双眼虹膜图像, 采集环境半受控, 在拍摄时会因为被采集者移动、姿态非对正等因素导致左右眼区域的最优聚焦位置不同, 影响立体结构特征的提取.所以左右眼区域最优聚焦位置的搜索过程是独立进行的.

重对焦过程本质是一个搜索过程, 因此本文采用了由粗到精的方法确定最优聚焦位置$ \alpha^{*} $.首先使用$ \Delta\alpha = 0.03 $的步长在$ [0.5, 1.7] $的重对焦区间内对图像进行大范围宽间距的搜索, 寻找焦栈图像中聚焦能量值最高的图像对应的$ \alpha{'} $, 然后以$ \alpha{'} $为中心, 在$ [\alpha{'}-0.03, \alpha{'}+0.03] $区间内进行小范围窄间距的二次重对焦搜索, 确定最优聚焦位置$ \alpha^{*} $.

根据相关实验结果(详见第3.1节), 确定最优重对焦范围为0.4, 因此构建眼睛区域立体结构特征的重对焦区间为$ [\alpha^{*}-0.2, \alpha^{*}+0.2] $; 重对焦步长$ \Delta\alpha = 0.0028 $, 对应的焦栈图像数量$ N_{\rm{SN}} $ (Sequence number)为145.将该序列中所有图像对焦能量值依次排列, 作为眼睛区域的立体结构特征$ \boldsymbol{F}_{\rm{SF}} $.立体结构通过对焦能量值曲线的形状反映了眼睛区域的深度结构信息.

图 6展示了同一虹膜在1.5 m、1.6 m、1.7 m处拍摄的真实虹膜图像和利用该虹膜制造的三种人造假体虹膜图像的归一化立体结构特征曲线.对比真假虹膜的归一化立体结构特征曲线, 可以发现两者之间存在显著差异. 1)真实虹膜图像的归一化立体结构特征曲线峰值比较低, 假虹膜曲线的峰值比较高.原因是真实人眼区域是立体结构, 虹膜与眼周区域位于不同的深度位置, 在一定重对焦范围内都有对象对焦, 对焦能量值衰减较慢, 因此在归一化立体结构特征曲线中峰值对应的比重较低. 2)真实虹膜归一化立体结构特征曲线存在不同程度的波动, 曲线不平滑, 而人造假体虹膜曲线平滑.原因是打印虹膜和屏显虹膜是平面结构, 没有深度变化, 而真实人眼区域是立体结构, 在计算对焦能量值时会产生较大程度的波动.

图 6 不同类型真假虹膜图像归一化立体结构特征曲线

Fig. 6 Normalized structure feature curves of different kinds of real and fake images

下载: 全尺寸图片幻灯片

实验结果表明(详见第3.3节), 当单独使用眼睛区域归一化立体结构特征进行虹膜活体检测时, 可以达到94.41 %分类准确率, 5.90 %平均分类错误率, 说明提取的归一化立体结构特征具有很强的区分性.

1.3 纹理特征提取

我们通过由粗到精的重对焦搜索确定了最优聚焦位置$ \alpha^{*} $和对应的最清晰虹膜图像.本方法使用最清晰虹膜图像进行虹膜定位、分割、归一化, 然后使用LPQ特征描述子提取虹膜图像的纹理特征.

LPQ特征使用图像低频信息进行构建, 对图像模糊不敏感, 可以在远距离情况下提取更鲁棒、更有区分性的特征.首先对图像$ f(\boldsymbol{x}) $中每个像素$ \boldsymbol{x} $的矩形邻域$ N_{\boldsymbol{x}} $做短时傅里叶变换(Short-time Fourier transform, STFT)变换:

$ \begin{equation} F(\boldsymbol{u}, \boldsymbol{x}) = \sum\limits_{\boldsymbol{y}}f(\boldsymbol{y})\omega(\boldsymbol{y}-\boldsymbol{x})\mathrm{e}^{-\mathrm{j2\pi} \boldsymbol{u}\cdot \boldsymbol{y}} \end{equation} $

(6)

式中, $ \boldsymbol{x} $、$ \boldsymbol{y} $是图像像素的二维坐标, $ \boldsymbol{u} $是频率, $ \omega(\boldsymbol{x}) $是表示邻域$ N_{\boldsymbol{x}} $的窗口函数.只考察四个频率$ \boldsymbol{u}_{0} = (a, 0) $, $ \boldsymbol{u}_{1} = (a, a) $, $ \boldsymbol{u}_{2} = (0, a) $, $ \boldsymbol{u}_{3} = (-a, a) $的傅里叶系数, 其中$ a\ll1 $.得到像素$ \boldsymbol{x} $的傅里叶系数特征$ \boldsymbol{F} (\boldsymbol{x}) $, 如式(7)和(8)所示.将$ \boldsymbol{G} (\boldsymbol{x}) $各分量的实部和虚部根据其正负号分别量化为1和0, 得到像素$ \boldsymbol{x} $邻域的傅里叶相位信息, 将其转换至$ [0, 255] $范围就得到该像素的LPQ特征值$ F_{\rm{LPQ}} (\boldsymbol{x}) $.最后统计图像所有像素点的LPQ特征值得到图像的LPQ特征统计直方图, 将其作为虹膜图像的纹理特征$ \boldsymbol{F}_{\rm{LPQ}} $.

$ \begin{align} \boldsymbol{F}(\boldsymbol{x}) & = [F(\boldsymbol{u}_{1}, \boldsymbol{x}), F(\boldsymbol{u}_{2}, \boldsymbol{x}), F(\boldsymbol{u}_{3}, \boldsymbol{x}), F(\boldsymbol{u}_{4}, \boldsymbol{x})] \end{align} $

(7)

$ \begin{align} \boldsymbol{G}(\boldsymbol{x}) & = [\mathrm{Re}{\boldsymbol{F}(\boldsymbol{x})}, \mathrm{Im}{\boldsymbol{F}(\boldsymbol{x})}] \end{align} $

(8)

图 7展示了同一虹膜在1.5 m、1.6 m、1.7 m处拍摄的真实虹膜图像和利用该虹膜制造的三种人造假体虹膜图像的纹理特征曲线.真假虹膜之间的纹理特征在形状、幅值等方面存在显著差异.

图 7 不同类型真假虹膜图像纹理特征曲线

Fig. 7 Texture feature curves of different kinds of real and fake images

下载: 全尺寸图片幻灯片

1.4 特征融合与分类

立体结构特征表达了眼睛区域的深度变化信息, 纹理特征表达了虹膜的纹理信息, 两类特征相互补充, 因此本方法融合两类特征进行虹膜活体检测.相比于分数层特征融合方式, 本文使用的特征层级联的特征融合方式可以使分类器既能提取每一类特征的有区分性信息, 又能利用两类特征之间隐含的相关性来提高分类结果, 获得更高的分类准确率.分别对立体结构特征和纹理特征进行归一化, 然后进行特征串联即可得到最终分类特征$ \boldsymbol{F}_{\rm{F}} = [\boldsymbol{F}_{\rm{SF}}, \boldsymbol{F}_{\rm{LPQ}}] $.

$ \begin{align} \min\limits_{\boldsymbol{\omega}, b, \boldsymbol{\xi}}&\Bigg(\max\limits_{\alpha_{i}, \beta_{i}}\Bigg(\frac{1}{2}\|\boldsymbol{\omega}\|^{2}+C\sum\limits_{i = 1}^{n}\xi_{i}-\sum\limits_{i = 1}^{n}\alpha_{i}(y_{i}(\boldsymbol{\omega}^\mathrm{T}\boldsymbol{x}_{i}+ \\ &b)-1+\xi_{i})-\sum\limits_{i = 1}^{n}\beta_{i}\xi_{i}\Bigg)\Bigg) \end{align} $

(9)

s.t.

$ \begin{align} \alpha_{i}\geq0, \ \beta_{i}\geq0, \ \xi_{i}\geq0, \ i = 1, 2, \cdots, n \end{align} $

本文采用径向基函数SVM分类器进行特征分类, 首先优化求解式(9), 利用$ n $个训练集数据求解变量$ \boldsymbol{\alpha}^{*} = (\alpha_{1}^{*}, \alpha_{2}^{*}, \cdots, \alpha_{n}^{*}) $和$ b^{*} $的最优解, 然后使用分类决策函数$ f(\boldsymbol{x}) $判断测试样本$ \boldsymbol{x} $的真伪.

$ \begin{equation} f(\boldsymbol{x}) = \mathrm{sign}\left(\sum\limits_{i = 1}^{n}\alpha_{i}^{*}y_{i}\exp(-\frac{\|\boldsymbol{x}_{i}-\boldsymbol{x}\|^{2}}{2\sigma^{2}})+b^{*}\right) \end{equation} $

(10)

2. 数据库建立

我们计划建立一个大型近红外光场虹膜活体检测数据库.目前已完成第一阶段的采集工作, 建立了一个中等规模的近红外远距离光场虹膜活体检测数据库.该数据库在半受控环境下采集, 半受控表现为采集环境光照多变、采集背景复杂、采集姿态非对正、遮挡等.采集对象有14人, 采集的人造假体虹膜样本类型有打印虹膜(普通打印纸、高光相片纸)和屏显虹膜(iPad)两类.对采集的光场图像进行认真筛选, 得到504个可用真假虹膜样本(约5万张重对焦光场图像).我们使用的采集设备有实验室自制光场相机和Lytro Illum商业级光场相机, 如图 8 (a)和8 (b)所示.下面分别介绍真实虹膜样本图像和人造假体虹膜样本图像的采集流程规范.

图 8 光场图像采集设备及采集场景

Fig. 8 Light-field image acquisition devices and acquisition scene

下载: 全尺寸图片幻灯片

2.1 真实虹膜样本采集流程

由于亚洲人种的虹膜在可见光下呈深褐色, 虹膜纹理不明显, 所以需要在近红外环境下采集真实人眼虹膜图像.真实人眼虹膜图像的采集过程分为两步.

1) 使用图 8 (c)所示的近距离高清虹膜采集设备采集近红外条件下的双眼虹膜图像, 专门用于人造假体虹膜样本的制作, 以及后续的虹膜识别研究. 图 8 (d)是采集白图像的过程, 采集的白图像用于光场相机的标定与光场图像的平场校正、参数配准等预处理过程.

2) 采集远距离不同离焦情况下的双眼真实虹膜样本.为了让拍摄环境更接近实际应用时的光照环境, 我们通过调整摄影灯的光照强度和近红外光的强度人为模拟了高亮光照环境、自然光照环境、昏暗光照环境, 每个参与者只在一种光照环境下拍摄虹膜图像.

我们将光场相机设置为拍摄1.6 m距离处图像能清晰对焦, 保持相机参数不变, 让参与者分别位于1.5 m、1.6 m、1.7 m和1.8 m处拍摄离焦距离分别为-10 cm、0 cm、+10 cm和+20 cm时的光场虹膜图像, 每个位置至少采集三张光场图像.采集的真实虹膜样本如图 9 (a)所示.

图 9 采集的真假虹膜图像

Fig. 9 Captured real an spoofing irises

下载: 全尺寸图片幻灯片

经过光场解码、标定、去渐晕等后处理增强, 最终采用115张真实双眼虹膜图像, 获得230个真实虹膜样本.

2.2 人造假体虹膜样本采集流程

拍摄的人造假体虹膜类型有打印虹膜和iPad屏显虹膜两类, 其中打印虹膜又细分为A4普通打印纸黑白打印与高光相片纸彩色打印两种.图 9 (b)$ \sim $9 (d)对应展示了A4普通打印纸打印虹膜、iPad屏显虹膜、高光相片纸打印虹膜三种人造假体虹膜图像.我们选择这三种人造假体攻击方式的原因有: 1)图像来源简单可靠, 高分辨率图像非常容易从社交媒体等渠道获取或盗用; 2)攻击方式简单有效, 文献[1-3]对这几种方法的有效性都进行了研究.

我们首先使用商业打印机制作两种打印类型的假体虹膜图像, 打印机DPI (Dots per inch)设置为1 200, 分别在高亮光照环境和自然光照环境下使用自制相机和Lytro相机采集1.5 m、1.6 m、1.7 m距离时的人造假体虹膜图像, 每个人造样本采集三张图像. iPad屏显虹膜图像使用屏幕分辨率为$ 2 048 \times 1 536 $的iPad mini 4展示.我们分别使用两种光场相机拍摄1.6 m距离时的iPad人造假体虹膜图像.最终, 我们采用137张人造假体双眼膜样本图像, 获得三种类型共274个人造假体虹膜样本.

3. 实验与结果

我们首先通过实验确定本文方法的关键参数, 然后介绍活体检测方法的评价准则, 最后在我们自主采集的光场虹膜数据库上进行实验, 并对实验结果进行分析.

3.1 实验参数

本文提出的虹膜活体检测方法需要利用光场重对焦技术来计算眼睛区域的立体结构特征, 所以重对焦范围$ S_{\rm{s}} $和重对焦序列图像数量$ N_{\rm{SN}} $的选取直接影响到立体结构特征的表达, 进而影响活体检测方法的准确率.但是$ S_{\rm{s}} $和$ N_{\rm{SN}} $无法根据理论和经验直接确定, 所以本文通过实验的方式确定它们的最优解.

重对焦范围$ S_{\rm{s}} $可以表示为重对焦序列图像数量$ N_{\rm{SN}} $与重对焦序列最小间隔$ \Delta\alpha $的乘积.

$ \begin{equation} S_{\rm{s}} = \Delta\alpha\cdot N_{\rm{SN}} \end{equation} $

(11)

我们固定$ \Delta\alpha $不变, 通过寻找$ S_{\rm{s}} $与活体检测准确率之间的关系来同时确定$ S_{\rm{s}} $和$ N_{\rm{SN}} $.通过简单实验进行拟合, 确定$ \Delta\alpha $的估计值为0.0028.图 10展示的是$ S_{\rm{s}} $取值分别为$ 0.1, 0.2, \cdots, 0.7 $时与活体检测准确率Accuracy的关系.实验结果表明$ S_{\rm{s}} $与活体检测准确率有相关性, $ S_{\rm{s}} $在$ [0.1, 0.4] $之间随着重对焦范围增大, 准确率逐渐提升, 在$ S_{\rm{s}} = 0.4 $时准确率达到最大值94.41 %, 此后准确率随着$ S_{\rm{s}} $的增大缓慢波动.因为程序执行时间与焦栈图像数量是线性关系, $ S_{\rm{s}} $越大焦栈图像渲染的耗时越长.所以$ S_{\rm{s}} $的最优值为0.4, 用于构建立体结构特征的重对焦区间为$ [\alpha^{*}-0.2, \alpha^{*}+0.2] $, $ N_{\rm{SN}} $的最优值为145.

图 10 S_s与准确率Accuracy关系曲线

Fig. 10 Relation curve between S_s and accuracy

下载: 全尺寸图片幻灯片

3.2 实验评价准则

根据ISO/IEC^[31]的规定, 虹膜活体检测方法的评价指标为: 1) Attack presentation classification error rate (APCER), 表示的是把人造假体虹膜样本错误地认定为真实虹膜样本的比例; 2) Bona fide presentation classification error rate (BPCER), 表示的是把真实虹膜样本错误认定为人造假体虹膜样本的比例.最后本文使用平均分类错误率ACER评价方法的整体性能.

$ \begin{equation} ACER = \frac{APCER+BPCER}{2} \end{equation} $

(12)

平均错误率ACER越小, 说明算法整体表现越好, 活体检测准确率越高. APCER、BPCER、ACER均可以通过比较测试集真实标签和SVM分类器估计的标签得到.

3.3 实验结果与分析

由于传统方法可以直接使用光场子孔径图像进行活体检测, 所以对比方法中包括了很多基于传统图像的方法, 比如基于局部特征描述子的方法和基于图像质量评价的方法.对比方法使用的虹膜图像为焦栈图像中最清晰的虹膜图像.实验在自主采集的近红外远距离光场虹膜活体检测数据库上进行, 将实验数据根据采集对象分为训练集和测试集, 训练集包括5人的真假虹膜图像, 测试集包括9人的真假虹膜图像, 实验结果如表 1所示.

表 1 虹膜活体检测方法在自主采集的数据库上的表现(%)

Table 1 Performance of iris liveness detection methods on self-collected database (%)

Method	Accuracy	APCER	BPCER	ACER
Bliinds2^[32]	79.61	23.81	16.18	19.99
BRISQUE^[33]	86.18	13.69	13.97	13.83
DIIVINE^[34]	89.14	5.95	16.91	11.43
BSIF^[35]	83.88	16.67	15.44	16.05
DSIFT^[36]	76.97	35.12	8.09	21.60
LPQ^[26]	90.13	11.90	7.35	9.63
SID^[37]	77.30	35.12	7.35	21.24
LBP^[38]	82.24	20.83	13.97	17.40
LBPV^[39]	79.61	30.95	7.35	19.15
Raghavendra^[14]	59.54	32.14	50.74	41.44
Ours_SF	94.41	2.98	8.82	5.90
Ours_Fusion	96.38	2.98	4.41	3.69

下载: 导出CSV

| 显示表格

表 1中Bliinds2、BRISQUE、DIIVINE是三种基于图像质量评价的方法, 最好的DIIVINE方法取得了89.14 %的分类准确率, 11.43 %的平均分类错误率. BSIF、DSIFT、LPQ、SID、LBP、LBPV是基于局部特征描述子的方法, 其中LPQ特征描述子取得了最好的90.13 %的分类准确率, 9.63 %的平均分类错误率.首次使用光场相机和重对焦策略进行虹膜活体检测的Raghavendra等^[14]方法只取得了59.54 %的分类准确率, 平均分类错误率达到了41.44 %.对于本文提出的方法, 当单独使用归一化的立体结构特征$ \boldsymbol{F}_{\rm{SF}} $进行分类时(Ours_SF)便取得了94.41 %的分类准确率, 平均分类错误率为5.90 %, 而使用特征融合后的特征$ \boldsymbol{F}_{\rm{F}} $进行分类时(Ours_Fusion)更是取得了96.38 %的分类准确率, 相比最好的对比方法提升了6.25 %, 平均分类错误率为3.69 %, 降低了5.94 %.因此, 由实验结果可知, 结构特征与纹理特征的融合对真实虹膜和人造假体虹膜有更强的区分性.

由“质量差异”假设可知, 人造假体虹膜在制作时不可避免地会丢失部分信息, 因此基于图像质量评价的方法总可以取得不错的分类效果.由于实验样本为远距离采集的虹膜图像, 光照明暗多变, 图像采集时容易被曝光等原因产生的噪声干扰, 影响部分特征描述子的特征提取, 降低分类准确率.由于文献[14]中方法使用单阈值区分真假虹膜样本, 无法同时应对多种攻击类型.所以在本文采集的混合攻击类型数据库中表现很差.

对于本文提出的方法, 特征融合后的APCER和只使用归一化的立体结构特征的APCER均为2.98 %, 一个可能原因是纹理特征误识别为真实样本的所有假体样本中, 包含全部立体结构特征误识别为真实样本的假体样本, 因此特征融合后APCER无法进一步降低.而由于两类特征误识别为假体样本的真实样本之间不是此种包含关系, 因此特征融合后BPCER降低了4.41 %.

由以上分析可知, 本文提出的基于计算光场成像的远距离虹膜活体检测方法通过融合眼睛区域的立体结构特征和虹膜图像的纹理特征, 可以有效地辨别真实虹膜和不同类型的人造假体虹膜, 在所有方法中取得了最好的分类效果.

除了本文测试的三种平面假体虹膜类型, 本方法对美瞳、义眼等假体类型也有区分性.美瞳和义眼等假体类型因为更接近真实人眼的结构和纹理, 所以更逼真.对于平面假体样本, 根据本文的实验结果, 立体结构特征的区分性更强(94.41 %), 纹理特征的区分性相对偏弱(90.13 %).而对于美瞳、义眼等假体类型, 立体结构特征的区分性虽然会减弱, 但纹理特征的区分性仍然很强, 依然可以有效阻止此类假体攻击.因此, 通过融合立体结构特征和虹膜纹理特征, 本方法理论上可以有效应对所有类型的假体攻击方式.

4. 结论

本文提出了一种基于计算光场成像的远距离虹膜活体检测方法.通过软硬件结合的方式, 使用光场相机采集虹膜图像, 利用计算光场成像技术, 使用硬件方法提取了眼睛区域的立体结构特征, 使用软件方法提取了虹膜图像的纹理特征, 并在特征层进行特征融合、分类.由于目前没有相关的数据库, 因此, 我们正在采集建立一个大型的近红外光场虹膜活体检测数据库, 现已完成14人的虹膜采集工作, 建立了目前为止第一个中等规模的近红外光场虹膜活体检测数据库.在半受控环境下采集了真实人眼虹膜图像和打印虹膜(普通打印纸、高光相片纸)、iPad屏显虹膜两类共三种人造假体虹膜图像.实验结果表明, 本方法可以对在1.6 m距离, 30 cm景深范围内采集的实验样本取得96.38 %的活体检测准确率, 3.69 %的平均分类错误率.相比最好的对比方法准确率提升6.25 %, 平均分类错误率降低5.94 %.

本文提出的远距离、大景深、高精度的虹膜活体检测方法, 通过软硬件结合的方式, 使用光场相机进行虹膜图像采集; 利用计算光场成像技术充分挖掘四维光场信息, 获取更多有助于活体检测的信息来提升虹膜活体检测的准确率.本方法不需要使用额外的硬件采集设备, 只需使用光场相机, 就可以实现远距离、非接触、大景深范围的虹膜图像采集, 对被采集者非常友好.本方法充分利用了四维光场信息和光场成像技术的“先拍摄, 后对焦”优势, 把光场重对焦技术与传统特征提取方法深度结合, 可以同时提取眼睛区域的立体结构特征和虹膜的纹理特征, 通过特征融合实现高准确率的虹膜活体检测, 为虹膜、人脸的活体检测方法提供了新的思路.文献[14]验证了近距离情况下使用光场相机进行虹膜活体检测的可行性和有效性, 本文在文献[14]的基础上通过实验证明, 在远距离、大景深条件下利用计算光场成像技术, 通过多特征融合能够同时应对多种攻击类型, 进行高准确率虹膜活体检测.本文的不足之处是由于数据量不足, 无法验证本方法对美瞳、义眼等假体类型的有效性.

本文责任编委王立威

图 1 典型的偏标记数据

Fig. 1 Examples of typical partial label data

下载: 全尺寸图片幻灯片

图 2 正负约束作用于消歧的效果

Fig. 2 The effects of positive and negative constraints on disambiguation

下载: 全尺寸图片幻灯片

图 3 基于成对约束的偏标记数据消歧算法流程

Fig. 3 The main procedure of PLDPC

下载: 全尺寸图片幻灯片

图 4 数据集中不同类别样本数量分布

Fig. 4 The distributions of different categories$'$ sample number in datasets

下载: 全尺寸图片幻灯片

图 5 PLDPC消歧准确率随不同参数的变化趋势

Fig. 5 The accuracy of disambiguation changes as different parameters varying

下载: 全尺寸图片幻灯片

表 1 数据集信息

Table 1 The information of datasets

数据集	样本数量	特征维度	类别数量	平均候选标签数量	领域
Lost	1 122	108	16	2.23	人脸自动标注
MSRCV2	1 758	48	23	3.16	目标分类
BirdSong	4 998	38	13	2.18	鸟鸣分类
Soccer Player	17 472	279	171	2.09	人脸自动标注
Yahoo!News	22 991	163	219	1.91	人脸自动标注

下载: 导出CSV

表 2 各算法消歧准确率(%)

Table 2 The disambiguation accuracy of each algorithm (%)

算法	Lost	MSRCV2	BirdSong	Soccer Player	Yahoo!News
PLDPC-abs	57.93	65.81	76.73	70.28	82.03
PLDPC-$p$	65.81	67.46	77.05	71.58	83.29
PLDPC-$n$	41.98	37.26	62.30	62.84	57.17
PL-KNN	64.53	58.25	70.99	57.76	72.32
IPAL	77.54	71.44	76.61	67.35	82.37
PL-LEAF	79.32	66.67	75.55	70.50	82.90
MMS	91.71	68.27	66.47	70.03	87.32
PLDPC	87.61	72.70	79.25	73.68	85.22

下载: 导出CSV

表 3 各算法消歧处理时间(秒(s)、分钟(min)、天(d))

Table 3 The processing time of each algorithm (second (s), minute (min), day (d))

算法	Lost	MSRCV2	BirdSong	Soccer Player	Yahoo!News
PLDPC-abs	2.13 s	2.39 s	11.62 s	4 min	6 min
PLDPC-$p$	2.05 s	2.30 s	11.07 s	4 min	6 min
PLDPC-$n$	2.12 s	2.69 s	11.71 s	4 min	6 min
PL-KNN	0.06 s	0.08 s	0.10 s	59.27	69.78 s
IPAL	0.51 s	0.63 s	1.56 s	73.75 s	94.62 s
PL-LEAF	56.04 s	4 min	35 min	$>$1 d	$>$1 d
MMS	57.02 s	1 min	2 min	34 min	35min
PLDPC	2.16 s	2.45 s	11.61 s	4 min	6 min

下载: 导出CSV

参考文献(26)

[1]	Su X P, Peng J Y, Feng X Y, Wu J. Labeling faces with names based on the name semantic network. Multimedia Tools and Applications, 2016, 75(11): 6445-6462 doi: 10.1007/s11042-015-2581-x
[2]	Jin R, Ghahramani Z. Learning with multiple labels. In: Proceedings of the 15th International Conference on Neural Information Processing Systems. Cambridge, MA: MIT Press, 2002. 921-928
[3]	Zhang M L, Yu F, Tang C Z. Disambiguation-free partial label learning. IEEE Transactions on Knowledge and Data Engineering, 2017, 29(10): 2155-2167 doi: 10.1109/TKDE.2017.2721942
[4]	张敏灵.偏标记学习研究综述.数据采集与处理, 2015, 30(1): 77-87 http://d.old.wanfangdata.com.cn/Periodical/sjcjycl201501007 Zhang Min-Ling. Research on partial label learning. Journal of Data Acquisition and Processing, 2015, 30(1): 77-87 http://d.old.wanfangdata.com.cn/Periodical/sjcjycl201501007
[5]	Nguyen N, Caruana R. Classification with partial labels. In: Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Las Vegas, Nevada, USA: ACM, 2008: 551-559
[6]	Chen Y C, Patel V M, Chellappa R, Phillips P J. Ambiguously labeled learning using dictionaries. IEEE Transactions on Information Forensics and Security, 2014, 9(12): 2076-2088 doi: 10.1109/TIFS.2014.2359642
[7]	Hüllermeier E, Beringer J. Learning from ambiguously labeled examples. In: Proceedings of the 6th International Symposium on Intelligent Data Analysis. Madrid, Spain: Springer, 2005. 168-179
[8]	Cour T, Sapp B, Taskar B. Learning from partial labels. Journal of Machine Learning Research, 2011, 12: 1501-1536 http://d.old.wanfangdata.com.cn/NSTLQK/NSTL_QKJJ0230239804/
[9]	Zhang M L, Yu F. Solving the partial label learning problem: an instance-based approach. In: Proceedings of the 24th International Conference on Artificial Intelligence. Buenos Aires, Argentina: AAAI Press, 2015. 4048-4054
[10]	Yu F, Zhang M L. Maximum margin partial label learning. Machine Learning, 2017, 106(4): 573-593 doi: 10.1007/s10994-016-5606-4
[11]	Olson C C, Judd K P, Nichols J M. Manifold learning techniques for unsupervised anomaly detection. Expert Systems with Applications, 2018, 91: 374-385 doi: 10.1016/j.eswa.2017.08.005
[12]	Liu G C, Lin Z C, Yu Y. Robust subspace segmentation by low-rank representation. In: Proceedings of the 27th International Conference on Machine Learning. Haifa, Israel: ICML, 2010. 663-670
[13]	王卫卫, 李小平, 冯象初, 王斯琪.稀疏子空间聚类综述.自动化学报, 2015, 41(8): 1373-1384 doi: 10.16383/j.aas.2015.c140891 Wang Wei-Wei, Li Xiao-Ping, Feng Xiang-Chu, Wang Si-Qi. A survey on sparse subspace clustering. Acta Automatica Sinica, 2015, 41(8): 1373-1384 doi: 10.16383/j.aas.2015.c140891
[14]	李波, 卢春园, 冷成财, 金连宝.基于局部图拉普拉斯约束的鲁棒低秩表示聚类方法.自动化学报, 2015, 41(11): 1971-1980 doi: 10.16383/j.aas.2015.c150031 Li Bo, Lu Chun-Yuan, Leng Cheng-Cai, Jin Lian-Bao. Robust low rank subspace clustering based on local graph Laplace constraint. Acta Automatica Sinica, 2015, 41(11): 1971-1980 doi: 10.16383/j.aas.2015.c150031
[15]	Hou X, Yao G J, Wang J. Semi-supervised classification based on low rank representation. Algorithms, 2016, 9(3): Article No. 48
[16]	Pasteris S, Vitale F, Gentile C, Herbster M. On pairwise clustering with side information[Online], available http://arxiv.org/abs/1706.06474, December 9, 2017
[17]	徐明亮, 王士同, 杭文龙.一种基于同类约束的半监督近邻反射传播聚类方法.自动化学报, 2016, 42(2): 255-269 doi: 10.16383/j.aas.2016.c150059 Xu Ming-Liang, Wang Shi-Tong, Hang Wen-Long. A semi-supervised affinity propagation clustering method with homogeneity constraint. Acta Automatica Sinica, 2016, 42(2): 255-269 doi: 10.16383/j.aas.2016.c150059
[18]	Zhu X J, Ghahramani Z, Lafferty J. Semi-supervised learning using Gaussian fields and harmonic functions. In: Proceedings of the Twentieth International Conference on Machine Learning. Washington DC, USA: ICML, 2003. 912-919
[19]	Zhu X J, Goldberg A B. Introduction to Semi-Supervised Learning. San Rafael: Morgan and Claypool Publishers, 2009. 1-130
[20]	由从哲.子空间聚类分析新算法及应用研究[博士学位论文], 江南大学, 中国, 2017 You Cong-Zhe. Novel Subspace Clustering Algorithms and Applications[Ph. D. dissertation], Jiangnan University, China, 2017
[21]	Zeng Z N, Xiao S J, Jia K, Chan T H, Gao S H, Xu D, et al. Learning by associating ambiguously labeled images. In: Proceedings of the 2013 IEEE Computer Vision and Pattern Recognition. Portland, OR, USA: IEEE, 2013. 708-715
[22]	Guillaumin M, Verbeek J, Schmid C. Multiple instance metric learning from automatically labeled bags of faces. In: Proceedings of the 11th European Conference on Computer Vision. Heraklion, Crete, Greece: Springe, 2010. 634-647
[23]	Liu L P, Dietterich T G. A conditional multinomial mixture model for superset label learning. In: Proceedings of the 25th International Conference on Neural Information Processing Systems. Lake Tahoe, Nevada: Curran Associates Inc., 2012. 548-556
[24]	Briggs F, Fern X Z, Raich R. Rank-loss support instance machines for MIML instance annotation. In: Proceedings of the 18th International Conference on Knowledge Discovery and Data Mining. Beijing, China: ACM, 2012. 534-542
[25]	Luo J, Orabona F. Learning from candidate labeling sets. In: Proceedings of the 23rd International Conference on Neural Information Processing Systems. Vancouver, British Columbia, Canada: Curran Associates Inc., 2010. 1504-1512
[26]	Zhang M L, Zhou B B, Liu X Y. Partial label learning via feature-aware disambiguation. In: Proceedings of the 22th International Conference on Knowledge Discovery and Data Mining. San Francisco, California, USA: ACM, 2016. 1335-1344

施引文献

期刊类型引用(1)

李博，熊天龙，杜宇慧. 基于实例的近邻传播偏标签学习算法. 山西大学学报(自然科学版). 2024(06): 1164-1177 .

百度学术

其他类型引用(0)

资源附件(0)

访问统计

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于成对约束的偏标记数据消歧算法

doi: 10.16383/j.aas.c170522

通讯作者: 征察 国家数字交换系统工程技术研究中心硕士研究生.主要研究方向为机器学习, 计算机视觉.本文通信作者. E-mail: zcpi31415926@163.com

计量

出版历程