A Metric Method Using Multidimensional Features for Nonrigid Registration of Medical Images
-
摘要: 医学图像的非刚性配准对于临床的精确诊疗具有重要意义.待配准图像对中目标的大形变和灰度分布呈各向异性给非刚性配准带来困难.本文针对这个问题,提出基于多维特征的联合Renyi α-entropy度量结合全局和局部特征的非刚性配准算法.首先,采用最小距离树构造联合Renyi α-entropy,建立多维特征度量新方法.然后,演绎出新度量准则相对于形变模型参数的梯度解析表达式,采用随机梯度下降法进行参数寻优.最终,将图像的Canny特征和梯度方向特征融入新度量中,实现全局和局部特征相结合的非刚性配准.通过在36对宫颈磁共振(Magnetic resonance,MR)图像上的实验,该方法的配准精度相比较于传统互信息法和互相关系数法有明显提高.这也表明,这种度量新方法能克服因图像局部灰度分布不一致造成的影响,一定程度地减少误匹配,为临床的精确诊疗提供科学依据.
-
关键词:
- 非刚性配准 /
- 联合Renyi α-entropy /
- 最小距离树 /
- 局部特征 /
- 自由形变模型
Abstract: Nonrigid registration of medical images has great significance for accurate diagnosis and therapy in clinic. It is difficult to register the images containing large deformation of object region and data anisotropy. According to this problem, an algorithm of nonrigid registration based on joint Renyi α-entropy is proposed in this paper, which combines global features with local features. Firstly, minimum spanning tree is employed for construction of joint Renyi α-entropy. A new metric is built on multidimensional features. And then, the analytical derivative of the new metric with respect to the parameters of deformation model is derived, in order to find the optima by a stochastic gradient descent method. Finally, Canny feature and gradient orientation feature of images are merged into the new metric, which implements nonrigid registration including global and local features. Experiments are performed on 36 cervical magnetic resonance (MR) image pairs. Compared to the traditional mutual information and correlation coefficient, the registration accuracy is improved significantly. It also manifests that the proposed method is able to overcome the adverse effects of local intensity inhomogeneity, and provides scientific evidence for accurate diagnosis and therapy in clinic, due to reducing mismatch in some degree. -
在模式识别和计算机视觉领域中, 物体分类识别方法已经得到广泛的研究, 现存的算法也比较成熟. 但是在一个标记样本很少的数据库上, 这些传统的方法并不能得到较高的识别准确度, 这是因为几乎所有的监督学习算法[1-2]都需要大量的标记样本作为训练数据.
近年来, 基于一个大量标记的同构数据集上的物体识别模型, 设计一种基于迁移学习的分类器算法来提高新的只有少量标记样本的数据集上的识别准确度是一个越来越受关注的研究方向, 其中大样本和小样本数据集分别被称作源域和目标域[3], 其主要原因是获取大量标记样本是一个昂贵、极其耗费人力和时间的过程, 同时不可避免人为标记错误的情况[4]. 借助于源域来优化目标域的分类模型能很好地解决上述问题. 但是源域训练得到的分类器直接应用在目标域中并不能得到理想的效果, 这是因为不同域的特征分布有差异. 导致域间差异的因素有很多, 比如相机参数、光线、视角、分辨率、背景和姿态等[3, 5-6], 如图 1所示. 因此, 我们可以将源域作为目标域的先验知识, 利用域间的相关性, 通过迁移学习的方法来提高目标域的分类准确率[6-8].
利用大样本数据学习小样本数据分类器问题的算法从采用的参数模型的角度主要可以分为三类: 基于支持向量机(Support vector machine, SVM)的算法、基于深度学习的算法和基于域间特征转换的算法. 基于SVM的算法, 比如文献[9-13], 通过改变在源域上训练得到的支持向量机中的参数或者目标函数来适应目标域. 基于SVM的算法最大的缺点是不能够将算法扩展到目标域中标记样本未出现过的新类别的情况. 基于深度学习的算法是将在大量已知标记样本集上训练得到的神经网络应用到一个相对少量标记的数据域上. 文献[14]是基于ILSVRC2012 数据库上训练好的CNNs (Cellular neural netwarks), 利用目标域上的标记样本重新训练了全连接层. 文献[15]是基于在ILSVRC13数据库上训练得到的OverFeat网络模型, 利用目标域中的少量标记样本以及OverFeat学习出来的特征, 训练出适应目标域的分类器. 基于深度学习的算法的局限性是需要海量训练数据来保证分类准确度. 基于域间特征转换的算法也有很多, 比如文献[3, 16-19]等. 文献[18]提出了一种将源域和目标域中的高维特征映射到低维特征空间中, 实现域间迁移的学习算法. 基于域间特征转换的算法刚好可以克服掉基于SVM的算法的最大缺点, 例如文献[16]提出的ARC-t算法. 但是ARC-t (Asymmetric regularized cross-domain transformation)算法对源域中类别的可分离性以及学习特征空间转换中训练点的选择缺乏充分的考虑.
综上, 为了充分利用源域的标记同构数据和保证目标域中不同类映射到源域后尽可能相互不重叠, 本文提出了一种新的基于域间特征转换的迁移学习方法. 首先, 针对源域的样本, 本文基于边际Fisher准则, 提出了特征向量点积作为距离度量标准, 尽可能最大化类间分离性和最小化类内紧凑性, 这个过程将直接影响后面的转换学习的效果. 其次, 本文设计了一种去除边缘奇异点的算法, 基于K-medoids思想从源域中选取合理的样本点, 学习与目标域标记样本间的特征转换, 实现目标域到源域的映射. 本文采用该去除奇异点算法的原因有两个: 1)由于源域中每个类别中样本点的分散性, 必然在边界附近存在部分奇异点, 所以采用K-medoids思想能够避免将目标域相应类别映射到源域的边界附近; 2) k-means算法同样可以达到以上效果, 但是该算法计算类的中心点时会受到奇异点的影响, 并不能将目标域映射到源域中样本密集分布区域. 由于线性的特征转换有时在特征空间上不能令不同类别可区分, 所以为实现特征的非线性转换, 本文利用了核化特征, 最后训练邻近算法(k-nearest neighbor, kNN)分类器并在通用数据库上计算物体分类识别准确度.
本文的结构如下: 第1节介绍本文所提算法涉及的相关工作; 第2节详细阐述本文提出的基于边际Fisher准则和迁移学习的分类器设计算法; 第3节是实验, 给出了本文算法的具体实现过程, 并把本文算法与近年来一些具有代表性的基于迁移学习的小样本分类器设计算法进行了性能对比; 第4节是论文总结及后续研究方向.
1. 相关工作
在近年来, 利用大样本数据集来提高小样本集分类器性能的问题吸引了越来越多的关注. 国内外很多学者针对该问题做了许多研究工作, 也提出了很多思路[6]. 目前提出的方法从目标域是否进行特征映射的角度主要分为以下两类: 一类是在保持源域和目标域在特征分布空间不变的前提下, 在目标域上通过调节分类器的适应性参数来达到提高小样本数据分类准确率的目的; 另一类是在保持目标域中的特征分布不变的前提下, 将目标域上的点在特征空间中映射到源域中, 直接利用在源域中训练好的分类器. 在第一类方法中, 文献[9]提出一种自适应SVM算法, 通过增加扰动函数和目标域中的标记样本来更新源域中训练好的分类器$f^{A}({\boldsymbol x})$, 即目标域上的分类器为$f^{\rm T}({\boldsymbol x})=f^A({\boldsymbol x})+\delta f({\boldsymbol x})$, 其中$\delta f({\boldsymbol x})$是扰动函数. 文献[11]中将转换SVMs应用到了适应性学习中. 同时, 很多工作是基于第二类的思想进行研究的. 文献[20]提出的算法是基于测地流核的特征迁移学习算法实现的. 在文献[21]中, Long等学习了一种能够直接使源域和目标域间的特征分布相匹配的域间不变核, 从而达到域间迁移学习的目的. 文献[22]通过一种自动域间适应的特征学习算法来适应不同图片数据域的特征差异性. 在文献[3]中, Saenko等提出了一种基于信息论矩阵学习[23]的特征转换算法(Symm算法), 在特征空间上将目标域映射到源域, 通过源域上的分类器对目标域进行分类. 在文献[16]中, Kulis等提出了一种叫做ARC-t的算法, 该算法的核心是一种基于域间特征核化非线性转换的模型并训练出kNN分类器.
与本文相关的工作还有文献[24-25], 它们提出了边际Fisher分析算法(Marginal Fisher analysis, MFA), 该算法是使用欧氏距离作为度量标准并基于边际Fisher准则来设计特征映射, 不仅对数据分布没有严格的要求, 而且能更好地表达出类内紧凑性和类外分离性, 有助于将不同类别更好地区分开. 为了提高域间适应性, 虽然基于信息论矩阵学习的算法和ARC-t算法能够将目标域在特征空间中映射到源域中, 但是存在两个明显的问题: 1)源域内不同类如果在特征空间中相互交错, 不具有很好的类别差异性, 那么目标域中的类别映射到源域也不能保证相互之间是可区分的. 2)在特征转换训练过程中, 源域中的训练样本是随机选取并与目标域中的标记样本组成训练对, 如果该过程选取的点是在源域对应类别的边界上, 那么目标域样本也会被映射到源域的边界区域, 这样势必会影响类别间的分类. 综上考虑, 首先我们需要将源域中的样本点降维到类间可分离的特征空间中, 使得在该空间中, 源域的不同类别相互可区分. 另外, 为了保证目标域的映射结果具有较高的分类准确度以及训练样本对的选择要避免边缘区域的样本点, 本文算法的设计正是基于上述考虑.
2. 基于边际Fisher准则和迁移学习的小样本集分类器设计算法
为了利用大量已有的同构标记数据提高小样本集的分类器性能, 本文提出了基于边际Fisher准则和迁移学习的小样本数据的分类器设计算法. 该算法的思路是首先为了提高源域的类内紧凑性和类间区分性, 本文根据内积度量的边际Fisher准则优化源域特征分布, 其次利用筛选算法得到的训练样本对学习目标域到源域的非线性特征转换的迁移学习算法, 将目标域映射到源域, 提高域间适应性, 最后利用在源域上训练得到的kNN分类器对目标域的样本进行分类. 本文的分类器设计算法流程图见图 2.
首先, 我们考虑到了源域内特征分布, 利用内积度量的边际Fisher准则对源域进行特征映射, 提高源域中类内紧凑性和类间区分性. 其次, 在目标域到源域的特征转换的学习过程中, 为了筛选合理的训练样本对, 本文提出一种去除边界奇异点的算法来选择源域密集区域样本点, 与目标域中的标记样本点组成训练样本对. 并在核化空间上, 本文学习了目标域特征到源域特征的非线性转换, 将目标域映射到源域. 最后, 利用kNN分类器对映射后的目标域样本进行分类. 与其他小样本集分类器的算法相比, 本文算法考虑了域间转换的学习过程的细节. 以下是本文提出算法的具体描述.
2.1 内积度量的边际Fisher准则
为了提高类内紧凑性和类间可分性, 本文首先利用根据边际Fisher准则将源域的特征映射到新的特征空间中. 本文对原始MFA[26]方法进行了改进. 改进后的边际Fisher准则与原始MFA方法的区别在于: 本文方法的距离度量方式是内积, 而不是欧几里得距离. 这是为了优化算法的求解过程, 同时与后面的迁移学习算法中的距离度量方式保持一致, 以保证算法求解的一致性. 边际Fisher准则是基于图嵌入的框架, 设计出描述类内紧凑性的本征图和类间区分性的惩罚图, 如图 3所示.
在本征图$G_c$中, 同类点间的邻近关系是由每一个样本与$k_1$个与其同类并近邻的样本点的距离之和描述. 在惩罚图 $G_p$中, 类间边界点邻近关系是由边界奇异点与$k_2$个与其异类并近邻的边界点的距离之和描述. 因此本征图$G_c$中类内紧凑性$S_c$可以表示为
$ \begin{array}{l} {S_c} = \sum\limits_i {\sum\limits_{i \in {N_{{k_1}}}(j){\rm{or}}j \in {N_{{k_1}}}(i)} {{{({M^{\rm{T}}}{x_i})}^{\rm{T}}}} } {M^{\rm{T}}}{x_j} = \\ \sum\limits_i {\sum\limits_{i \in {N_{{k_1}}}(j){\rm{or}}j \in {N_{{k_1}}}(i)} {x_i^{\rm{T}}} } M{M^{\rm{T}}}{x_j} = \\ {\rm{tr}}\left( {{M^{\rm{T}}}\left( {\sum\limits_i {\sum\limits_{i \in {N_{{k_1}}}(j){\rm{or}}j \in {N_{{k_1}}}(i)} {x_i^{\rm{T}}} } {x_j}} \right)M} \right) \end{array} $
(1) 其中, M代表特征变换矩阵, $N_{k_1}(i)$表示$k_1$个与样本${\boldsymbol x}_i$同类并与${\boldsymbol x}_i$近邻的样本点的索引集.
惩罚图$G_p$中的类间分离性$S_p$可以表示为
$ \begin{array}{l} {S_p} = \sum\limits_i {\sum\limits_{(i,j) \in {P_{{k_2}}}({c_i}){\rm{or}}(i,j) \in {N_{{k_2}}}({c_j})} {{{({M^{\rm{T}}}{{\boldsymbol{x}}_i})}^{\rm{T}}}} } {M^{\rm{T}}}{{\boldsymbol{x}}_j} = \\ \sum\limits_i {\sum\limits_{(i,j) \in {P_{{k_2}}}({c_i}){\rm{or}}(i,j) \in {N_{{k_2}}}({c_j})} {{\boldsymbol{x}}_i^{\rm{T}}} } M{M^{\rm{T}}}{{\boldsymbol{x}}_j} = \\ {\rm{tr}}\left( {{M^{\rm{T}}}\left( {\sum\limits_i {\sum\limits_{(i,j) \in {P_{{k_2}}}({c_i}){\rm{or}}(i,j) \in {N_{{k_2}}}({c_j})} {{\boldsymbol{x}}_i^{\rm{T}}} } {{\boldsymbol{x}}_j}} \right)M} \right) \end{array} $
(2) 其中, $P_{k_2}(c_i)$表示${(i, j), i\in \pi_{c_i}, j\notin \pi_{c_i}}$中$k_2$个最邻近的边界样本对集. 根据边界Fisher准则, 最小化类内紧凑性和最大化类间分离性, 则特征变换矩阵M可以利用图嵌入结构得到:
$ M = \arg {\min _M}\frac{{{S_c}}}{{{S_p}}} $
(3) 本文算法创新点之一就是本文通过改进传统的边界Fisher准则并将其与域间迁移学习相结合, 这样更加充分地利用了源域的标记样本信息. 本文的实验分别对集成了原始MFA的算法(实验部分的mmf-Euclid算法)和集成了改进后的边际Fisher准则算法(实验部分的mmf算法)进行了实验. 我们通过对比实验结果可以验证, 集成了改进后的边际Fisher准则的算法比集成了原始MFA的算法更有效地提高分类器的准确率.
2.2 自适应训练样本筛选和域间迁移学习
针对域间特征分布的差异性以及相关性, 本文通过信息矩阵学习的方式, 学习出目标域到源域的映射矩阵. 源域A和目标源B的类别数均为c, 其中A有$n_A$个样本点, 设为$X=[{\boldsymbol x}_1, {\boldsymbol x}_2, \cdots, {\boldsymbol x}_{n_A}]$, B中有$n_B$个样本点, 设为$Y=[{\boldsymbol y}_1, {\boldsymbol y}_2, \cdots, {\boldsymbol y}_{n_B}]$
2.2.1 训练样本对自适应筛选
训练样本对的选择会直接影响到训练结果的好坏. 在文献[16]提出的ARC-t算法, 对于样本对的选择是随机选取的. 但是事实上, 如果样本对恰好选择到源域中的奇异点, 那么目标域就会被映射到对应类别的边界区域, 类间差异性就会变得不明显, 如图 4所示.
为了避免源域中奇异点对于学习特征转换的影响, 特征映射学习的训练样本对$({\boldsymbol x}_i, {\boldsymbol y}_j)$不能随机选取. 本文其中一个主要的创新点是考虑到域间特征转换学习的效果与训练样本对的质量是紧密相关的, 我们提出了一种通过去除边缘奇异点筛选出训练样本对的算法, 算法详细过程如下:
1)计算每一个样本点${\boldsymbol x}_i$与同类其余样本点间的距离, 记为$S_{ij}$, 在本文中, 距离统一都用点积作为度量标准, 即$S_{ij}={\boldsymbol x}_i^{\rm T}{\boldsymbol y}_j, i\neq j$;
2)计算$S_i=\sum_{j=1}^{n^e}S_{ij}$, 其中$n^e$是类别e中样本数, $S_i$表示样本点${\boldsymbol x}_i$与同类其余样本点间的距离之和;
3)针对每个$i(1\leq i \leq n^e)$对$S_i$按降序进行排序, 倒数$k_3$个样本点会被认为是奇异点, 其余样本点组成样本候选集;
4)从上述候选集中随机均匀选出$k_A$个样本点, 该集合记为$T(A)$, 这些点将与B域中的$k_B$个标记样本点(记为$T(B)$) 组成样本对. 随机选取是为了避免将B域中的样本过分地映射到A域的中心位置, 而是均匀地映射到A域的较密集区域.
至此, 域转换学习中所用到的训练样本对的选择结束. 算法最后得到的样本对将作为域间特征转换的训练样本对.
2.2.2 域间迁移学习
样本间相似性函数可表示为
$ \begin{align} sim_{W}({\boldsymbol x}, {\boldsymbol y})={\boldsymbol x}^{\rm T}W{\boldsymbol y} \end{align} $
(4) 其中, ${\boldsymbol x}\in A$, ${\boldsymbol y}\in B$, 维数分别为$d_A$和$d_B$, 本文讨论的是维数相同的情况. 根据样本间的约束关系, 可计算出B到A的线性转换W. 为避免过拟合, 将W正则化, 记为$\gamma(W)$, 该优化问题可以表示为
$ \begin{array}{l} \mathop {\min }\limits_W \gamma (W)\\ {\rm{s}}.{\rm{t}}.\;{f_i}({X^{\rm{T}}}WY) \ge 0,\quad 1 \le i \le c \end{array} $
(5) 其中, $f_{i}(X^{\rm T}WY)$是域间的约束条件. 为了简化算法, 可以选择对W使用LogDet正则化. 正则化函数$\gamma(W)$可以写成W的奇异值之和的形式, 即如果$\sigma_1, \sigma_2, \cdots, \sigma_p$是W的奇异值, 那么$\gamma(W)$可以写成$\gamma(W)=\sum_{j=1}^p\gamma_j(\sigma_j)$的形式, $\gamma_j$是一个标量函数. 但是这个方法有一个很大的局限性就是使用LogDet正则化需要W是正定矩阵, 为避免这个限制条件, 本文提出用样本之间特征向量的点乘来表示样本间的相似性函数[16], 该问题的目标函数可以用内积的形式表示. 设内积$K_A=X^{\rm T}X, K_B=Y^{\rm T}Y$, 该问题的最优解$W=XK_A^{-1/2}LK_B^{-1/2}Y^{\rm T}$, 其中L是一个$n_A\times n_B$的矩阵[12]. 那么, 该问题的约束函数可以表示为
$ \begin{array}{l} {f_i}({X^{\rm{T}}}WY) = {f_i}({X^{\rm{T}}}XK_A^{ - \frac{1}{2}}LK_B^{ - \frac{1}{2}}{Y^{\rm{T}}}Y) = \\ {f_i}(K_A^{\frac{1}{2}}LK_B^{\frac{1}{2}}) \end{array} $
(6) 因此算法的计算过程中只涉及特征向量内积的计算问题.
考虑到类内相似性和类间差异性, 建立对应的约束条件. 假设$({\boldsymbol x}_i, l_i^A)$是源域A中的标记样本, 其中$l_i^A$是${\boldsymbol x}_i$的标签; $({\boldsymbol y}_j, l_j^B)$是目标域B中的标记样本, 其中$l_j^B$是${\boldsymbol y}_j$的标签. 从A和B中分别选出相应的样本对, 则将约束条件变成:
$ \begin{array}{l} {f_{ij}}({{\boldsymbol{x}}_i}W{{\boldsymbol{y}}_j}) = {\boldsymbol{x}}_i^{\rm{T}}W{{\boldsymbol{y}}_j} - l,\;\;l_i^A = l_j^B\\ {f_{ij}}({{\boldsymbol{x}}_i}W{{\boldsymbol{y}}_j}) = u - {\boldsymbol{x}}_i^{\rm{T}}W{{\boldsymbol{y}}_j},\;\;l_i^A \ne l_j^B \end{array} $
(7) 其中, l和u分别是两个样本点相似性的上限和下限参数. 对于同一类别的样本对来说, 相似性应该更大; 对于不同类别的样本对来说, 相似性应该更小.
综上, 域间迁移学习的过程可以表述如下. 设$\sigma_1, \sigma_2, \cdots, \sigma_p$是W的奇异值, $\gamma_j$是一个标量函数, 本文采用$\gamma_j(\sigma_j)=\sigma_j^2/2$的标量函数, 那么$\gamma(W)=\frac{1}{2}\|W\|_F^2$就是一个弗罗贝尼乌斯范数形式. 则该迁移学习问题的求解可以用以下形式描述:
$ \begin{array}{l} \mathop {\min }\limits_W \;\sum\limits_{j = 1}^p {{\gamma _j}} ({\sigma _j})\\ {\rm{s}}.{\rm{t}}.\;\;{{\boldsymbol{x}}_{i'}} \in T(A)\\ \;\;\;\;\;\;{\boldsymbol{x}}_{i'}^{\rm{T}}W{{\boldsymbol{y}}_{j'}} - l \ge 0,\;\;l_i^A = l_j^B\\ \;\;\;\;\;\;u - {\boldsymbol{x}}_{i'}^{\rm{T}}W{{\boldsymbol{y}}_{j'}} \ge 0,\;\;l_i^A \ne l_j^B \end{array} $
(8) 其中, ${\boldsymbol x}_i'=M{\boldsymbol x}_i, {\boldsymbol y}_j'=M{\boldsymbol y}_j$. 由于该问题是一个严格凸优化问题, 该凸优化问题的松弛系数记为λ, 则该问题可进一步表示为
$ \begin{array}{l} \mathop {\min }\limits_W \;\sum\limits_{j = 1}^p {{\gamma _j}} ({\sigma _j}) + \lambda \sum\limits_i {\sum\limits_j {{f_{ij}}} } ({\boldsymbol{x}}_{i'}^{\rm{T}}W{{\boldsymbol{y}}_{j'}})\\ {\rm{s}}.{\rm{t}}.\;{\boldsymbol{x}}_{i'}^{\rm{T}} \in T(A),\;{{\boldsymbol{x}}_{j'}} \in T(B) \end{array} $
(9) 线性转换有时并不能很好地表达出域间的映射关系, 而非线性转换则能较好地表达, 所以算法可以引入特征的核化空间. 该算法的核化就是将算法中出现特征向量内积的地方用相应的核化函数表示. 当引入原始核函数$k({\boldsymbol x}, {\boldsymbol y})=\phi({\boldsymbol x})^{\rm T}\phi({\boldsymbol y})$, 核化之后$f_i(\phi({\boldsymbol x}), \phi({\boldsymbol y}))=\phi({\boldsymbol x})^{\rm T}W\phi({\boldsymbol y})$, 则W表示的是在希尔伯特(Hilbert)空间中的一个算子, 维度与 $\phi({\boldsymbol x})$和$\phi({\boldsymbol y})$的维度相关. 因此, 如果引入的原始核函数为径向基函数(Radial basis function, RBF)核, 则W的维数就是无穷大. 尽管不能显式计算W, 但是仍然可以根据文献[23]中的核化算法将W递归展开成如下形式:
$ \begin{align} W=I+\sum_{i, j}\sigma_{ij}\phi({\boldsymbol x}_i)\phi({\boldsymbol y}_j)^{\rm T} \end{align} $
(10) 其中, $({\boldsymbol x}_i, {\boldsymbol y}_j)$为约束训练样本对, $\sigma_{ij}$为Bregman投影系数(Bregman projection parameter). 此时我们可定义一个新的核函数$\widetilde{k}({\boldsymbol x}, {\boldsymbol y})=\phi({\boldsymbol x})^{\rm T}W\phi({\boldsymbol y})$. 则核化之后的相似性函数可以用新引入的核化函数表示, 即$f_i(\phi({\boldsymbol x}), \phi({\boldsymbol y}))=\widetilde{k}({\boldsymbol x}, {\boldsymbol y})$, 因此算法中出现特征向量内积的地方用相应的核函数表示, 算法的核化就完成了. 该凸优化问题有很多方法可以求解, 本文采用Bregman迭代算法进行求解, 可以很快得到收敛解, 具体求解过程可以参考文献[27].
3. 实验结果
本文提出的算法采用Matlab编程实现.
3.1 数据库
实验所用数据库[3]包含了三个子数据域, 分别是webcam, amazon和dslr. 在这三个域中分别有31个物体类别, 涵盖了生活中常见的物体, 例如椅子、背包、键盘等. 这三个数据域相互之间是有差异的. 首先, webcam域中的图片是带有闪关灯的网络摄像头拍摄得到的, 具有姿态各异, 低分辨率(640×480), 背景变化等的特点, 每一类别中有5个不一样的对象且每个对象平均有3个不同的视角, webcam域共有795张图片. 其次, amazon域中的图片是从网上收集的, 具有画面单一、物体居中、白色背景等特点, 每一类别中平均有90张图片, 共计2813张图片. 最后, dslr域中的图片是由数码单镜头反光 (Single lens reflex, SLR)相机在自然环境中拍摄得到的, 具有背景多样, 高分辨率4288×2848, 自然光线的特点, 每一类别中有5个不同对象, 每个对象平均有3个不同的视角. dslr域共有498张图片.
3.2 本文算法的具体实现和参数
本文提出算法(记为mmf)实验的具体实现方案如下. 如果每个算法采用的图像特征不是统一的, 那么很难对这些算法做比较. 为了能更好地与前人取得的成果做对比, 本实验中所用到的图像特征均采用文献[3]中提供的SURF (Speeded up robust features)特征, 将所有图片灰度化并提取其SURF特征, 最后被量化成800维的特征. 为保证各对比算法实验结果的可比性, 所有算法中的参数$K_A$和$K_B$均保持一致. 从A中选取$K_A$个样本点(当A域为amazon时, 取$K_A=20$, 当A域为webcam或dslr时, 取$K_A=15$), 与B域中随机选择的3个样本点组成样本对, 取$K_B=3$. 首先训练出映射矩阵M, 本文借鉴了对比方法中采用的核函数, 利用的是高斯RBF核函数, 其中$\sigma=1, \lambda=10^3$. 通过迭代学习出域间的转换W, 本实验采用kNN分类器, 其中k=1, 通过20次的随机实验, 最终取所有实验的分类准确率的平均值作为本实验的平均分类准确率. 具体的实验参数设置如表 1所示.
表 1 本文算法的实验参数设置Table 1 The experiment parameters set of our methodA→B k1 k2 kA kB σ a→w 22 1700 20 3 1 a→d 22 1700 20 3 1 w→a 20 680 15 3 1 w→d 20 680 15 3 1 d→a 17 420 15 3 1 d→w 17 420 15 3 1 3.3 实验结果及分析
本文方法与近年来具有代表性的一些相关研究成果进行了实验对比. 基于深度学习的算法需要源域是目标域的父集[15]并且需要海量训练数据保证其准确率. 考虑到本文实验所用的数据库没有其对应的大样本库且其最小的数据域的样本仅有498个, 我们没有加入基于深度学习的算法对比. 对比实验中的基于SVM的算法和基于域间特征转换的算法描述如下:
1) kNN-ab是在A域中的标记样本上训练出kNN分类器, 直接将B域中的测试数据用在该kNN分类器上计算分类的准确率.
2) kNN-bb是将B域中的标记样本和A域中的标记样本作为训练样本训练出kNN分类器. 其余样本作为测试样本计算分类准确率.
3) symm是Saenko等提出的算法[3]. 该算法主要通过信息论矩阵学习实现域间转换并训练出kNN分类器来提高目标域上的分类准确率.
4) ARC-t是Kulis等提出的算法[16]. 该算法是利用域间的非线性转换的学习解决域间差异性问题, 结合源域训练的kNN分类器对目标域样本进行分类.
5) gfk是文献[20]中提出的算法, 是通过基于测地流核(Geodesic flow kernel)的迁移学习来训练目标域上的kNN分类器.
6) svm-s是利用A域中的标记样本训练出的SVM分类器.
7) hfa是文献[28]提出的, 该方法提出了一种新的边缘最大化的特征表示和svm损失函数相结合的算法, 最终通过SVM分类器达到提高目标域的分类准确度的目的.
表 2给出了本文算法和其他算法的对比结果. 其中mmf-Euclid是集成了原始MFA的分类器算法, mmf是集成了本文改进后的边际Fisher准则的分类器算法. 从实验结果可以看出, mmf的分类准确度要比mmf-Euclid更高, 因此本文采用改进后的边际Fisher准则比原始MFA更有助于提高本文的分类器算法的准确率. 与kNN-ab和kNN-bb的实验结果相比较, 本文提出的算法通过将目标域的样本映射到源域的学习过程而不是简单地融合了两个域的标记样本数据, 有效提高了目标域上的分类准确率. 从基于SVM的算法和基于域间特征转换的算法的对比实验结果中, 我们可以看出本文的算法充分考虑了源域和目标域的特征分布及其差异性, 通过对源域和目标域的特征映射的学习过程使得目标域的分类准确率上有提高, 并且在平均的识别准确率上是最高的.
表 2 在三个数据域上的分类准确率(%)(加粗字体表示最佳性能, 缩写: a: amazom, w: webcam, d: dslr)Table 2 Accuracy rates in the three domains (%)(The bold font represents the best performance, abbreviation: a: amazom, w: webcam, d: dslr.A→B kNN-ab kNN-bb symm[3] ARCt[16] gfk[20] svm-s hfa[28] mmf-Euclid mmf a→w 9.6±1.0 51.0±0.8 51.0±1.4 55.7±0.9 57.8±1.0 34.5±0.8 61.5±0.9 49.3±0.8 55.5±0.7 a→d 4.9±1.1 47.9±0.9 47.9±1.4 50.2±0.7 50.5±0.8 35.3±0.6 52.4±1.0 50.6±0.9 57.6±0.9 w→a 10.5±0.6 40.1±0.5 43.7±0.7 43.4±0.5 44.1±0.4 34.9±0.4 44.5±0.7 42.9±0.6 44.6±0.8 w→d 23.2±0.8 54.1±0.9 69.8±1.0 71.3±0.8 68.5±0.5 65.8±0.8 52.7±1.1 70.1±0.7 71.5±0.6 d→a 11.3±0.5 35.6±0.7 42.7±0.5 42.5±0.5 45.7±0.8 33.8±0.4 45.4±0.9 41.4±0.7 42.6±0.6 d→w 37.6±0.8 54.0±0.7 63.4±0.9 65.3±0.5 66.4±0.5 68.1±0.6 62.4±0.8 68.5±1.0 69.5±0.7 平均准确率 12.2±0.8 37.8±0.8 55.6±1.0 56.9±0.7 57.7±0.7 45.4±0.6 53.2±0.9 55.4±0.8 58.6±0.8 最后, 我们不仅验证了本文提出的算法能够获得高准确率, 而且在图 7中还验证了该算法的性能随着目标域可用标记样本数的增大而提升. 源域中的训练样本数为20, 目标域中可用标记的样本数从1到5变化. 从图 7可以看到这5种方法都是递增的趋势, 本文的方法在整体上要比其他方法好.
图 7 在目标域上的分类准确率随目标域中可用标记样本数量的变化曲线(其中源域中选择了20个标记样本, 源域为dslr, 目标域为webcam)Fig. 7 The accuracy rate curves in the target domain varying with the number of labeled samples in the target domain (Where 20 labeled samples in source domain is selected, the source domain here is dslr, while the target domain is webcam.综上, 与其他算法相比, 本文提出的小样本集的分类器设计算法能够更充分考虑到了源域中不同类间的可分离性、同类间的紧凑性、域间特征分布的差异性以及域间特征转换学习中学习样本对的选择过程, 并实现了目标到源域特征适应性更好的非线性转换. 通过目标域中少量标记样本特征的转换学习, 随着标记样本数的增加, 学习的分类器性能就越好.
4. 结论
本文提出了一种新的基于边际Fisher准则和迁移学习的小样本集的分类器设计算法. 通过对源域数据的特征分布的优化和目标域到源域的迁移学习, 实现了利用大量标记同构样本集来提升小样本集上分类准确率. 与最近针对小样本数据集上的分类器设计问题的算法进行对比, 本文提出的算法不仅在小样本数据集上的分类器准确率有所提高, 并且随着小样本集中的标记样本数量的增加, 本文提出的分类器设计算法的性能提升得也更明显.
实验结果虽然证实了本文算法的有效性, 但依然有待改进的地方. 其中一个是可以将该算法在边际Fisher准则的基础上引入核化函数; 另外一点是实验中用的是800维的SURF特征, 不排除有更好的特征表示方法. 因此, 以上两点将是以后工作研究的重点.
-
图 4 仿射粗配、互相关系数、互信息、基于图的广义互信息和本文方法的重叠率对比boxplot图(对于每一个解剖结构, 最左边的列显示了仿射粗配的结果, 第2列显示了互相关系数的结果, 第3列显示了互信息的结果, 第4列显示了基于图的广义互信息的结果, 最右边的列显示了本文方法的结果.一个星号表示两种方法重叠率中值在统计上的明显差异.)
Fig. 4 The boxplot of overlap scores using affine matching, CC, MI, GMI and our proposal (For each anatomical structure, the leftmost column shows the result for affine matching. The second column shows the result for CC. The third column shows the result for MI. The fourth column shows the result for GMI. The rightmost column shows the result for our proposal. A star indicates a statistical significant difference of the median overlaps of the two methods.)
表 1 所有配准DSC的均值和方差
Table 1 The mean and variance of DSC about all registration results
结构区域 配准方法 DSC值 仿射粗配 0.7618±0.0123 CC 0.8271±0.0056 CTV MI 0.8332±0.0756 GMI 0.8460±0.0706 本文方法 0.8462±0.0684 仿射粗配 0.6756±0.0198 CC 0.7386±0.0200 Bladder MI 0.7375±0.1362 GMI 0.7697±0.1332 本文方法 0.7800±0.1313 仿射粗配 0.6861±0.0083 CC 0.7338±0.0042 Rectum MI 0.7410±0.0673 GMI 0.7566±0.0627 本文方法 0.7680±0.0577 -
[1] Savage N. Technology: multiple exposure. Nature, 2013, 502(7473): S90-S91 doi: 10.1038/502S90a [2] Sotiras A, Davatzikos C, Paragios N. Deformable medical image registration: a survey. IEEE Transactions on Medical Imaging, 2013, 32(7): 1153-1190 doi: 10.1109/TMI.2013.2265603 [3] Schmidt-Richberg A, Werner R, Handels H, Ehrhardt J. Estimation of slipping organ motion by registration with direction-dependent regularization. Medical Image Analysis, 2012, 16(1): 150-159 doi: 10.1016/j.media.2011.06.007 [4] 张桂梅, 曹红洋, 储王君, 曾接贤.基于Nyström低阶近似和谱特征的图像非刚性配准.自动化学报, 2015, 41(2): 429-438 http://www.aas.net.cn/CN/abstract/abstract18621.shtmlZhang Gui-Mei, Cao Hong-Yang, Chu Jun, Zeng Jie-Xian. Non-rigid image registration based on low-rank Nyström approximation and spectral feature. Acta Automatica Sinica, 2015, 41(2): 429-438 http://www.aas.net.cn/CN/abstract/abstract18621.shtml [5] 周斌, 宋晓, 黄晓阳, 王博亮.联合直方图的刚性配准方法及其在肝脏CT图像配准中的应用.厦门大学学报(自然科学版), 2015, 54(3): 397-403 http://www.cnki.com.cn/Article/CJFDTOTAL-XDZK201503019.htmZhou Bin, Song Xiao, Huang Xiao-Yang, Wang Bo-Liang.A rigid registration method based on joint distribution histogram and its application on liver CT images. Journal of Xiamen University (Natural Science), 2015, 54(3): 397-403 http://www.cnki.com.cn/Article/CJFDTOTAL-XDZK201503019.htm [6] 夏威, 高欣, 王雷, 周志勇, 张冉.基于点集与互信息的肺部CT图像三维弹性配准算法.江苏大学学报(自然科学版), 2014, 35(5):558-563 http://www.cnki.com.cn/Article/CJFDTOTAL-JSLG201405012.htmXia Wei, Gao Xin, Wang Lei, Zhou Zhi-Yong, Zhang Ran. 3D deformable registration algorithm of CT lung images based on point set and mutual information. Journal of Jiangsu University (Natural Science Edition), 2014, 35(5): 558-563 http://www.cnki.com.cn/Article/CJFDTOTAL-JSLG201405012.htm [7] Cachier P, Bardinet E, Dormont D, Pennec X, Ayache N. Iconic feature based nonrigid registration: the PASHA algorithm. Computer Vision and Image Understanding, 2003, 89(2-3): 272-298 doi: 10.1016/S1077-3142(03)00002-X [8] Mellor M, Brady M. Phase mutual information as a similarity measure for registration. Medical Image Analysis, 2005, 9(4): 330-343 doi: 10.1016/j.media.2005.01.002 [9] Loeckx D, Slagmolen P, Maes F, Vandermeulen D, Suetens P. Nonrigid image registration using conditional mutual information. IEEE Transactions on Medical Imaging, 2010, 29(1): 19-29 doi: 10.1109/TMI.2009.2021843 [10] Neemuchwala H, Hero A, Carson P. Image matching using alpha-entropy measures and entropic graphs. Signal Processing, 2005, 85(2): 277-296 doi: 10.1016/j.sigpro.2004.10.002 [11] Staring M, van der Heide U A, Klein S, Viergever M A, Pluim J P W. Registration of cervical MRI using multifeature mutual information. IEEE Transactions on Medical Imaging, 2009, 28(9): 1412-1421 doi: 10.1109/TMI.2009.2016560 [12] Rivaz H, Karimaghaloo Z, Collins D L. Self-similarity weighted mutual information: a new nonrigid image registration metric. Medical Image Analysis, 2014, 18(2): 343-358 doi: 10.1016/j.media.2013.12.003 [13] 冯兆美, 党军, 崔崤山尧, 焦阳.基于B样条自由形变三维医学图像非刚性配准研究.影像科学与光化学, 2014, 32(2): 200-208 http://www.cnki.com.cn/Article/CJFDTOTAL-GKGH201402009.htmFeng Zhao-Mei, Dang Jun, Cui Xiao-Yao, Jiao Yang. Bspline free-form deformation based 3-D non-rigid registration of medical images. Imaging Science and Photochemistry, 2014, 32(2): 200-208 http://www.cnki.com.cn/Article/CJFDTOTAL-GKGH201402009.htm [14] Lowe D G. Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision, 2004, 60(2): 91-110 doi: 10.1023/B:VISI.0000029664.99615.94 [15] Bay H, Tuytelaars T, van Gool L. SURF: speeded up robust features. In: Proceedings of the 9th European Conference on Computer Vision. Graz, Austria: Springer, 2006. 404-417 [16] Tola E, Lepetit V, Fua P. DAISY: an efficient dense descriptor applied to wide-baseline stereo. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(5):815-830 doi: 10.1109/TPAMI.2009.77 [17] Canny J. A computational approach to edge detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1986, PAMI-8(6): 679-698 doi: 10.1109/TPAMI.1986.4767851 [18] Neemuchwala H F, Hero A O. Image registration in high dimensional feature space. In: Proceedings of the 2005 SPIE 5674, Computational Imaging III. San Jose, CA: SPIE, 2005. 99-113 [19] Sabuncu M R, Ramadge P J. Using spanning graphs for efficient image registration. IEEE Transactions on Image Processing, 2008, 17(5): 788-797 doi: 10.1109/TIP.2008.918951 [20] Hero A O, Ma B, Michel O J J, Gorman J. Applications of entropic spanning graphs. IEEE Signal Processing Magazine, 2002, 19(5): 85-95 doi: 10.1109/MSP.2002.1028355 [21] Klein S, Staring M, Pluim J P W. Evaluation of optimization methods for nonrigid medical image registration using mutual information and B-splines. IEEE Transactions on Image Processing, 2007, 16(12): 2879-2890 doi: 10.1109/TIP.2007.909412 [22] Klein S, Staring M, Murphy K, Viergever M A, Pluim J P W. Elastix: a toolbox for intensity-based medical image registration. IEEE Transactions on Medical Imaging, 2010, 29(1): 196-205 doi: 10.1109/TMI.2009.2035616 [23] Ibanez L, Schroeder W, Ng L, Cates J. The ITK software guide version 2.4 [Online], available: http://www.itk.org, September16, 2014 [24] [24 Dice L R. Measures of the amount of ecologic association between species. Ecology, 1945, 26(3): 297-302 doi: 10.2307/1932409 [25] Wilcoxon F. Individual comparisons by ranking methods.Biometrics Bulletin, 1945, 1(6): 80-83 doi: 10.2307/3001968 期刊类型引用(7)
1. 马新科,杨扬,杨昆,罗毅. 基于模糊形状上下文与局部向量相似性约束的配准算法. 自动化学报. 2020(02): 342-357 . 本站查看
2. 李玮琳,曾琪峰,李颖. 多模态医学图像外边界点云数据实时配准仿真. 计算机仿真. 2019(03): 248-251+417 . 百度学术
3. 贾迪,朱宁丹,杨宁华,吴思,李玉秀,赵明远. 图像匹配方法研究综述. 中国图象图形学报. 2019(05): 677-699 . 百度学术
4. 朱天宇,全惠敏,刘国才. 联合弯曲能量和标志点对应约束的非刚性医学图像配准. 计算机工程与科学. 2019(05): 851-857 . 百度学术
5. 刘雄乐,刘晓宁,朱丽品,杨稳. 基于多尺度投影的相似颅骨检索. 自动化学报. 2018(02): 289-298 . 本站查看
6. 郭磊,贺宏伟,王玉军,王昌元,杨秀云,刘露. 基于并行卷积神经网络的X线图像成像部位识别. 中国医疗器械杂志. 2018(02): 92-94+98 . 百度学术
7. 陆雪松,刘坤,谢勤岚. 基于快速最小距离树的肝脏图像非刚性配准. 中南民族大学学报(自然科学版). 2018(03): 48-52+67 . 百度学术
其他类型引用(10)
-