Research on TV-L1 Optical Flow Model for Image Registration Based on Fractional-order Differentiation
-
摘要: 图像的非刚性配准在计算机视觉和医学图像分析中有着重要的作用.TV-L1(全变分L1范数、Total variation-L1)光流模型是解决非刚性配准问题的有效方法,但TV-L1光流模型的正则项是一阶导数,会导致纹理特征等具有弱导数性质的信息模糊.针对该问题,将G-L(Grünwald-Letnikov)分数阶引入TV-L1光流模型,提出基于G-L分数阶微分的TV-L1光流模型,并应用原始-对偶算法求解该模型.新的模型用G-L分数阶微分代替正则项中的一阶导数,由于分数阶微分比整数阶微分具有更好的细节描述能力,并能有效地、非线性地保留具有弱导数性质的纹理特征,从而提高图像的配准精度.另外,通过实验给出了配准精度与G-L分数阶模板参数之间的关系,从而为模板最佳参数的选取提供了依据.尽管不同类型的图像其最佳参数是不同的,但是其最佳配准阶次一般在1 ~2之间.理论分析和实验结果均表明,提出的新模型能够有效地提高图像配准的精度,适合于包含较多弱纹理和弱边缘信息的医学图像配准,该模型是TV-L1光流模型的重要延伸和推广.Abstract: In computer vision and medical image analysis, non-rigid image registration is a challenging task. TV-L1 (Total variation-L1) optical flow model has been proved to be an effective method in the field of non-rigid image registration. It can solve the problem of fuzzy edge caused by smooth displacement fields of Horn-Schunck, but its first-order derivative in regularization term leads to fuzzy texture information with weak derivative property. Aiming at the problem, this paper introduces G-L (Grünwald-Letnikov) fractional differentiation to TV-L1 optical flow model, and proposes a new TV-L1 optical flow model based on fractional differentiation, and then finds the solution of the model using primal-dual algorithm. In this paper we use Grünwald-Letnikov fractional order differential instead of the first-order derivative in the regularization term for its better ability of detail description than first-order's. Then we purposefully control to retain or inhibit the texture information with weak derivative nature, thus improving the registration accuracy. Experimental results show that the proposed method has a better registration accuracy in registration of texture information with weak derivative, and that it can be considered an important extension and generalization of TV-L1 optical flow modes.
-
分数阶微积分理论在图像处理中的应用在最近几年才引起学者的关注, 越来越多的学者把分数阶微积分应用到图像处理中, 并在图像去噪、图像增强、小波变换、图像奇异性特征提取、图像融合、图像分割、图像边缘提取等方面取得了一些初步成果.文献[1]认为分数阶微分算子选择合适的阶次, 在增强图像的过程中可以大幅提升边缘和纹理细节, 并且可以非线性保留图像平滑区域的纹理信息.文献[2]利用分数阶微分阶次在(0, 1)区间时, 具有弱导数的性质, 利用分数阶微分算子对含弱噪声的图像进行边缘检测, 成功解决了整数阶梯度算子对噪声敏感的问题, 避免了噪声的影响, 准确检测噪声图像的边缘.文献[3]将分数阶积分理论引入图像去噪, 构造分数阶积分模板对图像进行滤波去噪, 该方法能够在提高峰值信噪比的同时更好地保留图像边缘和纹理信息.文献[4]将分数阶微积分引入奇异值分解用于人脸识别, 该方法在人脸变化剧烈时相对于传统方法具有更好的分类效果.文献[5]将分数阶微分引入全变分模型用于图像修复领域, 该方法对空域和频域损坏的图像, 特别是对图像细节信息的修复, 都具有更好的修复效果, 在提高视觉效果的同时还提高了峰值信噪比.文献[6]将分数阶微分引入图像分割领域, 提出一种具有分数阶次拟合项的活动轮廓模型, 分数阶拟合项能够更加准确地描述图像, 并且对噪声具有鲁棒性, 该方法对噪声图像、医学图像和红外图像都有很好分割效果.受以上文献启发, 分数阶微积分能够非线性地增强或者保留图像的纹理细节信息, 本文将分数阶微积分引入图像配准领域.
图像配准是图像处理的一个基本问题, 用于将不同时间、不同传感器、不同视角及不同拍摄条件下获取的两幅或者多幅进行匹配, 目的是寻求一种空间变换, 使一幅图像与另一幅图像上的对应点达到空间上的一致, 用以纠正图像的形变.图像配准是近年来图像处理领域的研究方向之一, 在遥感图像处理、医学图像分析, 计算机视觉等领域有着广泛的应用.图像配准的方法根据待配准目标的类型可以将其分为刚性配准和非刚性配准.刚性配准只适用于不存在变形的配准, 但现实生活中大多数形变是非刚性的, 如在医学图像处理领域, 大多数情况下, 人体组织的形变是非刚性的, 因而非刚性配准更具有重要研究意义[7-9].目前最著名的非刚性配准是基于光流场模型的Demons算法[7-9].其将图像的配准过程可以看作从源图像流动到目标图像的过程, 即配准所求解的位移场可以看作光流场模型求解的速度场, 因此可以通过求解光流场进行图像配准.如文献[10]提出基于光流场理论的Demons算法, 其思想是将配准看作浮动图像像素点在参考图像灰度梯度驱动下向参考图像移动的过程, 文献[11]在经典Demons算法基础上提出了主动Demons算法, 该算法利用参考图像和浮动图像的灰度梯度作为共同驱动力驱动像素点向对方对应像素点移动, 配准精度有所提高, 但该类算法在图像灰度均匀及弱纹理区域配准精度较低, 优化易陷入局部最小从而导致配准速度缓慢.文献[12]将Horn-Schunck (H-S)光流场模型引入图像配准, 由于Horn-Schunck模型采用的光滑性约束无法保持图像的不连续性, 而在医学图像配准中, 允许位移场的不连续性是必要的, 如呼吸运动, 膈膜产生严重变形, 而肋骨仍然是刚性形变, 这时光滑位移场就不足以适用这种复杂的运动.另外, Horn-Schunck模型的二次数据项对亮度异常值不具有足够的鲁棒性.针对上述缺点, Pock等[13]提出了基于变分方法的TV-L$^{1}$ (Total variation-L$^{1}$)光流模型, 该模型能够保持图像的不连续性, 即在图像演化过程中可以有效保持图像的边缘等特征信息, 而且数据项采用光流的L$^{1}$范数增强了配准的鲁棒性.文献[14]则具体描述了文献[13]方法的实现过程.文献[15]应用可变形配准方法得到比刚性配准、快速Demons配准和快速自由形状配准算法等更准确的效果.但是文献[13-15]对具有弱导数性质的纹理特征等信息的保持仍然不够理想.
虽然TV-L$^{1}$模型相对H-S模型有了很大提升, 能够在扩散过程中保持边缘信息, 但对具有弱导数性质的纹理细节等信息的保持仍不够理想, 并且在模型最小化过程中造成计算上的困难, 主要原因是正则项和数据项在零点处都不可微, 一个有效的方法是在零点处增加了一个极小值, 然而新引入的项会造成收敛很慢并且会模糊位移场.本文的研究对象主要为存在弱边缘和弱纹理等特征的图像, 如医学图像, 在成像过程中由于受到电磁环境, 成像设备, 以及人体结构的差异等客观因素的影响, 会造成图像存在弱纹理、弱边缘, 所以要求配准方法能较好保持图像的边缘和纹理特征.而分数阶微分算子具有弱导数的性质, 通过合理选择其阶次, 可以达到保持弱边缘和弱纹理的特性, 基于此, 本文尝试将G-L分数阶微分理论引入到TV-L $^{1}$光流模型中, 用于图像的非刚性配准, 以提高该模型的配准精度.
1. 基本理论
1.1 Horn-Schunck (H-S)光流场模型[16]
假设图像上的像素点$(x, y)$在$t$时刻的灰度值为$I(x, y, t)$, 经过较小的$\Delta t$时刻后该点位置为$(x + \Delta x, y + \Delta y)$, 该点灰度值为$I(x + \Delta x, y + \Delta y, t + \Delta t), $根据光流场的亮度恒定假设得到光流约束方程[16]
$ \begin{equation} \frac{{\partial I}}{{\partial x}}\frac{{{\rm d}x}}{{{\rm d}t}}+ \frac{{\partial I}}{{\partial y}}\frac{{{\rm d}y}}{{{\rm d}t}}+ \frac{{\partial I}}{{\partial t}}=0 \label{eq:1} %(1) \end{equation} $
(1) 即${I_x}u+{I_y}v+{I_t}=0, $其中$u(x, y, t)=\frac{{{\rm d}x}}{{{\rm d}t}}=\Delta x$, $v(x, y, t)=\frac{{{\rm d}y}}{{{\rm d}t}}=\Delta y$.
在图像配准中, 只取$\Delta t$时刻前后的两帧图像, ${\pmb U}=(u, v)^{\rm T}$为求解的速度场矢量, 即配准要求解的位移场矢量, 但是位移场矢量有两个变量, 而通过亮度恒定假设只能得到一个约束方程, 不足以求解$x$和$y$方向的位移$u$和$v$, 这就是光流场求解的病态问题.因此要求解光流场模型还需对位移场矢量附加另外的约束.
Horn等创造性地在光流约束的基础上加上光滑性约束, 该约束假设物体的运动速度在大多数情况下是局部光滑的, 特别是目标在无形变的刚性运动时, 各邻近像素点应具有相同的运动速度, 即相邻点的速度变化率为$0$, 因而将光流场的求解转化为能量泛函极小值问题:
$ \begin{equation} \begin{split} \mathop{{\rm{min}}}\limits_{u, v} \Bigg\{{{E_{\rm H\mbox{-}S}}}=&{\rm {\int}}_{\Omega}{({{\left|{\nabla u} \right|}^2}}+ {\left|{\nabla v}\right|^2}){\rm d}{\Omega}+ \\ &{\lambda {\int}_{\Omega}{{{({I_x}u+{I_y}v+{I_t})}^2}{\rm d}} \Omega}\Bigg\}\label{eq:2} \end{split} %(2) \end{equation} $
(2) 第一项为正则项, 惩罚光流场中大的变化以获得光滑的速度场, 第二项为数据项, 即基本光流约束, 假设对应点运动前后灰度值不变, $\lambda $为正则化参数, 是与正则项和数据项相关的一个权重参数.
由于H-S模型正则项采用光滑性约束, 导致无法保持位移场的不连续性, 会在图像的演化过程中产生严重模糊而丢失重要信息, 数据项采用二次项惩罚偏差, 对处理亮度异常值不具有鲁棒性.
1.2 TV-L$^{1}$光流场模型
为了克服Horn-Schunck光流模型的缺点, Pock [13]等提出了基于变分方法的TV-L$^1$光流模型, 并且由于在实际问题中, 光流约束并不会一直成立, 即图像亮度恒定假设对于很多真实图像并不适用, 如在光照条件变化大, 图像亮度恒定假设存在较大误差, Pock等引入变量$w$对光流约束加以改进, 通过$w$对光照变化建模得到:
$ \begin{equation} \begin{split} \mathop {{\rm{min}}}\limits_{u, v, w} \Bigg\{ {{E_{\rm TV - L^1}}} =&\int_{\Omega}{(\left|{\nabla u}\right|}+\left|{\nabla v}\right|+\left|{\nabla w}\right|){\rm d}{\Omega}+\\ &\lambda{\int_{\Omega}{\left|{\rho(u, v, w)}\right|}{\rm d}{\Omega}}\Bigg\}\label{eq:3} \end{split} %(3) \end{equation} $
(3) 其中, $\rho(u, v, w)={I_x}(u-{u_0})+{I_y}(v -{v_0})+{I_t}+\beta w, $参数$\beta$为光照变化项权重因子, ${u_0}$和${v_0}$为已知的位移场, 该模型用非二次正则项$\left|{\nabla u}\right| + \left|{\nabla v} \right|$替换了H-S模型的正则项${\left|{\nabla u} \right|^2}+{\left|{\nabla v}\right|^2}, $并用L$^1$范数的数据项$\left|{\rho(u, v, w)}\right|$替换了H-S模型的数据项${({I_x}u+{I_y}v+{I_t})^2}$.虽然与H-S模型相比改动较小, 但是配准精度有了很大的提升.首先全变分正则项保持了位移场的不连续性, 在扩散过程中保护边缘信息不被模糊, 这个替换后的正则项与与著名的ROF (Rudin、Osher、Fatemi)模型[17]的正则项相同, 而ROF模型在具有很好去噪效果的同时还能保持边缘信息不被模糊, 正是因为采用了非二次正则项.其次, 数据项使用稳健的L$^1$范数对亮度的变化不及H-S模型敏感.
虽然TV-L$^1$模型相对H-S模型有了很大提升, 能够在扩散过程中保持边缘信息, 但对具有弱导数性质的纹理细节等信息的保持仍不够理想, 并且在模型最小化过程中导致了计算上的困难, 主要原因是正则项和数据项在零点处都不可微, 一个有效的方法是用可微的$\sqrt {{{\left|{\nabla u}\right|}^2}+{\varepsilon^2}}$来近似替代$\left| {\nabla u}\right|$, 然而, 极小值$\varepsilon$会导致收敛很慢并且会模糊位移场.本文尝试将分数阶微分来代替TV-L$^1$模型中的一阶导数, 并采用文献[18]的方法来求解基于分数阶微分的TV-L$^1$光流场模型.
2. 基于G-L分数阶微分的TV-L1光流场模型
分数阶微积分在17世纪提出, 在19世纪得到了迅速发展, 期间提出了许多关于分数阶微积分的定义, 最著名的有R-L (Riemann-Liouville)定义、G-L (Grünwald-Letnikov)定义和Caputo定义.其中G-L和R-L定义在数值运算时可以转化为卷积积分形式, 因此适用于信号处理领域, 而Caputo定义适用于分数阶微分方程的初边值问题, 多用于实际工程领域.而G-L定义在计算时较R-L定义更加准确, 因此我们从G-L定义出发推导出本文算法所需要的分数阶微分算子, 对TV-L$^1$算法进行改进, 用于图像的非刚性配准.
2.1 离散分数阶微分算子
Grünwald-Letnikov分数阶微分定义的离散形式为[19]
$ \begin{equation} {\Delta ^\alpha}f(x)=\sum\limits_{m=0}^{M-1} {c_m^{(\alpha)}}f(x- m)\label{eq:4} %(4) \end{equation} $
(4) 式中, $f(x)$是实函数, $c_m^{(\alpha)} = {(-1)^m}c_m^\alpha$为广义二项式系数, $c_m^\alpha=\frac{{\Gamma (\alpha+1)}}{{\Gamma (m +1)\Gamma(\alpha-m+1)}}$, $\Gamma(x)$为Gamma函数, $m$为正整数, $m$值越大, 二项式系数值越趋于0.当$\alpha =1$, $m\ge 2$时, $c_m^\alpha=0, $式(4)变为一阶差分, 即为传统梯度算子.
为简化起见, 所用图像尺寸均为$N\times N$二维矩阵, 用$X$表示欧几里得空间${R^{N\times N}}, $对于$X$中的任意变量$u=({u_{i, j}})_{i, j=1}^N, $ $v= ({v_{i, j}})_{i, j=1}^N, $定义$X$中的内积:
$ \begin{equation} {\left\langle {u, v} \right\rangle _X}=\sum\limits_{i, j} {{u_{i, j}}{v_{i, j}}} \label{eq:5} %(5) \end{equation} $
(5) 定义矢量空间$Y=X\times X, $分数阶梯度算子${\nabla^\alpha}u$为矢量空间$Y$中的一个矢量:
$ \begin{equation} {\nabla^\alpha }u=(\nabla_1^\alpha u, \nabla_2^\alpha u)\label{eq:6} %(6) \end{equation} $
(6) 其中
$ \begin{equation} \nabla_1^\alpha {u_{i, j}}=\sum\limits_{m=0}^{M-1} {c_m^{(\alpha )}} {u_{i-m, j}}, \nabla_2^\alpha {u_{i, j}}=\sum\limits_{m=0}^{M-1} {c_m^{(\alpha)}} {u_{i, j-m}} \label{eq:7} \end{equation} $
(7) 对于$Y$中任意的变量$p = ({p^1}, {p^2}), $分数阶散度算子的离散形式为
$ \begin{equation} {({\rm div}{^\alpha }p)_{i, j}}=\sum\limits_{m=0}^{M - 1} {c_m^{(\alpha )}p_{i+m, j}^1+\sum\limits_{m=0}^{M-1} {c_m^{(\alpha )}p_{i, j+m}^2}}\label{eq:8} %(8) \end{equation} $
(8) 定义$Y$中的内积:
$ \begin{equation} \begin{split} {\left\langle{p, q}\right\rangle_Y}=&\sum\limits_{i, j} {p_{i, j}^1q_{i, j}^1+}p_{i, j}^2q_{i, j}^2, \\&p=(p^1, p^2), q=(q^1, q^2)\in Y \label{eq:9} \end{split} %(9) \end{equation} $
(9) 容易得到式(5)和式(9)满足如下性质:
$ \begin{equation} {\left\langle{{\nabla ^\alpha}u, p}\right\rangle _Y}=-{\left\langle {u, {\rm div}{^\alpha }p} \right\rangle _X}, \forall u \in X, p \in Y \label{eq:10} %(10) \end{equation} $
(10) 为方便计算, 本文根据G-L定义的分数阶导数在特定离散情况下与某种卷积积分的离散化形式相同这一个特点, 将分数阶导数转化为卷积积分的形式.若记卷积核函数为
$ \begin{equation} {v^\alpha }(k) = \left\{ {\begin{array}{*{20}{l}} {{{( - 1)}^m}c_m^\alpha }, &\qquad m \ge 0\\ 0, &\qquad m < 0 \end{array}} \right. \label{eq:11} %(11) \end{equation} $
(11) 则式(7)可看作为式(12)的一个离散化近似,
$ \begin{equation} \left\{ {\begin{array}{*{20}{c}} {{v^\alpha } * {u_1} = \int_{ - \infty }^{ + \infty } {{v^\alpha }(m)u(x - m)} {\rm d}m}\\ {{v^\alpha } * {u_2} = \int_{ - \infty }^{ + \infty } {{v^\alpha }(m)u(y - m)} {\rm d}m} \end{array}} \right. \label{eq:12} %(12) \end{equation} $
(12) 式(12)可认为是Grünwald-Letnikov分数阶导数的一种近似.同理, 式(10)可看作如式(13)的相关运算的离散化近似.
$ \begin{equation} {({\rm div}{^\alpha }p)_{i, j}} = {v^\alpha } \circ {p^1} + {v^\alpha } \circ {p^2} \label{eq:13} %(13) \end{equation} $
(13) 这样算法中涉及分数阶微分的运算便转化为卷积与相关运算.在具体计算时, 采用4个方向的分数阶微分掩模算子${W_1}$、${W_2}$、${W_3}$、${W_4}, $从而可以控制图像的上下左右4个方向的扩散程度, ${W_1}$如图 1所示.其中${C_0}=1$, ${C_1}=-\alpha $, ${C_2}=\frac{{\alpha(\alpha - 1)}}{2}, \cdots, {C_m}={(-1)^m}\frac{{\Gamma (\alpha + 1)}}{{m!\Gamma (\alpha - m + 1)}}$. ${W_1}$是沿$x$负方向的掩模算子, ${W_2}\sim{W_4}$依次顺时针与$x$负方向夹角为90$^{\circ}$、180$^{\circ}$、270$^{\circ}$.
2.2 分数阶TV-L1光流场模型
本文将G-L分数阶微分引入TV-L$^1$光流模型, 代替其中的一阶微分, 得到分数阶TV-L$^1$光流场模型(Fractional TV-L$^1$, 记为FTV-L$^1$):
$ \begin{align} &\mathop {{\rm{min}}}\limits_{u, v, w} \Bigg\{ {{E_{\rm FTV - L^1}}} = \int_{\Omega} {(\left| {{\nabla ^\alpha }u} \right|}+ \left| {{\nabla ^\alpha }v} \right| + \left| {{\nabla ^\alpha }w} \right|){\rm d}{\Omega} + \nonumber\\ &\qquad\lambda {\int_{\Omega} {\left| {\rho (u, v, w)} \right|} {\rm d}{\Omega} } \Bigg\} \label{eq:14} %(14) \end{align} $
(14) 将模型转化为离散形式得到:
$ \begin{align} \mathop {{\rm{min}}}\limits_{u, v, w} \left\{ {{E_{\rm FTV - L^1}}} \right. =& {\left\| {{\nabla ^\alpha }u} \right\|_1} + {\left\| {{\nabla ^\alpha }v} \right\|_1} + {\left\| {{\nabla ^\alpha }w} \right\|_1}+\nonumber\\ &\lambda \left. {{{\left\| {\rho (u, v, w)} \right\|}_1}} \right\} \label{eq:15} %(15) \end{align} $
(15) 其中
$ \begin{align} &{\left\|{{\nabla ^\alpha }u} \right\|_1}=\int_{\Omega} {\left| {{\nabla ^\alpha }u} \right|{\rm d}{\Omega}}=\sum\limits_{i, j} {\left| {{\nabla ^\alpha }u} \right|}, \nonumber\\&\qquad{\left| {{\nabla ^\alpha }u} \right|}=\sqrt{(\nabla_1^\alpha u)^2+(\nabla_2^\alpha u)^2} \label{eq:16} %%%%%%公式(16) \end{align} $
(16) $ \begin{align} &{\left\| {{\nabla ^\alpha }v} \right\|_1}=\int_{\Omega} {\left| {{\nabla ^\alpha }v} \right|{\rm d}{\Omega}}=\sum\limits_{i, j} {\left| {{\nabla ^\alpha }v} \right|}, \nonumber\\&\qquad{\left| {{\nabla ^\alpha }v} \right|}=\sqrt{(\nabla_1^\alpha v)^2+(\nabla_2^\alpha v)^2} \label{eq:17} %%%%%公式(17) \end{align} $
(17) $ \begin{align} &{\left\| {{\nabla ^\alpha }w} \right\|_1}=\int_{\Omega} {\left| {{\nabla ^\alpha }w} \right|{\rm d}{\Omega}}=\sum\limits_{i, j} {\left| {{\nabla ^\alpha }w} \right|}, \nonumber\\&\qquad{\left| {{\nabla ^\alpha }w} \right|}=\sqrt{(\nabla_1^\alpha w)^2+(\nabla_2^\alpha w)^2} \label{eq:18} %%%%%公式(18) \end{align} $
(18) 参数$\alpha$是个实数, 当$\alpha=1$时, 该分数阶TV-L$^1$光流场模型即可看作文献[13]提出的一阶TV-L$^1$光流场模型, 所以分数阶TV-L$^1$光流场模型实际上是整数阶TV-L$^1$光流场模型的一个扩展和延伸.
2.3 分数阶TV-L1模型的求解
文献[18]提出了有效且准确的一阶原始-对偶算法来求解变分问题, 且证明了以${\rm O}(1/N)$的速率收敛.本文应用文献[18]的方法求解本文提出的FTV-L$^1$光流场模型.文献[18]的TV-L$^1$光流模型迭代方法如下:对于一类问题的原始形式:
$ \begin{equation} \mathop {\min }\limits_{x \in X} F(Kx) + G(x) \label{eq:19} %(19) \end{equation} $
(19) 先变换为其的原始-对偶形式, 再进行迭代, 得到下式:
$ \begin{equation} \mathop {\min }\limits_{x \in X} \mathop {\max }\limits_{y \in Y} \left\langle {Kx, y} \right\rangle + G(x) - {F^ * }(y) \label{eq:20} %(20) \end{equation} $
(20) 其中, ${F^ * }$为$F$的凸共轭.
步骤1. 初始化: $\tau $, $\sigma>0$, ${\bar x^0} = {x^0}$.
步骤2. 迭代更新${x^n}$, ${y^n}$, ${\bar x^n}$:
$ {y^{n + 1}} = {(I + \sigma \partial {F^ * })^{ - 1}}({y^n} + \sigma K{\bar x^n}) $
(21) $ {x^{n + 1}} = {(I + \tau \partial G)^{ - 1}}({x^n} - \tau {K^ * }{y^{n + 1}}) $
(22) $ {\bar x^{n + 1}} = 2{x^{n + 1}} - {x^n} $
(23) 分数阶TV-L$^1$光流模型的离散形式为
$ \begin{align} \mathop {{\rm{min}}}\limits_{u, v, w} \left\{ {{E_{\rm FTV - L^1}}} \right. =&{\left\| {{\nabla ^\alpha }u} \right\|_1} + {\left\| {{\nabla ^\alpha }v} \right\|_1} + {\left\| {{\nabla ^\alpha }w} \right\|_1}+ \nonumber\\&\lambda \left. {{{\left\| {\rho (u, v, w)} \right\|}_1}} \right\} \label{eq:24} %(24) \end{align} $
(24) 引入对偶变量$p$, $q$, $z \in Y$, 则分数阶TV-L$^1$模型的原始-对偶形式如下:
$ \begin{align} &\mathop {\min }\limits_{u, v, w \in X} \mathop {\max }\limits_{p, q, z \in Y} {\left\langle {{\nabla ^\alpha }u, p} \right\rangle _Y}+ {\left\langle {{\nabla ^\alpha }v, q} \right\rangle _Y}+ \nonumber\\&\qquad{\left\langle {{\nabla ^\alpha }w, z} \right\rangle _Y}+\lambda {\left\|{\rho (u, v, w)}\right\|_1}-{\delta _P}(p)-\nonumber\\&\qquad{\delta _Q}(q) - {\delta _Z}(z)\label{eq:25} %(25) \end{align} $
(25) 根据式(12)的性质, 式(25)可变换为
$ \begin{align} &\mathop {\min }\limits_{u, v, w \in X} \mathop {\max }\limits_{p, q, z \in Y} - {\left\langle {u, {\rm div}^\alpha p} \right\rangle _X} - {\left\langle {v, {\rm div}^\alpha q} \right\rangle _X}- \nonumber\\&\qquad{\left\langle {w, {\rm div}^\alpha z} \right\rangle _X} + \lambda {\left\| {\rho (u, v, w)} \right\|_1}-{\delta _P}(p)-\nonumber\\&\qquad{\delta_Q}(q)-{\delta _Z}(z) \label{eq:26} %(26) \end{align} $
(26) 其中, $P$, $Q$, $Z$分别为变量$p$, $q$, $z$的凸集, 定义如下:
$ \begin{equation} \begin{split} &P = \left\{ {p \in Y:{{\left\| p \right\|}_\infty } \le 1} \right\}\\&Q = \left\{ {q \in Y:{{\left\| q \right\|}_\infty } \le 1} \right\}\\&Z = \left\{ {z \in Z:{{\left\| z \right\|}_\infty } \le 1} \right\} \label{eq:27} %%%%%%公式(27) \end{split} \end{equation} $
(27) 式中, ${\left\| \cdot \right\|_\infty }$表示无穷范数: ${\left\| p \right\|_\infty } = \mathop {\max }\limits_{i, j} \left| {{p_{i, j}}} \right|$, $\left| {{p_{i, j}}} \right| = \sqrt {{{\left( {p_{i, j}^1} \right)}^2} + {{\left( {p_{i, j}^2} \right)}^2}} $对${\left\| q \right\|_\infty }$和${\left\| z \right\|_\infty }$同理可得.
凸集$P$, $Q$, $Z$是${L^2}$球体内的点集, 式(26)中函数${\delta _P}(p)$、${\delta _Q}(q)$和${\delta _Z}(z)$分别为集合$P$, $Q$, $Z$的指示函数, 它们的表达式如下:
$ \begin{equation} \begin{split} &{\delta _P}(p) = \left\{ {\begin{array}{ll} 0, &{p \in P}\\ + \infty, &{p \not\in P} \end{array}} \right.\\ &{\delta _Q}(q) = \left\{ {\begin{array}{ll} 0, &{q \in Q}\\ + \infty, &{q \not\in Q} \end{array}} \right.\\ &{\delta _Z}(z) = \left\{ {\begin{array}{ll} 0, &{z \in Z}\\ + \infty,&{z \not\in Z} \end{array}} \right. \label{eq:28} %%%%%公式(28) \end{split} \end{equation} $
(28) 由式(21)和(22)知, 该迭代方法的关键是求解${(I + \sigma \partial {F^ * })^{ - 1}}$和${(I + \tau \partial G)^{ - 1}}$两个算子.对比式(26)和式(20)可知, ${F^ * }(p, q, z) = {\delta _P}(p) + {\delta _Q}(q) + {\delta _Z}(z)$, $G(u, v, w) = \lambda {\left\| {\rho (u, v, w)} \right\|_1}$, 下面将应用上述迭代方法来最小化式(15), 求解分数阶TV-L$^1$模型.具体求解步骤如下:
步骤1.
1) 先求解式(21)中的$({y^n} + \sigma K{\bar x^n})$:
$ \begin{align} &({\tilde p^{n + 1}}, {\tilde q^{n + 1}}, {\tilde z^{n + 1}})= (({p^n}, {q^n}, {z^n}) + \sigma K({\bar u^n}, {\bar v^n}, {\bar w^n})) \nonumber\\&\qquad\Leftrightarrow \tilde p_{i, j}^{n + 1}={\tilde p^n}_{i, j} + \sigma {\nabla ^\alpha }{\bar u^n}, \tilde q_{i, j}^{n + 1}={\tilde q^n}_{i, j} + \sigma {\nabla ^\alpha }{\bar v^n}, \nonumber\\&\qquad\tilde z_{i, j}^{n + 1} = {\tilde z^n}_{i, j} + \sigma {\nabla ^\alpha }{\bar w^n} \label{eq:29} %(29) \end{align} $
(29) 2) 再求解式(21)中的${(I + \sigma \partial {F^ * })^{ - 1}}$, 由于${F^ * }(p, q, z)$为集合$P$, $Q$, $Z$的指示函数, 把集合$P$, $Q$, $Z$内的点按欧几里得距离分别投影至${L^2}$球内:
$ \begin{align} ({p^{n + 1}}, &{q^{n + 1}}, {z^{n + 1}}) = {(I + \sigma \partial {F^ * })^{ - 1}}\times \nonumber\\&\qquad({\tilde p^{n + 1}}, {\tilde q^{n + 1}}, {\tilde z^{n + 1}})\Leftrightarrow\nonumber\\ &\qquad p_{i, j}^{n + 1} = \frac{{\tilde p_{i, j}^{n + 1}}}{{\max (1, \left| {\tilde p_{i, j}^{n + 1}} \right|)}}, \nonumber\\&\qquad q_{i, j}^{n + 1} = \frac{{\tilde q_{i, j}^{n + 1}}}{{\max (1, \left| {\tilde q_{i, j}^{n + 1}} \right|)}}, \nonumber\\&\qquad z_{i, j}^{n + 1} = \frac{{\tilde z_{i, j}^{n + 1}}}{{\max (1, \left| {\tilde z_{i, j}^{n + 1}} \right|)}} \label{eq:30} %%%%%%公式(30) \end{align} $
(30) 步骤2.
1) 先求解式(22)中的$({x^n} - \tau {K^ * }{y^{n + 1}})$ :
$ \begin{align} ({\tilde u^{n + 1}}, &{\tilde v^{n + 1}}, {\tilde w^{n + 1}}) = (({u^n}, {v^n}, {w^n}) -\nonumber\\ & \tau K({p^{n + 1}}, {q^{n + 1}}, {z^{n + 1}}))\Leftrightarrow \tilde u_{i, j}^{n + 1}=u_{i, j}^n -\nonumber\\ & \tau \times {\rm div}{^\alpha }p_{i, j}^{n + 1}, \tilde v_{i, j}^{n + 1}=v_{i, j}^n -\tau \times {\rm div}{^\alpha }q_{i, j}^{n + 1}, \nonumber\\ &\tilde w_{i, j}^{n + 1}=w_{i, j}^n -\tau \times {\rm div}{^\alpha }z_{i, j}^{n + 1} \label{eq:31} %%%%%公式(31) \end{align} $
(31) 2) 再求解式(22)中的${(I + \tau \partial G)^{ - 1}}$, 因为$G(u, v, w) = \lambda {\left\| {\rho (u, v, w)} \right\|_1}$是$L^{1}$范数, 而$L^{1}$范数是连续不光滑的, 为方便描述, 定义${a_{i, j}} = (\nabla {I_{i, j}}, \beta )$, $\left| a \right|_{i, j}^2 = \left| {\nabla I} \right|_{i, j}^2 + {\beta ^2}$:
$ \begin{align} &({u^{n + 1}}, {v^{n + 1}}, {w^{n + 1}}) = \nonumber\\&\qquad {(1 + \tau \partial G)^{ - 1}}({\tilde u^{n + 1}}, {\tilde v^{n + 1}}, {\tilde w^{n + 1}})\Leftrightarrow \nonumber\\ &\qquad (u_{i, j}^{n + 1}, v_{i, j}^{n + 1}, w_{i, j}^{n + 1}) = (\tilde u_{i, j}^{n + 1}, \tilde v_{i, j}^{n + 1}, \tilde w_{i, j}^{n + 1})+\nonumber\\ &\qquad \left\{{\begin{array}{lll} {\tau \lambda {a_{i, j}}},&\rho<-\tau \lambda {{\left|a\right|}_{i, j}^2}\\ { - \tau \lambda {a_{i, j}}},&\rho> \tau \lambda {{\left|a\right|}_{i, j}^2}\\ - \dfrac{\rho (\tilde u_{i, j}^{n + 1}, \tilde v_{i, j}^{n + 1}, \tilde w_{i, j}^{n + 1}){a_{i, j}}}{{\left| {{a_{i, j}}} \right|}^2}, & {\left|{\rho}\right|} \leq \tau \lambda {{\left|a\right|}_{i, j}^2} \end{array}} \right. \label{eq:32} %%%%%公式(32) \end{align} $
(32) 此处分三种情况, 分别为$\rho$在$-\tau \lambda \left| a \right|_{i, j}^2$左侧, $\rho$在$\tau \lambda \left| a \right|_{i, j}^2$右侧, 在$-\tau \lambda \left| a \right|_{i, j}^2$与$\tau \lambda \left| a \right|_{i, j}^2$之间.
步骤3. $(\bar u_{i, j}^{n+1}, \bar v_{i, j}^{n+1}, \bar w_{i, j}^{n+1})=2 \times (u_{i, j}^{n+1}, $ $v_{i, j}^{n+1}, w_{i, j}^{n + 1})-(u_{i, j}^n, v_{i, j}^n, w_{i, j}^n)$.返回步骤1.
由于FTV-L$^1$光流模型是个非凸优化问题, 光流约束仅对小位移有效, 为了使其对大位移的情形也适用, 本文对上述模型应用从粗到精的配准策略, 避免模型在极小化过程中陷入局部极小值.具体方法为:取降采样因子为2, 建立高斯图像金字塔, 对每一层图像极小化FTV-L$^1$模型(式(15)), 求其位移场.从最粗一层开始, 直到最精一层.每一层求得的位移场作为下一层图像求解的初值.第一层, 初始化位移场$(u, v)$为0, 光照变化变量$w$初始化为0, 对偶变量$(p, q, z)$初始化为0.对于每一层金字塔图像的位移场求解过程, 如上述三个迭代步骤.由于本文使用4个方向的分数阶微分模板进行求导操作, 故计算过程中关于位移场$(u, v, w)$的离散梯度算子及关于对偶变量$(p, q, z)$的离散散度算子变化如下:
$ \begin{equation} \begin{split} &{\nabla ^\alpha }u = (\nabla _1^\alpha u, \nabla _2^\alpha u, \nabla _3^\alpha u, \nabla _4^\alpha u), \\ &\qquad{\rm div}^\alpha p={\rm div}_1^\alpha p+{\rm div}_2^\alpha p+{\rm div}_3^\alpha p+{\rm div}_4^\alpha p \label{eq:33} \end{split} %(33) \end{equation} $
(33) 用式(33)替代原来的整数一阶前后差分算法.
2.4 实验参数的设置
本文实验中迭代次数取50时, 模型已经达到收敛, 此处迭代次数设置为50是因为经过多次实验发现, 在迭代次数为50时, 灰度均方差(Mean square error, MSE)和峰值信噪比(Peak singnal to noise ratio, PSNR)均达到了收敛, 故选择了迭代次数为50.如图 2(a)和图 2(b)所示为Lena图像的迭代次数与灰度均方差MSE和峰值信噪比PSNR的关系曲线, 在迭代次数为42时, 已达到了收敛.应用其他图像重复进行多次实验, 发现迭代次数均在50次内能达到收敛.
另外还有三个参数$\beta$、$\lambda$和$\alpha$. $\beta$值控制着光照项对模型的影响, 由于本文模型是基于光流强度保持恒定的假设, 但实际情况中, 由于光照变化等原因, 光流强度往往不会保持恒定, 所以增加$\beta$项来稍微改进光流约束项, $\beta$值应取较小值, 经过多次实验本文选取$\beta$为0.01.
正则化参数$\lambda$是影响着正则项和数据项的权重, 由于光流模型的正则项起惩罚光流场中大的变化以获得平滑光流场的作用, 若$\lambda$值大, 则对光流约束项的影响越大, 即光流约束只要存在一点偏离, 都会导致该泛函发散; 反之, 若$\lambda$越小, 则对光流约束项的影响越小.总之, $\lambda$的大小决定正则化的强度, 决定了模型解的倾向, 较大的$\lambda$倾向于满足正则项约束, 较小的$\lambda$倾向于满足光流约束, 本文的$\lambda$值则在两种极端中寻找某种平衡.一般$\lambda$值建议在10 $\sim$ 100之间, 本文经过多次实验, 选取$\lambda$值为40.
下面分析分数阶微分阶次$\alpha$的选取, 对于可积函数$f(x), $其傅里叶变换为$F(w) = \int_R {f(w){{\rm e}^{ - jwx}}{\rm d}x}, $根据傅里叶变换的性质, 其$n(n \in {z^ + })$阶导数为${D^n}f(x)\mathop \Leftrightarrow \limits^{FT} {(DF)^n}(w) = {(jw)^n}F(w) = {\hat h^n}(w)F(w), $把阶次从整数阶扩展到分数阶可得:
$ \begin{align} &{D^\alpha }f(x)\mathop \Leftrightarrow \limits^{FT} {(DF)^\alpha }(w) = {(jw)^\alpha }F(w) = {\hat h^\alpha }(w)F(w)\notag\\ &{\hat h^\alpha }(w) = {\hat b^\alpha }(w){{\rm e}^{{\rm j}{\theta ^\alpha }(w)}} \label{eq:34} %(34) \end{align} $
(34) 其中, ${\hat b^\alpha }(w) = {\left| w \right|^\alpha }$, ${\hat \theta ^\alpha }(w) = \frac{{\alpha \pi }}{2}{\mathop{\rm sgn}} (w)$, 根据式(34)绘制如图 3所示的分数阶幅频特性曲线图.
从图 3可以看出, 当阶次小于1时, 与整数1阶相比, 分数阶微分算子对中低频部分的幅值有所提升, 而对高频部分的幅值则有所压缩, 随着阶次的变大, 对中低频部分的提升幅度越来越小, 对高频部分的压缩也减弱.当阶次大于1时, 与整数1阶相比, 分数阶微分算子对中低频部分的幅值由提升变成了压缩, 阶次越大, 压缩越大, 而对高频部分的幅值则变成了提升, 阶次越大, 提升越大.当阶次小于1时, 可看作一个对中低频增强放行, 对高频压缩放行的滤波器, 而当阶次大于1时, 可看作一个高通滤波器.在图像处理中, 图像的平滑区域对应着信号的低频部分, 图像的纹理信息对应着信号的中低频部分, 图像的轮廓和噪声对应着信息的高频部分, 总之根据实际图像处理中目的不同选取不同的阶次区域, 而根据本文模型可知, 我们希望阻止中低频部分通过滤波器而非放行, 从而达到保持纹理细节信息的目的, 故阶次的合理区间建议选择在1 $\sim$ 2之间.但针对不同的图像, 其最佳参数不相同.分数阶微分相对于整数阶微分的优势是可以有目的地控制微分后的值大于或者小于整数阶微分后的值, 但这是通过某个像素点周围的众多像素点共同参与计算实现的, 若模板宽度过小, 则参与计算的像素点就少, 体现不了分数阶微分的优势, 但模板取得过大, 又会起到光滑平均的作用, 因此要在两者之间平衡, 需要经过多次实验取得最佳值.所以本文分数阶模板中的阶次和模板宽度都是通过实验确定, 并且对于不同的图像, 其最佳的参数都是不同的, 需要通过多次实验确定.
3. 实验结果与分析
本文选用标准库图像Lena和真实大脑图像Brain1、Brain2 (两种不同类型的)进行测试, 如图 4所示.图 4中第一行为参考图像, 第二行为与第一行对应的浮动图像, 即变形图像.为了证明本文方法的有效性, 从定性和定量两个方面来评价配准精度.定性评价即观察视觉效果, 比较配准后的图像和原始图像的差异以及通过二者差值图像黑色区域所占大小来评价, 定量评价则通过配准后图像和原始图像的灰度均方误差MSE (Mean square error)和峰值信噪比PSNR (Peak signal to noise ratio)来评价.
灰度均方误差定义如下:
$ \begin{equation} {\rm MSE} = \frac{1}{{m \times n}}\sum\limits_{i, j} {{{({I_1}(i, j) - I(i, j))}^2}} \label{eq:35} %(35) \end{equation} $
(35) 峰值信噪比定义如下:
$ \begin{equation} {\rm PSNR} = 10\lg \frac{{{\max\limits_{1 \le i \le m, 1 \le j \le n}}{{\left| {{I_1}(i, j)} \right|}^2}}}{{\frac{1}{{m\times n}}\sum\limits_{i = 1}^m {{{\sum\limits_{j = 1}^n {[{I_1}(i, j)- I(i, j)]} }^2}} }} \label{eq:36} %(36) \end{equation} $
(36) 其中, ${I_1}$是$t$时刻的图像, 即参考图像, $I$是经过配准后的图像, $m \times n$为像素个数.理想情况下MSE值应为0, 表示两幅图像同一位置上点的灰度值相同. PSNR值越大越好, 表示配准后图像越逼近参考图像.
本文实验所使用的计算机环境为: Intel Core i3-2130 CPU, 3.40 GHZ, 内存4 GB, 操作系统为64位Windows 7.0, 程序使用R2012b版Matlab实现.
3.1 标准库图像实验
本次实验选用图 4(a)所示的Lena作为参考图像进行实验, 为了证明本文方法有效性, 对Lena图像进行扭曲形变, 如图 5(a)所示, Lena图像头发处发生了明显扭曲变形. 图 5展示了TV-L$^1$算法和本文算法最佳阶次配准的视觉效果. 图 5(b)为TV-L$^1$算法配准后的图像, 图 5(c) $\sim$ (e)分别是本文算法取最佳阶次三个不同的模板宽度所对应的配准结果图, 从图中可得图 5(b)中的Lena图像眼角处以及头发处出现了信息丢失, 而对比本文算法配准后的配准图片图 5(c)、图 5(d)和图 5(e)在对应处效果则要好很多, 并未出现明显信息丢失. 图 5(f)是TV-L$^1$算法配准后的差值图像(配准后的图像与输入图像的差值图像), 图 5(h) $\sim$ (j)是本文算法取最佳分数阶阶次和三个不同模板宽度时所对应的差值图像.如果两幅图像完全配准, 理论上其差值图像应该全黑, 即表示配准后图像与参考图像相同, 所以差值图像黑色区域越多越好, 通过对比可知, 图 5(h) $\sim$ (j)相对图 5(g)黑色区域明显多很多, 从而也证明了分数阶微分TV-L$^1$配准算法能够较好地提高配准精度.在分数阶阶次为1.2时, 模板宽度$k$为2 (即为$5\times5$)时, 配准效果达到最佳.但是, 对于不同的图片, 最佳的实验参数仍然需要进行多次实验人工选定.
图 5 Lena图像实验(第一行为浮动图像和配准后图像, 第二行为差值图像. (a)为浮动图像, (b) $\sim$ (e)为配准后的图像; (b) TV-L$^{1}$方法; (c)本文方法($\alpha=1.2, k=1$); (d)本文方法($\alpha=1.2, k=2$); (e)本文方法($\alpha=1.2, k=3$); (f) $\sim$ (j)分别为第一行图像与参考图像(图 4(a))的差值图像)Fig. 5 Lena image (The first line is floating image and registered image, the second line is difference image. (a) Floating image, (b) $\sim$ (e) are registered images, (b) TV-L$^{1}$, (c) Our method ($\alpha=1.2, k=1$), (d) Our method ($\alpha=1.2, k=2$), (e) Our method ($\alpha=1.2, k=3$), (f) $\sim$ (j) are difference images)为了得到最佳的模板参数, 我们进一步进行实验, 依据灰度均方误差MSE和峰值信噪比PSNR来分析模板的参数$\alpha$, $k$对配准的影响. 图 6(a)展示了均方误差(MSE)和阶次$\alpha$与模板宽度$k$的关系, MSE值越小表示配准精度越高, 图 6(b)展示了峰值信噪比(PSNR)和阶次$\alpha$与模板宽度$k$的关系, PSNR值越大表示配准精度越高. 图 6(a)和图 6(b)中三条曲线分别是在模板大小参数$k$取1、2、3时的MSE值和PSNR值, 当阶次$\alpha$等于1时, 即为TV-L$^1$算法的实验结果.为方便观察, TV-L$^1$算法和本文算法最佳阶次下不同模板的MSE值和PSNR值已列在表 1和表 2中.从图 6(a)中可以看出, MSE最小值并不是在阶次$\alpha$等于1的时候, 阶次从0.1开始, 随着阶次的增大, MSE呈现减小的趋势, 当$\alpha$值在1.2处时, MSE值达到最小, 这是因为当$\alpha$小于1时, 纹理等中低频信息丢失, 图像纹理细节模糊, 导致图片配准精度降低, 而当$\alpha$大于1时, 纹理细节信息被阻止通过滤波器从而达到保持纹理的效果, 但当$\alpha$过大时, 会导致高频信号如边缘信息模糊, 从而配准精度降低, 所以存在一个最佳阶次, 使中低频信号和高频信号达到一个平衡, 而此次实验的最佳阶次为1.2. 图 6(b)中PSNR值最高的阶次也不在$\alpha$为1处, 原因同上.通过实验得知, 在分数阶阶次$\alpha$等于1.2, 模板宽度$k$等于2 (即为$5 \times 5$)时, 配准效果达到最佳.不过, 对于不同的图片, 最佳的实验参数仍然需要进行多次实验人工选定.同时也能得到结论:一阶微分并不能有效地刻画位移场中的具有弱导数性质的纹理细节等信息, 而近年来的研究也表明分数阶微分比整数阶微分具有更好的描述纹理信息能力, 所以用分数阶微分来代替整数阶微分在TV-L$^1$算法中的应用, 能够获得更高的配准精度.
表 1 参考图像和配准图像的均方误差(MSE)Table 1 Mean square error (MSE) of reference image and registered输入图片 配准前 TV-L $^{1}$ 本文算法($k$ = 1) 本文算法($k$ = 2) 本文算法($k$ = 3) Lena ($\alpha$ = 1.2) 669.33 14.86 10.36 9.17 11.56 Brain1 ($\alpha$ = 1.3) 295.85 27.51 18.20 15.93 20.22 Brain2 ($\alpha$ = 1.3) 813.77 31.02 11.47 9.95 17.89 表 2 峰值信噪比(PSNR)Table 2 Peak signal to noise ratio (PSNR)输入图片 配准前 TV-L $^{1}$ 本文算法($k$ = 1) 本文算法($k$ = 2) 本文算法($k$ = 3) Lena ($\alpha$ = 1.2) 19.32 35.55 38.18 38.88 37.50 Brain1 ($\alpha$ = 1.3) 22.78 33.73 35.34 36.17 34.89 Brain2 ($\alpha$ = 1.3) 19.03 31.21 37.73 38.15 35.60 3.2 真实图像实验
本次做了两组实验, 选用脑部图像, 如图 4中Brain1和Brain2, 将参考图像与浮动图像配准.该两组浮动图像相对于参考图像只有轻微变形, 人眼辨识已稍显困难, 但通过参考图像和浮动图像的差值图像还是可以看出大量白色区域存在, 如图 7所示. 图 7(g)是TV-L$^1$算法配准后图像图 7(b)与参考图像Brain1的差值图像, 图 7(h)、(i)和(j)分别是本文算法不同参数下的配准图像与参考图像Brain1的差值图像, 通过比较可以发现, 本文算法的差值图像白色区域有较大减少, 并且当$\alpha=1.3$, $k=2$时, MSE值达到最小, PSNR值达到最大, 也证明本文算法相比TV-L1算法具有更高的配准精度, 为了方便观察, TV-L$^1$算法和本文算法最佳阶次下不同模板的MSE值和PSNR值已列在表 1和表 2中.同理, 为了进一步验证本文方法的有效性, 再次选用了Brain2图像重复上述实验, 实验结果如图 8所示和表 1及表 2所示.多组实验结果表明本文的配准方法较原始的TV-L$^1$方法配准精度得到较大的提高.
图 7 Brain1图像实验(第一行为浮动图像和配准后图像, 第二行为差值图像. (a)为浮动图像, (b) $\sim$ (e)为配准后的图像; (b) TV-L$^{1}$方法; (c)本文方法($\alpha=1.3, k=1$); (d)本文方法($\alpha=1.3, k=2$); (e)本文方法($\alpha=1.3, k=3$); (f) $\sim$ (j)分别为第一行图像与参考图像(图 4(b))的差值图像)Fig. 7 Brain1 image (The first line is floating image and registered image, the second line is difference image. (a) Floating image, (b) $\sim$ (e) are registered images, (b) TV-L$^{1}$, (c) Our method ($\alpha=1.3, k=1$), (d) Our method ($\alpha=1.3, k=2$), (e) Our method ($\alpha=1.3, k=3$), (f) $\sim$ (j) are difference images)图 8 Brain2图像实验(第一行为浮动图像和配准后图像, 第二行为差分图像. (a)为浮动图像, (b) $\sim$ (e)为配准后的图像; (b) TV-L$^{1}$方法; (c)本文方法($\alpha=1.3$, $k=1$); (d)本文方法($\alpha=1.3$, $k=2$); (e)本文方法($\alpha=1.3$, $k=3$); (f) $\sim$ (j)分别为第一行图像与参考图像(图 4(c))的差值图像)Fig. 8 Brain2 image. The first line is floating image and registered image, the second line is difference image ((a) floating image, (b) $\sim$ (e) are registered images, (b) TV-L$^{1}$, (c) Our method ($\alpha=1.3$, $k=1$), (d) Our method ($\alpha=1.3$, $k=2$), (e) Our method ($\alpha=1.3$, $k=3$), (f) $\sim$ (j) are difference images)4. 结论
将G-L分数阶微分引入到TV-L $^{1}$光流模型中, 提出了一种新的基于分数阶微分的全变分方法(FTV-L$^{1}$)来解决图像的非刚性配准问题.结合全变分能量方程的对偶形式来极小化FTV-L$^{1}$光流模型获得位移场.融合G-L分数阶的TV-L$^{1}$光流模型能够解决图像灰度均匀, 弱纹理区域配准结果中的信息模糊的问题, 这是因为分数阶微分比整数阶微分具有更好的细节描述能力, 可以有针对性地选择合适的阶次对具有弱导数性质的信息如纹理信息进行抑制或者非线性保留, 因此可以提高图像的配准精度.另外, 通过实验给出了配准精度和阶次、模板宽度的关系, 从而为最佳模板参数的选取提供了依据, 尽管不同类型的图像其最佳参数是不同的, 但是其最佳配准阶次一般在1 $\sim$ 2之间.理论分析和实验结果均表明, 本文的方法可用于弱纹理和弱边缘图像的非刚性配准, 提高图像配准的精度, 是TV-L$^{1}$光流场模型的一个重要延伸和扩展.
但是不同图像配准的最佳阶次需要不断测试, 因而是比较耗时和费力的.今后可以研究自适应G-L分数阶TV-L $^{1}$的非刚性图像配准算法.此外本文的分数微分掩模是二维的, 要完成三维图像的配准, 还需将其扩展到三维空间.
-
图 5 Lena图像实验(第一行为浮动图像和配准后图像, 第二行为差值图像. (a)为浮动图像, (b) $\sim$ (e)为配准后的图像; (b) TV-L$^{1}$方法; (c)本文方法($\alpha=1.2, k=1$); (d)本文方法($\alpha=1.2, k=2$); (e)本文方法($\alpha=1.2, k=3$); (f) $\sim$ (j)分别为第一行图像与参考图像(图 4(a))的差值图像)
Fig. 5 Lena image (The first line is floating image and registered image, the second line is difference image. (a) Floating image, (b) $\sim$ (e) are registered images, (b) TV-L$^{1}$, (c) Our method ($\alpha=1.2, k=1$), (d) Our method ($\alpha=1.2, k=2$), (e) Our method ($\alpha=1.2, k=3$), (f) $\sim$ (j) are difference images)
图 7 Brain1图像实验(第一行为浮动图像和配准后图像, 第二行为差值图像. (a)为浮动图像, (b) $\sim$ (e)为配准后的图像; (b) TV-L$^{1}$方法; (c)本文方法($\alpha=1.3, k=1$); (d)本文方法($\alpha=1.3, k=2$); (e)本文方法($\alpha=1.3, k=3$); (f) $\sim$ (j)分别为第一行图像与参考图像(图 4(b))的差值图像)
Fig. 7 Brain1 image (The first line is floating image and registered image, the second line is difference image. (a) Floating image, (b) $\sim$ (e) are registered images, (b) TV-L$^{1}$, (c) Our method ($\alpha=1.3, k=1$), (d) Our method ($\alpha=1.3, k=2$), (e) Our method ($\alpha=1.3, k=3$), (f) $\sim$ (j) are difference images)
图 8 Brain2图像实验(第一行为浮动图像和配准后图像, 第二行为差分图像. (a)为浮动图像, (b) $\sim$ (e)为配准后的图像; (b) TV-L$^{1}$方法; (c)本文方法($\alpha=1.3$, $k=1$); (d)本文方法($\alpha=1.3$, $k=2$); (e)本文方法($\alpha=1.3$, $k=3$); (f) $\sim$ (j)分别为第一行图像与参考图像(图 4(c))的差值图像)
Fig. 8 Brain2 image. The first line is floating image and registered image, the second line is difference image ((a) floating image, (b) $\sim$ (e) are registered images, (b) TV-L$^{1}$, (c) Our method ($\alpha=1.3$, $k=1$), (d) Our method ($\alpha=1.3$, $k=2$), (e) Our method ($\alpha=1.3$, $k=3$), (f) $\sim$ (j) are difference images)
表 1 参考图像和配准图像的均方误差(MSE)
Table 1 Mean square error (MSE) of reference image and registered
输入图片 配准前 TV-L $^{1}$ 本文算法($k$ = 1) 本文算法($k$ = 2) 本文算法($k$ = 3) Lena ($\alpha$ = 1.2) 669.33 14.86 10.36 9.17 11.56 Brain1 ($\alpha$ = 1.3) 295.85 27.51 18.20 15.93 20.22 Brain2 ($\alpha$ = 1.3) 813.77 31.02 11.47 9.95 17.89 表 2 峰值信噪比(PSNR)
Table 2 Peak signal to noise ratio (PSNR)
输入图片 配准前 TV-L $^{1}$ 本文算法($k$ = 1) 本文算法($k$ = 2) 本文算法($k$ = 3) Lena ($\alpha$ = 1.2) 19.32 35.55 38.18 38.88 37.50 Brain1 ($\alpha$ = 1.3) 22.78 33.73 35.34 36.17 34.89 Brain2 ($\alpha$ = 1.3) 19.03 31.21 37.73 38.15 35.60 -
[1] 蒲亦非, 王卫星.数字图像的分数阶微分掩模及其数值运算规则.自动化学报, 2007, 33(11):1128-1135 http://www.aas.net.cn/CN/abstract/abstract13448.shtmlPu Yi-Fei, Wang Wei-Xing. Fractional differential masks of digital image and their numerical implementation algorithms. Acta Automatica Sinica, 2007, 33(11):1128-1135 http://www.aas.net.cn/CN/abstract/abstract13448.shtml [2] 陈青, 刘金平, 唐朝晖, 李建奇, 吴敏.基于分数阶微分的图像边缘细节检测与提取.电子学报, 2013, 41(10):1873-1880 doi: 10.3969/j.issn.0372-2112.2013.10.001Chen Qing, Liu Jin-Ping, Tang Zhao-Hui, Li Jian-Qi, Wu Min. Detection and extraction of image edge curves and detailed features using fractional differentiation. Acta Electronica Sinica, 2013, 41(10):1873-1880 doi: 10.3969/j.issn.0372-2112.2013.10.001 [3] Pu Y F, Siarry P, Zhou J L, Liu Y G, Zhang N, Huang G, Liu Y Z. Fractional partial differential equation denoising models for texture image. Science China Information Sciences, 2014, 57(7):1-19 doi: 10.1007/s11432-014-5112-x [4] Liu J, Chen S C, Tan X Y. Fractional order singular value decomposition representation for face recognition. Pattern Recognition, 2008, 41(1):378-395 doi: 10.1016/j.patcog.2007.03.027 [5] Zhang Y, Pu Y F, Hu J R, Zhou J L. A class of fractional-order variational image inpainting models. Applied Mathematics and Information Sciences, 2012, 6(2):299-306 http://www.researchgate.net/publication/260210952_A_Class_of_Fractional-Order_Variational_Image_Inpainting_Models [6] Ren Z M. Adaptive active contour model driven by fractional order fitting energy. Signal Processing, 2015, 117:138-150 doi: 10.1016/j.sigpro.2015.05.009 [7] 薛鹏, 杨佩, 曹祝楼, 贾大宇, 董恩清.基于平衡系数的Active Demons非刚性配准算法.自动化学报, 2016, 42(9):1389-1400 http://www.aas.net.cn/CN/abstract/abstract18927.shtmlXue Peng, Yang Pei, Cao Zhu-Lou, Jia Da-Yu, Dong En-Qing. Active demons non-rigid registration algorithm based on balance coefficient. Acta Automatica Sinica, 2016, 42(9):1389-1400 http://www.aas.net.cn/CN/abstract/abstract18927.shtml [8] 张桂梅, 曹红洋, 储珺, 曾接贤.基于Nyström低阶近似和谱特征的图像非刚性配准.自动化学报, 2015, 41(2):429-438 http://www.aas.net.cn/CN/abstract/abstract18621.shtmlZhang Gui-Mei, Cao Hong-Yang, Chu Jun, Zeng Jie-Xian. Non-rigid image registration based on low-rank Nyström approximation and spectral feature. Acta Automatica Sinica, 2015, 41(2):429-438 http://www.aas.net.cn/CN/abstract/abstract18621.shtml [9] 闫德勤, 刘彩凤, 刘胜蓝, 刘德山.大形变微分同胚图像配准快速算法.自动化学报, 2015, 41(8):1461-1470 http://www.aas.net.cn/CN/abstract/abstract18720.shtmlYan De-Qin, Liu Cai-Feng, Liu Sheng-Lan, Liu De-Shan. A fast image registration algorithm for diffeomorphic image with large deformation. Acta Automatica Sinica, 2015, 41(8):1461-1470 http://www.aas.net.cn/CN/abstract/abstract18720.shtml [10] Thirion J P. Image matching as a diffusion process:an analogy with Maxwell's demons. Medical Image Analysis, 1998, 2(3):243-260 doi: 10.1016/S1361-8415(98)80022-4 [11] Wang H, Dong L, O'Daniel J, Mohan R, Garden A A, Ang K K, Kuban D A, Bonnen M, Chang J Y, Cheung R. Validation of an accelerated 'demons' algorithm for deformable image registration in radiation therapy. Physics in Medicine and Biology, 2005, 50(12):2887-2905 doi: 10.1088/0031-9155/50/12/011 [12] Palos G, Betrouni N, Coulanges M, Vermandel M, Devlaminck V, Rousseau J. Multimodal matching by maximisation of mutual information and optical flow technique. In:Proceedings of the 26th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (IEMBS). San Francisco, CA, USA:IEEE, 2004. 1679-1682 http://europepmc.org/abstract/MED/17272026 [13] Pock T, Urschler M, Zach C, Beichel R, Bischof H. A duality based algorithm for TV-L1-optical-flow image registration. Medical Image Computing and Computer-Assisted Intervention-MICCAI 2007. Berlin Heidelberg:Springer-Verlag, 2007. 511-518 [14] Pérez J S, Meinhardt-Llopis E, Facciolo G. TV-L1 optical flow estimation. Image Processing on Line, 2013, 3:137-150 doi: 10.5201/ipol [15] Yip S S F, Coroller T P, Sanford N N, Huynh E, Mamon H, Aerts H J W L, Berbeco R I. Use of registration-based contour propagation in texture analysis for esophageal cancer pathologic response prediction. Physics in Medicine and Biology, 2016, 61(2):906-922 doi: 10.1088/0031-9155/61/2/906 [16] Horn B K, Schunck B G. Determining optical flow. In:Technical Symposium East. Washington, D.C., USA:International Society for Optics and Photonics, 1981. 319-331 [17] Rudin L I, Osher S, Fatemi E. Nonlinear total variation based noise removal algorithms. Physica D:Nonlinear Phenomena, 1992, 60(1-4):259-268 doi: 10.1016/0167-2789(92)90242-F [18] Chambolle A, Pock T. A first-order primal-dual algorithm for convex problems with applications to imaging. Journal of Mathematical Imaging and Vision, 2011, 40(1):120-145 doi: 10.1007/s10851-010-0251-1 [19] Cafagna D. Fractional calculus:a mathematical tool from the past for present engineers. IEEE Industrial Electronics Magazine, 2007, 1(2):35-40 doi: 10.1109/MIE.2007.901479 期刊类型引用(9)
1. 陈震,张道文,张聪炫,汪洋. 基于深度匹配的由稀疏到稠密大位移运动光流估计. 自动化学报. 2022(09): 2316-2326 . 本站查看
2. 庄波,崔宝同,楼旭阳,陈娟. 基于反步法的耦合分数阶反应扩散系统边界输出反馈控制. 自动化学报. 2022(11): 2729-2743 . 本站查看
3. 宿海涛,张廷华. 图像序列的变分光流计算. 光学技术. 2020(01): 124-128 . 百度学术
4. 许美玲,邢通,韩敏. 基于时空Kriging方法的时空数据插值研究. 自动化学报. 2020(08): 1681-1688 . 本站查看
5. 高敏娟,党宏社,魏立力,王海龙,张选德. 结合全局与局部变化的图像质量评价. 自动化学报. 2020(12): 2662-2671 . 本站查看
6. 韩敏,闫阔,秦国帅. 基于改进KAZE的无人机航拍图像拼接算法. 自动化学报. 2019(02): 305-314 . 本站查看
7. 张桂梅,李艳兵. 结合纹理结构的分数阶TV模型的图像修复. 中国图象图形学报. 2019(05): 700-713 . 百度学术
8. 贾迪,朱宁丹,杨宁华,吴思,李玉秀,赵明远. 图像匹配方法研究综述. 中国图象图形学报. 2019(05): 677-699 . 百度学术
9. 霍其润,李建武,陆耀,秦明. 基于变分的CT图像环形伪影校正. 自动化学报. 2019(09): 1713-1726 . 本站查看
其他类型引用(15)
-