2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于变尺度变换减少Sigma点的粒子滤波算法研究

赵光琼 陈绍刚 付奎 唐忠樑 贺威

李春娜, 陈伟杰, 邵元海. 鲁棒的稀疏Lp-模主成分分析. 自动化学报, 2017, 43(1): 142-151. doi: 10.16383/j.aas.2017.c150512
引用本文: 赵光琼, 陈绍刚, 付奎, 唐忠樑, 贺威. 基于变尺度变换减少Sigma点的粒子滤波算法研究. 自动化学报, 2015, 41(7): 1350-1355. doi: 10.16383/j.aas.2015.c140833
LI Chun-Na, CHEN Wei-Jie, SHAO Yuan-Hai. Robust Sparse Lp-norm Principal Component Analysis. ACTA AUTOMATICA SINICA, 2017, 43(1): 142-151. doi: 10.16383/j.aas.2017.c150512
Citation: ZHAO Guang-Qiong, CHEN Shao-Gang, FU Kui, TANG Zhong-Liang, HE Wei. A Particle Filter Algorithm Based on Scaled UKF with Reduced Sigma Points. ACTA AUTOMATICA SINICA, 2015, 41(7): 1350-1355. doi: 10.16383/j.aas.2015.c140833

基于变尺度变换减少Sigma点的粒子滤波算法研究

doi: 10.16383/j.aas.2015.c140833
基金项目: 

国家重点基础研究发展计划(973计划) (2014CB744206)资助

详细信息
    作者简介:

    赵光琼电子科技大学数学科学学院硕士研究生. 主要研究方向为控制论. E-mail: zhaoguangqiong.math@gmail.com

A Particle Filter Algorithm Based on Scaled UKF with Reduced Sigma Points

Funds: 

Supported by National Basic Research Program of China (973 Program) (2014CB744206)

  • 摘要: 为了减少传统无味粒子滤波(Unscented particle filter, UPF) 算法的计算负担, 提出了最小斜度单形无味转换(Minimal skew simplex UT, MSSUT) 方法, 这种方法是用最小斜度无味卡尔曼滤波来产生粒子的重要性函数. 它不仅能够扩大重要性分布与系统状态的后验概率密度的重叠性, 而且能够通过减少Sigma 点来减少计算负担. 但是, 随着状态空间维数的增加, Sigma 点集的覆盖半径增大, 导致了Sigma 点集的聚集性变差. 辅助随机变量变尺度无味变换(Auxiliary random variable formulation of the scaled unscented transformation, ASUT) 能够克服Sigma 点集分布扩展的缺点. 所以, 提出了一种高维空间中改进的变尺度最小斜度无味粒子滤波(Scaled minimal skew simplex unscented particle filter, SMSSUPF) 算法. 仿真结果表明: 在高维状态空间中, 与传统的无味粒子滤波(UPF) 相比, 计算复杂度和计算负担显著减少. 与最小斜度无味粒子滤波(Minimal skew simplex unscented particle filter, MSSUPF) 相比, SMSSUPF 减少了系统噪声方差和测量噪声方差所带来的估计误差.
  • 主成分分析(Principle component analysis,PCA) [1]是一种被广泛研究的数据处理和降维技术,在多元统计分析、 生物信息、图像识别等领域中有着广泛应用 [2-6]. 对于给定的数据,PCA寻找线性投影方向使得数据在投影后空间中方差极大化,从而使得这些投影方向构成的低维线性空间能够较好地体现原空间的数据结构信息.

    当数据服从正态分布时,经典的PCA由于使用L2- 模,使得其在均方重构误差意义下是最优的.此外,PCA所求出的各主成分(Principle component,PC)之间互不相关,因此更有利于对各个主成分进行分析.尽管经典的PCA有诸多优点,但其各主成分是原变量的线性组合,且组合权重系数通常是非零的,这使得PCA在实际应用中往往可解释性较差. 为解决该问题,通常的做法是对权重系数加稀疏限制,如Zou等 [7]将PCA的原始问题构造为回归类型的优化问题,并通过Lasso和弹性网络得到稀疏的主成分; Shen等 [8]利用PCA和奇异值分解(Singular value decomposition,SVD) 之间的关系,通过求解低阶矩阵问题求解PCA,并通过极小化带正则项的优化问题得到稀疏的主成分; Johnstone等 [9] 则在高维情况下对单个主成分模型用阈值方法进行求解; Journée 等 [10]利用广义幂法通过添加L0- 模、L1- 模稀疏惩罚项构造非凸优化问题提取稀疏主成分.

    同时,L2- 模本身性质会导致PCA对数据离群点敏感 [11].对此,许多学者对鲁棒性进行了研究 [12-18]. L1- 模常常被作为达到鲁棒降维的有效手段 [19-21]. Brooks等 [12]针对含不平衡离群点数据提出基于低维子空间的L1- 模PCA (L1-PCA*),并用基于最适应超平面的方法来求解. 相比于文献[12],Ke等 [13] 通过求解凸优化问题实现L1- 模问题.不同于利用L1- 模,Ding 等 [14] 使用旋转不变的R1- 模构造PCA,在一定程度上抑制了离群点的影响.但是 该方法依赖于投影空间的维数.不同于以上方法通过在输入空间中极小化重构误差而实现,Kwak [15]提出PCA-L1,在特征空间中极大化相应的L1- 模问题并通过贪婪算法进行求解.该算法直观、简单且易于实施,并且与R1-PCA相比速度更快; 文献[16]则讨论了带Lp- 模稀疏约束的PCA模型,其中0<p< 1,并采用逐次线性化算法求解.最近,Kwak [17]将PCA-L1推广到PCA-Lp,其中p是任意非负数,同时证明了当p=2和p=1时,PCA-Lp分别等价于经典PCA和文献[15]提出的PCA-L1.

    为同时达到鲁棒性和稀疏性,Meng等 [18] 在PCA-L1的基础上提出具有稀疏性的L1- 模PCA (RSPCA). 实验表明,该算法不仅保持了PCA-L1的鲁棒性,而且具有稀疏性 [18]. 因此,本文拟提出稀疏的PCA-Lp (LpSPCA),将对任意p>0的LpSPCA进行研究;同时,通过添加额外L1- 模正则项,LpSPCA不仅有较好的降维性能,并具有一定的稀疏性.特别地,当0<p≦1时,LpSPCA同时具有良好的鲁棒性和稀疏性.

    LpSPCA可以通过一个简单的迭代算法实现,并且该算法在p≧1时收敛于局部最优解.此外,当p=1时,LpSPCA等价于文献[18]中所提的RSPCA.在具有离群点的人工数据及带噪声的人脸数据上的实验表明,LpSPCA在鲁棒性和稀疏性上与经典PCA相比有诸多优势,并可针对不同数据选择适当的p 以达到更好的效果.

    本文结构如下:第1节给出本文所提LpSPCA模型,第2节提出LpSPCA求解算法并进行相应的理论分析. 第3节将LpSPCA应用到人工数据及人脸数据上进行实验.第4节进行总结.

    考虑如下原始数据矩阵: $X = [{x_1},{x_2}, \cdots ,{x_N}] \in {R^{d \times N}}$ ,其中d代表样本点维数,N代表样本点个数. 不失一般性,假设数据已中心化.

    经典PCA试图寻找一个m<d维线性子空间使得样本点X在该空间中的方差尽可能大.该空间可以通过求解以下优化问题得到:

    $\eqalign{ & \mathop {\max }\limits_W \sum\limits_{i = 1}^N {\left\| {{W^{\rm{T}}}{x_i}} \right\|} _2^2 \cr & {\rm{s}}.{\rm{t}}.\quad {W^{\rm{T}}}W = I \cr} $

    (1)

    其中, $\|\cdot\|_2 $ 为L2- 模, $W = [{w_1},{w_2}, \cdots ,{w_m}] \in {R^{d \times m}},I \in {R^{m \times m}}$ 是单位阵.这里 ${{w}_j}$ 是数据X的第j主成分, $j=1,\cdots,m$ .优化问题(1)可以通过特征值问题进行求解.由约束条件 $W^{\rm T}W=I$ 知, $\{{{w}_j}\}_{j=1}^m $ 构成所求m 维线性子空间的标准正交基.

    由于优化问题(1)对w不具有稀疏性,为了引入稀疏性,可考虑以下带稀疏约束的优化问题:

    $\eqalign{ & \mathop {\max }\limits_W \mathop \sum \limits_{i = 1}^N \left\| {{W^{\rm{T}}}{x_i}} \right\|_2^2 \cr & {\rm{s}}.{\rm{t}}.\quad {W^{\rm{T}}}W = I,\left\| W \right\|0 \le k \cr} $

    (2)

    其中, $\| \cdot \| _0$ 为L0- 模,k是所求主成分稀疏度.显然,优化问题(2)是一个复杂的NP难组合问题,求解困难.为得到该问题的近似解,Jolliffe等 [22]L0- 模问题(2)松弛为L1- 模问题:

    $\eqalign{ & \mathop {\max }\limits_W \mathop \sum \limits_{i = 1}^N \left\| {{W^{\rm{T}}}{x_i}} \right\|_2^2 \cr & {\rm{s}}.{\rm{t}}.\quad {W^{\rm{T}}}W = I,{\left\| W \right\|_1} \le k \cr} $

    (3)

    其中, $\| \cdot \| _1$ 为L1- 模.优化问题(3)使得投射后的样本点在L2- 模意义下方差最大,并使解具有L1- 模意义下的稀疏度k. 但由于L2- 模的应用使得样本方差由范数较大的样本点决定,因此文献[18]进一步考虑如下优化问题:

    $\eqalign{ & \mathop {\max }\limits_W \mathop \sum \limits_{i = 1}^N {\left\| {{W^{\rm{T}}}{x_i}} \right\|_1} \cr & {\rm{s}}.{\rm{t}}.\quad {W^{\rm{T}}}W = I,{\left\| W \right\|_1} \le k \cr} $

    (4)

    优化问题(3)和(4)的区别在于式(4)使用L1- 模定义投射空间样本方差,而式(3)则用L2- 模定义.进一步,我们可以将以上问题推广为要求投射后的样本点在Lp- 模意义下方差最大,其中p>0是任意实数.通过选择适当的p,适应更广泛类型的数据.因此,本文提出稀疏Lp- 模PCA的原始优化问题如下:

    $\eqalign{ & \mathop {\max }\limits_W {F_p}(W) = \cr & {1 \over p}\sum\limits_{i = 1}^N {\left\| {{W^{\rm{T}}}{x_i}} \right\|_p^p} = {1 \over p}\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^m | } w_j^{\rm{T}}{x_i}{|^p} \cr & {\rm{s}}.{\rm{t}}.\quad {W^{\rm{T}}}W = I,{\left\| W \right\|_1} \le k \cr} $

    (5)

    其中, $\| \cdot \|_p$ 为Lp- 模.我们称以上模型为LpSPCA.容易看到,当p=2时,式(5)是优化问题(3),而当p = 1时,式(5)等价于优化问题(4).此外,当0 < p ≦1时,LpSPCA可同时保持鲁棒性及稀疏性的优点.因此,可以通过选择不同的p,实现在保持稀疏性的同时满足不同的降维要求.

    尽管优化问题(5)中的稀疏约束用凸的L1- 模代替了非凸的L0- 模,LpSPCA仍然难以给出通用的优化方法.为此,我们首先考虑求解m=1的情况;对于m>1的情形,可通过引入贪婪算法求解.因此,首先考虑求解如下问题:

    $\eqalign{ & \mathop {\max }\limits_w {F_p}(w) = {1 \over p}\sum\limits_{i = 1}^N | {w^{\rm{T}}}{x_i}{|^p} \cr & {\rm{s}}.{\rm{t}}.\quad {w^{\rm{T}}}w = 1,{\left\| w \right\|_1} \le k \cr} $

    (6)

    通过引入拉格朗日函数对优化问题(6)进行求解.记优化问题(6)的拉格朗日函数如下:

    $L(w) = {F_p}(w) - \lambda ({w^{\rm{T}}}w - 1) - \gamma ({\left\| w \right\|_1} - k)$

    (7)

    其中,λ>0.令

    $\nabla w = \sum\limits_{i = 1}^N {{\rm{sgn}}} ({w^{\rm{T}}}{x_i})|{w^{\rm{T}}}{x_i}{|^{p - 1}}{x_i}$

    (8)

    Fp (w)w的导数,其中 ${\rm sgn}(\cdot)$ 为符号函数.则L(w)w 的导数为0时有

    $\nabla w - 2\lambda w - \gamma {\rm{sgn}}(w) = 0$

    (9)

    从而, $w = {1 \over {2\lambda }}(\nabla w - \gamma {\rm{sgn}}(w))$ ,λ>0. 当λ< 0 时,令 $\triangledown_{ w} =0$ . 则此时w=0,问题(6)无解. 当λ> 0时,从式(9)可得w满足 ${\rm{sgn}}(w) = {\rm{sgn}}({\nabla _w}),|{\nabla _w}| \ge \gamma $.由此,

    $w = {{{\rm{sgn}}(w)} \over {2\lambda }}{(|{\nabla _w}| - \gamma )_ + } = {1 \over {2\lambda }}\beta $

    (10)

    其中,

    $\eqalign{ & \beta = {\rm{sgn}}(w){(|\nabla w| - \gamma )_ + } \cr & {(a)_ + } = \left\{ \matrix{ a,{\rm{ }}a > 0 \hfill \cr 0,{\rm{ }}a \le 0 \hfill \cr} \right. \cr} $

    由于 ${ w}^{\rm T}{ w}=1$ ,因此可得 $\lambda =\| {\beta} \| _2 /2$ ,且 ${ w}^\ast={\beta} /\| {\beta} \| _2$ . 令λ是 $| \triangledown_{ w} | $ 中第k+1大的元素,则由式(10)所表示的w恰好有k个非零元素.从而我们可以得到当m=1时,LpSPCA 模型的求解算法如下:

    算法 1. 一个主成分的LpSPCA算法(m=1)

    输入. 数据矩阵 $X=[{ x}_1 ,{ x}_2 ,\cdots ,{ x}_N]\in R^{d\times N}$ ,稀疏度k.

    输出. ${ w}^\ast $ .

    步骤 1. 初始化 ${ w}(0)$ ,并令 $w(0) = w(0)/w(0){_2}$ ,迭代次数t=0.

    步骤 2. 奇异性检查:若 $p\le 1$ ,且存在i,使得 ${ w}^{\rm T}(t){ x}_i$ = 0,则令 $w(t) \leftarrow (w(t) + \delta )/w(t) + \delta {_2}$ ,其中是一个小的随机生成的向量.

    步骤 3. 计算

    $\nabla w(t) = \sum\limits_{i = 1}^N {{\rm{sgn}}} (w{(t)^{\rm{T}}}{x_i})|w{(t)^{\rm{T}}}{x_i}{|^{p - 1}}{x_i}$

    令 ${ w}(t+1)={\beta} (t)/\| {\beta} (t)\| _2$ ,其中${\beta} (t)={\rm sgn}({ w}(t))$×$(| \triangledown_{{ w}(t)} | -\gamma )_+ $,λ是 $| \triangledown_{{ w}(t)} | $ 中第k+1大的元素.

    步骤 4. 收敛检查:如果优化问题(6)的目标函数继续增长,转到步骤2; 否则,得到最优解 ${w^ * } = w(t)$ ,并停止迭代.

    在给出求解多个主成分的算法前,首先讨论算法1当p≧1时的收敛性.

    定理 1.p≧1时,优化问题(6)的目标函数值通过每次迭代单调不降.

    证明 . 首先考虑p>1的情况.令 w(t)w在第t次迭代中的值.则 ${ w}(t+1)={\beta} (t)/\| {\beta} (t)\| _2 $ ,其中 ${\beta} (t)={\rm sgn}({ w}(t))(| \triangledown_{{ w}(t)} | -\gamma )_+ $ .由于p>1,因此 $F_p ({ w})$ 是凸函数.由凸函数的性质可知:

    ${F_p}(w(t + 1)) - {F_p}(w(t)) \ge \nabla _{w(t)}^{\rm{T}}(w(t + 1) - w(t))$

    (11)

    注意到sgn(w(t+1))=sgn(▽w(t)),且w(t+1) 满足 $w(t + 1){_2} = 1,w(t + 1){_1} \le k$ ,而w(t)满足 $\| { w}(t)\| _2 =1$,$\| { w}(t)\| _1 \le k$ ,因此有 $\nabla _{w(t)}^{\rm{T}}(w(t + 1) - w(t)) \ge 0$ .结合式(11)可知, ${F_p}(w(t + 1)) - {F_p}(w(t)) \ge 0$ ,因此可得p>1时的结论.

    p=1时,由文献[18]中的定理1知,算法1收敛.

    综上所述,当p≧1时,优化问题(6)的目标函数是单调不降的.

    由于优化问题(6)的目标函数有上界,且由定理1知,随着每次迭代目标函数值非降,因此算法1当p≧1时是收敛的.需要注意的是,尽管当0< p<1时,优化问题(6)的目标函数是非凸的,但在实验中发现,目标函数值在迭代过程中也很快趋于稳定.

    由于当m>1时,优化问题(5)很难用一般优化方法进行求解.为此,采用贪婪算法进行求解.算法的基本思路是首先对原始数据应用算法1得到第一主成分w1;然后将数据投影到与w1正交的空间中得到新的数据集,并在投影后的数据集上继续应用算法1 得到第二主成分;依次类推,直到得到m个主成分.算法具体步骤如下:

    算法 2. 多个主成分的LpSPCA算法 (m>1)

    输入. 数据矩阵 $X=[{ x}_1 ,{ x}_2 ,\cdots ,{ x}_N]\in R^{d\times N}$ ,稀疏度k,主成分个数m>1.

    输出. m个稀疏主成分 $\{{ w}_i \}_{i=1}^m $ .

    步骤 1. 记 ${ w}_0 =0\in R^d$ 且 $X^0=\{{ x}_i^0 ={ x}_i \}_{i=1}^n $ .

    步骤 2. 对$j=1,2,\cdots ,m$,进行以下循环:

    1) 令 $X^j=\{{ x}_i^j ={ x}_i^{j-1} -{ w}_{j-1} ({ w}_{j-1}^{\rm T} { x}_i^{j-1} )\}_{i=1}^N $ ;

    2) 应用算法1到数据集Xj上并得到稀疏度为k的主成份wj.

    算法2求得的各主成分不随m的变化而改变,并且第1主成分为原始式(6)的局部最优解,第2主成分为式(6)的局部次优解,依次类推.算法2是一个启发式算法,只能得到式(5)的近似解.主要包括两方面: 1)算法1本身只能得到式(6)的局部解; 2)由算法2产生的 $\{{ w}_i\}_{i=1}^m $ 的正交性不能在理论上给予保证.然而,由算法2中步骤2可知, $w_s^{\rm{T}}x_i^j = 0,i = 1,2, \cdots ,N,s = 1,2, \cdots ,j - 1$ ,因此投射后的样本集Xj属于 $\{{ w}_s \}_{s=1}^{j-1}$ 所张成的$(j-1)$维子空间,并且由Xj所得到的第j个主成分wj也近似正交于 $\{{ w}_s \}_{s=1}^{j-1} $ .

    需要注意的是,算法2实际上是对算法1在不同数据集上的循环执行.因此,算法1的解对算法2有直接影响.在算法1中,初始值是随机选取,而算法1所得的局部解是依赖于该初始值的.因此,好的初始值比较重要.在实际运行中,除了随机赋初始值外,还可以采用经典PCA 的解作为算法1的初始值;或者选择不同的初始值多次运行算法1,并在这些初始值中选择使得目标函数最大的初始值;还可以选择初始值使得其与范数最大的样本同向.为减少运算复杂度,同时为了测试算法的稳定性,本文采取随机赋值的方法.

    为验证本文算法的鲁棒性和稀疏性,通过两个人工数据集和两组带离群点和噪声点的Yale人脸数据集,以重构误差(Reconstruction error)为指标,分别对LpSPCA算法与经典PCA [1]、PCA-Lp [17]及RSPCA [18]算法进行性能分析. 为方便起见,以下称PCA-Lp为LpPCA.所有实验均以Matlab 2014b为软件环境,以Intel i5 (2.3 GHz)处理器,8 GB内存的计算机为硬件平台.在实验中,使用Matlab中eig函数求解经典PCA的特征值问题,使用算法2求解LpSPCA.

    3.1.1   LpSPCA 鲁棒性分析

    通过设计一个三维带离群点的人工数据集,验证不同p值对LpSPCA算法抗离群点性能的影响.人工数据集构造如下: 1)选取31个数据点 $\{ ({x_i},{y_i},{z_i})\} _{i = 1}^{31}$ 构成空间中平行于x轴的近似直线,其中 ${x_i} \in [ - 3,3]$ ,且yizi分别随机取自[0,0.1]和[-1,-0.9]上的均匀分布. 2)在该数据中引入4个离群点,分别为 $(4+\alpha_i ,2+{\beta} _i ,4+\gamma _i )$ 和 $({\alpha _i}, - 3 + {\beta _i},4 + {\gamma _i})$ ,其中 ${\alpha _i},{\beta _i},{\gamma _i}$ 随机取自[0,0.1]上的均匀分布,i=1,2,如图 1 (a)所示.

    图 1  PCA和LpSPCA在人工数据集上所得到的第1个主成分及 将数据用LpSPCA、PCA、RSPCA、LpPCA投影到该主成分所张成空间上的重构误差
    Fig. 1  The -rst principal components of the arti-cial data set obtained by classical PCA and LpSPCA, and reconstruction errors in the spaces spanned by the -rst principal components obtained by LpSPCA, PCA, RSPCA and LpPCA, respectively

    由上述人工数据集的结构可知,该数据由1个平行于x的主方向和远离该主方向的4个离群点构成.因而,该人工数据本质上是1维向量嵌入在3 维空间中的数据.因此,在本组实验中,将检验LpSPCA和PCA、RSPCA、LpPCA将数据降到1维子空间后的重构性能.另外,设置LpSPCA 和RSPCA的稀疏度为k=2.

    对于LpSPCA,由于该人工数据在三维空间中,因此稀疏度k可以取为1或2.然而,若取k=1时,则主成分将有两个分量为0.此时,根据该数据点的构造,可以得到的主成分将平行于x轴方向,因而意义不大.因此,选取稀疏度k=2.

    图 1 (a)给出了LpSPCA和经典PCA的第1主成分(PC)投影方向(为使图像更清晰,没有画出LpPCA所提取的PC方向).结果表明:当p=0.5时,LpSPCA所得到的第一PC方向与数据的真实方向最为接近,并且随着p的增长,LpSPCA的PC方向受离群点影响越来越大.特别地,当p=2时,LpSPCA与经典PCA所得PC方向基本一致.

    为进一步验证各算法性能,与文献[15]类似,引入重构误差指标,定义如下:

    ${e_i} = {\left\| {{\zeta _i} - {w_1}w_1^{\rm{T}}{\zeta _i}} \right\|_2}$

    其中, ${\zeta} _i =\{(x_i ,y_i ,z_i )\}$ 为第i个样本点,w1是相应方法所得的第一PC.图 1 (b)描绘了各算法将原3维空间数据降到1维后每个样本点的重构误差.从图 1(b) 可以看出,当p=0.5时,LpSPCA在该数据上的重构误差最小,并且随着p增大,LpSPCA的重构误差依次增大; LpPCA也呈现同样的特点.然而,当取相同p时,可以看到LpSPCA的重构误差比LpPCA 略低,说明在此数据集上,主成分本身具有一定稀疏性,因此LpSPCA效果更好.同时,RSPCA的重构误差与p=1时的LpSPCA、LpPCA基本持平.此外,p=2时,LpSPCA、LpPCA与经典PCA在样本点上的重构误差相近.实验结果表明,LpSPCA可以通过调节p达到相当的鲁棒性.

    3.1.2   LpSPCA 稀疏性分析

    通过设计一个8维的人工数据集验证LpSPCA算法的稀疏性.该人工数据集的构造基于文献[7]中的人工数据.

    在构造人工数据集前,定义三个潜在因子:

    $\eqalign{ & {V_1} \sim {\rm{N}}(0,20) \cr & {V_2} \sim {\rm{N}}(0,30) \cr & {V_3} = - 0.2V + 0.8{V_2} + \varepsilon \cr} $

    其中, $\varepsilon \sim {\rm N}(0,1)$ ,且V1V2ε互相独立.记xi为数据集的第i个特征, $i=1,2,{\cdots},8$ . 则定义 ${x_1},{x_2},{x_3} = {V_1},{x_4},{x_5},{x_6} = {V_2},{x_7},{x_8} = {V_3}$ .三个潜在因子的方差分别为20、30和20,因此V2最重要,V1V3基本同等重要.这样,得到的第1主成分应只用 $({x_4},{x_5},{x_6})$ 就可恢复V3,而第2和第3主成分可只用 $({x_1},{x_2},{x_3})$ 或 $({x_7},{x_8})$ 恢复,即所构造数据本身具有稀疏性.将各算法应用于此数据,所得结果列于表 1 ~ 3中.

    表 1  PCA和RSPCA在人工数据集2上提取的前两个主成分
    Table 1  The first two PCs extracted by PCA and RSPCA on artificial data set 2
    PCARSPCA
    PC1PC2PC1PC2
    0.0608-0.123800.0998
    -0.05270.042200.4954
    0.03890.151400.4048
    -0.1343-0.1754-0.36080
    0.167-0.10620.36790
    0.20740.184100
    0.21350.023700
    -0.12540.19330.27130
    下载: 导出CSV 
    | 显示表格
    表 2  LpPCA 在人工数据集2 上所提取的前两个主成分
    Table 2  The first two PCs extracted by LpPCA on artificial data set 2
    LpPCA (L0.5)LpPCA (L1) LpPCA (L1.5)LpPCA (L2)
    PC1 PC2 PC1 PC2 PC1 PC2 PC1 PC2
    0.1610.1896-0.1924-0.16570.0588-0.1483-0.1807-0.1945
    -0.14330.08550.17830.0865-0.1833-0.0360.03990.1858
    -0.1472-0.18070.1511-0.0542-0.17710.04280.1957-0.1054
    0.07730.0125-0.10560.131-0.0350.10670.2457-0.0457
    -0.09420.05660.17130.1395-0.2173-0.1576-0.01840.0696
    0.1948-0.16460.05-0.1428-0.2380.23750.1488-0.1129
    0.08310.1925-0.14280.14990.21350.08990.08310.1925
    -0.09910.11790.0085-0.1306-0.12540.1812-0.09910.1179
    下载: 导出CSV 
    | 显示表格
    表 3  LpSPCA 在人工数据集2 上所提取的前两个主成分
    Table 3  The first two PCs extracted by LpSPCA on artificial data set 2
    LpPCA (L0.5)LpPCA (L1) LpPCA (L1.5)LpPCA (L2)
    PC1 PC2 PC1 PC2 PC1 PC2 PC1 PC2
    00.29780-0.447400.128500.1126
    0-0.6740-0.169600.4496-0.06250
    00.02820-0.38300.422000.4801
    0.272600.256700.5954000.4073
    -0.402700.37410-0.24690-0.58450
    0.324700.3693000-0.3530
    00000000
    00000.2713000
    下载: 导出CSV 
    | 显示表格

    表 1 ~ 3可以看出,经典PCA和LpPCA (p = 0.5,1,1.5,2)均不具有稀疏性,而RSPCA和LpSPCA (p=0.5,1,1.5,2)有较好的稀疏性.同时p越小,LpSPCA所提取的稀疏主成分越接近于真实情况.特别地,当p=0.5,1和1.5时,LpSPCA所得结果优于RSPCA.

    特征脸提取是人脸识别的一个重要环节,近年来得到广泛研究与发展.然而,传统的特征脸提取方法大多基于无噪声污染的人脸图像数据 [23-26].但是,现实中人脸图像大多包含离群点或噪声,例如脸部被遮掩、弱光线下的图像等,这极大影响了传统基于L2- 模降维方法的性能.因此,本实验将LpSPCA算法应用到带离群点和噪声的Yale人脸数据上,并 将其和经典PCA、RSPCA及LpPCA比较,以验证其特征提取能力及鲁棒性.

    Yale人脸数据集包含15类共165张灰色人脸数据图片,每类包含11张图片,并且每张图片都具有不同的布局及面部表情. Yale人脸数据图片的原始大小为320像素×243像素,本文采用裁剪后大小为64像素×64像素的归一化图片. 为测试LpSPCA的鲁棒性,本文采取文献[18]中的做法,对原始图片进行两种加离群点及噪声点处理: 1) 遮盖噪声(Occluded),首先在每类的11个图像中随机抽取两张图像,然后在抽取的图像上随机选择大小为40×30 的长方形区域,并用黑白噪声对其覆盖; 2)哑噪声(Dummy),在整个人脸数据集中额外加入与原人脸图像大小相同的50张黑白点噪声图片.

    本文将分别在上述两类Yale人脸数据集上,以重构特征脸和平均重构误差(Average reconstruction error,ARCE)为指标,验证和分析LpSPCA的鲁棒性.类似文献[15],这里将使用前m个PC对图像进行重构,其ARCE定义如下:

    $e(m) = {1 \over n}\sum\limits_{i = 1}^n {\xi _i^o - \sum\limits_{j = 1}^m {{w_j}} w_j^{\rm{T}}{\xi _i}{_2}} $

    其中,n为图像样本点个数, ${\xi} _i^o $ 代表第i张原始人脸图片, ${\xi} _i$ 代表噪声化人脸数据集中相应的图片.

    3.2.1   稀疏度 k 对算法性能的影响

    在验证LpSPCA算法的鲁棒性之前,首先分析稀疏度k对ARCE的影响.每个人脸在实际计算中都相当于4 096 (64×64)维向量. 对每个不同的p,选取稀疏度k为维度的一定百分比: 95 %,90 %,85 %,80 %,75 %. 例如,当取百分比为95 %时,则此时稀疏度k 为4 096×95 %.

    图 2 (a)图 2 (b)分别给出了在两种噪声人脸数据集上,具有不同稀疏度的LpSPCA的平均重构误差.从图 2可以看出,无论是哪种数据,随着k 值的增加,LpSPCA的重构误差整体趋势逐渐增加,然而,当稀疏度选为维数的90% 时,其重构误差最小.因此,在后续鲁棒性实验中,始终设定算法稀疏度为维度的90%.

    图 2  稀疏度k对LpSPCA平均重构误差在带遮盖噪声和哑噪声的Yale 人脸数据上的影响
    Fig. 2  The influence of parsity k to the ARCE of LpSPCA on the occluded or dummy Yale face database
    3.2.2   LpSPCA 与其他算法性能对比

    对于遮盖噪声型数据,首先使用各算法将64×64维的图像高维空间降维到由前30个PC张成的子空间,然后再用该子空间对遮盖噪声图像进行重构. 图 3 (a)给出了各算法的重构效果.从图 3 (a)可以看出,当p=0.5时,LpSPCA重构效果最好,这是由于L0.5- 模极大程度抑制了噪声的影响; 随着p的增大,LpSPCA受噪声的影响增大;当p=2时,其性能与经典的L2-PCA相近.上述结果表明,传统基于L2- 模的降维算法,其重构性能易受噪声点影响.

    图 3  带遮盖噪声的Yale人脸数据及LpSPCA、PCA、RSPCA和LpPCA在该数据上用前30个相应主成分的重构效果图及 将数据用各方法投影到该1 ~ 70个主成分上的重构误差
    Fig. 3  Occluded Yale face database and face reconstruction pictures of the data set constructed by the first thirty principal components obtained by LpSPCA,PCA,RSPCA and LpPCA and reconstruction errors in the spaces spanned by 1 ~ 70 principal components obtained by PCA,RSPCA,LpPCA and LpSPCA,respectively

    图 3 (b)给出了各算法提取的PC个数(即重构子空间维数)对ARCE的影响.结果表明:对于所有算法,随着PC个数的增大,ARCE逐级减少,说明重构子空间维数对重构效果存在较大影响.随PC个数增加,当p=0.5时,LpPCA和LpSPCA的ARCE 快速下降,且当特征个数大于35时,LpSPCA的ARCE略低于LpPCA. p=1时,LpPCA和LpSPCA的ARCE小于RSPCA,且当所提取特征个数小于50 时,LpSPCA的重构误差更小.随着p的增大(p=1.5,2),LpPCA和LpSPCA的性能开始变差,其ARCE高于RSPCA. 然而,LpPCA、 LpSPCA (p= 0.5,1,1.5,2)和RSPCA的性能都比经典PCA要好.从图中可以看出,当提取PC个数在12 ~ 30之间时,随着提取特征数的增加,经典PCA、RSPCA及p=1.5,2时,LpPCA和LpSPCA的重构误差也有所增加.表明对于经典PCA、RSPCA及p=1.5,2时的LpPCA和LpSPCA,所加遮盖噪声对第12 ~ 30个PC的提取有很大影响.相反,当p=0.5,1时,LpPCA和LpSPCA随提取特征数据的增长,ARCE下降较快,且没有接近常数的值.以上结果表明,当0<p< 1时,LpSPCA具有良好的鲁棒性.

    对于哑噪声型数据,可以得到类似结论. 1)图 4 (a)描述了经典PCA、RSPCA 及p =0.5,1,1.5,2时LpPCA和LpSPCA在该数据集上的重构效果.从图 4 (a)可以看出,经典PCA及p=1.5,2时的LpPCA和LpSPCA对原始图片重构效果最差,以至于对半数以上人脸重构失真,并且p=1.5时的结果比p=2时更差.相对而言,RSPCA及对应p=0.5,1 的LpPCA和LpSPCA则成功提取人脸特征,并再现了原始人脸图片. 2)图 4 (b)给出的相应平均重构误差,进一步印证了以上结论.具体地,当提取特征数为5 ~ 55时,对于经典PCA、 p=1.5,2时的LpPCA 和p=2 时的LpSPCA,它们的重构误差接近于常数,表明所加虚拟噪声图像对第5 ~ 55个PC的提取有很大的影响.相反,当p=0.5,1时,LpSPCA和LpPCA的ARCE则下降较快,并且两者ARCE值基本相同.说明与LpPCA相比,LpSPCA并没有损失精度,却具有良好的稀疏性.

    图 4  原始Yale人脸数据及LpSPCA、PCA、RSPCA和LpPCA 在带哑噪声的Yale数据上用前30个相应主成分的\\重构效果图及将数据用 各方法投影到该1 ~ 70个主成分上的重构误差
    Fig. 4  Original Yale face database and face reconstruction pictures of its dummy data set constructed by the first thirty principal components obtained by LpSPCA,PCA,RSPCA and LpPCA and reconstruction errors in the spaces spanned by 1 ~ 70 principal components obtained by PCA,RSPCA,LpPCA and LpSPCA,respectively

    以上在Yale带离群点和噪声人脸数据上的实验结果表明,相比于经典PCA和LpPCA,本文所提LpSPCA在不损失精度的基础上具有较好的稀疏性; 相比于经典PCA和RSPCA,LpSPCA可通过选择p达到不同的处理离群点及噪声效果,具有鲁棒性.

    本文提出一种新的鲁棒稀疏PCA模型及算法LpSPCA. LpSPCA对LpPCA赋予了稀疏性,使得算法在具有鲁棒性的同时具有较强的可解释性. LpSPCA可由一个简单的算法进行求解,并理论上验证了该算法p≧1时的收敛性. LpSPCA在人工数据及人脸数据上的结果表明了该算法的优势.然而,本文所提LpSPCA算法只能求得局部近似解而不保证精确解.因此,设计针对LpSPCA更有效的算法是值得进一步研究的.

  • [1] Rigatos G G. A derivative-free Kalman filtering approach to state estimation-based control of nonlinear systems. IEEE Transactions on Industrial Electronics, 2012, 59(10): 3987-3997
    [2] Kong L, Kong L F, Wu P L. Adaptive Gaussian particle filter for nonlinear state estimation. In: Proceedings of the 31st Chinese Control Conference. Hefei, China: IEEE, 2012. 2146-2150
    [3] Zhang X C. A novel cubature Kalman filter for nonlinear state estimation. In: Proceedings of the 52nd IEEE Conference on Decision and Control. Florence, Italy: IEEE, 2013. 7797-7802
    [4] Hu J P, Liu Z X, Wang J H, Wang L, Hu X M. Estimation, intervention and interaction of multi-agent systems. Acta Automatica Sinica, 2013, 39(11): 1796-1804
    [5] Wen Xin-Yu. Disturbance observer based control for a class of nonlinear systems with input time-delay. Acta Automatica Sinica, 2014, 40(9): 1882-1888) (文新宇. 一类含输入时滞非线性系统的干扰观测器控制. 自动化学报, 2014, 40(9): 1882-1888)
    [6] Novara C, Ruiz F, Milanes M. A new approach to optimal filter design for nonlinear systems. In: Proceedings of the 48th IEEE Conference on Decision and Control and 28th Chinese Control Conference. Shanghai, China: IEEE, 2009. 5484-5489
    [7] Zhang F R, Cao J S, Xu Z H. An improved particle swarm optimization particle filtering algorithm. In: Proceedings of the International Conference on 2013 Communications, Circuits and Systems. Chengdu, China: IEEE, 2013. 173-177
    [8] Zuo Jun-Yi, Zhang Yi-Zhe, Liang Yan. Particle filter based on adaptive part resampling. Acta Automatica Sinica, 2012, 38(4): 647-652(左军毅, 张怡哲, 梁彦. 自适应不完全重采样粒子滤波器. 自动化学报, 2012, 38(4): 647-652)
    [9] Zhu J, Wang X L, Fang Q S. The improved particle filter algorithm based on weight optimization. In: Proceedings of the 2013 International Conference on Information Science and Cloud Computing Companion. Guangzhou, China: IEEE, 2013. 351-356
    [10] Ouyang Cheng, Ji Hong-Bing, Guo Zhi-Qiang. Improved multiple model particle PHD and CPHD filtering algorithm. Acta Automatica Sinica, 2012, 38(3): 341-348(欧阳成, 姬红兵, 郭志强. 改进的多模型粒子PHD和CPHD滤波算法. 自动化学报, 2012, 38(3): 341-348)
    [11] Li L Q, Ji H B, Luo J H. The iterated extended Kalman particle filtering. Journal of Xidian University (Natural Science), 2007, 34(2): 233-238
    [12] Charalampidis A C, Papavassilopoulos G P. Improved auxiliary and unscented particle filter variants. In: Proceedings of the 52nd IEEE Annual Conference on Decision and Control. Florence, Italy: IEEE, 2013. 7040-7046
    [13] Julier S J. The scaled unscented transformation. In: Proceedings of the American Control Conference. Anchorage, AK: IEEE, 2002. 4555-4559
    [14] Julier S J. The spherical simplex unscented transformation. In: Proceedings of the American Control Conference. Denver, USA: IEEE, 2003. 2430-2434
    [15] Guo W Y, Han C Z, Lei M. Research on particle filter based on spherical unscented transformation. In: Proceedings of the 7th Word Congress on Intelligent Control and Automation. Chongqing, China: IEEE, 2008. 8388-8392
    [16] Tian Jun, Qian Jian-Sheng, Li Shi-Yin. Unscented particle filter using iterative minimal skew simplex UKF. Control and Decision, 2011, 26(6): 888-892(田隽, 钱建生, 李世银. 迭代最小斜度单型Sigma采样UPF算法. 控制与决策, 2011, 26(6): 888-892)
    [17] Ning Xiao-Lin, Fang Jian-Cheng, Ma Xin. Impact of UPF filter parameters on spacecraft celestial navigation performance. Chinese Space Science and Technology, 2010, 30(3): 1-11(宁晓琳, 房建成, 马辛. UPF滤波参数对航天器天文导航性能的影响. 中国空间科学技术, 2010, 30(3): 1-11)
    [18] Guo Ying-Shi, Wang Chang, Zhang Ya-Qi. Analysis of noise variance's effect on Kalman filter result. Computer Engineering and Design, 2014, 35(2): 641-645(郭应时, 王畅, 张亚岐. 噪声方差对卡尔曼滤波结果影响分析. 计算机工程与设计, 2014, 35(2): 641-645)
    [19] Jiang Wei-Nan, Zhou Hai-Yin, Duan Xiao-Jun, Pan Xiao-Gang. Adaptive selecting method for scaling factor of scaled unscented transformation. Chinese Space Science and Technology, 2008, 28(3): 1-6(姜伟南, 周海银, 段晓君, 潘晓刚. 比例UT变换的一种比例因子自适应选取方法. 2008, 28(3): 1-6)
    [20] Cheng Shui-Ying. Unscented transformation and unscented Kalman filtering. Computer Engineering and Applications, 2008, 44(24): 25-35(程水英. 无味变换与无味卡尔曼滤波. 计算机工程与应用, 2008, 44(24): 25-35)
  • 加载中
计量
  • 文章访问数:  1666
  • HTML全文浏览量:  102
  • PDF下载量:  1397
  • 被引次数: 0
出版历程
  • 收稿日期:  2014-12-03
  • 修回日期:  2015-03-03
  • 刊出日期:  2015-07-20

目录

/

返回文章
返回