阿法狗围棋系统的简要分析

田渊栋

doi:10.16383/j.aas.2016.y000001

阿法狗围棋系统的简要分析

doi: 10.16383/j.aas.2016.y000001

田渊栋

脸书人工智能研究所加利福尼亚州 94025 美国

详细信息

作者简介:
田渊栋脸书人工智能研究所研究员.主要研究方向为深度学习及计算机视觉.2013至2014年曾任谷歌无人车组研究员/软件工程师.2008年毕业于上海交通大学获硕士学位,2013年于美国卡耐基梅隆大学机器人系获博士学位,曾获2013年国际计算机视觉会议(ICCV)马尔奖提名.E-mail:yuandong@fb.com

计量
- 文章访问数: 4352
- HTML全文浏览量: 908
- PDF下载量: 4904
- 被引次数: 0
出版历程
- 收稿日期: 2016-04-14
- 录用日期: 2016-05-10
- 刊出日期: 2016-05-01

A Simple Analysis of AlphaGo

TIAN Yuan-Dong

Facebook AI Research (FAIR) Facebook Inc., CA 94025, USA

More Information

Author Bio:
Research scientist in Facebook AI Research, working on deep learning and computer vision. Prior to that, he was a researcher/software engineer in Google Self-driving Car Team in 2013»2014. He received Ph. D. in Robotics Institute, Carnegie Mellon University in 2013, Bachelor and Master degrees in computer science in Shanghai Jiao Tong University. He is the recipient of 2013 ICCV Marr Prize Honorable Mentions.

摘要

摘要: 谷歌的围棋系统阿法狗(AlphaGo)在三月的比赛中以4:1的成绩击败了围棋世界冠军李世石, 大大超过了许多人对计算机围棋程序何时能赶上人类职业高手的预期(约10～30年).本文在技术层面分析了阿法狗系统的组成部分, 并基于它过去的公开对局预测了它可能的弱点.
- 深度学习 /
- 深度卷积神经网络 /
- 计算机围棋 /
- 强化学习 /
- 阿法狗
Abstract: In March 2016, the AlphaGo system from Google DeepMind beat the World Go Champion Lee Sedol 4:1 in a historic five-game match. This is a giant leap filling the gap between Go AI and top human professional players, which was once regarded to be filled in at least 10～30 years. In this paper, based on published results [Silver et al., 2016], i analyze the components of AlphaGo and predict its potential technical weakness based on the public games of AlphaGo.
- Deep learning /
- deep convolutional neural network /
- computer Go /
- reinforcement learning /
- AlphaGo

HTML全文

主成分分析(Principle component analysis,PCA) ^[1]是一种被广泛研究的数据处理和降维技术,在多元统计分析、生物信息、图像识别等领域中有着广泛应用 ^[2-6]. 对于给定的数据,PCA寻找线性投影方向使得数据在投影后空间中方差极大化,从而使得这些投影方向构成的低维线性空间能够较好地体现原空间的数据结构信息.

当数据服从正态分布时,经典的PCA由于使用L₂- 模,使得其在均方重构误差意义下是最优的.此外,PCA所求出的各主成分(Principle component,PC)之间互不相关,因此更有利于对各个主成分进行分析.尽管经典的PCA有诸多优点,但其各主成分是原变量的线性组合,且组合权重系数通常是非零的,这使得PCA在实际应用中往往可解释性较差. 为解决该问题,通常的做法是对权重系数加稀疏限制,如Zou等 ^[7]将PCA的原始问题构造为回归类型的优化问题,并通过Lasso和弹性网络得到稀疏的主成分; Shen等 ^[8]利用PCA和奇异值分解(Singular value decomposition,SVD) 之间的关系,通过求解低阶矩阵问题求解PCA,并通过极小化带正则项的优化问题得到稀疏的主成分; Johnstone等 ^[9] 则在高维情况下对单个主成分模型用阈值方法进行求解; Journée 等 ^[10]利用广义幂法通过添加L₀_- 模、L₁- 模稀疏惩罚项构造非凸优化问题提取稀疏主成分.

同时,L₂- 模本身性质会导致PCA对数据离群点敏感 ^[11].对此,许多学者对鲁棒性进行了研究 ^[12-18]. L₁- 模常常被作为达到鲁棒降维的有效手段 ^[19-21]. Brooks等 ^[12]针对含不平衡离群点数据提出基于低维子空间的L₁- 模PCA (L₁-PCA*),并用基于最适应超平面的方法来求解. 相比于文献[12],Ke等 ^[13] 通过求解凸优化问题实现L₁- 模问题.不同于利用L₁- 模,Ding 等 ^[14] 使用旋转不变的R₁- 模构造PCA,在一定程度上抑制了离群点的影响.但是该方法依赖于投影空间的维数.不同于以上方法通过在输入空间中极小化重构误差而实现,Kwak ^[15]提出PCA-L₁,在特征空间中极大化相应的L₁- 模问题并通过贪婪算法进行求解.该算法直观、简单且易于实施,并且与R1-PCA相比速度更快; 文献[16]则讨论了带Lp- 模稀疏约束的PCA模型,其中0<p< 1,并采用逐次线性化算法求解.最近,Kwak ^[17]将PCA-L₁推广到PCA-Lp,其中p是任意非负数,同时证明了当p=2和p=1时,PCA-Lp分别等价于经典PCA和文献[15]提出的PCA-L₁.

为同时达到鲁棒性和稀疏性,Meng等 ^[18] 在PCA-L₁的基础上提出具有稀疏性的L₁- 模PCA (RSPCA). 实验表明,该算法不仅保持了PCA-L₁的鲁棒性,而且具有稀疏性 ^[18]. 因此,本文拟提出稀疏的PCA-Lp (LpSPCA),将对任意p>0的LpSPCA进行研究;同时,通过添加额外L₁- 模正则项,LpSPCA不仅有较好的降维性能,并具有一定的稀疏性.特别地,当0<p≦1时,LpSPCA同时具有良好的鲁棒性和稀疏性.

LpSPCA可以通过一个简单的迭代算法实现,并且该算法在p≧1时收敛于局部最优解.此外,当p=1时,LpSPCA等价于文献[18]中所提的RSPCA.在具有离群点的人工数据及带噪声的人脸数据上的实验表明,LpSPCA在鲁棒性和稀疏性上与经典PCA相比有诸多优势,并可针对不同数据选择适当的p 以达到更好的效果.

本文结构如下:第1节给出本文所提LpSPCA模型,第2节提出LpSPCA求解算法并进行相应的理论分析. 第3节将LpSPCA应用到人工数据及人脸数据上进行实验.第4节进行总结.

1. 鲁棒的稀疏L_p-模主成分分析 LpSPCA

考虑如下原始数据矩阵: $X = [{x_1},{x_2}, \cdots ,{x_N}] \in {R^{d \times N}}$ ,其中d代表样本点维数,N代表样本点个数. 不失一般性,假设数据已中心化.

经典PCA试图寻找一个m<d维线性子空间使得样本点X在该空间中的方差尽可能大.该空间可以通过求解以下优化问题得到:

$\eqalign{ & \mathop {\max }\limits_W \sum\limits_{i = 1}^N {\left\| {{W^{\rm{T}}}{x_i}} \right\|} _2^2 \cr & {\rm{s}}.{\rm{t}}.\quad {W^{\rm{T}}}W = I \cr} $

(1)

其中, $\|\cdot\|_2 $ 为L₂- 模, $W = [{w_1},{w_2}, \cdots ,{w_m}] \in {R^{d \times m}},I \in {R^{m \times m}}$ 是单位阵.这里 ${{w}_j}$ 是数据X的第j主成分, $j=1,\cdots,m$ .优化问题(1)可以通过特征值问题进行求解.由约束条件 $W^{\rm T}W=I$ 知, $\{{{w}_j}\}_{j=1}^m $ 构成所求m 维线性子空间的标准正交基.

由于优化问题(1)对w不具有稀疏性,为了引入稀疏性,可考虑以下带稀疏约束的优化问题:

$\eqalign{ & \mathop {\max }\limits_W \mathop \sum \limits_{i = 1}^N \left\| {{W^{\rm{T}}}{x_i}} \right\|_2^2 \cr & {\rm{s}}.{\rm{t}}.\quad {W^{\rm{T}}}W = I,\left\| W \right\|0 \le k \cr} $

(2)

其中, $\| \cdot \| _0$ 为L₀_- 模,k是所求主成分稀疏度.显然,优化问题(2)是一个复杂的NP难组合问题,求解困难.为得到该问题的近似解,Jolliffe等 ^[22]将L₀_- 模问题(2)松弛为L₁- 模问题:

$\eqalign{ & \mathop {\max }\limits_W \mathop \sum \limits_{i = 1}^N \left\| {{W^{\rm{T}}}{x_i}} \right\|_2^2 \cr & {\rm{s}}.{\rm{t}}.\quad {W^{\rm{T}}}W = I,{\left\| W \right\|_1} \le k \cr} $

(3)

其中, $\| \cdot \| _1$ 为L₁- 模.优化问题(3)使得投射后的样本点在L₂- 模意义下方差最大,并使解具有L₁- 模意义下的稀疏度k. 但由于L₂- 模的应用使得样本方差由范数较大的样本点决定,因此文献[18]进一步考虑如下优化问题:

$\eqalign{ & \mathop {\max }\limits_W \mathop \sum \limits_{i = 1}^N {\left\| {{W^{\rm{T}}}{x_i}} \right\|_1} \cr & {\rm{s}}.{\rm{t}}.\quad {W^{\rm{T}}}W = I,{\left\| W \right\|_1} \le k \cr} $

(4)

优化问题(3)和(4)的区别在于式(4)使用L₁- 模定义投射空间样本方差,而式(3)则用L₂- 模定义.进一步,我们可以将以上问题推广为要求投射后的样本点在Lp- 模意义下方差最大,其中p>0是任意实数.通过选择适当的p,适应更广泛类型的数据.因此,本文提出稀疏Lp- 模PCA的原始优化问题如下:

$\eqalign{ & \mathop {\max }\limits_W {F_p}(W) = \cr & {1 \over p}\sum\limits_{i = 1}^N {\left\| {{W^{\rm{T}}}{x_i}} \right\|_p^p} = {1 \over p}\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^m | } w_j^{\rm{T}}{x_i}{|^p} \cr & {\rm{s}}.{\rm{t}}.\quad {W^{\rm{T}}}W = I,{\left\| W \right\|_1} \le k \cr} $

(5)

其中, $\| \cdot \|_p$ 为Lp- 模.我们称以上模型为LpSPCA.容易看到,当p=2时,式(5)是优化问题(3),而当p = 1时,式(5)等价于优化问题(4).此外,当0 < p ≦1时,LpSPCA可同时保持鲁棒性及稀疏性的优点.因此,可以通过选择不同的p,实现在保持稀疏性的同时满足不同的降维要求.

2. LpSPCA 算法

尽管优化问题(5)中的稀疏约束用凸的L₁- 模代替了非凸的L₀_- 模,LpSPCA仍然难以给出通用的优化方法.为此,我们首先考虑求解m=1的情况;对于m>1的情形,可通过引入贪婪算法求解.因此,首先考虑求解如下问题:

$\eqalign{ & \mathop {\max }\limits_w {F_p}(w) = {1 \over p}\sum\limits_{i = 1}^N | {w^{\rm{T}}}{x_i}{|^p} \cr & {\rm{s}}.{\rm{t}}.\quad {w^{\rm{T}}}w = 1,{\left\| w \right\|_1} \le k \cr} $

(6)

2.1 一个主成分的 LpSPCA 算法

通过引入拉格朗日函数对优化问题(6)进行求解.记优化问题(6)的拉格朗日函数如下:

$L(w) = {F_p}(w) - \lambda ({w^{\rm{T}}}w - 1) - \gamma ({\left\| w \right\|_1} - k)$

(7)

其中,λ>0.令

$\nabla w = \sum\limits_{i = 1}^N {{\rm{sgn}}} ({w^{\rm{T}}}{x_i})|{w^{\rm{T}}}{x_i}{|^{p - 1}}{x_i}$

(8)

为F_p (w)对w的导数,其中 ${\rm sgn}(\cdot)$ 为符号函数.则L(w) 对w 的导数为0时有

$\nabla w - 2\lambda w - \gamma {\rm{sgn}}(w) = 0$

(9)

从而, $w = {1 \over {2\lambda }}(\nabla w - \gamma {\rm{sgn}}(w))$ ,λ>0. 当λ< 0 时,令 $\triangledown_{ w} =0$ . 则此时w=0,问题(6)无解. 当λ> 0时,从式(9)可得w满足 ${\rm{sgn}}(w) = {\rm{sgn}}({\nabla _w}),|{\nabla _w}| \ge \gamma $.由此,

$w = {{{\rm{sgn}}(w)} \over {2\lambda }}{(|{\nabla _w}| - \gamma )_ + } = {1 \over {2\lambda }}\beta $

(10)

其中,

$\eqalign{ & \beta = {\rm{sgn}}(w){(|\nabla w| - \gamma )_ + } \cr & {(a)_ + } = \left\{ \matrix{ a,{\rm{ }}a > 0 \hfill \cr 0,{\rm{ }}a \le 0 \hfill \cr} \right. \cr} $

由于 ${ w}^{\rm T}{ w}=1$ ,因此可得 $\lambda =\| {\beta} \| _2 /2$ ,且 ${ w}^\ast={\beta} /\| {\beta} \| _2$ . 令λ是 $| \triangledown_{ w} | $ 中第k+1大的元素,则由式(10)所表示的w恰好有k个非零元素.从而我们可以得到当m=1时,LpSPCA 模型的求解算法如下:

算法 1. 一个主成分的LpSPCA算法(m=1)

输入. 数据矩阵 $X=[{ x}_1 ,{ x}_2 ,\cdots ,{ x}_N]\in R^{d\times N}$ ,稀疏度k.

输出. ${ w}^\ast $ .

步骤 1. 初始化 ${ w}(0)$ ,并令 $w(0) = w(0)/w(0){_2}$ ,迭代次数t=0.

步骤 2. 奇异性检查:若 $p\le 1$ ,且存在i,使得 ${ w}^{\rm T}(t){ x}_i$ = 0,则令 $w(t) \leftarrow (w(t) + \delta )/w(t) + \delta {_2}$ ,其中△是一个小的随机生成的向量.

步骤 3. 计算

$\nabla w(t) = \sum\limits_{i = 1}^N {{\rm{sgn}}} (w{(t)^{\rm{T}}}{x_i})|w{(t)^{\rm{T}}}{x_i}{|^{p - 1}}{x_i}$

令 ${ w}(t+1)={\beta} (t)/\| {\beta} (t)\| _2$ ,其中${\beta} (t)={\rm sgn}({ w}(t))$×$(| \triangledown_{{ w}(t)} | -\gamma )_+ $,λ是 $| \triangledown_{{ w}(t)} | $ 中第k+1大的元素.

步骤 4. 收敛检查:如果优化问题(6)的目标函数继续增长,转到步骤2; 否则,得到最优解 ${w^ * } = w(t)$ ,并停止迭代.

在给出求解多个主成分的算法前,首先讨论算法1当p≧1时的收敛性.

定理 1. 当p≧1时,优化问题(6)的目标函数值通过每次迭代单调不降.

证明 . 首先考虑p>1的情况.令 w(t)为w在第t次迭代中的值.则 ${ w}(t+1)={\beta} (t)/\| {\beta} (t)\| _2 $ ,其中 ${\beta} (t)={\rm sgn}({ w}(t))(| \triangledown_{{ w}(t)} | -\gamma )_+ $ .由于p>1,因此 $F_p ({ w})$ 是凸函数.由凸函数的性质可知:

${F_p}(w(t + 1)) - {F_p}(w(t)) \ge \nabla _{w(t)}^{\rm{T}}(w(t + 1) - w(t))$

(11)

注意到sgn(w(t+1))=sgn(▽w(t)),且w(t+1) 满足 $w(t + 1){_2} = 1,w(t + 1){_1} \le k$ ,而w(t)满足 $\| { w}(t)\| _2 =1$,$\| { w}(t)\| _1 \le k$ ,因此有 $\nabla _{w(t)}^{\rm{T}}(w(t + 1) - w(t)) \ge 0$ .结合式(11)可知, ${F_p}(w(t + 1)) - {F_p}(w(t)) \ge 0$ ,因此可得p>1时的结论.

当p=1时,由文献[18]中的定理1知,算法1收敛.

综上所述,当p≧1时,优化问题(6)的目标函数是单调不降的.

由于优化问题(6)的目标函数有上界,且由定理1知,随着每次迭代目标函数值非降,因此算法1当p≧1时是收敛的.需要注意的是,尽管当0< p<1时,优化问题(6)的目标函数是非凸的,但在实验中发现,目标函数值在迭代过程中也很快趋于稳定.

2.2 多个主成分的 LpSPCA 算法

由于当m>1时,优化问题(5)很难用一般优化方法进行求解.为此,采用贪婪算法进行求解.算法的基本思路是首先对原始数据应用算法1得到第一主成分w₁;然后将数据投影到与w₁正交的空间中得到新的数据集,并在投影后的数据集上继续应用算法1 得到第二主成分;依次类推,直到得到m个主成分.算法具体步骤如下:

算法 2. 多个主成分的LpSPCA算法 (m>1)

输入. 数据矩阵 $X=[{ x}_1 ,{ x}_2 ,\cdots ,{ x}_N]\in R^{d\times N}$ ,稀疏度k,主成分个数m>1.

输出. m个稀疏主成分 $\{{ w}_i \}_{i=1}^m $ .

步骤 1. 记 ${ w}_0 =0\in R^d$ 且 $X^0=\{{ x}_i^0 ={ x}_i \}_{i=1}^n $ .

步骤 2. 对$j=1,2,\cdots ,m$,进行以下循环:

1) 令 $X^j=\{{ x}_i^j ={ x}_i^{j-1} -{ w}_{j-1} ({ w}_{j-1}^{\rm T} { x}_i^{j-1} )\}_{i=1}^N $ ;

2) 应用算法1到数据集X^j上并得到稀疏度为k的主成份w_j.

算法2求得的各主成分不随m的变化而改变,并且第1主成分为原始式(6)的局部最优解,第2主成分为式(6)的局部次优解,依次类推.算法2是一个启发式算法,只能得到式(5)的近似解.主要包括两方面: 1)算法1本身只能得到式(6)的局部解; 2)由算法2产生的 $\{{ w}_i\}_{i=1}^m $ 的正交性不能在理论上给予保证.然而,由算法2中步骤2可知, $w_s^{\rm{T}}x_i^j = 0,i = 1,2, \cdots ,N,s = 1,2, \cdots ,j - 1$ ,因此投射后的样本集X^j属于 $\{{ w}_s \}_{s=1}^{j-1}$ 所张成的$(j-1)$维子空间,并且由X^j所得到的第j个主成分w_j也近似正交于 $\{{ w}_s \}_{s=1}^{j-1} $ .

需要注意的是,算法2实际上是对算法1在不同数据集上的循环执行.因此,算法1的解对算法2有直接影响.在算法1中,初始值是随机选取,而算法1所得的局部解是依赖于该初始值的.因此,好的初始值比较重要.在实际运行中,除了随机赋初始值外,还可以采用经典PCA 的解作为算法1的初始值;或者选择不同的初始值多次运行算法1,并在这些初始值中选择使得目标函数最大的初始值;还可以选择初始值使得其与范数最大的样本同向.为减少运算复杂度,同时为了测试算法的稳定性,本文采取随机赋值的方法.

3. 实验结果与分析

为验证本文算法的鲁棒性和稀疏性,通过两个人工数据集和两组带离群点和噪声点的Yale人脸数据集,以重构误差(Reconstruction error)为指标,分别对LpSPCA算法与经典PCA ^[1]、PCA-Lp ^[17]及RSPCA ^[18]算法进行性能分析. 为方便起见,以下称PCA-Lp为LpPCA.所有实验均以Matlab 2014b为软件环境,以Intel i5 (2.3 GHz)处理器,8 GB内存的计算机为硬件平台.在实验中,使用Matlab中eig函数求解经典PCA的特征值问题,使用算法2求解LpSPCA.

3.1 人工数据集

3.1.1 LpSPCA 鲁棒性分析

通过设计一个三维带离群点的人工数据集,验证不同p值对LpSPCA算法抗离群点性能的影响.人工数据集构造如下: 1)选取31个数据点 $\{ ({x_i},{y_i},{z_i})\} _{i = 1}^{31}$ 构成空间中平行于x轴的近似直线,其中 ${x_i} \in [ - 3,3]$ ,且y_i和z_i分别随机取自[0,0.1]和[-1,-0.9]上的均匀分布. 2)在该数据中引入4个离群点,分别为 $(4+\alpha_i ,2+{\beta} _i ,4+\gamma _i )$ 和 $({\alpha _i}, - 3 + {\beta _i},4 + {\gamma _i})$ ,其中 ${\alpha _i},{\beta _i},{\gamma _i}$ 随机取自[0,0.1]上的均匀分布,i=1,2,如图 1 (a)所示.

图 1 PCA和LpSPCA在人工数据集上所得到的第1个主成分及将数据用LpSPCA、PCA、RSPCA、LpPCA投影到该主成分所张成空间上的重构误差

Fig. 1 The -rst principal components of the arti-cial data set obtained by classical PCA and LpSPCA, and reconstruction errors in the spaces spanned by the -rst principal components obtained by LpSPCA, PCA, RSPCA and LpPCA, respectively

下载: 全尺寸图片幻灯片

由上述人工数据集的结构可知,该数据由1个平行于x的主方向和远离该主方向的4个离群点构成.因而,该人工数据本质上是1维向量嵌入在3 维空间中的数据.因此,在本组实验中,将检验LpSPCA和PCA、RSPCA、LpPCA将数据降到1维子空间后的重构性能.另外,设置LpSPCA 和RSPCA的稀疏度为k=2.

对于LpSPCA,由于该人工数据在三维空间中,因此稀疏度k可以取为1或2.然而,若取k=1时,则主成分将有两个分量为0.此时,根据该数据点的构造,可以得到的主成分将平行于x轴方向,因而意义不大.因此,选取稀疏度k=2.

图 1 (a)给出了LpSPCA和经典PCA的第1主成分(PC)投影方向(为使图像更清晰,没有画出LpPCA所提取的PC方向).结果表明:当p=0.5时,LpSPCA所得到的第一PC方向与数据的真实方向最为接近,并且随着p的增长,LpSPCA的PC方向受离群点影响越来越大.特别地,当p=2时,LpSPCA与经典PCA所得PC方向基本一致.

为进一步验证各算法性能,与文献[15]类似,引入重构误差指标,定义如下:

${e_i} = {\left\| {{\zeta _i} - {w_1}w_1^{\rm{T}}{\zeta _i}} \right\|_2}$

其中, ${\zeta} _i =\{(x_i ,y_i ,z_i )\}$ 为第i个样本点,w₁是相应方法所得的第一PC.图 1 (b)描绘了各算法将原3维空间数据降到1维后每个样本点的重构误差.从图 1(b) 可以看出,当p=0.5时,LpSPCA在该数据上的重构误差最小,并且随着p增大,LpSPCA的重构误差依次增大; LpPCA也呈现同样的特点.然而,当取相同p时,可以看到LpSPCA的重构误差比LpPCA 略低,说明在此数据集上,主成分本身具有一定稀疏性,因此LpSPCA效果更好.同时,RSPCA的重构误差与p=1时的LpSPCA、LpPCA基本持平.此外,p=2时,LpSPCA、LpPCA与经典PCA在样本点上的重构误差相近.实验结果表明,LpSPCA可以通过调节p达到相当的鲁棒性.

3.1.2 LpSPCA 稀疏性分析

通过设计一个8维的人工数据集验证LpSPCA算法的稀疏性.该人工数据集的构造基于文献[7]中的人工数据.

在构造人工数据集前,定义三个潜在因子:

$\eqalign{ & {V_1} \sim {\rm{N}}(0,20) \cr & {V_2} \sim {\rm{N}}(0,30) \cr & {V_3} = - 0.2V + 0.8{V_2} + \varepsilon \cr} $

其中, $\varepsilon \sim {\rm N}(0,1)$ ,且V₁、V₂和ε互相独立.记x_i为数据集的第i个特征, $i=1,2,{\cdots},8$ . 则定义 ${x_1},{x_2},{x_3} = {V_1},{x_4},{x_5},{x_6} = {V_2},{x_7},{x_8} = {V_3}$ .三个潜在因子的方差分别为20、30和20,因此V₂最重要,V₁和V₃基本同等重要.这样,得到的第1主成分应只用 $({x_4},{x_5},{x_6})$ 就可恢复V₃,而第2和第3主成分可只用 $({x_1},{x_2},{x_3})$ 或 $({x_7},{x_8})$ 恢复,即所构造数据本身具有稀疏性.将各算法应用于此数据,所得结果列于表 1 ~ 3中.

表 1 PCA和RSPCA在人工数据集2上提取的前两个主成分

Table 1 The first two PCs extracted by PCA and RSPCA on artificial data set 2

PCA		RSPCA
PC1	PC2	PC1	PC2
0.0608	-0.1238	0	0.0998
-0.0527	0.0422	0	0.4954
0.0389	0.1514	0	0.4048
-0.1343	-0.1754	-0.3608	0
0.167	-0.1062	0.3679	0
0.2074	0.1841	0	0
0.2135	0.0237	0	0
-0.1254	0.1933	0.2713	0

下载: 导出CSV

| 显示表格

表 2 LpPCA 在人工数据集2 上所提取的前两个主成分

Table 2 The first two PCs extracted by LpPCA on artificial data set 2

LpPCA (L_0.5)		LpPCA (L₁)		LpPCA (L_1.5)		LpPCA (L₂)
PC1	PC2	PC1	PC2	PC1	PC2	PC1	PC2
0.161	0.1896	-0.1924	-0.1657	0.0588	-0.1483	-0.1807	-0.1945
-0.1433	0.0855	0.1783	0.0865	-0.1833	-0.036	0.0399	0.1858
-0.1472	-0.1807	0.1511	-0.0542	-0.1771	0.0428	0.1957	-0.1054
0.0773	0.0125	-0.1056	0.131	-0.035	0.1067	0.2457	-0.0457
-0.0942	0.0566	0.1713	0.1395	-0.2173	-0.1576	-0.0184	0.0696
0.1948	-0.1646	0.05	-0.1428	-0.238	0.2375	0.1488	-0.1129
0.0831	0.1925	-0.1428	0.1499	0.2135	0.0899	0.0831	0.1925
-0.0991	0.1179	0.0085	-0.1306	-0.1254	0.1812	-0.0991	0.1179

下载: 导出CSV

| 显示表格

表 3 LpSPCA 在人工数据集2 上所提取的前两个主成分

Table 3 The first two PCs extracted by LpSPCA on artificial data set 2

LpPCA (L_0.5)		LpPCA (L₁)		LpPCA (L_1.5)		LpPCA (L₂)
PC1	PC2	PC1	PC2	PC1	PC2	PC1	PC2
0	0.2978	0	-0.4474	0	0.1285	0	0.1126
0	-0.674	0	-0.1696	0	0.4496	-0.0625	0
0	0.0282	0	-0.383	0	0.4220	0	0.4801
0.2726	0	0.2567	0	0.5954	0	0	0.4073
-0.4027	0	0.3741	0	-0.2469	0	-0.5845	0
0.3247	0	0.3693	0	0	0	-0.353	0
0	0	0	0	0	0	0	0
0	0	0	0	0.2713	0	0	0

下载: 导出CSV

| 显示表格

从表 1 ~ 3可以看出,经典PCA和LpPCA (p = 0.5,1,1.5,2)均不具有稀疏性,而RSPCA和LpSPCA (p=0.5,1,1.5,2)有较好的稀疏性.同时p越小,LpSPCA所提取的稀疏主成分越接近于真实情况.特别地,当p=0.5,1和1.5时,LpSPCA所得结果优于RSPCA.

3.2 Yale 人脸数据集

特征脸提取是人脸识别的一个重要环节,近年来得到广泛研究与发展.然而,传统的特征脸提取方法大多基于无噪声污染的人脸图像数据 ^[23-26].但是,现实中人脸图像大多包含离群点或噪声,例如脸部被遮掩、弱光线下的图像等,这极大影响了传统基于L₂- 模降维方法的性能.因此,本实验将LpSPCA算法应用到带离群点和噪声的Yale人脸数据上,并将其和经典PCA、RSPCA及LpPCA比较,以验证其特征提取能力及鲁棒性.

Yale人脸数据集包含15类共165张灰色人脸数据图片,每类包含11张图片,并且每张图片都具有不同的布局及面部表情. Yale人脸数据图片的原始大小为320像素×243像素,本文采用裁剪后大小为64像素×64像素的归一化图片. 为测试LpSPCA的鲁棒性,本文采取文献[18]中的做法,对原始图片进行两种加离群点及噪声点处理: 1) 遮盖噪声(Occluded),首先在每类的11个图像中随机抽取两张图像,然后在抽取的图像上随机选择大小为40×30 的长方形区域,并用黑白噪声对其覆盖; 2)哑噪声(Dummy),在整个人脸数据集中额外加入与原人脸图像大小相同的50张黑白点噪声图片.

本文将分别在上述两类Yale人脸数据集上,以重构特征脸和平均重构误差(Average reconstruction error,ARCE)为指标,验证和分析LpSPCA的鲁棒性.类似文献[15],这里将使用前m个PC对图像进行重构,其ARCE定义如下:

$e(m) = {1 \over n}\sum\limits_{i = 1}^n {\xi _i^o - \sum\limits_{j = 1}^m {{w_j}} w_j^{\rm{T}}{\xi _i}{_2}} $

其中,n为图像样本点个数, ${\xi} _i^o $ 代表第i张原始人脸图片, ${\xi} _i$ 代表噪声化人脸数据集中相应的图片.

3.2.1 稀疏度 k 对算法性能的影响

在验证LpSPCA算法的鲁棒性之前,首先分析稀疏度k对ARCE的影响.每个人脸在实际计算中都相当于4 096 (64×64)维向量. 对每个不同的p,选取稀疏度k为维度的一定百分比: 95 %,90 %,85 %,80 %,75 %. 例如,当取百分比为95 %时,则此时稀疏度k 为4 096×95 %.

图 2 (a)和图 2 (b)分别给出了在两种噪声人脸数据集上,具有不同稀疏度的LpSPCA的平均重构误差.从图 2可以看出,无论是哪种数据,随着k 值的增加,LpSPCA的重构误差整体趋势逐渐增加,然而,当稀疏度选为维数的90% 时,其重构误差最小.因此,在后续鲁棒性实验中,始终设定算法稀疏度为维度的90%.

图 2 稀疏度k对LpSPCA平均重构误差在带遮盖噪声和哑噪声的Yale 人脸数据上的影响

Fig. 2 The influence of parsity k to the ARCE of LpSPCA on the occluded or dummy Yale face database

下载: 全尺寸图片幻灯片

3.2.2 LpSPCA 与其他算法性能对比

对于遮盖噪声型数据,首先使用各算法将64×64维的图像高维空间降维到由前30个PC张成的子空间,然后再用该子空间对遮盖噪声图像进行重构. 图 3 (a)给出了各算法的重构效果.从图 3 (a)可以看出,当p=0.5时,LpSPCA重构效果最好,这是由于L_0.5- 模极大程度抑制了噪声的影响; 随着p的增大,LpSPCA受噪声的影响增大;当p=2时,其性能与经典的L₂-PCA相近.上述结果表明,传统基于L₂- 模的降维算法,其重构性能易受噪声点影响.

图 3 带遮盖噪声的Yale人脸数据及LpSPCA、PCA、RSPCA和LpPCA在该数据上用前30个相应主成分的重构效果图及将数据用各方法投影到该1 ~ 70个主成分上的重构误差

Fig. 3 Occluded Yale face database and face reconstruction pictures of the data set constructed by the first thirty principal components obtained by LpSPCA,PCA,RSPCA and LpPCA and reconstruction errors in the spaces spanned by 1 ~ 70 principal components obtained by PCA,RSPCA,LpPCA and LpSPCA,respectively

下载: 全尺寸图片幻灯片

图 3 (b)给出了各算法提取的PC个数(即重构子空间维数)对ARCE的影响.结果表明:对于所有算法,随着PC个数的增大,ARCE逐级减少,说明重构子空间维数对重构效果存在较大影响.随PC个数增加,当p=0.5时,LpPCA和LpSPCA的ARCE 快速下降,且当特征个数大于35时,LpSPCA的ARCE略低于LpPCA. p=1时,LpPCA和LpSPCA的ARCE小于RSPCA,且当所提取特征个数小于50 时,LpSPCA的重构误差更小.随着p的增大(p=1.5,2),LpPCA和LpSPCA的性能开始变差,其ARCE高于RSPCA. 然而,LpPCA、 LpSPCA (p= 0.5,1,1.5,2)和RSPCA的性能都比经典PCA要好.从图中可以看出,当提取PC个数在12 ~ 30之间时,随着提取特征数的增加,经典PCA、RSPCA及p=1.5,2时,LpPCA和LpSPCA的重构误差也有所增加.表明对于经典PCA、RSPCA及p=1.5,2时的LpPCA和LpSPCA,所加遮盖噪声对第12 ~ 30个PC的提取有很大影响.相反,当p=0.5,1时,LpPCA和LpSPCA随提取特征数据的增长,ARCE下降较快,且没有接近常数的值.以上结果表明,当0<p< 1时,LpSPCA具有良好的鲁棒性.

对于哑噪声型数据,可以得到类似结论. 1)图 4 (a)描述了经典PCA、RSPCA 及p =0.5,1,1.5,2时LpPCA和LpSPCA在该数据集上的重构效果.从图 4 (a)可以看出,经典PCA及p=1.5,2时的LpPCA和LpSPCA对原始图片重构效果最差,以至于对半数以上人脸重构失真,并且p=1.5时的结果比p=2时更差.相对而言,RSPCA及对应p=0.5,1 的LpPCA和LpSPCA则成功提取人脸特征,并再现了原始人脸图片. 2)图 4 (b)给出的相应平均重构误差,进一步印证了以上结论.具体地,当提取特征数为5 ~ 55时,对于经典PCA、 p=1.5,2时的LpPCA 和p=2 时的LpSPCA,它们的重构误差接近于常数,表明所加虚拟噪声图像对第5 ~ 55个PC的提取有很大的影响.相反,当p=0.5,1时,LpSPCA和LpPCA的ARCE则下降较快,并且两者ARCE值基本相同.说明与LpPCA相比,LpSPCA并没有损失精度,却具有良好的稀疏性.

图 4 原始Yale人脸数据及LpSPCA、PCA、RSPCA和LpPCA 在带哑噪声的Yale数据上用前30个相应主成分的\\重构效果图及将数据用各方法投影到该1 ~ 70个主成分上的重构误差

Fig. 4 Original Yale face database and face reconstruction pictures of its dummy data set constructed by the first thirty principal components obtained by LpSPCA,PCA,RSPCA and LpPCA and reconstruction errors in the spaces spanned by 1 ~ 70 principal components obtained by PCA,RSPCA,LpPCA and LpSPCA,respectively

下载: 全尺寸图片幻灯片

以上在Yale带离群点和噪声人脸数据上的实验结果表明,相比于经典PCA和LpPCA,本文所提LpSPCA在不损失精度的基础上具有较好的稀疏性; 相比于经典PCA和RSPCA,LpSPCA可通过选择p达到不同的处理离群点及噪声效果,具有鲁棒性.

4. 结论

本文提出一种新的鲁棒稀疏PCA模型及算法LpSPCA. LpSPCA对LpPCA赋予了稀疏性,使得算法在具有鲁棒性的同时具有较强的可解释性. LpSPCA可由一个简单的算法进行求解,并理论上验证了该算法p≧1时的收敛性. LpSPCA在人工数据及人脸数据上的结果表明了该算法的优势.然而,本文所提LpSPCA算法只能求得局部近似解而不保证精确解.因此,设计针对LpSPCA更有效的算法是值得进一步研究的.

图 1 AlphaGo的分析1

Fig. 1 Analysis 1 of AlphaGo

下载: 全尺寸图片幻灯片

图 2 AlphaGo的分析2

Fig. 2 Analysis 2 of AlphaGo

下载: 全尺寸图片幻灯片

表 1 阿法狗在快速走子中使用的盘面特征

Table 1 Input features for rollout and tree policy

Feature	# of patterns	Description
Response	1	Whether move matches one or more response pattern features
Save atari	1	Move saves stone(s) from capture
Neighbour	8	Move is 8-connected to previous move
Nakade	8 192	Move matches a nakade pattern at captured stone
Response pattern	32 207	Move matches 12-point diamond pattern near previous move
Non-response pattern	69 338	Move matches 3 £ 3 pattern around move
Self-atari	1	Move allows stones to be captured
Last move distance	34	Manhattan distance to previous two moves
Non-response pattern	32 207	Move matches 12-point diamond pattern centred around move
(Features used by the rollout pollcy (the frst set) and tree policy (the frst and second sets). Patterns are based on stone colour (black/white/empty) and liberties (1, 2,≥3) at each intersection of the pattern.)

下载: 导出CSV

表 2 不同版本阿法狗的等级分比较(等级分由一场内部锦标赛决出)

Table 2 Results of a tournament between di®erent variants of AlphaGo

Short name	Policy network	Value network	Rollouts	Mixing constant	Policy GPUs	Value GPUs	Elo rating
α_rvp	p_σ	v_θ	p_π	λ= 0.5	2	6	2 890
α_vp	p_σ	v_θ	-	λ= 0	2	6	2 177
α_rp	p_σ	-	p_π	λ= 1	8	0	2 416
α_rv	[p_τ]	v_θ	p_π	λ= 0.5	0	8	2 077
α_v	[p_τ]	v_θ	-	λ= 0	0	8	1 655
α_r	[p_τ]	-	p_π	λ= 1	0	0	1 457
α_p	p_σ	-	-	-	0	0	1 517
Evaluating positions using rollouts only (α_rp; α_r), value nets only (α_vp; α_v), or mixing both (α_rvp; α_rv); either using the policy network ρ_σ(α_rvp; α_vp; α_rp) or no policy network (α_rvp; α_vp; α_rp), that is, instead using the placeholder probabilities from the tree policy p_τ throughout. Each program used 5 s per move on a single machine with 48 CPUs and 8 GPUs. Elo ratings were computed by BayesElo.

下载: 导出CSV

参考文献(2)

[1]	Silver D, Huang A, Maddison C J, Guez A, Sifre L, van den Driessche G, Schrittwieser J, Antonoglou I, Panneershelvam V, Lanctot M, Dieleman S, Grewe D, Nham J, Kalchbrenner N, Sutskever I, Lillicrap T, Leach M, Kavukcuoglu K, Graepel T, Hassabis D. Mastering the game of go with deep neural networks and tree search. Nature, 2016, 529(7587): 484-489
[2]	Tian Y D, Zhu Y. Better computer go player with neural network and long-term prediction. In: International Conference on Learning Representation (ICLR). San Juan, Puerto Rico, 2016.

施引文献

资源附件(0)

访问统计

图(2) / 表(2)

计量

文章访问数: 4352
HTML全文浏览量: 908
PDF下载量: 4904
被引次数: 0

1. 鲁棒的稀疏Lp-模主成分分析 LpSPCA
2. LpSPCA 算法
2.1 一个主成分的 LpSPCA 算法
2.2 多个主成分的 LpSPCA 算法
3. 实验结果与分析
3.1 人工数据集
3.2 Yale 人脸数据集
4. 结论

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

阿法狗围棋系统的简要分析

doi: 10.16383/j.aas.2016.y000001

计量

A Simple Analysis of AlphaGo

1. 鲁棒的稀疏L_p-模主成分分析 LpSPCA

2. LpSPCA 算法

2.1 一个主成分的 LpSPCA 算法

2.2 多个主成分的 LpSPCA 算法

3. 实验结果与分析

3.1 人工数据集

3.1.1 LpSPCA 鲁棒性分析

3.1.2 LpSPCA 稀疏性分析

3.2 Yale 人脸数据集

3.2.1 稀疏度 k 对算法性能的影响

3.2.2 LpSPCA 与其他算法性能对比

4. 结论

计量

目录

1. 鲁棒的稀疏L_p-模主成分分析 LpSPCA

2. LpSPCA 算法

2.1 一个主成分的 LpSPCA 算法

2.2 多个主成分的 LpSPCA 算法

3. 实验结果与分析

3.1 人工数据集

3.2 Yale 人脸数据集

4. 结论

留言板

阿法狗围棋系统的简要分析

doi: 10.16383/j.aas.2016.y000001

计量

出版历程

A Simple Analysis of AlphaGo

1. 鲁棒的稀疏Lp-模主成分分析 LpSPCA

2. LpSPCA 算法

2.1 一个主成分的 LpSPCA 算法

2.2 多个主成分的 LpSPCA 算法

3. 实验结果与分析

3.1 人工数据集

3.1.1 LpSPCA 鲁棒性分析

3.1.2 LpSPCA 稀疏性分析

3.2 Yale 人脸数据集

3.2.1 稀疏度 k 对算法性能的影响

3.2.2 LpSPCA 与其他算法性能对比

4. 结论

计量

出版历程

目录

1. 鲁棒的稀疏Lp-模主成分分析 LpSPCA

2. LpSPCA 算法

2.1 一个主成分的 LpSPCA 算法

2.2 多个主成分的 LpSPCA 算法

3. 实验结果与分析

3.1 人工数据集

3.2 Yale 人脸数据集

4. 结论

1. 鲁棒的稀疏L_p-模主成分分析 LpSPCA

1. 鲁棒的稀疏L_p-模主成分分析 LpSPCA