2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于凸近似的避障原理及无人驾驶车辆路径规划模型预测算法

韩月起 张凯 宾洋 秦闯 徐云霄 李小川 和林 葛建勇 王天培 刘宏伟

陈旭, 万九卿. 基于结构化预测的细胞跟踪方法. 自动化学报, 2017, 43(3): 376-389. doi: 10.16383/j.aas.2017.c160039
引用本文: 韩月起, 张凯, 宾洋, 秦闯, 徐云霄, 李小川, 和林, 葛建勇, 王天培, 刘宏伟. 基于凸近似的避障原理及无人驾驶车辆路径规划模型预测算法. 自动化学报, 2020, 46(1): 153-167. doi: 10.16383/j.aas.2018.c170287
CHEN Xu, WAN Jiu-Qing. Cell Tracking Using Structured Prediction. ACTA AUTOMATICA SINICA, 2017, 43(3): 376-389. doi: 10.16383/j.aas.2017.c160039
Citation: HAN Yue-Qi, ZHANG Kai, BIN Yang, QIN Chuang, XU Yun-Xiao, LI Xiao-Chuan, HE Lin, GE Jian-Yong, WANG Tian-Pei, LIU Hong-wei. Convex Approximation Based Avoidance Theory and Path Planning MPC for Driver-less Vehicles. ACTA AUTOMATICA SINICA, 2020, 46(1): 153-167. doi: 10.16383/j.aas.2018.c170287

基于凸近似的避障原理及无人驾驶车辆路径规划模型预测算法

doi: 10.16383/j.aas.2018.c170287
基金项目: 

国家自然科学基金 51007003

重庆市科学技术委员会重点专项资助项目 cstc2017jcyjBX0029

详细信息
    作者简介:

    韩月起  长城汽车股份有限公司技术中心智能驾驶系统开发部工程师. 2014年获得山东理工大学学士学位.主要研究为自动驾驶路径规划控制算法设计开发. E-mail: cyaqdlxkz@gwm.cn

    张凯  长城汽车股份有限公司技术中心智能驾驶系统开发部副总工程师. 2003年获得沈阳理工大学学士学位.主要研究方向为自动驾驶系统设计开发. E-mail: zhangkai@gwm.cn

    秦闯  长城汽车股份有限公司技术中心智能驾驶系统开发部工程师. 2015年获得华北水利水电大学学士学位.主要研究方向为自动驾驶路径规划算法开发. E-mail: cyaqdlxkz@gwm.cn

    徐云霄  曾是长城汽车股份有限公司技术中心智能驾驶系统开发部工程师. 2014年获得燕山大学硕士学位.主要研究方向为自动驾驶路径规划算法开发. E-mail: xuyunxiao@chehejia.com

    李小川  长城汽车股份有限公司技术中心智能驾驶系统开发部工程师. 2015年获得河北工业大学城市学院学士学位.主要研究方向为自动驾驶运动规划与多传感器数据融合. E-mail: xchuan.l@foxmail.com

    和林  长城汽车股份有限公司技术中心智能驾驶系统开发部主任工程师. 2006年获得吉林大学车辆工程硕士学位.曾于2006至2014年主导博世第九代ESP系统开发工作.主要研究方向为车辆底盘动态控制, 运动规划控制, 自动驾驶系统多传感器融合, 智能决策. E-mail: helin@gwm.cn

    葛建勇  长城汽车股份有限公司技术中心智能驾驶系统开发部主管工程师. 2012年获得山东理工大学车辆工程学士学位.主要研究方向为底盘动力学控制及自动驾驶系统开发. E-mail: gejianyong@gwm.cn

    王天培  长城汽车股份有限公司技术中心智能驾驶系统开发部主管工程师. 2012年获得北京理工大学硕士学位.主要研究方向为自动驾驶及其关键技术, 数据融合, 决策控制. E-mail: wangtianpei@gwm.cn

    刘宏伟  长城汽车股份有限公司技术中心智能驾驶系统开发部工程师. 2013年获得燕山大学硕士学位.主要研究方向为自动驾驶系统嵌入式开发. E-mail: liuhongwei@gwm.cn

    通讯作者:

    宾洋  工学博士, IEEE会员, 教授.主要研究方向为无人驾驶车辆路径规划/多传感器数据融合技术、燃料电池优化控制, 分布式混合动力电驱动系统, 电流/电压可控双向DC/DC变换器等.本文通信作者E-mail: edward.biny@hotmail.com

Convex Approximation Based Avoidance Theory and Path Planning MPC for Driver-less Vehicles

Funds: 

National Natural Science Foundation of China 51007003

Key Funding Projects of the Chongqing Science and Technology Commission cstc2017jcyjBX0029

More Information
    Author Bio:

    HAN Yue-Qi  Engineer in the Department of Intelligent Driving System Design, Research and Development Center of GWM Company. He received his bachelor degree from Shandong University of Technology in 2014. His research interest covers the research and development of self-driving path planning control algorithm

    ZHANG Kai  Deputy Chief Engineer in the Department of Intelligent Driving System Design, Research and Development Center of GWM Company. He received his bachelor degree from Shenyang Ligong University in 2003. His research interest covers the research and development of self-driving system

    QIN Chuang  Engineer in the Department of Intelligent Driving System Design, Research and Development Center of GWM Company. He received his bachelor degree from North China University of Water Resources and Electric Power in 2015. His research interest covers the research and development of self-driving path planning algorithm

    XU Yun-Xiao  Engineer, who previously worked in the Department of Intelligent Driving System Design, Research and Development Center of GWM Company. He received his master degree from Yanshan University in 2014. His research interest covers the research and development of self-driving path planning algorithm

    LI Xiao-Chuan  Engineer in the Department of Intelligent Driving System Design, Research and Development Center of GWM Company. He received his bachelor degree from Hebei University of Technology City College in 2015. His research interest covers self-driving motion planning and multi-sensor data fusion

    HE Lin  Stafi engineer in the Department of Intelligent Driving System Design, Research and Development Center of GWM Company. He received his master degree from Jilin University in 2006. He was ever leading the Gen 9 ESP development from 2006 to 2014 when working at Bosch. His interest covers vehicle dynamic control, motion control, multi-sensor data fusion, intelligent decision of self-driving car

    GE Jian-Yong  Supervisor engineer in the Department of Intelligent Driving System Design, Research and Development Center of GWM Company. He received his bachelor degree from Shandong University of Technology in 2012. His research interest covers the research and development of chassis dynamic control and self-driving system

    WANG Tian-Pei  Supervisor engineer at the Dept of Intelligent Driving System Design, Research and Development Center of GWM Company. He received his master degree from Beijing University of Technology in 2012. His research interest covers self-driving and its key technologies, data fusion, decision-making control

    LIU Hong-Wei  Engineer in the Department of Intelligent Driving System Design, Research and Development Center of GWM Company. He received his master degree from Yanshan University in 2013. His research interest covers the embedded research and development of self-driving system

    Corresponding author: BIN Yang  Ph. D., IEEE member, Professor. His research interest covers the path planning / multisensor data fusion technology of driverless vehicle, optimization control of fuel cell systems, distributed hybrid electric power propelsion system, current/voltage adjustable bi-directional DC/DC converter etc. Corresponding author of this paper
  • 摘要: 提出了一种改进的无人驾驶车辆路径规划方法, 并搭建了相应的软件在环实时仿真系统, 对方法在结构化道路下的复杂动态交通工况进行性能验证.首先, 引入基于凸近似的避障原理, 对障碍物参考点的选取进行优化, 扩大了路径规划的可行域范围.采用改进后的方法, 并结合模型预测控制(Model predictive control, MPC)原理和曲线坐标系统, 综合考虑自车及障碍车的外形、道路几何约束及自车的机械结构约束、路径最短、侧向加速度、道路对中、逐次变道、车距安全度、左变道优先和前轮转角变化率等权重的影响, 实现了车辆在复杂动态交通工况下的路径规划.最后, 以长城H7运动多用途车作为无人驾驶实验及仿真平台, 搭建基于dSPACE多核架构的Carsim + Simulink软件在环实时仿真系统, 对算法进行验证.结果表明, 所提出的方法不仅可获得合理、平滑的行驶路径, 顺利避开运动障碍车的干扰, 而且具有良好的实时性.
    Recommended by Associate Editor LI Li
  • 在计算机视觉和模式识别领域, 输入数据的维数过高会增加计算的复杂度, 使得对数据的处理变得困难.为了降低数据的维数, 通常采用矩阵分解的方法.矩阵分解的方法将数据矩阵分解成多个矩阵的形式, 其中一个矩阵可以很好地逼近原始矩阵, 在保留原始信息的条件下, 同时可以从高维到低维的映射, 学习更好的特征描述方法.这样这种矩阵分解的方法有多种, 如SVD (Singular value decomposition)、QR分解、NMF (Nonnegative matrix factorization)等.

    NMF可以将原始数据分解为基矩阵和系数矩阵的乘积.基矩阵的作用类似人脸的各个不同局部块的描述, 系数矩阵为原始数据在这些基向量的线性组合的权重.对于给定的数据矩阵$X$, 在学习到对应的基矩阵$U$之后, 对应的系数矩阵$V$便可以描述原始矩阵.最近的研究表明, NMF在人脑识别等领域已经超过基于SVD的方法[1-3].

    虽然单视图的NMF提高了原始数据的有效性, 但是图像可以从不同的视图进行描述.这些视图可以是不同的数据集, 也可以是侧重于不同角度的特征提取方法, 所以, 这些视图具有多种特征:有的是视觉底层特征、有的是视觉美学特征, 甚至有中层语义特征.这些特征往往可以互补地描述图像[4], 因此, 多视图学习相比较于单视图的方法能更有效地利用视图之间的互补信息.而在实例检索[5]任务上, Multi的思想[6]也被用于获得更加精确的检索效果.目前, 利用多视图来进行聚类分析的方法主要有两种:多视图谱聚类和多视图K均值聚类.其中, 多视图谱聚类有文献[7-11]等.虽然这些方法性能的相比单视图的谱聚类有所提高, 但是多视图谱聚类需要为每一个视图都计算亲和矩阵, 视图越多, 计算的复杂度也更大.相比之下, 多视图K均值聚类不需要计算亲和矩阵, 只需要利用原始特征即可.多视图K均值聚类又分为基于指示矩阵的方法和基于NMF矩阵分解的方法.基于指示矩阵的方法有RMKMC[12]和DEKM (Discriminatively emmbedded K-means)[13]等, 这种方法是从样本角度来形成聚类质心, 且这种方法的准确率依赖于指示矩阵的初始值.而基于NMF矩阵分解的方法是从维数的角度来进行降维, 从而形成聚类质心.具体地, 关于矩阵分解多视图学习方面的研究有很多:在文献[14]中, Kumar等利用全局和局部2种视图的特征, 提高了单视图NMF在人脸识别问题上的准确率; 文献[15]利用稀疏编码框架来对多视图特征学习进行研究; 文献[16]中, Akata等提出Collective-NMF算法令多种特征数据共享相同的系数矩阵, 这等同于先串联各种特征然后进行NMF分解.然而Liu等认为这种共享系数矩阵具有太强的约束, 提出一种弱化的约束, 旨在保证每种特征的一致性, 即视角间的一致性保持[17].

    但是, 以上这些方法没有考虑相同样本在不同视角中的空间结构关系, 这种局部空间结构在半监督学习、流形学习等多个领域的方法中具有重要的意义.典型的计算空间局部结构约束的方法有Locality preserving projection (LPP)[18]和Spectral Regression[19]等. Cai等在文献[19]的算法中, 通过引入局部结构约束达到了大幅度提高实验准确率的效果.

    因此, 本文提出了一种基于局部结构约束的多视图特征学习方法, 称之为MultiGNMF.这种方法的主要目标是相似的数据在每个视图都有相近的相似性.因此, 我们通过构建亲和矩阵来将每个视图的空间结构加入到目标函数中, 并提出迭代规则来解决这个优化问题.然而, MultiGNMF等多视图学习方法要求特征矩阵的值是非负的, 而实际中并不能总是保证这一限制条件.为了消除这一限制条件, 本文又提出了一种基于多视图学习的MultiGSemiNMF算法.

    文章主要结构分为4个部分:在第1节, 简要回顾一下基于矩阵分解的特征学习方法, 并将局部结构约束引入多视图学习框架中, 提出基于局部结构约束的多视图NMF分解算法—MultiGNMF; 在第2节, 针对MultiGNMF等多视图学习方法只适用于非负矩阵的缺点, 提出MultiGSemiNMF算法, 并对其进行详细介绍; 第3节对所提的算法进行实验验证和分析; 最后, 第4节对本文的工作进行总结.

    在这一节, 我们首先介绍基于NMF分解的单视图特征学习方法.然后, 考虑到多视图特征比单视图特征能更好地描述图像, 且分解后的系数矩阵应与原始特征据的空间结构相似, 我们提出了基于局部结构约束的多视图特征学习方法—MultiGNMF.下面将分别介绍NMF和MultiGNMF这两种特征学习算法.

    下面介绍NMF的求解过程.

    定义${X=[X_{\mathit{\boldsymbol{.}}, 1}, \cdots, X_{\mathit{\boldsymbol{.}}, N}] \in\, {\bf R}^{M\times N}}$为输入数据矩阵, 每一列都描述的是一个数据, ${U\in\, {\bf R}^{M\times K}}$为基矩阵, ${V\in\, {\bf R}^{N\times K}}$为系数矩阵, 即新的描述子, 两者的乘积是对原始矩阵的逼近, 如式(1)所示, 其中$K$是一个变量, 它决定了特征最终学习的特征维数.

    $ \begin{equation} X\approx UV^\mathit{\boldsymbol{T}}, \qquad U\geq0, V\geq0, X\geq0 \end{equation} $

    (1)

    如果从每一列的视图来观察这个表达式, ${X_j\approx U{(V_{j, \mathit{\boldsymbol{.}}})}^{\rm T}=\sum_{k=1}^K {U_{\mathit{\boldsymbol{.}}, k} V_{j, k}}}$, $U_{\mathit{\boldsymbol{.}}, k}$表示矩阵的第$k$列, $V_{j, \mathit{\boldsymbol{.}}}$代表矩阵的第$j$行, 我们称这两个向量为基向量和系数向量.这样可以很清晰地看到, 一个样本数据($X$的列向量)是基矩阵的各个基向量($U_{{\rm .}, k}$)的线性累加了.度量矩阵分解的误差的方法有很多种, 在欧氏空间中一般采用$l_F$范数来度量矩阵之间的距离.这样整个NMF求解便变成如下的有约束优化问题.

    $ \begin{equation} \min\limits_{U, V} {\parallel{X-UV^{\rm T}}\parallel}_{\rm F}^2, \qquad {\rm s.\, t.}\quad\, U\geq0, V\geq0 \end{equation} $

    (2)

    采用KKT (Karush-Kuhn-Tucher)条件, 分别引入拉格朗日因子$\Psi$和$\Phi$将$U\geq0, V\geq0$这两个约束条件变成无约束优化问题, 如式(3)所示.

    $ \begin{equation} L={\parallel{X-UV^{\rm T}} \parallel}_{\rm F}^2 +{\rm tr}(\Psi U^{\rm T} )+{\rm tr}(\Phi V^{\rm T} ) \end{equation} $

    (3)

    对于同时满足$U$和$V$的条件下对于式(3)这种无约束优化问题是非凸优化问题, 没有精确的求解方法.文献[19]提出了乘子更新法则来迭代求解上述最小化约束问题.迭代过程如式(4)和(5)所示.

    $ \begin{align*} \frac{\partial L}{\partial U}=\, &UV^{\rm T}V-XV+\Psi \Rightarrow \\ &U_{j, k}=U_{j, k}\times \frac {{(XV)}_{j, k}}{(UV^{\rm T}V)_{j, k}} \end{align*} $

    (4)

    $ \begin{align*} \frac{\partial L}{\partial V}=\, &VU^{\rm T}U-X^{\rm T}U+\Phi \Rightarrow\\ & V_{j, k}=V_{j, k}\times \frac{{(X^{\rm T}U)}_{j, k}}{(VU^{\rm T}U)_{j, k}} \end{align*} $

    (5)

    NMF是基于单视图的特征学习方法, 然而, 对同一个样本而言, 不同视图的多种特征往往可以互补地描述图像.基于此, 文献[17]提出了对每种特征保持弱化的一致性约束的多视图学习方法—MultiNMF.现将MultiNMF介绍如下.定义$X$为$G$个视图的输入特征数据矩阵, ${X^f=[X^f_{\mathit{\boldsymbol{.}}, 1}, \cdots, X^f_{\mathit{\boldsymbol{.}}, N}]\in {{\bf R}^{M_f\times N}}, (f\in {[1, G]}}$)为第$f$个视图的特征矩阵.其中, $M_f$为第$f$个视图的特征维数, $N$为样本数据的数量.对应地, 定义基矩阵${U={U^1, \cdots, U^G}}$和系数矩阵${V={V^1, \cdots, V^G }}$, ${U^f\in R^{M_f\times K}, V^f\in R^{N\times K}}$.其中, $K$为定义的新特征维数. Liu在文献[17]中提出Soft-regularization的方法认为, 对每个视图映射后的特征$V^f$需要保持一致性的约束, 但是允许存在差异性, 差异的大小采用欧氏空间中的$l_F$范数来度量.于是, 可以得到Liu的方法定义的损失函数如下式(6)所示.

    $ \min\limits_{U^f, V^f, V^\ast}\sum\limits_{f=1}^G\parallel X^f-U^f{V^f}^{\rm T}\parallel_{\rm F}^2+\lambda_f{\parallel{V^f-V^\ast}\parallel}_{\rm F}^2\\ \quad {\rm s.t.}~\, X^f\geq0, U^f\geq0, V^f\geq0, V^\ast\geq0\\ \quad {\parallel{U_{\ast, k}^f}\parallel}_1=1, \, {k=1, \cdots, K}, \, {f=1, \cdots, G} $

    (6)

    方程的解需要采用乘子更新法则来进行迭代求得, 具体过程这里不再赘述.

    局部空间结构约束的思想主要是保持样本的局部空间结构不变(近似不变), 这种局部空间结构在多个领域的方法中具有重要的意义.而MultiNMF没有考虑相同样本的原始数据与降维之后数据的空间结构关系, 因此, 本文提出了基于NMF矩阵分解的局部结构正则化约束多视图学习方法, 称之为MultiGNMF.下面对MultiGNMF方法进行详细介绍.

    1.3.1   局部结构正则化约束

    局部空间结构近似不变的具体含义就是:如果两个样本$x_i$和$x_j$在原始空间中相似, 那么我们认为它们在映射后的空间中(分别用$V_{i, \mathit{\boldsymbol{.}}}$和$V_{j, \mathit{\boldsymbol{.}}}$表示)也应该有近似的相似程度, 即原始数据与映射后的数据有相似的局部结构关系.

    根据以往文献的考察, 我们采用数据的亲和矩阵$W$来表征局部结构关系.计算亲和矩阵的方法很多, 在没有监督信息的前提下, 一般采用数据之间的欧氏距离构建亲和矩阵$W$.定义一个正整数变量$k$, 一个样本$i$与其他样本的权重可以如此计算:对所有样本与该样本的距离进行从小到大的排序, 如果样本$j$在前$k$个, 那么$W_{ij}=1$; 否则, $W_{ij}=0$.还有其他的方法不采用0/1值作为权值, 而是直接用数据之间的核函数值作为权值.典型的核函数有高斯核$W_{ij}={\rm e}^\frac{-{\parallel{x_i-x_j}\parallel} ^2}{\sigma}$, 线性核$W_{ij}={x_i}^{\rm T} x_j$等.不同的计算方法适应于不同的研究内容, 在文档特征中采用线性核表现更好, 在图像视觉特征中高斯核可能更适合.在和其他的方法比较的过程中, 我们采用比较通用的高斯核函数值作为权值, 从而就可以得到原始数据的亲和矩阵$W$.但是, 这些方法的性能受参数的影响较大.最近, Nie等[20]提出了一种无参数构建亲和矩阵$W$的方法, 该方法不需要任何参数, 很好地解决了构图过程需要反复调节参数的问题.但本文提出的MultiGSemiNMF和MultiGNMF算法直接应用无参数构图后缺乏普适性, 因此本文仍然使用高斯核函数来构建亲和矩阵, 在以后的工作将深入研究无参数构图和本文方法的结合.对于经过映射后的数据$V_{i, \mathit{\boldsymbol{.}}}$和$V_{j, \mathit{\boldsymbol{, }}}$, 仍用欧氏距离来度量它们之间的相似程度, 如式(7)所示.利用亲和矩阵$W$, 我们便可以构造用于约束局部结构的平滑惩罚因子.对于第$f$个视图的平滑惩罚因子$R^f$, 公式如下:

    $ \begin{equation} \mathcal {D}(V_{i, \mathit{\boldsymbol{.}}}, V_{j, \mathit{\boldsymbol{.}}} )={\parallel{V_{j, \mathit{\boldsymbol{.}}}^f-V_{i, \mathit{\boldsymbol{.}}}^f}\parallel}^2 \end{equation} $

    (7)

    $ \begin{align*} R^f&=\sum\limits_{i, j=1}^N{\parallel{V_{j, \mathit{\boldsymbol{.}}}^f-V_{i, \mathit{\boldsymbol{.}}}^f }\parallel}^2 W_{ij}^f=\\ &{\rm tr}((V^f )^{\rm T} D^f V^f )-{\rm tr}((V^f )^{\rm T} W^f V^f )= \\ &{\rm tr}((V^f )^{\rm T} L^f V^f ) \end{align*} $

    (8)

    其中, $L=D-W$为拉普拉斯矩阵, $D$是一个对角矩阵$D_{(j, j)} =\sum_iW_{i, j} $.

    1.3.2   目标方程的构建及求解

    将平滑惩罚因子引入多视图特征学习MultiNMF的框架中, 我们得到MultiGNMF方法的目标函数如下:

    $ \begin{align*} \min\limits_{U^f, V^f, V^\ast}\sum\limits_{f=1}^G&{\parallel{X^f-U^f{(V^f)}^{\rm T}}\parallel}_{\rm F}^2+\lambda_f{\parallel{V^f-V^\ast}\parallel}_{\rm F}^2+\\ & \mu\lambda_f {\rm tr}((V^f)^{\rm T}L^fV^f))\\ {\rm s.\, t.}~\, X^f\geq0,& U^f\geq0, V^f\geq0, V^\ast\geq0\\ &{\parallel{U_{\ast, k}^f}\parallel}_1=1, \, {k=1, \cdots, K}, \, {f=1, \cdots, G} \end{align*} $

    (9)

    Liu在文献[17]中建议用对角阵$Q$归一化$U$和$V$, 即$UV^{\rm T}=UQ^{-1} QV^{\rm T}$.其中, $Q_f$定义如下:

    $ \begin{equation} Q_f:= {\rm diag}{\left(\sum\limits_{m=1}^MU_{m, 1}^f, \cdots, \sum\limits_{m=1}^MU_{m, K}^f \right)} \end{equation} $

    (10)

    diag$(\cdot)$表示对角矩阵.这样, 经过归一化后, ${\parallel{U_{*, i} \parallel}_1=1}$.因此, 式(9)可以改写成:

    $ \begin{align*} \min\limits_{U^f, V^f, V^\ast}\sum\limits_{f=1}^G&{\parallel{X^f-U^f{(V^f)}^{\rm T}}\parallel}_{\rm F}^2+\lambda_f\parallel V^fQ^f-\\ &V^\ast\parallel_{\rm F}^2+\mu\lambda_f Tr((V^f)^{\rm T}L^fV^f))\\ {\rm s.\, t.}~\, &X^f\geq0, U^f\geq0, V^f\geq0, V^\ast\geq0 \end{align*} $

    (11)

    由此, 我们可以得到整体的损失函数定义如式(12)所示.

    $ \begin{align*} L_G=\sum\limits_{f=1}^G&{\parallel{X^f-U^f{(V^f)}^{\rm T}}\parallel}_{\rm F}^2+\lambda_f\parallel V^fQ^f-\\ &V^\ast\parallel_{\rm F}^2+\mu\lambda_f {\rm tr}((V^f)^{\rm T}L^fV^f)) \end{align*} $

    (12)

    MultiGNMF在$U^f\geq0, V^f\geq0$的约束下最小化$L_G$是一个带约束的优化问题.采用迭代的方法求解.引入拉格朗如因子后, MultiGNMF的第$f$种特征损失函数为式(13).

    $ \begin{align*} L_1=\, &{\parallel{X-UV^{\rm T}} \parallel}_{\rm F}^2+\lambda_f{\parallel{VQ-V^\ast}\parallel}_{\rm F}^2+\\ &{\rm tr}(\Phi V^{\rm T} )+ \mu\lambda_f{\rm tr}(V^{\rm T}LV)+{\rm tr}(\Psi U^{\rm T} ) \end{align*} $

    (13)

    $L_1$分别对$U$和$V$求导, 求导结果如下:

    $ \begin{align*} \frac{\partial L_1}{\partial U}&=UV^{\rm T}V-XV+\Psi+\lambda_fP \\ \frac{\partial L_1}{\partial V}&=VU^{\rm T}U-X^{\rm T}U+\Phi+\lambda_f{(V-V^\ast+\mu LV)} \end{align*} $

    (14)

    其中, $P:={(\sum_{m=1}^MU_{m, k}\sum_{n=1}^NV_{n, k}^2-\sum_{n=1}^NV_{n, k}V_{n, k}^\ast)}$.采用KKT条件${\Psi_{j, k}U_{j, k}=0}$和${\Phi_{j, k}V_{j, k}=0}$得到$U$和$V$的迭代式如下:

    $ \begin{eqnarray*} U_{j, k}\leftarrow U_{j, k}\times\frac{{(XV)}_{j, k}+\lambda_f \sum\limits_{n=1}^NV_{n, k}V_{n, k}^\ast}{{(UV^{\rm T}V)}_{j, k}+\lambda_f \sum\limits_{n=1}^NV_{n, k}^2}\\ V_{j, k}\leftarrow V_{j, k}\times\frac{{({X^{\rm T}U}+\lambda_fV^\ast+\mu\lambda_fWV)}_{j, k}}{{({VU^{\rm T}U}+\lambda_fV+\mu\lambda_fDV)}_{j, k}} \end{eqnarray*} $

    (15)

    根据文献[17], 我们在每次迭代得到$U$和$V$之后, 按照式(10)进行归一化处理, 即:

    $ \begin{equation} U^f\leftarrow U^f{(Q^f)}^{-1}, \, V^f\leftarrow V^fQ^f \end{equation} $

    (16)

    在优化$U$和$V$之后, 将它们视为常量, 对$L_1$求导得到$V^\ast$的更新表达式如下所示:

    $ \begin{equation} V^\ast=\dfrac{\sum\limits_{f=1}^G\lambda_fV^f}{\sum\limits_{f=1}^G\lambda_f} \end{equation} $

    (17)

    NMF和MultiGNMF都要求$U\geq0, V\geq0, X\geq0$.这种非负性约束来源于在现实世界中大部分数据是非负的, 系数的累加也是非负的.然而, 实际情况中, 我们提取到的图像特征往往存在负数, 这就使得以上两种特征学习方法存在局限性.为了消除这个局限, 我们提出一种对负数特征也适用的多视图特征学习方法—ṀultiGSemiNMF, 我们将在下一节对其进行详细介绍.

    在第1节中我们分析了各种基于NMF矩阵分解的特征学习方法的优越表现, 不过这些方法有一个重要的约束:所有数据都必须是非负的.在物理世界中可能大部分数据保持这个特性, 但是, 在图像处理中有些特征, 如由小波变换得到的三分法特征、结构特征等, 并没有保持非负性的条件, 如果强制向正数方向映射, 往往含有一定的失真.这就使得基于NMF的特征学习方法有一定的局限性.如何将NMF算法拓展到对负数矩阵也适用, 文献[13]中进行了详细探究.其中一种方法是SemiNMF, 下面我们对其进行介绍, 并由此引出本文所提算法—ṀultiGSemiNMF.

    SemiNMF中的数据与NMF中的数据一致, 但是, SemiNMF算法对原始数据$X$和基矩阵$U$不带有非负性约束, 只需系数矩阵$V\geq0$.由此, 我们可以得到SemiNMF的目标方程和损失函数分别如式(18)和(19)所示:

    $ \min\limits_{U, V} {\parallel{X-UV^{\rm T}}\parallel}_{\rm F}^2, \quad {\rm s.\, t.}\, V\geq0 $

    (18)

    $ L_{semi}={\parallel{X-UV^{\rm T}}\parallel}_{\rm F}^2= \\ \ \ \ \ \ \ \ \ \ \ \ {\rm tr}{(XX^{\rm T}-2X^{\rm T}UV^{\rm T}+VU^{\rm T}UV^{\rm T})} $

    (19)

    SemiNMF在$V\geq0$的约束下最小化$L_{semi}$是一个带约束的优化问题.采用迭代的方法求解, 求解过程我们将在第2.2节具体介绍.

    SemiNMF这种方法具有很好的描述性, 同时相对NMF有较大使用范围和较高性能.于是, 为了克服基于NMF的各种特征学习方法只适用于非负数据的缺点, 本文提出基于SemiNMF的多视图特征学习算法, 我们称之为MultiGSemiNMF.下面将对这种方法做详细的介绍.

    2.2.1   目标方程

    多视图学习过程中我们需要遵守几个准则: 1)每个视图学习的新特征需要保持一致性; 2)在学习前的特征和学习后的特征对样本之间的局部结构进行度量, 需要保持这种结构的一致性.于是, 我们得到弱化的一致性约束项${{\parallel V^f-V^\ast \parallel}_{\rm F}^2}$和局部结构正则化约束项${{\rm tr}((V^f )^{\rm T}L^f V^f)}$.我们将多视图学习的准则应用到SemiNMF, 于是, 我们可以得到MultiGSemiNMF算法的目标函数如式(20)所示.

    $ \begin{align*} \min\limits_{U^f, V^f, V^\ast}\sum\limits_{f=1}^G&{\parallel{X^f-U^f{(V^f)}^{\rm T}}\parallel}_{\rm F}^2+\lambda_f\parallel V^fQ^f-\\ &V^\ast\parallel_{\rm F}^2+\mu\lambda_f {\rm tr}((V^f)^{\rm T}L^fV^f))\\ \quad {\rm s.t.}\quad &V^f\geq0, V^\ast\geq0 \end{align*} $

    (20)

    其中, $Q^f$的引进是为了使方程满足${{\parallel{U_{\ast, k}^f}\parallel}_1=1}$的约束条件.而${{\parallel{U_{\ast, k}^f}\parallel}_1=1}$的约束条件是为了每一种特征的数据归一化处理, 那么对应的系数矩阵也变得归一化, 具有比较性.又因为${\parallel X\parallel}={\parallel \sum_jX_j\parallel} \approx \sum_{k=1}^K{\parallel {U_{i, k}\sum_jV_{j, k}}}\parallel =\sum_{k=1}^K{\parallel {\sum_jV_{j, k}\parallel}}= \parallel V\parallel$.所以, 在$U$归一化之后如果对$X$也进行归一化处理, $V$便也达到归一化的目的.而$X$为原始数据我们能更好的操作, 故在求解过程中只需要在每次迭代$U$之后对其进行归一化即可.所以, 式(20)可以简写成(21), 但是我们需要求解前对原始数据$X$进行归一化操作, 在每次迭代后对$U$进行归一化.

    $ \begin{align*} \min\limits_{U^f, V^f, V^\ast}\sum\limits_{f=1}^G&{\parallel{X^f-U^f{(V^f)}^{\rm T}}\parallel}_{\rm F}^2+\lambda_f\parallel{V^fQ^f-}\\ &V^\ast\parallel_{\rm F}^2+\mu\lambda_f {\rm tr}((V^f)^{\rm T}L^fV^f)\\ \quad {\rm s.\, t.}\quad &V^f\geq0, V^\ast\geq0 \end{align*} $

    (21)

    由此, 我们可以得到MultiGSemiNMF算法的整体损失函数如下所示:

    $ \begin{align*} L_{GSemi}=\sum\limits_{f=1}^G&{\parallel{X^f-U^f{(V^f)}^{\rm T}}\parallel}_{\rm F}^2+\lambda_f\parallel{V^f-}\\ &V^\ast\parallel_{\rm F}^2+\mu\lambda_f {\rm tr}((V^f)^{\rm T}L^fV^f)) \end{align*} $

    (22)

    其中, $L=D-W$为拉普拉斯矩阵, $D$是一个对角矩阵${D_{(j, j) }=\sum_iW_{i, j}}$, $W$为样本在原始空间关系的亲和矩阵.各变量的具体含义及计算方法详见第1.3节.

    2.2.2   方程求解

    MultiGSemiNMF在${V^f\geq0}$的约束下最小化$L_{GSemi}$是一个带约束的优化问题.对于每个视图的特征, 引入拉格朗日因子后, MultiGSemiNMF的第$f$个视图特征的损失函数为

    $ \begin{align*} L_2=&{\parallel{X-UV^{\rm T}} \parallel}_{\rm F}^2+\lambda_f{\parallel{V-V^\ast}\parallel}_{\rm F}^2+\\ &{\rm tr}(\Phi V^{\rm T} )+ \mu\lambda_f{\rm tr}(V^{\rm T}LV) \end{align*} $

    (23)

    损失函数在变量$U$和$V$下不是一个凸优化问题没有精确的数值解, 采用迭代优化方法求解, 具体计算步骤如下:

    1) 对$V$取随机矩阵或者采用K-means算法得到的系数矩阵.

    2) 固定$V$更新$U$.将$L_2$中只有变量$U$, 变成一个无约束优化问题, 对其求导${\frac{\partial L_2}{\partial U}=UV^{\rm T}V-XV=0}$, 获得$U$的解析解.其中${V^T V\in {\bf R}^{K\times K}}$在一般情况下是一个半正定的矩阵, 在不可逆的情况下, 用伪逆矩阵来代替(Matlab中的pinv函数).

    $ \begin{equation} U=XV{(V^{\rm T}V)}^{-1} \end{equation} $

    (24)

    3) 固定$U$更新$V$.将$U$固定, $L_2$中只有变量$V$, 对其求导${\frac{\partial L_2}{\partial V}=VU^{\rm T}U-X^{\rm T}U+\Phi+\lambda_f{(V-V^\ast+\mu LV)}}$ ${=0}$, 采用KKT条件$\Phi_{j, k}V_{j, k}=0$获得式(25)的优化问题.

    $ \begin{align*} &{(VU^{\rm T}U-X^{\rm T}U+\lambda_f(V-V^\ast+\mu LV))}_{ik}V_{ik}=\\ &\qquad\beta_{ik}V_{ik}=0 \end{align*} $

    (25)

    式(25)是一个典型的定点等式问题, 求解${f(x)=0}$, 可以变成${x=g(x)}$的形式, 迭代式子$x_{i+1}=g{(x_i)}$由于存在$V\geq0$的约束条件, 式(25)中的各项需要保持绝对的非负性.所以, 我们采用拆分的方法.通过拆分, ${X^{\rm T}U={(X^{\rm T}U)}^+-{(X^{\rm T}U)}^-, U^{\rm T}U={(U^{\rm T}U)}^+}$ ${-{(U^{\rm T} U)}^-}$, 其中的拆分函数定义如式(26)所示.这样式(25)便变成多个非负矩阵之间的线性组合.

    $ \begin{equation} A_{ik}^+=\frac {\mid{A_{ik}\mid}+A_{ik}}{2}, \, A_{ik}^-=\frac {\mid{A_{ik}\mid}-A_{ik}}{2} \end{equation} $

    (26)

    $ V_{ik}=V_{ik}\times \\ {\sqrt{\frac {{X^{\rm T}U}_{j, k}^++{[V{(U^{\rm T}U)}^-]}_{j, k}+\lambda_f{(\mu WV+V^\ast)}_{j, k}}{{X^{\rm T}U}_{j, k}^-+{[V{(U^{\rm T}U)}^+]}_{j, k}+\lambda_f{(\mu WV+V)}_{j, k}}}} $

    (27)

    文献[21]提出一种满足定点等式的${x=g(x)}$形式, 将式(27)所示, 代入到式(25)中${{(VU^{\rm T}U-X^{\rm T}U+\lambda_f(V-V^\ast+\mu LV))}_{ik}V_{ik} =0}$, 由于KKT条件约束${\beta_{ik}V_{ik}=0}$, 当${V_{ik}\neq0}$时, 必然存在$(VU^{\rm T}U-X^{\rm T}U+\lambda_f(V-V^\ast+\mu LV))_{ik} =0$, 式(27)满足式(25);反之, 当$V_{ik}=0$也满足.综合考虑, 式(27)满足KKT条件.迭代式(27)的收敛性证明方法可以详见文献[21-22].

    4) 交替迭代第2)步和第3)步, 直到损失函数值小于阈值或损失函数值变化小于阈值.

    5) 在优化$U$和$V$之后, 将它们视为常量, 利用式(17)更新${V^\ast}$. MultiGSemiNMF与MultiGNMF的不同之处在于缺少了${U^f\geq0}$的约束, 因此不仅适用于特征矩阵非负的情况, 在特征矩阵中存在负数时, 也表现良好.式(28)是各种变量的迭代方程.

    $ \ \ \ U_{j, k}\leftarrow U_{j, k}\times\frac{{(XV)}_{j, k}+\lambda_f \sum\limits_{n=1}^NV_{n, k}V_{n, k}^\ast}{{(UV^{\rm T}V)}_{j, k}+\lambda_f \sum\limits_{n=1}^NV_{n, k}^2}\\ V_{ik}\leftarrow V_{ik}\times \\ {\sqrt{\frac {{X^{\rm T}U}_{j, k}^++{[V{(U^{\rm T}U)}^-]}_{j, k}+\lambda_f{(\mu WV+V^\ast)}_{j, k}}{{X^{\rm T}U}_{j, k}^-+{[V{(U^{\rm T}U)}^+]}_{j, k}+\lambda_f{(\mu WV+V)}_{j, k}}}} $

    (28)

    为了验证MultiGNMF算法和MultiGSemiNMF算法的有效性, 我们在4个公共的图像数据库中和其他几种多特征学习算法比较图像聚类效果.下面分别从实验设置、评估指标和实验结果及分析这三部分作详细介绍.

    3.1.1   数据库

    实验中所用的数据库为CMU PIE人脸数据库、UCI手写体数字图像数据库、3-Sources文本数据库和ORL人脸库.表 1详细介绍这4个数据库的统计特性.具体介绍如下:

    表 1  4个数据库的资料
    Table 1  The information of four databases
    数据库 数量 视图个数 聚类个数
    CMU PIE 2 856 2 68
    UCI Digit 2 000 2 10
    3-Sources 169 3 6
    ORL 400 2 40
    下载: 导出CSV 
    | 显示表格

    CMU PIE人脸数据库包含41 368张$32\times 32$像素的人脸图像, 这些数据是68个人按照指定的13种姿势角度和43种不同光照条件下采集人脸的图像.在实验中, 我们从每个人的一个角度中随机选择42幅图像, 构成2 856幅人脸图像.如果按照人脸作为聚类中心的话, 那么数据可以分成68个集群.在本次实验中, 我们用图像的像素值(二维图像按行展开)和HOG (Histogram of oriented gradient)特征作为CMU PIE的两个视图.

    UCI手写体数字数据库有UCI大学构建数字0$\, \sim\, $ 9的手写体图像, 数据库包含2 000个样本.我们利用手写体图像的低频傅里叶变换和原始像素值作为不同的视图.

    3-Sources文本数据库包含BBC、Reuters和Guardian三种流行的网上新闻资源.其中, 有169条新闻被这三个新闻网报道过.我们选取这169条新闻作为测试样本, 这三个新闻网分别作为三个视图来进行聚类分析.这些新闻的主题包含商业、娱乐、健康、政治、运动和科技, 我们将其作为我们聚类的标签.

    ORL (Olivetti research laboratory)人脸库是英国剑桥大学Olivetti研究所制作的人脸数据库, 它共包含400张的人脸图像.这些数据是40个人在不同的时间、变化的光线、面部表情(张开/合拢眼睛、微笑/不微笑)和面部细节(戴眼镜/不戴眼镜)下拍摄的.所有的图像为实验者的正脸, 带有一定程度的朝上下左右的偏转或倾斜, 相似的黑暗同质背景.所有图像的大小均为$28\times 23$像素.在本次实验中, 我们用图像的像素值(二维图像按行展开)和低频傅里叶变换系数值作为ORL的两个视图.

    3.1.2   对比算法

    为了更全面地评估本文提出的算法, 我们比较了近期多种典型的多视图学习算法.下面对它们进行描述.

    1) 单视图算法(BSV和WSV):我们对每个视图利用NMF算法进行特征学习, 将学习的系数矩阵作为特征.统计每个视图的效果, 我们取每个视图该算法对应的最好效果为BSV和最差效果为WSV.

    2) ConcatNMF:这是一种前向融合的学习方法.其算法可以简单理解为, 首先将每个视图的特征串联成一个向量(矩阵)作为数据新的特征, 然后利用非负矩阵分解算法进行特征学习, 所有算法流程和度量标准与单视图的方法一致.

    3) ColNMF:一种多视图学习方法, 采用一致性准则, 如式(29)所示, 所有的视图共享相同的系数矩阵.与ConcatNMF类似, 不过每个视图添加了权重和归一化约束.

    $ \begin{equation} \min\limits_{U^f, V}\sum\limits_{f=1}^G{\parallel {X^f-U^f{(V)}^{\rm T}}\parallel}_{\rm F}^2 \end{equation} $

    (29)

    4) Co-reguSC:一种改进的谱聚类算法, 在文献[23]中被Kumar等提出.每个视图采用谱聚类学习作为基本的聚类学习算法, 与MultiNMF算法相似的是, 在视图之间采用弱一致性准则约束各个视图的映射矩阵之间的关系, 如式(30)所示.在实验中我们采用高斯核核函数, 该算法的详细介绍可以参考文献[23].

    $ \begin{align} &\max\limits_{U^v, U^\ast}\sum\limits_{v=1}^m{\rm tr}{((U^v )^{\rm T}L^v U^v)}+\nonumber\\ &\qquad\sum\limits_v\alpha_v{\rm tr}{(U^v{(U^v)}^{\rm T}U^\ast {(U^\ast)}^{\rm T})} \end{align} $

    (30)

    5) MultiNMF:本文算法的基准算法, 采用弱一致性约束的多视图NMF学习方法.

    6) Sc-ML:是一种改进的Co-reguSC算法. Dong等在文献[24]中提出, 利用格拉斯曼流行距离中的一种投影距离来定义不同视图学习的子空间之间一致性准则.

    7) MMSC:是一种多模态的谱聚类方法.不同的模态(也就是图像特征)共享一个相同的图拉普拉斯矩阵, 也就是最后的聚类指示矩阵$G$.该算法的详细介绍可以参考文献[10].

    $ \begin{align} &\min\limits_{G\geq0, G^{\rm T}G=I, G_i}\sum\limits_i({\rm tr}(G^i)^{\rm T}L^i G^i+\nonumber\\ &\qquad\alpha {\rm tr}{(G-G^i)}^{\rm T}\times(G-G^i)) \end{align} $

    (31)

    8) AMGL:是一种多视图谱聚类方法.但是不同视图所占的权重是自动学得的, 不需要有额外的参数来指导训练.该算法的详细介绍可以参考文献[11].

    本文采用以往文献中的经典评估方法: AC (精确度)和NMI (归一化互信息)来度量图像数据聚类的评估指标.给定一幅图像, 定义为图像的标签类别, 为图像对应的聚类中心的类别标签, AC可以用如下式(31)来定义.其中$n$为所有的测试图像数量, 是一个脉冲函数, 函数中两个参数相同则返回1, 否则返回0.是一种将聚类中心的标签映射到图像集已知的对等标签, 其中我们采用Kuhn-Munkres[25]的映射方法.

    $ \begin{equation} AC=\frac {\sum\limits_{i=1}^n\delta{(\alpha_i, map(l_i))}}{n} \end{equation} $

    (31)

    给定两个数据集的所有聚类中心, 它们之间的互信息可以用式(32)计算.

    $ \begin{equation} MI{(\mathcal {C}, \mathcal {C}')} = \sum\limits_{c_i \in \mathcal {C}, {c_j}'\in {\mathcal {C}'}}p{(c_i, c_j')}\cdot {\rm log}_2{\frac {p{(c_i, c_j')}}{p(c_i )p(c_j')}} \end{equation} $

    (32)

    其中, $p(c_i)$和${p(c_j' )}$表示在所有测试图像中被分到各自对应聚类中心的概率, 在这里我们用数量比率代表概率, ${p(c_i, c_j')}$表示一个图像被同时分到这两个聚类中心$c_i$和${c_j'}$的概率, 同样我们用数量比代替概率(注意在这里聚类算法计算得到的聚类中心的编号可以为任意的顺序).在实验中, 第一个聚类中心集为图像的已知类别标签, 同一个标签的图像为一个聚类中心, 第二个聚类中心集为聚类算法得到的标签, 标签可以为任意的顺序标签.归一化的互信息为互信息除以最大的聚类标签熵, 其中${H(\mathcal {C})=-\sum_ip(c_i) {\rm log}_2p(c_i)}$, ${p(c_i)}$指属于聚类中心${c_i}$的图像数量比率.

    $ \begin{equation} NMI(\mathcal {C}, \mathcal {C}')=\frac {MI(\mathcal {C}, \mathcal {C}' )}{\max(H({\mathcal {C}}), H(\mathcal {C}' ))} \end{equation} $

    (33)
    3.3.1   聚类的准确性验证

    在本文提出的方法需要计算各个数据之间的局部结构关系, 我们采用高斯核函数值作为权值, 即${W_{ij}={\rm e}^{-\frac {\parallel {x_i-x_j} \parallel ^2} {\sigma }}}$.变量${k=5}$, 这种参数设置在非大量样本数据库中使用的较多.在式(12)中所有的变量我们设定为${\lambda_f=0.01\, (f=1, \cdots, G), \mu =10}$, 与算法MultiNMF和MultiGNMF保持一致.

    在定义了参数之后, 计算每个视图图像之间的亲和矩阵, 每种方法我们都运行20次, 取所有次数运行结果的平均值和方差作为最终的算法效果评估值.经过20次的实验运行, 我们统计了各种算法在4个数据库上的AC和NMI值, 如表 2表 3所示.

    表 2  不同方法在4个数据库中的AC值
    Table 2  The AC values by different methods in four databases
    算法 UCI Digit CMU PIE 3-Sources ORL
    BSV ${68.5\pm.05}$ ${55.2\pm.02}$ ${60.8\pm.01}$ ${51.8\pm.02}$
    WSV ${63.4\pm.04}$ ${47.6\pm.01}$ ${49.1\pm.03}$ ${42.8\pm.05}$
    ConcatNMF ${67.8\pm.06}$ ${51.5\pm.00}$ ${58.6\pm.03}$ ${66.8\pm.02}$
    ColNMF ${66.0\pm.05}$ ${56.3\pm.00}$ ${61.3\pm.02}$ ${66.3\pm.04}$
    Co-reguSC ${86.6\pm.00}$ ${59.5\pm.02}$ ${47.8\pm.01}$ ${70.5\pm.02}$
    MultiNMF ${88.1\pm.01}$ ${64.8\pm.02}$ ${68.4\pm.06}$ ${67.3\pm.03}$
    SC-ML ${88.1\pm.00}$ ${72.3\pm.00}$ ${54.0\pm.00}$ ${70.8\pm.00}$
    MMSC ${89.4\pm.38}$ ${61.6\pm.06}$ ${69.9\pm.04}$ ${70.7\pm.06}$
    AMGL ${82.6\pm.74}$ ${63.6\pm.19}$ ${68.3\pm.12}$ ${64.2\pm.10}$
    MultiGNMF ${95.1\pm.10}$ ${72.5\pm.02}$ ${73.4\pm.00}$ ${73.5\pm.00}$
    MultiGSemiNMF ${95.6\pm.02}$ ${77.2\pm.12}$ ${79.3\pm.00}$ ${76.2\pm.00}$
    下载: 导出CSV 
    | 显示表格
    表 3  不同方法在4个数据库中的NMI值
    Table 3  The NMI values by different methods in four databases
    算法 UCI Digit CMU PIE 3-Sources ORL
    BSV ${63.4\pm.03}$ ${74.1\pm.00}$ ${53.0\pm.01}$ ${69.8\pm.01}$
    WSV ${60.3\pm.03}$ ${69.1\pm.02}$ ${44.1\pm.02}$ ${65.4\pm.04}$
    ConcatNMF ${60.3\pm.03}$ ${70.5\pm.00}$ ${51.7\pm.03}$ ${85.1\pm.01}$
    ColNMF ${62.1\pm.03}$ ${68.3\pm.00}$ ${55.2\pm.02}$ ${84.5\pm.03}$
    Co-reguSC ${77.0\pm.00}$ ${80.5\pm.01}$ ${41.4\pm.01}$ ${80.5\pm.01}$
    MultiNMF ${80.4\pm.01}$ ${82.2\pm.02}$ ${60.2\pm.06}$ ${87.6\pm.01}$
    SC-ML ${87.6\pm.00}$ ${85.1\pm.00}$ ${45.5\pm.00}$ ${85.3\pm.00}$
    MMSC ${88.0\pm.05}$ ${80.3\pm.01}$ ${66.3\pm.09}$ ${85.9\pm.01}$
    AMGL ${84.9\pm.33}$ ${81.8\pm.10}$ ${56.9\pm.11}$ ${81.9\pm.02}$
    MultiGNMF ${90.1\pm.04}$ ${90.2\pm.01}$ ${65.4\pm.00}$ ${88.5\pm.00}$
    MultiGSemiNMF ${91.2\pm.01}$ ${93.8\pm.05}$ ${73.4\pm.00}$ ${89.9\pm.00}$
    下载: 导出CSV 
    | 显示表格

    表 2表 3中我们可以看到本文提出的算法在聚类分析中相比较其他多视图学习算法在准确度和归一化互信息两个指标下都有较好的表现.同时我们注意到Co-reguSC和SC-ML算法也采用了局部结构约束的条件(谱聚类算法是一种基于数据样本图结构的算法), MMSC也采用了一致性约束, 本文算法同样超过该类算法.在比较本文提出的算法MultiGSemiNMF和MultiGNMF算法中, 我们发现基于MultiGSemiNMF的算法相对于MultiGNMF算法聚类效果上也有提升, 即使所有特征并没有负数或零, 这证明在特征学习中MultiGSemiNMF算法比MultiGNMF算法在一些应用场景中具有更好的表现, 且MultiGSemiNMF消除了MultiGNMF算法要求所有特征非负的限制, 因此也有着更为广阔的应用平台.

    3.3.2   参数对算法性能的影响

    在式(12)中有$G$个参数变量$\lambda_f$, 它的物理意义是不同视图对学习过程的重要性进行权衡.如果我们具有一些先验知识, 带有噪声的视图特征可以适当减少权重, 被认为重要的视图如文本标签信息等可以适当增加权重.在我们的实验中没有先验知识, 同时数据已经归一化处理, 所以所有的$\lambda_f$定义为相同的数.但是$\lambda_f$的大小会影响聚类效果, $\lambda_f$越小则对系数矩阵的一致性约束越松弛, 反之, $\lambda_f$为无穷大的话所有系数矩阵为相同的数值.

    下面我们在两个数据库CMU PIE和UCI Digit上用MultiNMF、MultiGNMF和MultiSemiNMF三个算法做聚类分析, 准确率AC作为指标度量不同的$\lambda_f$值对实验的影响.我们设定$\lambda_f$为0.001, 0.005, 0.002, 0.01, 0.02, 0.05, 0.1, 图 1图 2描述了对应的聚类效果.

    图 1  在UCI Digit数据库中参数$\lambda$对本文算法的影响
    Fig. 1  The influences of $\lambda$ on UCI Digit database
    图 2  在CMU PIE数据库中参数$\lambda$对本文算法的影响
    Fig. 2  The influences of $\lambda$ on CMU PIE database

    图 1图 2中我们可以看到, 在MultiNMF、MultiGNMF和MultiSemiNMF三个算法中, MultiGSemiNMF算法的准确率最高, 且受参数影响很小, 在较小或者较大的值均能有稳定的表现. MultiGNMF算法最不稳定, 但是在大部分实验中仍能超过基准算法MultiNMF.三种算法均在${\lambda=0.01}$时有较高的表现.

    本文提出的算法MultiGSemiNMF和MultiGNMF需要构建一个样本亲和矩阵, 在损失函数其中有一个参数$k$, $k$值越大样本的局部结构约束越多, 反之局部结构约束越少.不同的$k$值对聚类效果有一定影响, 在与其他算法的比较中, 我们采用其他算法一样的$k$值, 在这里我们另外分析$k$值对本文提出算法的影响.在UCI Digit数据总库, 我们选取${k = 5, 10, 15, 20}$构建亲和矩阵(${\lambda=0.01}$), 用聚类的准确率AC来评估算法效果, 如图 3所示.

    图 3  在UCI Digit中参数$k$对本文提出算法的影响
    Fig. 3  The influences of $k$ on UCI Digit database

    图 3我们看到参数$k$对本文算法有一定的影响, $k$值越大虽然能更充分地保留样本之间的局部空间结构关系, 但是从图中的结果来看聚类准确度随着$k$的变大有降低的趋势.过度的保留空间结构关系并不能提升算法的效果, 反而可能产生过度拟合的副作用, 因为样本的结构关系是基于原始特征的距离计算得到, 而原始特征并不能充分描述样本信息, 其中或多或少含有冗余和噪声.同时, 也可以看出, 无论参数$k$取何值时, MultiGSemiNMF算法的性能都优于MultiGNMF算法.

    本文提出了两种多视图学习的方法: MultiGNMF算法和MultiGSemiNMF算法. MultiGNMF和MultiGSemiNMF算法都是基于样本局部结构空间约束的非负矩阵分解多视图学习方法.

    本文首先介绍了一种单视图学习方法: NMF矩阵分解.然后, NMF算法的基础之上, 在以往多视图学习的框架准则下, 本文提出了基于样本局部结构空间约束的非负矩阵分解多视图学习方法MultiGNMF.但是, MultiGNMF方法只适用于非负的特征矩阵. MultiGSemiNMF算法则不限于此.

    为了验证本文提出的多视图学习算法的性能, 我们在公有的图像数据库中做聚类分析.实验中和以往的算法比较, 实验结果表明本文提出的算法相对于其他基于矩阵分解的多视图学习方法有更好的表现.同时实验中分析了算法中的参数变化对算法性能的影响, 实验结果表明MultiGSemiNMF对参数变化具有很好的鲁棒性.在未来的工作中, 我们将探索一种新的基于局部结构约束的多视图学习方法.


  • 本文责任编委  李力
  • 图  1  车辆模型

    Fig.  1  Vehicle model

    图  2  情景1~3下3种方法的对比结果

    Fig.  2  Comparison of three methods under scenarios 1~3

    图  3  不同参考点计算的可行域对比

    Fig.  3  Feasible area comparison calculated by different reference points

    图  4  改进前后两种凸近似避障法的路径规划结果对比

    Fig.  4  Path planning comparison results between un-developed and developed convex approximation avoidance methods

    图  5  基于曲线坐标系统的车道偏移量计算原理

    Fig.  5  Lane off-set calculation theory based on the curvilinear coordination system

    图  6  车道偏移量与车道线权重值的关系

    Fig.  6  The relationship between lane off-set and cost coefficient

    图  7  权重函数松弛前后结果对比

    Fig.  7  Comparison results of the cost functions before/after relaxation

    图  8  SILS系统实物图

    Fig.  8  Hard-ware of SILS system

    图  9  SILS硬件系统架构图

    Fig.  9  Architecture of the SILS hard-ware system

    图  10  基于SILS的ADAS激光雷达感知系统

    Fig.  10  ADAS lidar sensing system based on SILS

    图  11  长城H7实验样车

    Fig.  11  Prototype vehicle of GWM H7

    图  12  基于SILS的H7 Carsim模型与实车实验性能对比

    Fig.  12  Performance comparison between the H7 Carsim model and prototype vehicle based on SILS

    图  13  静态工况下的仿真结果

    Fig.  13  Simulation results under static scenario

    图  14  动态工况下的仿真结果

    Fig.  14  Simulation results under dynamic scenario

    图  15  弯道动态工况下的仿真结果

    Fig.  15  Simulation results under curvature dynamics scenario

    表  1  长城H7车辆参数值

    Table  1  Vehicle parameters of the GWM H7

    参数 数值 单位 参数 数值 单位
    $k_f$ $-$111187 N/rad $I_z$ 3522.1 ${\rm {kg\cdot m}}^{2}$
    $k_r$ $-$90773 N/rad $M_v$ 2211 kg
    $a$ 1.25 m $v_r$ 6 m/s
    $b$ 1.59 m
    下载: 导出CSV

    表  2  MPC控制系统参数

    Table  2  Parameters of MPC system

    参数 数值 参数 数值
    $k_1$ 0.3 $k_6$ 0.2
    $k_2$ 8 $k_7$ 0.7
    $k_3$ 3 $N$ 3
    $k_4$ 2.5 $N_{\mu}$ 1
    $k_5$ 15
    下载: 导出CSV
    符号 说明 单位
    $a/b$ 前/后轴距离质心的距离 m
    ${\pmb d_{\ast}}$ 自车外观几何形状向量 m
    $D_{0}$ 自车停车时自车和障碍车之间的距离 m
    $I_{z}$ 车辆绕$z$轴的转动惯量 kg$\cdot$s$^2$
    $k_{f/r}$ 前/后轮的侧倾刚度 N/rad
    $l$ 车的轴距 m
    $M$ 障碍车的数量
    $M_{v}$ 车辆质量 kg
    $N/N_{u}$ 预测/控制步长
    $o_{L}$ 车辆质心点$p_{0}$投影到中间车道的最短距离 m
    $OXY/o_{V}x_{V}y_{V}/o_{L}x_{L}y_{L}$
    大地/车辆/道路坐标系
    ${\pmb p}$ 可行域中的点 m
    ${\pmb p_{0}}$ 自车质心位置 m
    ${\pmb q_{\ast}}$ 障碍车参考点
    $r$ 自车凸多边形外形端点数
    $R$ 车辆转弯半径 m
    $s_{*}$ 障碍车凸多边形外形端点数
    $S_{L}$ 车辆质心偏移中间道路的位移量 m
    $S_{L_ {\rm max/min}}$ 左/右道路边缘的极限位置偏移量 m
    $t$ 采样时间 s
    $v_{f/r}$ 自车前/后轴速度 m/s
    $v_{l}$ 障碍车速 m/s
    $v_{la/lg}$ 质心的侧/纵向速度 m/s
    $\dot{v_{la}}$ 质心的侧向加速度 m/s$^{2}$
    $v_{rel}$ 自车和障碍车之间的相对速度 m/s
    ${\pmb w_{\ast}}$ 障碍车(物)外观几何形状向量 m
    $W_{c}$ 车宽 m
    $W_{L}$ 实时测得的车道宽 m
    $x/y$ 自车质心在大地坐标系下的横/纵坐标 m
    $\dot{x}/\dot{y}$ 质心沿大地坐标系$X/Y$轴的速度 m/s
    $\delta_{f}$ 前轮转角 rad
    $\mu_{*}$ 缩放系数
    ${\pmb w}$ 障碍车(物)内部点 m
    $\varphi/\dot{\varphi}/\ddot{\varphi}$ 航向角/横摆角速度/角加速度 rad/rad/s/rad/s$^2$
    $\gamma$ 实际车距与安全车距的比值
    下载: 导出CSV
  • [1] How google's self-driving car works [Online], available: http://news.discovery.com/autos/how-google-self-driving-car-works-111018.html, January 1, 2013
    [2] DARPA grand challenge [Online], available: http://en.wikipedia.org/wiki/DARPA Grand Challenge. January 1, 2013
    [3] 姜岩, 龚建伟, 熊光明, 陈慧岩.基于运动微分约束的无人车辆纵横向协同规划算法的研究.自动化学报, 2013, 39(12): 2012-2020 doi: 10.3724/SP.J.1004.2013.02012

    Jiang Yan, Gong Jian-Wei, Xiong Guang-Ming, Chen Hui-Yan. Research on diferential constraints-based planning algorithm for autonomous-driving vehicles. Acta Automatica Sinica, 2013, 39(12): 2012-2020 doi: 10.3724/SP.J.1004.2013.02012
    [4] Khatib O. Real-time obstacle avoidance for manipulator and mobile robot. The International Journal Robotics Research, 1986, 5(1): 90-98 doi: 10.1177/027836498600500106
    [5] Mcfetridge L, Ibrahim M Y. A new methodology of mobile robot navigation: The agoraphilic algorithm. Robotics and Computer-Integrated Manufacturing, 2009, 25(3): 545-551 doi: 10.1016/j.rcim.2008.01.008
    [6] Zhang Q S, Chen D D, Chen T. An Obstacle Avoidance Method of Soccer Robot Based on Evolutionary Artificial Potential Field. Energy Procedia Part C, 2012, 16: 1792-1798 doi: 10.1016/j.egypro.2012.01.276
    [7] 杜广龙, 张平.基于人工势场的机器人遥操作安全预警域动态生成方法.机器人, 2012, 34(1): 44-49 http://d.old.wanfangdata.com.cn/Periodical/jqr201201007

    Du Guang-Long, Zhang Ping.A method for generating dynamic security warning region in robotic teleoperation based on artificial potential field. Robot, 2012, 34 (1): 44-49 http://d.old.wanfangdata.com.cn/Periodical/jqr201201007
    [8] Howden W E. The sofa problem. The Computer Journal, 1968, 11(3): 299-301 doi: 10.1093/comjnl/11.3.299
    [9] Guernane R, Achour N. Generating optimized paths for motion planning. Robotics and Autonomous Systems, 2011, 59(10): 789-800 doi: 10.1016/j.robot.2011.06.001
    [10] 张纯刚, 席裕庚.全局环境未知时基于滚动窗口的机器人路径规划.中国科学(E辑), 2001, 31(1): 51-58 http://d.old.wanfangdata.com.cn/Periodical/zgkx-ce200101008

    Zhang Chun-Gang, XI Yu-Geng. Robust window-based robot path planning when the global environment is unknown. Chinese Science (E), 2001, 31(1): 51-58 http://d.old.wanfangdata.com.cn/Periodical/zgkx-ce200101008
    [11] 刘春明, 李兆斌, 黄振华, 等.基于LSPI和滚动窗口的移动机器人反应式导航方法.中南大学学报(自然科学版), 2013(03): 970-977 http://d.old.wanfangdata.com.cn/Periodical/zngydxxb201303016

    Liu Chun-Ming, Li Zhao-Bin, Huang Zhen-Hua, et al. A reactive navigation method of mobile robots based on LSPI and rolling windows. Journal of Central South University (Science and Technology), 2013(03): 970-977 http://d.old.wanfangdata.com.cn/Periodical/zngydxxb201303016
    [12] Chou C, Lian F, Wang C. Characterizing indoor environment for robot navigation using velocity space approach with region analysis and look-ahead verification. IEEE Transactions on Instrumentation and Measurement, 2011, 60(2): 442-451 doi: 10.1109/TIM.2010.2058531
    [13] Bemporad A, Rocchi C. Decentralized linear time-varying model predictive control of a formation of unmanned aerial vehicles. In: Proceedings of the 50th IEEE Conference on Decision and Control and European Control Conference (CDC-ECC) Orlando, FL, USA: IEEE, 2011. 7488-7493
    [14] Bemporad A, Pascucci C, Rocchi C. Hierarchical and hybrid model predictive control of quadcopter air vehicles. In: Proceedings of the 3rd IFAC Conference on Analysis and Design of Hybrid Systems, Zaragoza, Spain: Elsevier, 2009.
    [15] Zhi J Z, Schmerling E, Pavone M. A convex optimization approach to smooth trajectories for motion planning with car-like robots. In: Procedings of IEEE 54th Annual Conference on Decision and Control (CDC), Osaka, Japan: IEEE, 2015.
    [16] Quinlan S, Khatib O. Elastic bands: Connecting path planning and control. in Proc. IEEE Conference on Robotics and Automation, Atlanta, GA, May 1993(2): 80-807
    [17] Janson L, Schmerling E, Clark A, Pavone M. Fast marching tree: a fast marching sampling-based method for optimal motion planning in many dimensions. International Journal of Robotics Research, 2015, 34(7): 883-921 doi: 10.1177/0278364915577958
    [18] Tian Y G, Dolan J M, Lee J W. Runtime-bounded tunable motion planning for autonomous driving. In: Proceedings of the 2016 IEEE Intelligent Vehicles Symposium (Ⅳ), Gothenburg, Sweden: IEEE, 2016. 1301-1306
    [19] Tian Y G, Atwood J, Chi Y D, Dolan J M, Lee J W. Tunable and stable real-time trajectory planning for urban autonomous driving. In: Proceedings of the 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2015. 250-256
    [20] Ryu J H, Ogay D, Bulavintsev S, Kim H, Park J S. Development and experiences of an autonomous vehicle for high-speed navigation and obstacle avoidance. Frontiers of Intelligent Autonomous Systems. Springer, 2013: 105-116
    [21] T Berglund, A Brodnik, H Jonsson, M Staffanson, I Soderkvist. Planning smooth and obstacle-avoiding b-spline paths for autonomous mining vehicles. IEEE Transactions on Automation Science and Engineering, 2010, 7(1): 167-172 doi: 10.1109/TASE.2009.2015886
    [22] Perez J, Lattarulo R, Nashashibi F. Dynamic trajectory generation using continuous-curvature algorithms for door to door assistance vehicles. Intelligent Vehicles Symposium Proceedings, IEEE, 2014: 510-515 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=CC0214340693
    [23] Petrov P, Nashashibi F. Modeling And Nonlinear Adaptive Control for Autonomous Vehicle Overtaking. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(4): 1643-1656 doi: 10.1109/TITS.2014.2303995
    [24] Brezak M, Petrovic I. Real-time Approximation of Clothoids With Bounded Error for Path Planning Applications. IEEE Transactions on Robotics, 2014, 3(2): 507-515 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=4a6528809b11cf384afa45538b6d5a21
    [25] Funke J, Theodosis P, Hindiyeh R, Stanek G, Kritatakirana K, Gerdes C, Langer D, Hernandez M, Muller-Bessler B, Huhnke B. Up to the limits: Autonomous audi TTS. In: Rroceedings of the Intelligent Vehicles Symposium, June 2012: 541-547
    [26] Junsoo Kim, Kichun Jo, Wontaek Lim, Minchul Lee, Myoungho Sunwoo. Curvilinear-Coordinate-Based Object and Situation Assessment for Highly Automated Vehicles. IEEE Transactions on Intelligent Transportation Systems, 2015, 16(3): 1559-1575 doi: 10.1109/TITS.2014.2369737
    [27] Chu K, Lee M, Sunwoo M. Local Path Planning for Off-Road Autonomous Driving With Avoidance of Static Obstacles. IEEE Transactions on Intelligent Transportation Systems, 2012, 13(4): 1599-1615 doi: 10.1109/TITS.2012.2198214
    [28] Kim J H, Kum D S. Threat Prediction Algorithm based on Local Path Candidates and Surrounding Vehicle Trajectory Predictions for Automated Driving Vehicles. In: Proceedings of the 2015 IEEE Intelligent Vehicles Symposium (Ⅳ), COEX, Seoul, Korea: IEEE, 2015. 1220-1225
    [29] Barfoot T D, Clark C M. Motion Planning for Formations of Mobile Robots. Robotics and Autonomous Systems, 2004, 45: 65-78 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=cd879d19070c8114dcc0b35a6f7de20a
    [30] Wang H, Kearney J, Atkinson K. Robust and Efficient Computation of The Closest Point on A Spline Curve. In: Procedings of 5th International Conference Curves Surfaces, 2002: 397-406
    [31] 席裕庚.预测控制(第二版).北京:国防工业出版社, 2013.

    Xi Yu-Geng. Predictive Control (Second Edition). Beijing: National Defense Industry Press, 2013.
    [32] 郭烈, 葛平淑, 张明恒, 李琳辉, 赵一兵.汽车安全辅助驾驶技术.北京:北京大学出版社, 2014.

    Guo Lie, Ge Pin-Shu, Zhang Ming-Heng, Li Lin-Hui, Zhao Yi-Bing. Automobile Driving Assisted Driving Technology. Beijing: Peking University Press, 2014.
    [33] 刘明明, 崔春风, 童小娇, 戴彧虹.混合整数非线性规划的算法软件及最新进展, 中国科学:数学, 2016, 46(1): 1-20 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=zgkx-ca201601001

    Liu Ming-Ming, Cui Chun-Feng, Tong Xiao-Jiao, Dai Yu-Hong. Algorithm Software for Mixed Integer Nonlinear Programming and Recent Progress, Scientia Sinica (Mathematica) 2016, 46(1): 1-20 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=zgkx-ca201601001
    [34] 陈宝林.最优化理论与算法.北京, 清华大学出版社, 2005.

    Chen Bao-Lin. Optimization Theory and Algorithm. Beijing, Tsinghua University Press, 2005.
    [35] Powell M J D. The convergence of variable metric methods for nonlinearly constrained optimization calculations. Nonlinear Programming 3, (O.L. Mangasarian, R.R. Meyer and S.M. Robinson, eds.), Academic Press, 1978.
    [36] Constrained Optimization, Sequential Quadratic Programming (SQP), Optimization Toolbox User's Guide. Mathworks Inc, 2016.
    [37] Andersen H, Zhuang J C, You H E, Pendleton S, Marcelo H A. Geometric path tracking algorithm for autonomous driving in pedestrian environment. In: Proceedings of the 2016 IEEE International Conference on Advanced Intelligent Mechatronics (AIM), Bahff, Canada: IEEE, 2016. 1669-1674
  • 加载中
  • 图(15) / 表(3)
    计量
    • 文章访问数:  3713
    • HTML全文浏览量:  1675
    • PDF下载量:  714
    • 被引次数: 0
    出版历程
    • 收稿日期:  2017-06-02
    • 录用日期:  2017-12-06
    • 刊出日期:  2020-01-21

    目录

    /

    返回文章
    返回