2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

Adaptive Dynamic Feedback Tracking Control for a Robot-camera System with Unknown Parameters

LIANG Zhen-Ying WANG Chao-Li CHEN Hua LI Cai-Hong

MA Cheng-Long, YAN Yong-Hong. Short Text Classification Based on Probabilistic Semantic Distribution. ACTA AUTOMATICA SINICA, 2016, 42(11): 1711-1717. doi: 10.16383/j.aas.2016.c150268
Citation: LIANG Zhen-Ying, WANG Chao-Li, CHEN Hua, LI Cai-Hong. Adaptive Dynamic Feedback Tracking Control for a Robot-camera System with Unknown Parameters. ACTA AUTOMATICA SINICA, 2016, 42(10): 1595-1604. doi: 10.16383/j.aas.2016.e110097

Adaptive Dynamic Feedback Tracking Control for a Robot-camera System with Unknown Parameters

Funds: 

National Natural Science Foundation of China 61374040

Graduate Innovation Program of Shanghai 54-13-302-102

Natural Science Foundation of Shandong Province ZR2014FM007

National Natural Science Foundation of China 61304004

Hujiang Foundation of China C14002

Scientific Innovation Program 13ZZ115

Natural Science Foundation of Shandong Province ZR2013FM012

National Natural Science Foundation of China 61473179

More Information
    Author Bio:

    WANG Chao-Li Received his Ph.D.degree in control theory and engineering atBeijing University of Aeronautics and Astronautics in 1999, and received his master and bachelor degrees in applied mathematics at Lanzhou University in 1992 and 1986, respectively.Currently, he is a professor in the Department of Electrical Engineering, University of Shanghai for Scienceand Technology.His research interest covers nonlinear control, robust control, robotdynamic and control, visual servoing feedback control, and pattern identification.E-mail:clclwang@126.com

    CHEN Hua Received his bachelor degree from the Department of Mathematics, Yangzhou University in 2001, receivedhis master degree from the Departmentof Management Sciences and Engineering, Nanjing University in 2009, and receivedhis Ph.D.degree from the Department ofControl Science and Engineering, University of Shanghai for Science and Technology in 2012.Currently, he is an associateprofessor in the Mathematics and PhysicsDepartment, Hohai University, Changzhou Campus.His research interest covers saturated control for nonlinear systems, motion control of nonholonomic mobile robots, and analysis andcontrol of fractional-order systems.E-mail:chenhua112@163.com

    LI Cai-Hong Received her bachelor degree in automation from the School of Information Engineering, Southwest University of Science and Technology in 1993, and received her master degree in controltheory and control engineering from theCollege of Information Science and Engineering, Shandong University of Scienceand Technology in 2000.She received herPh.D.degree in detection technique andautomatic device from the School of Control Science and Engineering, Shandong University in 2007.Currently, she is a professor at the College of Computer Science andTechnology, Shandong University of Technology.Her researchinterest covers intelligent mobile robot, artificial intelligence inthe mobile robot, coverage path planning for the mobile robot, and the applications of chaotic theory in the path planning.E-mail:lich@sdut.edu.cn

    Corresponding author: LIANG Zhen-Ying Received her Ph.D.degree from the Department of Control Science and Engineering, University of Shanghai for Science and Technology in 2011.She received her master degree and bachelor degree in mathematics from Liaoning Normal University in 1991 and Shandong Normal University in 1986, respectively.Currently, she is an associate professor at the Science School, Shandong University of Technology.Her research interest covers nonlinear controls, robust controls, and visual servoing feedback control.Corresponding author of this paper.E-mail:lzhenying@126.com

doi: 10.16383/j.aas.2016.e110097
基金项目: 

National Natural Science Foundation of China 61374040

Graduate Innovation Program of Shanghai 54-13-302-102

Natural Science Foundation of Shandong Province ZR2014FM007

National Natural Science Foundation of China 61304004

Hujiang Foundation of China C14002

Scientific Innovation Program 13ZZ115

Natural Science Foundation of Shandong Province ZR2013FM012

National Natural Science Foundation of China 61473179

    • 关键词:
    •  / 
    •  / 
    •  / 
    •  / 
    •  
  • 近年来,随着社交网络和电子商务的飞速发展,微博、Twitter、即时信息、商品评价等短文本形式的文字充斥着互联网.这些短文本包含了用户的潜在需求、兴趣点、意图倾向等,如何能够从这些短文本中获取信息从而更好地为用户提供服务成为关键.然而,这些短文本通常都有长度限制,如微博字数限制在140字以内,短消息限制在70字以内,如何能够从只言片语中挖掘出目标信息成为了一大挑战.在使用传统的向量空间模型 (Vector space model,VSM)将短文本数字向量化时,该向量会很稀疏[1],特别是在测试阶段,由于训练数据的不充分,会造成很多有用特征因未被模型捕获过而被忽略的情况,因此使用传统的文本分类方法将导致分类结果不理想.

    为了充分利用短文本所蕴含的信息,已有很多相关研究.一种方案是计算短文本之间的相似性,文献[2]提出使用外部数据作为一个桥梁,如果预测文档和训练文档同时和某一外部文档相似,那么领域标签信息也应该一样,但搜集的外部数据必须和实验数据相关;文献[3]提出使用搜索引擎返回的结果来衡量两个词语之间的相似度,但是需要等待搜索引擎返回结果,比较耗时,不利于在线实时应用;文献[4]提出使用固定的资源维基百科作为知识库进行搜索.另一种解决方案是在短文本稀疏特征的基础上扩展相关语义特征,文献[5]提出使用Lucene[6]对维基百科建立索引,在原有特征基础上增加Lucene返回的搜索结果作为额外特征;文献[7]提出使用短文本隐藏的主题作为额外特征集,在相关数据上使用LDA(Latent Dirichlet allocation)[8]获得主题模型,针对短文本首先进行推理得到主题特征,与原始特征融合用于训练和分类.上述研究都是基于利用外部相关数据对原始文本进行相似度估计或者特征扩展,并且取得了不错的效果,但是对外部数据的相关性要求较高,而这些相关数据通常是根据领域知识,人工干预下进行收集的,在实际应用中获取相关领域的外部数据有时比较困难.上述方法最终将文本转换为空间向量,统计特征的共现权重,简单来说是一种计数原理.随着神经网络模型在自然语言处理中的广泛应用,文献[9]提出将词矢量作为输入特征,利用卷积神经网络进行模型训练.为了得到句子层级的矢量表示,文献[10]提出将变长文本训练为固定维度的段落矢量(Paragraph vector)的概念,文献[11]提出动态卷积神经网络,不依赖于句法解析树,而是利用动态k-max pooling提取全局特征.

    基于文献[7],为了摆脱对外部相关数据的过度依赖,本文从句子语义层面出发,深度挖掘短文本所表达的语义.本文利用词矢量作为输入特征表征语义.词矢量是指将词语映射成空间中的一个低维实数向量,向量之间的距离描述了词与词之间的语义关系,语义相近的词语在空间中成群出现,提高了文字表示的泛化能力.为了更好地利用词矢量,本文提出了概率语义分布模型,利用词矢量来表征语义分布,在一定程度上避免了数据的稀疏性问题,实验结果表明,本文所提出的方法准确率相对于传统的分类器提高了17.7%.

    本文结构如下:第1节简要介绍连续空间词矢量,第2节描述了本文提出的概率语义分布模型,第3节介绍了在概率语义分布模型的假设下,本文提出了一种基于通用语义背景模型的短文本分类方法,第4节为实验及结果分析,第5节给出总结.

    近几年,越来越多的学者开始关注利用低维实数向量来表征一个词、短语或者句子.例如,LSA (Latent semantic analysis)[12]和 LDA模型将文本映射成主题模型里的一个低维向量.随着神经网络的广泛应用,人们可以利用神经网络对大规模语料进行语言模型训练,同时能够得到描述语义和句法关系的词矢量.其中,文献[13]提出的Skip-gram模型便是一种能够高效得到词矢量的训练模型,通过训练无标注语料将每个词映射成低维实数向量,每一维都代表了词的浅层语义特征[14].同时,文献[15]发现上述模型训练得到的词矢量能够通过余弦距离描述词与词之间的语义和句法关系,并且相同的余弦距离表征了同样关系,例如,向量"Man"与向量"King"之间的距离近似于向量"Woman"与向量"Queen"之间的距离.因此,本文利用词矢量上述特性,结合短文本的特点,提出了概率语义分布模型,应用于短文本分类中.

    不同于传统的文本分类算法,本文认为短文本是在贝叶斯框架下各个领域里的一个抽样.本文假设短文本数据产生于一个概率语义分布模型,不同领域数据来自于不同的语义分布模型,并且我们可以利用已知的文本数据去估计这些模型.得到这些模型之后,对于新的测试数据,计算来源于各个模型的概率,根据贝叶斯原理选择类别标签作为预测结果.

    假设训练数据包含一系列的短文本文档,D={d1,d2, $d_3,\cdots,d_n$ },di表示一条短文本,共n条训练数据,分别属于C={c1,c2, $c_3,\cdots,c_m$ },cj为领域标记,共m个领域.本文假设同一领域短文本文档产生于同一个语义分布模型(模型参数为λ).一条短文本数据di的产生,首先根据先验概率p(cj|λ)选择语义分布模型,然后根据该领域模型的模型参数p(di|cj;λ)产生文档di.因此文档di的产生概率为p(di|λ):

    $p({{d}_{i}}|\lambda )=\sum\limits_{j=1}^{m}{p}({{c}_{j}}|\text{ }\lambda )p({{d}_{i}}|{{c}_{j}};\lambda )$

    (1)

    类似于一元语言模型,认为短文本中词与词之间是互相独立的,不依赖于前文信息,dik表示短文本di中位置为k的单词,|di| 表示文本中单词的个数,则有

    $p({{d}_{i}}|{{c}_{j}};\text{ }\lambda )=\prod\limits_{k=1}^{|{{d}_{i}}|}{p}({{d}_{ik}}|{{c}_{j}};\text{ }\lambda )$

    (2)

    假设已通过训练数据计算得到模型参数 $\widehat{\text{ }\lambda }$ ,针对测试数据,可以分别计算各个分布模型产生该数据的概率.根据贝叶斯原理,由式(1) 和(2) 得到

    $\begin{array}{*{35}{l}} p({{c}_{j}}|{{d}_{i}};\hat{\lambda }) & =\frac{p({{c}_{j}}|\hat{\lambda })p({{d}_{i}}|{{c}_{j}};\hat{\lambda })}{p({{d}_{i}}|\hat{\lambda })}=\text{ } \\ {} & \frac{p({{c}_{j}}|\hat{\lambda })\prod\limits_{k=1}^{|{{d}_{i}}|}{p}({{d}_{ik}}|{{c}_{j}};\hat{\lambda })}{\sum\limits_{l=1}^{|C|}{p}({{c}_{l}}|\hat{\lambda })\prod\limits_{k=1}^{|{{d}_{i}}|}{p}({{d}_{ik}}|{{c}_{l}};\hat{\lambda })}\text{ } \\ \end{array}$

    (3)

    根据上述提出的概率语义分布模型假设,本文认为可以选择合适的模型去近似描述每个领域内的词语分布.由于混合高斯模型能够描述任意形状的概率分布,因此本文选用混合高斯模型.由于训练数据的不充分,直接使用混合高斯模型进行多高斯训练时会产生欠拟合,因此本文在混合高斯模型的基础上提出了一种基于通用语义背景模型的短文本分类方法.

    在实际应用中,由于自然语言表达的灵活性,获取足够多的标注数据是一件费时费力的事情,如何能够充分利用已有数据进行短文本分类成为关键.在图像处理、说话人识别系统中,高斯混合-通用背景模型[16-17]便是一种能够在训练数据不足的情况下,由一个通用的背景模型根据少量的训练数据自适应到目标模型上,并且取得了很好效果.因此,借鉴于高斯混合-通用背景模型,在概率语义分布模型的假设下,首先利用混合高斯构建通用概率语义背景分布模型,然后根据训练数据自适应得到目标领域概率语义分布模型,如图 1所示.

    图 1  基于通用语义背景模型的短文本分类
    Fig. 1  Short text classification based on universal semantic background model

    在连续空间词矢量表示中,通过向量之间的空间距离来表征词与词之间的特定关系,并且文献[18]指出从大量无标记文本数据训练得到的词矢量要比随机初始化的矢量性能要好.在短文本分类中,我们应该首先训练得到词矢量.然而,词矢量的训练通常需要耗费很长时间,并且已有许多学者将训练好的词矢量进行了开源.本文的实验直接使用文献[19]提供的词矢量词典,该词典是利用大概十亿单词数量的谷歌新闻数据训练得到的维度为300的词矢量.

    高斯混合模型(Gaussian mixture model,GMM)作为一种通用的概率模型,只要高斯数足够大,便能有效地模拟多维矢量的连续概率分布,因而很适合去表征语义分布.高斯混合模型是一系列高斯分布的加权组合.一个由M个高斯分量组成的高斯混合密度函数是M个高斯密度函数的线性加权和:

    $p({{d}_{i}}|\lambda )=\sum\limits_{k=1}^{M}{{{w}_{k}}}{{p}_{k}}({{d}_{i}})\text{ }$

    (4)

    上式中 λ 为GMM模型参数,pk(di), $k = 1,\cdots,M$ 是高斯分量密度函数. wk, $k = 1,\cdots,M$ 是各个高斯分量的权重,满足 $\sum_{k=1}^{M} w_k=1$ .每个高斯分量的概率密度函数公式 $p_k(d_i)$ 表示如下:

    $\frac{1}{{{(2\pi )}^{\frac{D}{2}}}|{{\Sigma }_{k}}{{|}^{\frac{1}{2}}}}\text{exp}\{-\frac{1}{2}{{({{d}_{i}}-{{\mu }_{k}})}^{\text{T}}}\Sigma _{k}^{-1}({{d}_{i}}-{{\mu }_{k}})\}\text{ }$

    (5)

    这里 $\mu_k$ 是第k个高斯分量的均值矢量, $\Sigma_k$ 为相应的协方差矩阵,D是特征矢量的维度. 这样,GMM模型便可以由以下参数集合表示:

    $\lambda =\{{{w}_{k}},{{\mu }_{k}},{{\Sigma }_{k}}\},\quad k=1,2,\cdots ,M$

    (6)

    使用GMM对概率语义分布建模主要基于两个出发点: 1) GMM的高斯分量能够描述一定词矢量的分布; 2) 线性加权的高斯密度函数可以逼近任意形状的概率分布,因此选用GMM对语义分布进行描述.

    利用高斯混合模型在无标注文本数据上训练得到通用概率语义背景分布模型,再用带有标记的训练数据进行模型自适应得到目标模型.最大后验概率(Maximum a posteriori,MAP)是一种典型的贝叶斯估计,它首先计算训练数据相对于通用背景模型的各个统计量,然后用一个相关系数将通用背景模型参数与相关统计量联合,得到目标模型.给定通用背景模型: $\lambda = \{w_k,\mu_k,\Sigma_k \},~k = 1,2,\cdots,M$ ,以及某一特定领域内的短文本训练数据 $D_{c_j}=\{d_{c_1},\cdots,d_{c_i},\cdots,d_{|c_j|} \}$ ,对每一条训练数据计算其在各高斯分量上的占有率,即后验条件概率:

    \begin{equation}p(k|d_{c_i}) =\frac{w_kp_k(d_{c_i})}{\sum\limits_{j=1}^{M}w_jp_j(d_{c_i})}\end{equation}

    (7)

    然后便可计算出与权重相关的零阶统计量nk,与均值相关的一阶统计量 $E_k(d)$ 以及与协方差矩阵相关的二阶统计量 $E_k(d^2) $ :

    \begin{equation}n_k = \sum_{c_i=1}^{|c_j|}p(k|d_{c_i}) \end{equation}

    (8)

    \begin{equation}E_k(d) = \frac{1}{n_k}\sum_{c_i=1}^{|c_j|}d_{c_i}p(k|d_{c_i})\end{equation}

    (9)

    \begin{equation}E_k(d^2) = \frac{1}{n_k}\sum_{c_i=1}^{|c_j|}d_{c_i}^2p(k|d_{c_i})\end{equation}

    (10)

    用以上计算得到的统计量对通用背景模型的各个高斯分量的权重、均值和协方差进行自适应,得到新的模型参数:

    \begin{equation}w_k^* = \left[\frac{\alpha_k^wn_k}{T}+(1-\alpha_k^w)w_k\right]\gamma \end{equation}

    (11)

    \begin{equation}\mu_k^* = \alpha_k^mE_k(d)+(1-\alpha_k^m)\mu_k \end{equation}

    (12)

    \begin{equation}\sigma_k^{2*} = \alpha_k^\nu E_k(d^2) +(1-\alpha_k^\nu)(\sigma_k^2+\mu_k^2) -(\mu_k^*)^2 \end{equation}

    (13)

    其中 $\gamma$ 用来平衡高斯分量的权值,以保证更新后各分量的权值和为1. $\{\alpha_k^w,\alpha_k^m,\alpha_k^\nu\ \}$ 是调整新旧模型参数平衡的自适应系数,通常使用同一个自适应系数.为了能够确定上述参数,本文在训练集上使用5折交叉验证来确保参数的可靠性.

    为了验证所提出方法的有效性,本文利用文献[7]提供的短文本数据,首先验证背景模型和高斯数对分类性能的影响,其次与基线系统进行比较,最后验证所提出的方法对训练数据的依赖性.

    本文选择文献[7]提供的网页搜索片段数据作为实验数据,网页搜索片段数据集是将特定领域词送入谷歌搜索引擎得到的搜索结果片段,为了保证领域的特定性,通常选取前20~30个片段作为引用数据.例如计算机类,选取60个计算机领域的词语,分别送入谷歌搜索引擎,每次抽取搜索结果的前20条数据作为训练数据,则可以得到1200条数据,数据分布如表 1.为了区分训练数据和测试数据,在生成测试数据时所使用的领域词不同于训练数据.如表 2所示,无论是英文单词未经提取词干还是经过提取词干(Porter stemming)[20]之后,都会有超过40%的未登录词(未登录词通常是指未在词典中出现的词[21])出现在测试集中,这极大地增加了分类的难度.

    表 1  网页搜索片段数据分布
    Table 1  Statistics of web snippets data
    编号领域训练数据测试数据
    1商业1200300
    2计算机1200300
    3文化与艺术1880330
    4教育与科技2360300
    5技术220150
    6健康880300
    7社会政策1200300
    8体育1120300
    共计100602280
    下载: 导出CSV 
    | 显示表格
    表 2  未登录词分布
    Table 2  Statistics of unseen words
    原始单词词干
    训练数据26 265 21 596
    测试数据10 037 8 200
    未登录词4 378 3 677
    未登录词的比例43.62% 44.84%
    下载: 导出CSV 
    | 显示表格

    在实验过程中,本文使用精度(Precision,P)、召回率(Recall,R)、F1值和准确率(Accuracy,A)作为评价标准.

    4.2.1   参数设置

    如何选择背景数据进行通用背景语义模型训练以及不同的背景模型对性能如何影响,混合高斯模型中的高斯数如何确定,这些参数都需要通过实验进行验证.本文选择: 1) 相关数据:去掉标注的训练数据作为背景数据;2) 通用数据:选取语言资源联盟 (Linguistic Data Consortium)提供的新闻数据[22],本文仅选取标签 Headline下的文本;3) 混合数据:相关数据和通用数据的混合,分别作为背景数据进行背景模型训练,实验结果如图 2所示.

    当我们不断增加高斯数时,混合高斯能够很好地拟合特征分布,但是当高斯数过高时,由于数据的稀缺,会出现过拟合现象,正如图 2中当使用训练数据1) 进行背景模型训练时,高斯数达到256时无法拟合出混合高斯模型.在图 2中,直接使用无标注的训练数据进行通用背景模型训练,在低维混合高斯下能够快速地提高分类性能,但是由于数据有限,无法进行高维高斯拟合,高斯数为128时准确率达到78.6%;使用通用数据,由于数据量较大,能够进行高维高斯拟合,并且在高维混合高斯的情况下能够达到直接使用训练数据的分类性能,高斯数为8时准确率达到最高75.83%;当使用无标注的训练数据+通用数据时,高斯数为16,短文本分类准确率达到最高值80%.

    图 2  不同的背景数据和高斯数对分类结果的影响
    Fig. 2  Influence of background data and \\the number of GMM
    4.2.2   与基线系统相比

    为了验证本文所提方法的有效性,本文选择以下方法作为基线系统:

    1) TF*IDF + SVM/MaxEnt:特征值采用TF*IDF进行计算,利用支持向量机(Support vector machine,SVM)或最大熵(MaxEnt)作为分类器.

    2) LDA + MaxEnt:在文献[7]中,利用LDA对文本进行主题特征提取,与文本特征进行合并,利用MaxEnt进行分类模型的训练.

    3) Wiki feature+SVM: 对维基百科数据1进行去除网页标签、网页链接等预处理之后,使用Lucene对其建立索引,对每一条短文本实验数据进行检索.在检索结果中,类似文献[5]中提出的方法,将维基百科数据的标题作为额外的文本特征扩充到原始短文本数据中.不同于文献[5]中所描述的聚类任务,我们将融合后的文本用于短文本分类.

    1http://download.wikipedia.com/enwiki

    4) Paragraph vector +SVM:文献[10]提出了一种无监督的方法,利用定长数学向量表征不定长文本.该模型认为当前词语的选择不仅由上下文决定,还由隐藏的文本矢量共同决定.该隐藏文本矢量可以看做为文本的隐藏主题[23].

    5) LSTM (Long short term memory):对文献[24]中提出的LSTM模型进行修改,组成结构为单一的LSTM层、均值池化层(Average pooling layer)和 逻辑回归层(Logistic regression layer),使其能够进行文本类别预测[23].

    在传统的文本分类方法中,通常是利用词袋模型(Bag of words,BoW)将文本离散化,计算特征权重,转换为向量空间模型中的特征权重向量,每个词被转换为字典中的索引数字.这种方法降低了计算复杂度,但是对于未登录词的处理能力大幅度降低.

    由于在训练的过程中,分类模型未捕捉到未登录词对分类结果的贡献能力,在测试阶段,未登录词通常会被忽略.尤其是在该测试集中会出现超过40%的未登录词,这极大地增加了分类难度.因此,在表 3中传统的文本分类方法SVM和MaxEnt性能均不是很高.以维基百科作为搜索库,利用Lucene的搜索结果进行原始短文本扩展,在一定程度上降低了特征稀疏性,对分类性能有所提升.本文的方法利用词矢量将文本向量化,词矢量体现了一定的语言泛化能力,充分利用了训练数据里的每一个有用词语,使得准确率相对传统方法提高了17.7%,并且如表 4所示每一领域的分类结果 F1 值均优于传统的分类结果.在Paragraph vector和LSTM这两种模型中,都使用到了词矢量,但都未能有效地捕获到语句中的语义信息.

    表 3  与基线系统对比实验结果(%)
    Table 3  Experimental results of the proposed method against other methods (%)
    方法Accuracy
    TF*IDF+SVM 66.14
    TF*IDF+MaxEnt 66.80
    LDA+MaxEnt 82.18
    Wiki feature+SVM 76.89
    Paragraph vector+SVM 61.90
    LSTM 63.00
    本文的方法80.00
    下载: 导出CSV 
    | 显示表格

    文献[7]提到的方法需要根据领域知识额外准备大概470000篇维基百科数据,共计3.5GB的相关数据进行主题模型训练,增加了收集数据的难度.本文在使用混合数据时准确率达到80%,略低于文献[7]中的82.18%,但是本文有效地避免了收集相关数据的困难.本文选用维基百科数据,对其进行去除网页标签、链接等预处理之后,用于LDA主题模型训练和词矢量训练.在主题模型训练过程中,主题数目选择为50、100、200、300、400等,在训练集上利用五折交叉验证确定最优主题数.针对词矢量的训练,使用开源工具 word2vector2训练得到维度为300的词矢量.在使用相同外部数据的情况下,本文方法取得79.93%的性能,略高于基于LDA+MaxEnt方法的79.89%.从这一点可以看出,在使用外部数据进行主题模型训练时,外部数据与实验数据的相关性,是影响主题特征贡献能力的一个重要因素.因此,当面对一个新的分类任务时,文献[7]中的方法需要根据领域知识重新挑选大量相关语料进行主题模型训练,从一定程度来讲,本文的方法更易实现.

    2http://word2vec.googlecode.com/svn/trunk

    表 4  SVM、MaxEnt和本文方法的实验结果
    Table 4  Evaluations of SVM,MaxEnt and the proposed method
    SVMMaxEnt本文的方法
    领域P (%)R (%)F1P (%)R (%)F1P (%)R (%)F1
    社会政策77.6152.000.622870.7550.000.585986.3670.370.7755
    计算机73.7563.670.683472.2666.000.689980.3187.290.8365
    教育与科技41.9882.000.555345.9382.670.590581.6068.230.7432
    体育85.1976.670.807086.0878.330.820284.5489.930.8715
    健康89.0156.670.692586.9464.330.739576.3585.570.8070
    技术76.5350.000.604872.8439.330.510858.8293.330.7216
    商业70.3757.000.629868.0560.330.639673.9967.330.7051
    文化与艺术62.2781.520.706062.8678.480.698188.1577.850.8268
    下载: 导出CSV 
    | 显示表格
    4.2.3   训练数据大小对分类效果的影响

    为了验证本文方法对训练数据的依赖性,本文将训练数据保持原领域数据的分布比例不变平均分成10份,每次增加1份进行试验,在同一测试集上进行测试,得到10组实验结果,如图 3所示.由于SVM和MaxEnt的分类效果相差不大,因此仅选择了MaxEnt作为基线系统.随着训练数据的减少,测试集中未登录词的比重会逐渐加大,MaxEnt的分类效果变化幅度较大,对训练数据的依赖性比较大.在训练数据稀缺的情况下(仅占原训练数据的1/10) ,本文方法能够将正确率从47.06%提高到71.54% (相对提高52%).从另一角度说明如何充分利用词汇信息成为分类的关键,而这也是本文方法的关键.

    图 3  训练数据大小对分类效果的影响(1)
    Fig. 3  Influence of training set size (1)

    为了进一步检验训练数据对本文方法的影响,本文继续将训练数据数量缩小,如图 4所示.在仅有100条训练数据的情况下,本文所提出的方法准确率能够达到51.4%,高于MaxEnt在1000条训练数据下的47.06%,这对于获取训练数据比较困难的应用来说,可以大大地降低对训练数据的依赖性.

    图 4  训练数据大小对分类效果的影响(2)
    Fig. 4  Influence of training set size (2)

    本文摒弃了传统的文本向量空间表示模型,提出概率语义分布模型,认为短文本是来自于概率语义模型的一个抽样,利用词矢量将文本数字化,通过无标记数据构建通用语义背景模型,利用训练数据进行自适应得到目标模型.实验结果验证了本文所提出方法的可行性,利用能够表征语义和句法关系的词矢量有效地降低了训练数据不充分所带来的影响,短文本分类性能明显优于传统的文本分类方法,降低了对训练数据的依赖性.虽然本文的实验结果略低于基于主题模型的短文本分类系统的结果,但明显优于基于SVM和最大熵的分类算法,并且本文的方法无需准备大量的相关数据,在一定程度上本文方法更易实现.

  • Fig.  1  Wheeled mobile robots with monocular camera

    Fig.  2  The trajectory $e_{0}$ with respect to time for Case 1

    Fig.  3  The trajectories of ${{e}_{i}}(i=1,\cdots ,4)$ for Case 1

    Fig.  4  The trajectories of ${{u}_{i}}(i=0,1,2)$ for Case 1

    Fig.  5  The trajectory of $\hat{\alpha}$ with respect to time for Case 1

    Fig.  6  The trajectory of $p$ with respect to time for Case 1

    Fig.  7  The velocity $v_{1}$ of the mobile robot for Case 1

    Fig.  8  The velocities $v_{2}$ and $v_{3}$ of the mobile robot for Case 1

    Fig.  9  The tracking error trajectories for ${{e}_{{{x}_{m}}}},{{e}_{{{y}_{m}}}}$ and $e_{\theta_{m}}$ in the image frame for Case 1

    Fig.  10  The tracking error trajectories for ${{e}_{x}},{{e}_{y}}$ and $e_{\theta}$ in the robot task-space for Case 1

    Fig.  11  The tracking errors in the robot task-space for Case 2

    Fig.  12  The tracking errors in the image frame for Case 2

    Fig.  13  The tracking error trajectories for ${{e}_{x}},{{e}_{y}}$ and $e_{\theta}$ in the robot task-space for Case 2

    Fig.  14  The tracking errors in the robot task-space for Case 3

    Fig.  15  The tracking errors in the image frame for Case 3

    Fig.  16  The tracking error trajectories for ${{e}_{x}},{{e}_{y}}$ and $e_{\theta}$ in the robot task-space for Case 3

  • [1] Kolmanovsky I, McClamroch N H. Developments in nonholonomic control problems. IEEE Control Systems Magazine, 1995, 15(6):20-36 http://cn.bing.com/academic/profile?id=2120944681&encoded=0&v=paper_preview&mkt=zh-cn
    [2] Wang C L. Semiglobal practical stabilization of nonholonomic wheeled mobile robots with saturated inputs. Automatica, 2008, 44(3):816-822 http://cn.bing.com/academic/profile?id=1967598091&encoded=0&v=paper_preview&mkt=zh-cn
    [3] Leroquais W, d'Andréa-Novel B. Transformation of the kinematic models of restricted mobility wheeled mobile robots with a single platform into chain forms. In:Proceedings of the 34th Conference on Decision and Control. New Orleans, LA:IEEE, 1995. 3811-3816
    [4] Pang Hai-Long, Ma Bao-Li. Adaptive unified controller of arbitrary trajectory tracking for wheeled mobile robots with unknown parameters. Control Theory and Applications, 2014, 31(3):285-292(in Chinese) http://en.cnki.com.cn/Article_en/CJFDTOTAL-KZLY201403003.htm
    [5] Cao K C. Global κ-exponential tracking control of nonholonomic systems in chained-form by output feedback. Acta Automatica Sinica, 2009, 35(5):568-576 http://cn.bing.com/academic/profile?id=2145479289&encoded=0&v=paper_preview&mkt=zh-cn
    [6] Ma B L, Tso S K. Unified controller for both trajectory tracking and point regulation of second-order nonholonomic chained systems. Robotics and Autonomous Systems, 2008, 56(4):317-323 http://cn.bing.com/academic/profile?id=2038047332&encoded=0&v=paper_preview&mkt=zh-cn
    [7] Campion G, Bastin G, Dandrea-Novel B. Structural properties and classification of kinematic and dynamic models of wheeled mobile Robots. IEEE Transactions on Robotics and Automation, 1996, 12(1):47-62 http://cn.bing.com/academic/profile?id=2149012351&encoded=0&v=paper_preview&mkt=zh-cn
    [8] Jiang Z P. Robust exponential regulation of nonholonomic systems with uncertainties. Automatica, 2000, 36(2):189-209 http://cn.bing.com/academic/profile?id=2079519375&encoded=0&v=paper_preview&mkt=zh-cn
    [9] Ma Bao-Li. Robust smooth time-varying exponential stabilization of dynamic nonholonomic mobile cart with parameter uncertainties. Acta Automatica Sinica, 2005, 31(2):314-319(in Chinese) http://cn.bing.com/academic/profile?id=2380252068&encoded=0&v=paper_preview&mkt=zh-cn
    [10] Wang C L, Liang Z Y, Jia Q W. Dynamic feedback robust stabilization of nonholonomic mobile robots based on visual servoing. Journal of Control Theory and Applications, 2010, 8(2):139-144 http://cn.bing.com/academic/profile?id=2084185762&encoded=0&v=paper_preview&mkt=zh-cn
    [11] Liang Z Y, Wang C L. Robust stabilization of nonholonomic chained form systems with uncertainties. Acta Automatica Sinica, 2011, 37(2):129-142 http://cn.bing.com/academic/profile?id=2081318309&encoded=0&v=paper_preview&mkt=zh-cn
    [12] Dong W J. On trajectory and force tracking control of constrained mobile manipulators with parameter uncertainty. Automatica, 2002, 38(9):1475-1484 http://cn.bing.com/academic/profile?id=2093817182&encoded=0&v=paper_preview&mkt=zh-cn
    [13] Wang Y N, Peng J Z, Sun W, Yu H S, Zhang H. Robust adaptive tracking control of robotic systems with uncertainties. Journal of Control Theory and Applications, 2008, 6(3):281-286 http://cn.bing.com/academic/profile?id=1997765899&encoded=0&v=paper_preview&mkt=zh-cn
    [14] Allen P K, Timcenko A, Yoshimi B, Michelman P. Automated tracking and grasping of a moving object with a robotic hand-eye system. IEEE Transactions on Robotics and Automation, 1993, 9(2):152-165 http://cn.bing.com/academic/profile?id=2109618870&encoded=0&v=paper_preview&mkt=zh-cn
    [15] Do K D, Jiang Z P, Pan J. Simultaneous tracking and stabilization of mobile robots:an adaptive approach. IEEE Transactions on Automatic Control, 2004, 49(7):1147-1152 http://cn.bing.com/academic/profile?id=2128698518&encoded=0&v=paper_preview&mkt=zh-cn
    [16] Dixon W E, Dawson D M, Zergeroglu E, Behal A. Adaptive tracking control of a wheeled mobile robot via an uncalibrated camera system. IEEE Transactions on Systems, Man, and Cybernetics——Part B:Cybernetics, 2001, 31(3):341-352 http://cn.bing.com/academic/profile?id=2171694674&encoded=0&v=paper_preview&mkt=zh-cn
    [17] Jia Bing-Xi, Liu Shan, Zhang Kai-Xiang, Chen Jian. Survey on robot visual servo control:vision system and control strategies. Acta Automatica Sinica, 2015, 41(5):861-873(in Chinese)
    [18] Chen J, Dixon W E, Dawson M, McIntyre M. Homography-based visual servo tracking control of a wheeled mobile robot. IEEE Transactions on Robotics, 2006, 22(2):406-415 http://cn.bing.com/academic/profile?id=2097671019&encoded=0&v=paper_preview&mkt=zh-cn
    [19] Wang H S, Liu Y H, Zhou D X. Dynamic visual tracking for manipulators using an uncalibrated fixed camera. IEEE Transactions on Robotics, 2007, 23(3):610-617 http://cn.bing.com/academic/profile?id=2016213375&encoded=0&v=paper_preview&mkt=zh-cn
    [20] Wang C L, Mei Y C, Liang Z Y, Jia Q W. Dynamic feedback tracking control of non-holonomic mobile robots with unknown camera parameters. Transactions of the Institute of Measurement and Control, 2010, 32(2):155-169 http://cn.bing.com/academic/profile?id=2083474219&encoded=0&v=paper_preview&mkt=zh-cn
    [21] Yang F, Wang C L. Adaptive tracking control for dynamic nonholonomic mobile robots with uncalibrated camera parameters. In:Proceedings of the 8th Asian Control Conference. Kaohsiung, China:IEEE, 2011. 269-274 http://cn.bing.com/academic/profile?id=2141389837&encoded=0&v=paper_preview&mkt=zh-cn
    [22] Liang Z Y, Wang C L. Robust exponential stabilization of nonholonomic wheeled mobile robots with unknown visual parameters. Journal of Control Theory and Applications, 2011, 9(2):295-301 http://cn.bing.com/academic/profile?id=2061563135&encoded=0&v=paper_preview&mkt=zh-cn
    [23] Samson C. Control of chained systems application to path following and time-varying point-stabilization of mobile robots. IEEE Transactions on Automatic Control, 1995, 40(1):64-77 http://cn.bing.com/academic/profile?id=2127988032&encoded=0&v=paper_preview&mkt=zh-cn
  • 期刊类型引用(3)

    1. 董莉莉,梁振英,金增珂,徐玉镜. 不确定链式系统的动力学自适应跟踪控制. 控制工程. 2020(06): 962-970 . 百度学术
    2. 王立玲,董力元,马东,刘秀玲,王洪瑞. 移动机器人速度饱和约束下的轨迹跟踪控制. 机床与液压. 2019(21): 1-4 . 百度学术
    3. 陈志勇,张婷婷,郭益深. 弹性基和弹性关节空间机器人的自适应鲁棒抗扰控制及振动抑制. 自动化学报. 2018(07): 1271-1281 . 本站查看

    其他类型引用(4)

  • 加载中
图(16)
计量
  • 文章访问数:  1580
  • HTML全文浏览量:  139
  • PDF下载量:  791
  • 被引次数: 7
出版历程
  • 收稿日期:  2015-06-06
  • 录用日期:  2016-05-25
  • 刊出日期:  2016-10-01

目录

/

返回文章
返回