自动化学报

姓名
邮箱
手机号码
标题
留言内容
验证码

2014, 40(6).

[封面浏览] [PDF 1732KB](301)

刘建伟, 黎海恩, 罗雄麟

2014, 40(6): 1025-1044. doi: 10.3724/SP.J.1004.2014.01025 cstr: 32138.14.SP.J.1004.2014.01025

[摘要](2926) [PDF 1200KB](2259)

摘要:
概率图模型能有效处理不确定性推理，从样本数据中准确高效地学习概率图模型是其在实际应用中的关键问题.概率图模型的表示由参数和结构两部分组成，其学习算法也相应分为参数学习与结构学习.本文详细介绍了基于概率图模型网络的参数学习与结构学习算法，并根据数据集是否完备而分别讨论各种情况下的参数学习算法，还针对结构学习算法特点的不同把结构学习算法归纳为基于约束的学习、基于评分搜索的学习、混合学习、动态规划结构学习、模型平均结构学习和不完备数据集的结构学习.并总结了马尔科夫网络的参数学习与结构学习算法.最后指出了概率图模型学习的开放性问题以及进一步的研究方向.

基于运动相关皮层电位握力运动模式识别研究

伏云发, 徐保磊, 李永程, 李洪谊, 王越超, 余正涛

2014, 40(6): 1045-1057. doi: 10.3724/SP.J.1004.2014.01045 cstr: 32138.14.SP.J.1004.2014.01045

[摘要](2517) [PDF 3066KB](1593)

摘要:
面向基于脑-机接口（Brain-computer interface，BCI）的脑-机交互控制（Brain-machine interaction control，BMIC）——直接脑控机器人，提出一种新的左、右手握力运动参数范式，在该范式下探索左、右手握力运动相关皮层电位/运动相关电位（Movement-related potentials，MRPs）的时域特征表示并识别握力运动模式.在涉及左、右手4个不同任务的实验中采集了11个健康被试的脑电信号，任务期间要求被试以2种握力变化模式之一完成自愿握力运动，每种任务随机重复30次.不同握力任务之间具有显著差异的运动相关电位特征用于识别握力运动模式.分别用基于核的Fisher线性判别分析和支持向量机识别4个不同的握力运动任务.研究结果进一步证实运动相关电位可以表征握力运动规划、运动执行和运动监控的脑神经机制过程.基于核的Fisher线性判别分析和支持向量机分别获得24±4%和21±5%的平均错误分类率.最小误分类率是12%，所有被试平均最小误分类率为20.9±5%.与传统的仅仅识别参与运动的肢体类型以及识别单侧肢体运动参数的研究相比，本研究可望为脑-机交互控制/脑控机器人接口提供更多的力控制意图指令，奠定了后续的对比研究基础.

基于区域生长的多源遥感图像配准

倪鼎, 马洪兵

2014, 40(6): 1058-1067. doi: 10.3724/SP.J.1004.2014.01058 cstr: 32138.14.SP.J.1004.2014.01058

[摘要](2245) [PDF 6207KB](1101)

摘要:
多源遥感图像由于成像设备、所用光谱、拍摄时间等因素的不同，给配准带来极大的困难.尽管已经提出了多种匹配方法，但已有方法一般只能适用于特定的应用环境，开发出更加稳定和适用的配准算法仍然是一个极具挑战性的研究课题.提出一种基于区域生长的配准方法，首先，提取改进后的尺度不变特征，通过全局匹配确定种子点和种子区域并完成变换模型的初始化；然后，运用迭代区域生长和双向匹配策略，得到整个图像的可靠匹配点，从而实现多源遥感图像之间的配准.实验表明，该方法提取的匹配点的数量和正确率均远高于已有方法，能够对存在严重灰度差异的多源遥感图像实现高精度的配准，充分证明了该方法的鲁棒性和适用性.

高斯PLDA在说话人确认中的应用及其联合估计

许云飞, 杨海, 周若华, 颜永红

2014, 40(6): 1068-1074. doi: 10.3724/SP.J.1004.2014.01068 cstr: 32138.14.SP.J.1004.2014.01068

[摘要](2095) [PDF 640KB](1318)

摘要:
近年来，基于总变化因子的说话人识别方法成为说话人识别领域的主流方法.其中，概率线性鉴别分析（Probabilistic linear discriminant analysis，PLDA）因其优异的性能而得到学者们的广泛关注.然而，在估计PLDA模型时，传统的因子分析方法只更新模型空间，因此，模型均值不能很好地与更新后的模型空间耦合.提出联合估计法对模型均值和模型空间同时估计，得到更为严格的期望最大化更新公式，在美国国家标准与技术局说话人识别评测2010扩展测试数据库以及2012核心测试数据库上，等错率得到一定提升.

多标签代价敏感分类集成学习算法

付忠良

2014, 40(6): 1075-1085. doi: 10.3724/SP.J.1004.2014.01075 cstr: 32138.14.SP.J.1004.2014.01075

[摘要](2597) [PDF 894KB](1250)

摘要:
尽管多标签分类问题可以转换成一般多分类问题解决，但多标签代价敏感分类问题却很难转换成多类代价敏感分类问题.通过对多分类代价敏感学习算法扩展为多标签代价敏感学习算法时遇到的一些问题进行分析，提出了一种多标签代价敏感分类集成学习算法.算法的平均错分代价为误检标签代价和漏检标签代价之和，算法的流程类似于自适应提升（Adaptive boosting，AdaBoost）算法，其可以自动学习多个弱分类器来组合成强分类器，强分类器的平均错分代价将随着弱分类器增加而逐渐降低.详细分析了多标签代价敏感分类集成学习算法和多类代价敏感AdaBoost算法的区别，包括输出标签的依据和错分代价的含义.不同于通常的多类代价敏感分类问题，多标签代价敏感分类问题的错分代价要受到一定的限制，详细分析并给出了具体的限制条件.简化该算法得到了一种多标签AdaBoost算法和一种多类代价敏感AdaBoost算法.理论分析和实验结果均表明提出的多标签代价敏感分类集成学习算法是有效的，该算法能实现平均错分代价的最小化.特别地，对于不同类错分代价相差较大的多分类问题，该算法的效果明显好于已有的多类代价敏感AdaBoost算法.

基于泡沫图像特征的浮选槽液位智能优化设定方法

赵洪伟, 谢永芳, 蒋朝辉, 徐德刚, 阳春华, 桂卫华

2014, 40(6): 1086-1097. doi: 10.3724/SP.J.1004.2014.01086 cstr: 32138.14.SP.J.1004.2014.01086

[摘要](1849) [PDF 3201KB](948)

摘要:
浮选生产过程中浮选槽液位通常根据经验人工设定，具有主观随意性﹑液位波动大，使精/尾矿品位不满足要求.为此，提出一种基于浮选泡沫图像多特征的浮选槽液位智能优化设定的方法.在浮选槽工作原理以及液位与泡沫图像特征间关系的分析基础上，将基于案例推理的浮选槽液位预设定﹑基于多泡沫图像特征的改进LS-SVM（Least squares support vector machine）品位预测及基于BP神经网络的自学习模糊推理智能补偿等模型有机集成，提出了充分利用泡沫图像特征的液位智能优化设定方法.将该方法在某铝土矿浮选生产过程进行应用验证，可使粗选槽液位波动减小，提高了粗选精/尾矿品位合格率、总精矿品位合格率及回收率.

基于视觉显著性的两阶段采样突变目标跟踪算法

江晓莲, 李翠华, 李雄宗

2014, 40(6): 1098-1107. doi: 10.3724/SP.J.1004.2014.01098 cstr: 32138.14.SP.J.1004.2014.01098

[摘要](2430) [PDF 19221KB](5124)

摘要:
针对运动突变目标视觉跟踪问题，提出一种基于视觉显著性的两阶段采样跟踪算法.首先，将视觉显著性信息引入到Wang-Landau蒙特卡罗（Wang-Landau Monte Carlo，WLMC）跟踪算法中，设计了结合显著性先验的接受函数，利用子区域的显著性值来引导马尔可夫链的构造，通过增大目标出现区粒子的接受概率，提高采样效率；其次，针对运动序列中平滑与突变运动共存的特点，建立两阶段采样模型.其中第一阶段对目标当前运动类型进行判定，第二阶段则根据判定结果采用相应算法.突变运动采用基于视觉显著性的WLMC算法，平滑运动采用双链马尔可夫链蒙特卡罗（Marko chain Monte Carlo，MCMC）算法，以此完成目标跟踪，提高算法的鲁棒性.该算法既避免了目标在平滑运动时全局采样导致精度下降的缺点，又能在目标发生运动突变时有效捕获目标.实验结果表明，该算法不仅能有效处理运动突变目标的跟踪问题，在典型图像序列上也具有良好的鲁棒性.

一种新的FAST-Snake目标跟踪方法

王蒙, 戴亚平, 王庆林

2014, 40(6): 1108-1115. doi: 10.3724/SP.J.1004.2014.01108 cstr: 32138.14.SP.J.1004.2014.01108

[摘要](2227) [PDF 4377KB](1244)

摘要:
提出一种新的FAST-Snake目标跟踪方法，利用改进的FAST角点特征匹配来估计目标轮廓在帧间的全局仿射变换，将投影轮廓点作为Snake模型的初始化轮廓.为提高跟踪实时性，在Snake能量模型中定义了先验约束能，并用限定搜索方向的贪婪算法（Greedy algorithm）实现局部轮廓优化.实验包括三维目标数据库及真实场景视频，验证了提出方法的均方误差（Means quare error，MSE）及收敛速度评估均优于对比算法，并具备对复杂运动及局部遮挡的适应能力.

考虑局部均值和类全局信息的快速近邻原型选择算法

李娟, 王宇平

2014, 40(6): 1116-1125. doi: 10.3724/SP.J.1004.2014.01116 cstr: 32138.14.SP.J.1004.2014.01116

[摘要](1959) [PDF 3129KB](814)

摘要:
压缩近邻法是一种简单的非参数原型选择算法，其原型选取易受样本读取序列、异常样本等干扰.为克服上述问题，提出了一个基于局部均值与类全局信息的近邻原型选择方法.该方法既在原型选取过程中，充分利用了待学习样本在原型集中k个同异类近邻局部均值和类全局信息的知识，又设定原型集更新策略实现对原型集的动态更新.该方法不仅能较好克服读取序列、异常样本对原型选取的影响，降低了原型集规模，而且在保持高分类精度的同时，实现了对数据集的高压缩效应.图像识别及UCI（University of California Irvine）基准数据集实验结果表明，所提出算法集具有较比较算法更有效的分类性能.

热含量不变量的SAR图像点特征变化检测

罗湾, 林伟, 张红波

2014, 40(6): 1126-1134. doi: 10.3724/SP.J.1004.2014.01126 cstr: 32138.14.SP.J.1004.2014.01126

[摘要](1815) [PDF 2430KB](820)

摘要:
针对区域变化检测受分类器精度影响大、无法探测出内部细微变化这一问题，本文提出了基于热含量不变量的合成孔径雷达（Synthetic aperture radar，SAR）图像点特征变化检测.该方法利用热核特征，具有计算简便、矩阵扰动性小的特点，且有效地降低了噪声的干扰.由热核不变量的统计特性，采用期望极大化（Expectation maximization，EM）算法解决了SAR图像的自动变化检测.同时通过对权的讨论，给出了适用于SAR图像的权函数定义.对单波段单极化SAR与多极化SAR图像，本文算法相比于基于像素和似然比的方法，能够更快速更精确地检测到变化区域.

基于逆运动学和重构式ICA的人体运动风格分析与合成

蓝荣祎, 孙怀江

2014, 40(6): 1135-1147. doi: 10.3724/SP.J.1004.2014.01135 cstr: 32138.14.SP.J.1004.2014.01135

[摘要](1875) [PDF 6241KB](1148)

摘要:
使用独立成分分析（Independent component analysis，ICA）来建模运动风格、合成风格化的人体运动，是一种有效且有前景的手段.为了避免现有方法在设定独立成分个数或子空间结构时的人为影响，并提高风格成分的质量，提出一种基于重构式独立成分分析的运动风格分析方法.由于放弃了混合矩阵的正交性约束，一方面，拥有了更多的自由度来表示各独立成分；另一方面，利用特征的过完备性以及自身在特征选择时的稀疏特性，能够自动地确立独立成分数目.此外，通过结合基于主测地线分析的逆运动学与运动过渡技术，该方法能够合成包含多种风格、任意长度的行走运动，同时还能通过编辑特定帧的人体姿势来约束合成的结果.实验结果表明，该方法能够有效地分析出行走、跳跃和踢腿等运动中代表风格的独立成分，并根据用户对风格的编辑，实时地生成自然、平滑的运动.

一种基于Local Jet结构的全局图像特征构造方法

谢锦, 蔡自兴

2014, 40(6): 1148-1155. doi: 10.3724/SP.J.1004.2014.01148 cstr: 32138.14.SP.J.1004.2014.01148

[摘要](2077) [PDF 2772KB](760)

摘要:
提出一种鲁棒的特征描述符MSALJS （Multi-Scale Autoconvolution on Local Jet Structure)，该描述符对仿射变换具有近似不变性. MSALJS是一种全局图像特征描述符，它基于描述图像局部结构的微分进行多尺度自卷积矩计算. 实验结果表明，MSALJS能适用于目标识别实际应用时图像发生部分遮挡、视角变化等变形情形.

结合局部分类水平集与颜色特征的遥感影像阴影检测

方菊芹, 陈帆, 和红杰, 尹忠科

2014, 40(6): 1156-1165. doi: 10.3724/SP.J.1004.2014.01156 cstr: 32138.14.SP.J.1004.2014.01156

[摘要](2259) [PDF 7688KB](622)

摘要:
为提高对非匀质阴影与亮阴影的检测效果，提出结合局部分类水平集与颜色特征的遥感影像阴影检测方法，首先，结合阴影区域的亮度非均匀性，采用局部分类水平集分割遥感图像的阴影区域；然后，通过分析绿地与阴影颜色特征分量的差别以去除候选阴影区中被误检的绿地.实验结果表明所提出的方法优于现有的黑体辐射模型与自适应特征选择法，有效克服了传统方法对非匀质阴影与亮阴影的漏检问题，且整个检测过程无需人工干预.

使用半高斯核的冲击扩散滤波图像盲复原方法

徐焕宇, 孙权森, 陈强, 罗楠, 夏德深

2014, 40(6): 1166-1175. doi: 10.3724/SP.J.1004.2014.01166 cstr: 32138.14.SP.J.1004.2014.01166

[摘要](1797) [PDF 10729KB](835)

摘要:
提出一种冲击扩散模型对含有模糊与噪声的退化图像进行盲复原.该方法使用半高斯核提取图像边缘的精确方向，并且对不同的图像区域使用不同的冲击扩散策略.实验结果表明，所提出的方法能够有效地消除图像中的噪声并增强边缘，同时能够保存小物体与角落等图像结构.相比于其他方法，所提出方法的复原图像拥有更好的视觉效果与更高图像评价指标.

一种面向多源领域的实例迁移学习

张倩, 李明, 王雪松, 程玉虎, 朱美强

2014, 40(6): 1176-1183. doi: 10.3724/SP.J.1004.2014.01176 cstr: 32138.14.SP.J.1004.2014.01176

[摘要](3743) [PDF 2116KB](1370)

摘要:
在迁移学习最大的特点就是利用相关领域的知识来帮助完成目标领域中的学习任务，它能够有效地在相似的领域或任务之间进行信息的共享和迁移，使传统的从零开始的学习变成可积累的学习，具有成本低、效率高等优点.针对源领域数据和目标领域数据分布类似的情况，提出一种基于多源动态TrAdaBoost的实例迁移学习方法.该方法考虑多个源领域知识，使得目标任务的学习可以充分利用所有源领域信息，每次训练候选分类器时，所有源领域样本都参与学习，可以获得有利于目标任务学习的有用信息，从而避免负迁移的产生.理论分析验证了所提算法较单源迁移的优势，以及加入动态因子改善了源权重收敛导致的权重熵由源样本转移到目标样本的问题.实验结果验证了此算法在提高识别率方面的优势.

抗拼贴攻击的二值图像认证算法

秦瑶, 和红杰, 陈帆

2014, 40(6): 1184-1190. doi: 10.3724/SP.J.1004.2014.01184 cstr: 32138.14.SP.J.1004.2014.01184

[摘要](1874) [PDF 3051KB](569)

摘要:
为提高算法抵抗拼贴攻击的能力，本文结合块相关思想提出一种二值图像认证算法.该算法首先将每个图像块中的像素点分为“可翻转”和“不可翻转”两类，将“不可翻转”像素点 Hash 生成水印信息，用其替代相应映射块的“可翻转”像素点实现水印嵌入.通过比较图像块重构水印及提取水印的一致性判断该图像块的真实性，并结合各图像块邻域篡改特征进一步提高篡改检测性能.实验结果表明，该算法不仅提高了在替换、添加、删除攻击下的篡改检测性能，而且能够有效抵抗拼贴攻击.

一种参数自适应的简化PCNN图像分割方法

周东国, 高潮, 郭永彩

2014, 40(6): 1191-1197. doi: 10.3724/SP.J.1004.2014.01191 cstr: 32138.14.SP.J.1004.2014.01191

[摘要](2101) [PDF 2195KB](1422)

摘要:
为了进一步延伸脉冲耦合神经网络（Pulse coupled neural network，PCNN）在图像分割中的应用，本文对PCNN模型作了简化和改进，并探讨和分析了参数的设置方法.首先利用阈值和脉冲输出所对应的区域均值之间的关系，提出了一种优化连接系数的方法，使得模型最终以迭代的方式得到分割结果.在仿真和真实红外图像上实验结果表明，文中方法能取得较优的分割效果，且相比于常用的阈值方法以及较新的PCNN方法，文中的简化模型对噪声及复杂图像具有更好的适应性和鲁棒性.

基于双因子高斯过程动态模型的声道谱转换方法

孙新建, 张雄伟, 杨吉斌, 曹铁勇, 钟新毅

2014, 40(6): 1198-1207. doi: 10.3724/SP.J.1004.2014.01198 cstr: 32138.14.SP.J.1004.2014.01198

[摘要](1919) [PDF 1374KB](765)

摘要:
针对作者已经提出的双因子高斯过程隐变量模型（Two-factor Gaussian process latent variable model，TF-GPLVM）用于语音转换时未考虑语音的动态特征，并且模型训练时需要估计的参数较多的问题，提出引入隐马尔科夫模型（Hidden Markov model，HMM）对语音动态特征进行建模，并利用HMM隐状态对各帧语音进行关于语义内容的概率软分类，建立了分离精度更高、运算负荷较小的双因子高斯过程动态模型（Two-factor Gaussian process dynamic model，TF-GPDM）.基于此模型，设计了一种全新的基于说话人特征替换的语音声道谱转换方案.主、客观实验结果表明，无论是与传统的统计映射和频率弯折转换方法相比，还是与双因子高斯过程隐变量模型方法相比，本文方法都获得了语音质量和转换相似度的提升，以及两项性能的更佳平衡.

基于MCE准则的语音识别特征线性判别分析

陈斌, 张连海, 牛铜, 屈丹, 李弼程

2014, 40(6): 1208-1215. doi: 10.3724/SP.J.1004.2014.01208 cstr: 32138.14.SP.J.1004.2014.01208

[摘要](1898) [PDF 1367KB](849)

摘要:
提出了一种基于最小分类错误（Minimum classification error，MCE）准则的线性判别分析方法（Linear discriminant analysis，LDA），并将其应用到连续语音识别中的特征变换.该方法采用非参数核密度估计方法进行数据概率分布估计；根据得到的概率分布，在最小分类错误准则下，采用基于梯度下降的线性搜索算法求解判别分析变换矩阵.利用判别分析变换矩阵对相邻帧梅尔滤波器组输出拼接的超矢量变换降维，得到时频特征.实验结果表明，与传统的MFCC特征相比，经过本文判别分析提取的时频特征其识别准确率提高了1.41%，相比于HLDA（Heteroscedastic LDA）和近似成对经验正确率准则（Approximate pairwise empirical accuracy criterion，aPEAC）判别分析方法，识别准确率分别提高了1.14%和0.83%.

基于SURF特征和Delaunay三角网格的图像匹配

闫自庚, 蒋建国, 郭丹

2014, 40(6): 1216-1222. doi: 10.3724/SP.J.1004.2014.01216 cstr: 32138.14.SP.J.1004.2014.01216

[摘要](2474) [PDF 4033KB](1093)

摘要:
图像特征匹配的核心是通过距离函数实现在高维矢量空间进行相似性检索.重点研究提取好的特征点并快速准确地找到查询点的近邻.首先，提取图像的多量、有区别且稳健的SURF（Speeded up robust feature）特征点，并将特征点凸包进行Delaunay剖分.然后，对Delaunay三角边抽样、聚类、量化并构建索引.通过票决算法，将点对匹配与否映射到矩阵中以解决距离度量没有利用数据集本身所蕴含的任何结构信息和搜索效率相对较低的问题.结合SURF算法和Delaunay三角网提出一种特征匹配的新方法，在标准图像集上的实验验证，在耗时基本相同的情况下，提取的特征点较多且正确匹配率较高.

基于两段多组件图割的非监督彩色图像分割算法

董卓莉, 李磊, 张德贤

2014, 40(6): 1223-1232. doi: 10.3724/SP.J.1004.2014.01223 cstr: 32138.14.SP.J.1004.2014.01223

[摘要](2073) [PDF 6234KB](722)

摘要:
提出基于两段多组件图割的彩色图像分割算法，以解决因标签过多和噪声导致的过分割和图割算法低效等问题.多组件图割算法分割图像时，把标签相同的区域处理为该标签的多个组件，结合两层高斯金字塔形成两段多组件图割，以减少分割错误和标签数量，提高分割的性能.算法首先提取基于多尺度四元数Gabor滤波的texton纹理特征，并自适应融合颜色特征；然后使用两段多组件图割获取图像的优化分割，其中，为了引导图割优化的方向，在平滑项中引入彩色梯度信息；最后去除分割结果中的弱边界，获得最终的分割结果.实验结果表明，相对于比较算法，新算法的分割性能有明显提升.

结合FCMS与变分水平集的图像分割模型

唐利明, 田学全, 黄大荣, 王晓峰

2014, 40(6): 1233-1248. doi: 10.3724/SP.J.1004.2014.01233 cstr: 32138.14.SP.J.1004.2014.01233

[摘要](1934) [PDF 19398KB](688)

摘要:
提出了一个结合融合空间约束的模糊C均值（Fuzzy C means with spatial constraints，FCMS）聚类与变分水平集的图像模糊聚类分割模型.在该模型中引入了一个基于图像局部信息和空间信息的外部模糊聚类能量，从而可以获取精确的局部图像的空间特征，使得本文模型对噪声图像的聚类分割具有较强的鲁棒性.采用不同类型的实验图像，将本文模型与10个不同类型的图像分割模型进行了对比实验，实验结果显示本文模型能克服图像中噪声影响并取得较满意的聚类分割结果.

分维自适应稀疏网格积分非线性滤波器

徐嵩, 孙秀霞, 刘树光, 刘希, 蔡鸣

2014, 40(6): 1249-1264. doi: 10.3724/SP.J.1004.2014.01249 cstr: 32138.14.SP.J.1004.2014.01249

[摘要](2479) [PDF 6089KB](1558)

摘要:
针对含加性高斯噪声的非线性离散系统，提出了可分别根据各维状态及量测方程的非线性函数特性来确定采样点及其权重的积分滤波器.设计了基于嵌入式高斯采样积分和稀疏网格法则的自适应多变量采样积分方法，可在匹配函数高阶泰勒展开项时，利用低阶采样点，提出了高效的数据结构和遍历算法，便于采用该积分方法分别估计系统状态/量测的预测均值和协方差矩阵.该滤波器既能根据各维非线性函数的特性确定采样点，又实现了对采样值和权重的完全复用，保证了算法效率.理论分析和仿真表明，该滤波算法中自适应调整的运算量小于计算非线性函数采样值.该滤波器与无迹卡尔曼滤波相比，提高了滤波精度，与固定形式的稀疏网格滤波器相比，提高了采样效率，且该方法为两者的广义形式.仿真实验也验证了状态估计的精确性和函数采样的高效性.

留言板

2014年第40卷第6期

特别推荐

公告More

相关链接

访问统计

留言板

2014年 第40卷 第6期

特别推荐

公告More

相关链接

访问统计

2014年第40卷第6期