自动化学报

姓名
邮箱
手机号码
标题
留言内容
验证码

2012, 38(9).

[封面浏览] [PDF 169KB](482)

蒋亦樟, 邓赵红, 王士同

2012, 38(9): 1393-1409. doi: 10.3724/SP.J.1004.2012.01393

[摘要](2802) [PDF 1440KB](2034)

摘要:
经典模糊系统构建方法训练时通常仅考虑单一的场景,其伴随的一个重要缺陷是: 如当前场景重要信息缺失,则受训所得系统泛化能力较差.针对此问题, 以Mamdani-Larsen (ML)型模糊系统为对象,探讨了具有迁移学习能力的模糊系统, 即ML型迁移学习模糊系统. ML型迁移学习模糊系统不仅能充分利用当前场景的数据信息, 而且能有效地利用历史知识来进行学习,具有通过迁移历史场景知识来弥补当前场景信息缺失的能力.具体地,基于经典的压缩集密度估计(Reduced set density estimat...

图像去雾算法清晰化效果客观评价方法

郭璠, 蔡自兴

2012, 38(9): 1410-1419. doi: 10.3724/SP.J.1004.2012.01410

[摘要](3299) [PDF 8128KB](1452)

摘要:
针对目前去雾效果评价方法少和已有评价方法存在局限性等问题, 提出了两种图像清晰化效果评价方法.一种借助由环境渲染或光路传播图所模拟的雾环境图像,采用全参考方式评估算法的去雾效果;一种从人类视觉感知的角度出发,采用无参考方式构建综合评价体系以全面衡量算法的去雾性能.实验证明两种方法均能有效地评价各算法的清晰化效果,且评估结果与人眼的主观感受相一致.本文所提评价方法分别从构建模拟雾环境和人类视觉感知两方面考虑,与已有评价方法相比,在获得全方面评估结论的同时,具有较好的实用性和可靠性.

基于类别相关近邻子空间的最大似然稀疏表示鲁棒图像识别算法

胡正平, 宋淑芬

2012, 38(9): 1420-1427. doi: 10.3724/SP.J.1004.2012.01420

[摘要](1989) [PDF 1947KB](821)

摘要:
为了构建一个快速鲁棒的图像识别算法, 提出基于类别相关近邻子空间的最大似然稀疏表示图像识别算法. 考虑到每个测试样本的不同分布特性及训练样本选择的类别代表性原则, 不再将所有训练样本作为稀疏表示的字典, 而是基于距离相近准则选择合适子空间, 从每个类别中选取自适应数量的局部近邻构成新的字典, 在减少训练样本的同时保留了稀疏表示原有的子空间结构. 然后基于最大似然稀疏表示识别方法, 将稀疏表示的保真度表示为余项的最大似然函数, 并将识别问题转化为加权的稀疏优化问题. 在公用人脸与数字识别数据库上的...

针对大规模点集三维重建问题的分布式捆绑调整方法

刘鑫, 孙凤梅, 胡占义

2012, 38(9): 1428-1438. doi: 10.3724/SP.J.1004.2012.01428

[摘要](2041) [PDF 1368KB](972)

摘要:
捆绑调整(Bundle adjustment, BA)是三维重建中的关键步骤,它需要消耗大量的计算时间和内存存储空间.本文旨在处理三维点数比相机模型数多很多的捆绑调整问题,我们称之为针对大规模三维点集的捆绑调整(Massive-points bundle adjustment, MPBA)问题.此类问题在对高分辨率图像进行三维重建时会经常出现.为了高效地解决MPBA问题,本文提出一种分布式的捆绑调整算法.通过基于三维点集划分的分解方法,原MPBA问题被分成若干子问题.该分解方法不依赖于输...

基于minmaxKKT条件的三维重构方法

周果清, 王庆

2012, 38(9): 1439-1444. doi: 10.3724/SP.J.1004.2012.01439

[摘要](1825) [PDF 2171KB](836)

摘要:
机器视觉中, 三维重构是一个重要问题. 基于2范数的最小二乘法速度较快, 但因误差代价函数非凸, 理论上无法获得全局最优解, 即使通过分支限界等方法, 往往也只能获得局部最优. 无穷范数表示的误差代价函数理论上可以获得全局最优, 但是计算速度很慢. 本文提出一种基于最小最大库恩塔克条件(minmaxKKT)的三维重构方法. 该方法利用minmaxKKT条件对基于2范数的三维重构结果进行全局最优判别, 对陷入局部最优的结果运用混合最速下降法进行全局寻优. 该方法可以获得全局最优, 相对于无穷范数算...

基于高斯混合模型的DCT域水印检测方法

林晓丹

2012, 38(9): 1445-1448. doi: 10.3724/SP.J.1004.2012.01445

[摘要](1982) [PDF 481KB](854)

摘要:
基于音频DCT系数的统计特征,提出了一种水印检测方法.采用扩频的方法在DCT域嵌入水印, 分别对嵌入水印和未包含水印的音频信号在DCT域进行统计学习,得到对应的高斯混合模型(Gaussian mixture model, GMM). 接收端采用最大似然检测,判断是否嵌入水印并提取相应的水印信息. 仿真结果表明本文的水印检测算法对常见的信号攻击具有鲁棒性,与传统的相关检测法相比,检测可靠性更高.

区分性模型组合中基于决策树的声学上下文建模方法

黄浩, 李兵虎, 吾守尔·斯拉木

2012, 38(9): 1449-1458. doi: 10.3724/SP.J.1004.2012.01449

[摘要](1666) [PDF 922KB](777)

摘要:
上下文相关的区分性模型组合的局限在于引入大的模型权重参数集, 在数据有限时容易导致区分性权重训练过拟合. 针对该问题,本文提出利用决策树进行上下文建模, 采用最小音子错误准则构建决策树以获得最优上下文相关权重参数集. 决策树构造过程中通过评估目标函数的一阶近似增量来加速最优问题集的选择, 并利用精细问题集来获得更好的声学区分能力. 基于多模型组合的语音识别实验表明,该方法能够增强权重训练对过拟合的鲁棒性, 在大幅减小参数数量的情况下降低误识率,并优于在特征空间进行组合的方法.

二进神经网络中汉明球突的判定及其逻辑意义

杨娟, 陆阳, 俞磊, 方欢

2012, 38(9): 1459-1470. doi: 10.3724/SP.J.1004.2012.01459

[摘要](1749) [PDF 1783KB](674)

摘要:
在布尔空间中,汉明球突表达了一类结构清晰的布尔函数, 由于其特殊的几何特性,存在线性可分与线性不可分两种空间结构. 剖析汉明球突的逻辑意义对二进神经网络的规则提取十分重要, 然而,从线性可分的汉明球突中提取具有清晰逻辑意义的规则, 以及如何判定非线性可分的汉明球突,并得到其逻辑意义,仍然是二进神经网络研究中尚未很好解决的问题. 为此,本文首先根据汉明球突在汉明图上的几何特性, 采用真节点加权高度排序的方法, 提出对于任意布尔函数是否为汉明球突的判定算法;然后, 在此基础上利用已知结构的逻辑意义,...

粒子群算法的交互性与随机性分析

刘建华, 刘国买, 杨荣华, 胡文瑜

2012, 38(9): 1471-1484. doi: 10.3724/SP.J.1004.2012.01471

[摘要](2246) [PDF 4395KB](1032)

摘要:
在现有分析结论的基础上, 分别采用优化的凸性理论和概率收敛理论, 分析了粒子群 (Particle swarm optimization, PSO) 算法的交互性和随机性对算法的影响. 分析得出, 在不考虑随机性的条件下, 当 PSO 算法优化单峰函数时, 交互性使粒子最终收敛于全局最优粒子位置; 当 PSO 算法优化多峰函数时, 交互性未必使粒子最终收敛于全局最优位置. 但如果考虑随机性, 算法优化的目标函数无论是单峰函数还是多峰函数, 粒子都会依概率收敛于最优位置. 通过基准函数的实验验证了...

张量局部Fisher判别分析的人脸识别

郑建炜, 王万良, 姚晓敏, 石海燕

2012, 38(9): 1485-1495. doi: 10.3724/SP.J.1004.2012.01485

[摘要](2182) [PDF 1907KB](1205)

摘要:
子空间特征提取是人脸识别中的关键技术之一,结合局部Fisher判别分析技术和张量子空间分析技术的优点, 本文提出了一种新的张量局部Fisher判别分析(Tensor local Fisher discriminant analysis, TLFDA)子空间降维技术. 首先,通过对局部Fisher判别技术进行分析,调整了其类间散度目标泛函, 使算法的识别性能更高且时间复杂度更低;其次,引入张量型降维技术对输入数据进行双边投影变换而非单边投影, 获得了更高的数据压缩率;最后,采用迭代更新的方法计算最...

基于水平扩张毯子维的掌纹识别

郭秀梅, 周卫东, 耿淑娟, 王玉

2012, 38(9): 1496-1502. doi: 10.3724/SP.J.1004.2012.01496

[摘要](1913) [PDF 3957KB](822)

摘要:
掌纹识别作为一种新兴的生物识别技术近年来得到了广泛研究.鉴于毯子维(Blanket dimension, BD)的多分辨率特性和掌纹纹理的方向性,本文对比分析了普通毯子维、水平方向扩张毯子维和垂直方向扩张毯子维对掌纹分形特征的表达性能,提出并研究了一种基于水平扩张毯子维的掌纹识别新算法.本文算法在香港理工大学掌纹数据库(版本2)进行了实验,实验结果表明,水平扩张毯子维可以很好地提取掌纹特征,获得的识别率可达99.9%,识别时间小于287ms,可满足在线掌纹识别.

二维投影非负矩阵分解算法及其在人脸识别中的应用

方蔚涛, 马鹏, 成正斌, 杨丹, 张小洪

2012, 38(9): 1503-1512. doi: 10.3724/SP.J.1004.2012.01503

[摘要](2450) [PDF 2706KB](1173)

摘要:
建立在最小化非负矩阵分解损失函数上的人脸识别算法需同时计算基矩阵和系数矩阵, 导致求解这类问题十分耗时. 本文把非负属性引入二维主成分分析(2-dimensional principal component analysis, 2DPCA)中, 提出了一种新的二维投影非负矩阵分解(2-dimensional projective non-negative matrix factorization, 2DPNMF)人脸识别算法. 该算法在保持人脸图像的局部结构情况下, 突破了最小化非负矩阵分解损失...

一种基于扇形区域分割的SIFT特征描述符

曾峦, 顾大龙

2012, 38(9): 1513-1519. doi: 10.3724/SP.J.1004.2012.01513

[摘要](1946) [PDF 2189KB](1739)

摘要:
提出了一种在圆形区域内基于扇形区域分割的特征描述符构建方法. 首先, 针对SIFT描述符维数过高, 导致匹配速度慢的弱点, 提出在半径为9像素的圆形特征区域内划分为8个扇区, 在这些扇形特征邻域内统计8个方向的灰度梯度直方图, 形成64维描述符的方法,降低了描述符的维数. 同时, 针对SIFT构建描述符的运算复杂性较高的事实, 提出在圆形区域内计算像素灰度梯度主方向, 以主方向为基准点把该区域划分为8个等面积扇区的方法, 取消了对特征区域的旋转变换, 降低了构建描述符的运算复杂性. 通过与Ope...

改进强跟踪滤波算法及其在汽车状态估计中的应用

周聪, 肖建

2012, 38(9): 1520-1527. doi: 10.3724/SP.J.1004.2012.01520

[摘要](2306) [PDF 1225KB](1017)

摘要:
准确实时地获取汽车行驶过程中的状态变量,对汽车底盘控制有着重要的意义,而这些关键状态往往难以直接测量或者成本较高.结合纵向、侧向和横摆三自由度非线性汽车模型,将改进强跟踪滤波(Improved strong track filter, ISTF)算法应用到汽车的状态估计中,并改进了算法的稳定性.与扩展卡尔曼滤波(Extended Kalman filter, EKF)算法进行比较分析.通过Carsim和Matlab/Simulink联合仿真和实车双移线实验验证算法,结果表明,该算法在估计精...

反舰导弹航路规划的OACRR-PSO算法

刘钢, 老松杨, 袁灿, 侯绿林, 谭东风

2012, 38(9): 1528-1537. doi: 10.3724/SP.J.1004.2012.01528

[摘要](2039) [PDF 1457KB](736)

摘要:
为了提高反舰导弹航路规划算法的搜素效率,从几何学角度对航路规划空间进行了研究,在将功能区域概念融入逆向航路规划的过程中发现了功能区域的几何学渐变规律,据此提出功能区域簇作为其物理载体.将功能区域簇引入粒子群优化(Particle swarm optimization, PSO)算法,提出了功能区域簇实时约束(Operational area cluster real-time restriction, OACRR)的PSO算法(OACRR-PSO).为了便于表示功能区域簇,采用航路极坐标编码方...

自组织状态空间模型参数初始分布搜索算法

甘敏, 彭辉, 黄云志, 董学平

2012, 38(9): 1538-1543. doi: 10.3724/SP.J.1004.2012.01538

[摘要](2033) [PDF 562KB](837)

摘要:
自组织状态空间模型为估计非线性非高斯状态空间模型中的未知参数提供了一种有效方法. 针对自组织状态空间模型中参数的初始分布难以确定的难点,提出了一种搜索自组织状态空间模型参数初始分布的算法. 所用搜索算法基于一种高效的进化模型,具有全局搜索能力,使得参数的初始分布向真实参数"移动". 数值实验分析结果验证了提出方法的有效性.

基于多角度LBP特征的三维0.3人脸性别分类

赵海英, 杨一帆, 徐正光

2012, 38(9): 1544-1549. doi: 10.3724/SP.J.1004.2012.01544

[摘要](2003) [PDF 2049KB](824)

摘要:
人脸性别分类是一个富有挑战的研究方向,目前的研究尚不完善.本文提出一种三维人脸的性别分类方法, 首先对数据集进行局部区域最近邻点迭代算法(Iterative closest point, ICP)匹配,自动实现人脸正向姿态校正;对数据集人脸统一做俯仰角度的旋转, 从不同视角上提取基于深度缩略图的多角度LBP (Local binary patterns)特征;再由支持向量机(Support vector machine, SVM)分类器完成训练分类. 该方法在CASIA数据库上实验,对全库中性表...

压电陶瓷驱动平台自适应输出反馈控制

张利军, 杨立新, 郭立东, 孙立宁

2012, 38(9): 1550-1556. doi: 10.3724/SP.J.1004.2012.01550

[摘要](1821) [PDF 632KB](860)

摘要:
压电陶瓷驱动平台的精度和动态特性主要取决于所设计的控制器是否可以有效地补偿压电陶瓷固有的迟滞特性. 针对这一问题, 提出了一种基于神经网络 (Neural network, NN)的自适应输出反馈控制策略. 为了避免压电陶瓷速度测量噪声的影响, 采用高增益观测器对压电陶瓷平台的速度状态进行估计; 为了克服压电陶瓷的迟滞非线性特征, 采用神经网络动态补偿策略; 针对神经网络逼近误差和观测器估计误差, 控制器设计中增加了鲁棒控制项. 最后应用Lyapunov 稳定性理论证明了所提出的控制器的收敛性问...

留言板

2012年第38卷第9期

特别推荐

公告More

相关链接

访问统计

留言板

2012年 第38卷 第9期

特别推荐

公告More

相关链接

访问统计

2012年第38卷第9期