2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

2012年  第38卷  第9期

显示方式:
目录
目录
2012, 38(9).
长论文
ML 型迁移学习模糊系统
蒋亦樟, 邓赵红, 王士同
2012, 38(9): 1393-1409. doi: 10.3724/SP.J.1004.2012.01393
摘要:
经典模糊系统构建方法训练时通常仅考虑单一的场景,其伴随的一个重要缺陷是: 如当前场景重要信息缺失,则受训所得系统泛化能力较差.针对此问题, 以Mamdani-Larsen (ML)型模糊系统为对象,探讨了具有迁移学习能力的模糊系统, 即ML型迁移学习模糊系统. ML型迁移学习模糊系统不仅能充分利用当前场景的数据信息, 而且能有效地利用历史知识来进行学习,具有通过迁移历史场景知识来弥补当前场景信息 缺失的能力.具体地,基于经典的压缩集密度估计(Reduced set density estimator, RSDE) ML型模糊系统构建方法, 通过引入迁移学习机制提出了一种基于密度估计的ML型迁移模糊系统构建方法. 在模拟数据和真实数据上的实验研究亦验证了该迁移模糊系统在信息缺失场景下较之于 传统模糊系统建模方法的更好适应性.
论文与报告
图像去雾算法清晰化效果客观评价方法
郭璠, 蔡自兴
2012, 38(9): 1410-1419. doi: 10.3724/SP.J.1004.2012.01410
摘要:
针对目前去雾效果评价方法少和已有评价方法存在局限性等问题, 提出了两种图像清晰化效果评价方法.一种借助由环境渲染或光路传播图所模拟的雾 环境图像,采用全参考方式评估算法的去雾效果;一种从人类视觉感知的角度出发,采 用无参考方式构建综合评价体系以全面衡量算法的去雾性能.实验证明两种方法均能 有效地评价各算法的清晰化效果,且评估结果与人眼的主观感受相一致.本文所提评 价方法分别从构建模拟雾环境和人类视觉感知两方面考虑,与已有评价方法相比,在 获得全方面评估结论的同时,具有较好的实用性和可靠性.
基于类别相关近邻子空间的最大似然稀疏表示鲁棒图像识别算法
胡正平, 宋淑芬
2012, 38(9): 1420-1427. doi: 10.3724/SP.J.1004.2012.01420
摘要:
为了构建一个快速鲁棒的图像识别算法, 提出基于类别相关近邻子空间的最大似然稀疏表示图像识别算法. 考虑到每个测试样本的不同分布特性及训练样本选择的类别代表性原则, 不再将所有训练样本作为稀疏表示的字典, 而是基于距离相近准则选择合适子空间, 从每个类别中选取自适应数量的局部近邻构成新的字典, 在减少训练样本的同时保留了稀疏表示原有的子空间结构. 然后基于最大似然稀疏表示识别方法, 将稀疏表示的保真度表示为余项的最大似然函数, 并将识别问题转化为加权的稀疏优化问题. 在公用人脸与数字识别数据库上的实验证明该算法的合理性, 提高识别速度的同时保证了识别精度和算法的鲁棒性, 特别是对于遮挡与干扰图像具有较好的适应性.
针对大规模点集三维重建问题的分布式捆绑调整方法
刘鑫, 孙凤梅, 胡占义
2012, 38(9): 1428-1438. doi: 10.3724/SP.J.1004.2012.01428
摘要:
捆绑调整(Bundle adjustment, BA)是三维重建中的关键步骤,它需要消耗大量的计算时间和内存存储空间.本 文旨在处理三维点数比相机模型数多很多的捆绑调整问题,我们称之为针对大规模三维点集的捆 绑调整(Massive-points bundle adjustment, MPBA)问题.此类问题在对高分辨率图像进行三 维重建时会经常出现.为了高效地解决MPBA问题,本文提出一种分布式的捆绑调整算法.通过基 于三维点集划分的分解方法,原MPBA问题被分成若干子问题.该分解方法不依赖于输入参数的内在 联系,因而分解结果与具体BA问题无关.算法被映射于两个集群上,一个集群有5台计算机,另一个集 群有3台计算机,其中每台机器都配置一块图形处理器(Graphic processing unit, GPU).通过对若 干MPBA问题的实验,与经典捆绑调整算法SBA (Sparse bundle adjustment)相比,本文算法获得了 最高达75倍的加速比,并保持了算法的高精确度.而且,本文算法的两个实现所消耗的单机内存存储 空间,仅为SBA实现的1/7和1/4.
基于minmaxKKT条件的三维重构方法
周果清, 王庆
2012, 38(9): 1439-1444. doi: 10.3724/SP.J.1004.2012.01439
摘要:
机器视觉中, 三维重构是一个重要问题. 基于2范数的最小二乘法速度较快, 但因误差代价函数非凸, 理论上无法获得全局最优解, 即使通过分支限界等方法, 往往也只能获得局部最优. 无穷范数表示的误差代价函数理论上可以获得全局最优, 但是计算速度很慢. 本文提出一种基于最小最大库恩塔克条件(minmaxKKT)的三维重构方法. 该方法利用minmaxKKT条件对基于2范数的三维重构结果进行全局最优判别, 对陷入局部最优的结果运用混合最速下降法进行全局寻优. 该方法可以获得全局最优, 相对于无穷范数算法具有更高的计算效率. 对标准数据集和真实数据的实验结果证明了本文算法的可行性和优点.
基于高斯混合模型的DCT域水印检测方法
林晓丹
2012, 38(9): 1445-1448. doi: 10.3724/SP.J.1004.2012.01445
摘要:
基于音频DCT系数的统计特征,提出了一种水印检测方法.采用扩频的方法在DCT域嵌入水印, 分别对嵌入水印和未包含水印的音频信号在DCT域进行统计学习,得到对应的高斯混合模型(Gaussian mixture model, GMM). 接收端采用最大似然检测,判断是否嵌入水印并提取相应的水印信息. 仿真结果表明本文的水印检测算法对常见的信号攻击具有鲁棒性,与传统的相关检测法相比,检测可靠性更高.
区分性模型组合中基于决策树的声学上下文建模方法
黄浩, 李兵虎, 吾守尔·斯拉木
2012, 38(9): 1449-1458. doi: 10.3724/SP.J.1004.2012.01449
摘要:
上下文相关的区分性模型组合的局限在于引入大的模型权重参数集, 在数据有限时容易导致区分性权重训练过拟合. 针对该问题,本文提出利用决策树进行上下文建模, 采用最小音子错误准则构建决策树以获得最优上下文相关权重参数集. 决策树构造过程中通过评估目标函数的一阶近似增量来加速最优问题集的选择, 并利用精细问题集来获得更好的声学区分能力. 基于多模型组合的语音识别实验表明,该方法能够增强权重训练对过拟合的鲁棒性, 在大幅减小参数数量的情况下降低误识率,并优于在特征空间进行组合的方法.
二进神经网络中汉明球突的判定及其逻辑意义
杨娟, 陆阳, 俞磊, 方欢
2012, 38(9): 1459-1470. doi: 10.3724/SP.J.1004.2012.01459
摘要:
在布尔空间中,汉明球突表达了一类结构清晰的布尔函数, 由于其特殊的几何特性,存在线性可分与线性不可分两种空间结构. 剖析汉明球突的逻辑意义对二进神经网络的规则提取十分重要, 然而,从线性可分的汉明球突中提取具有清晰逻辑意义的规则, 以及如何判定非线性可分的汉明球突,并得到其逻辑意义,仍然是二进神经网络研究中尚未很好解决的问题. 为此,本文首先根据汉明球突在汉明图上的几何特性, 采用真节点加权高度排序的方法, 提出对于任意布尔函数是否为汉明球突的判定算法;然后, 在此基础上利用已知结构的逻辑意义, 将汉明球突分解为若干个已知结构的并集,从而得到汉明球突的逻辑意义; 最后,通过实例说明判定任意布尔函数是否为汉明球突的过程, 并相应得到汉明球突的逻辑表达.
粒子群算法的交互性与随机性分析
刘建华, 刘国买, 杨荣华, 胡文瑜
2012, 38(9): 1471-1484. doi: 10.3724/SP.J.1004.2012.01471
摘要:
在现有分析结论的基础上, 分别采用优化的凸性理论和概率收敛理论, 分析了粒子群 (Particle swarm optimization, PSO) 算法的交互性和随机性对算法的影响. 分析得出, 在不考虑随机性的条件下, 当 PSO 算法优化单峰函数时, 交互性使粒子最终收敛于全局最优粒子位置; 当 PSO 算法优化多峰函数时, 交互性未必使粒子最终收敛于全局最优位置. 但如果考虑随机性, 算法优化的目标函数无论是单峰函数还是多峰函数, 粒子都会依概率收敛于最优位置. 通过基准函数的实验验证了分析的结论.
张量局部Fisher判别分析的人脸识别
郑建炜, 王万良, 姚晓敏, 石海燕
2012, 38(9): 1485-1495. doi: 10.3724/SP.J.1004.2012.01485
摘要:
子空间特征提取是人脸识别中的关键技术之一,结合局部Fisher判别分析技术和张量子空间分析技术的优点, 本文提出了一种新的张量局部Fisher判别分析(Tensor local Fisher discriminant analysis, TLFDA)子空间降维技术. 首先,通过对局部Fisher判别技术进行分析,调整了其类间散度目标泛函, 使算法的识别性能更高且时间复杂度更低;其次,引入张量型降维技术对输入数据进行双边投影变换而非单边投影, 获得了更高的数据压缩率;最后,采用迭代更新的方法计算最优的变换矩阵.通过ORL和PIE两个人脸库验证了所提算法的有效性.
基于水平扩张毯子维的掌纹识别
郭秀梅, 周卫东, 耿淑娟, 王玉
2012, 38(9): 1496-1502. doi: 10.3724/SP.J.1004.2012.01496
摘要:
掌纹识别作为一种新兴的生物识别技术近年来得到了广泛研究.鉴于毯子 维(Blanket dimension, BD)的多分辨率特性和掌纹纹理的方向性,本文对比分析了普通毯子维、水平方向扩张 毯子维和垂直方向扩张毯子维对掌纹分形特征的表达性能,提出并研究了一种基于水平扩张 毯子维的掌纹识别新算法.本文算法在香港理工大学掌纹数据库(版本2)进行了实验,实验结 果表明,水平扩张毯子维可以很好地提取掌纹特征,获得的识别率可达99.9%,识别时间 小于287ms,可满足在线掌纹识别.
二维投影非负矩阵分解算法及其在人脸识别中的应用
方蔚涛, 马鹏, 成正斌, 杨丹, 张小洪
2012, 38(9): 1503-1512. doi: 10.3724/SP.J.1004.2012.01503
摘要:
建立在最小化非负矩阵分解损失函数上的人脸识别算法需同时计算基矩阵和系数矩阵, 导致求解这类问题十分耗时. 本文把非负属性引入二维主成分分析(2-dimensional principal component analysis, 2DPCA)中, 提出了一种新的二维投影非负矩阵分解(2-dimensional projective non-negative matrix factorization, 2DPNMF)人脸识别算法. 该算法在保持人脸图像的局部结构情况下, 突破了最小化非负矩阵分解损失函数的约束, 仅需计算投影矩阵(基矩阵), 从而降低了计算复杂度. 本文从理论上证明了所提出算法的收敛性, 同时, 使用了YALE、FERET和AR三个人脸库进行实验, 结果表明2DPNMF不仅识别率高, 而且速度优于非负矩阵分解和二维主成分分析.
一种基于扇形区域分割的SIFT特征描述符
曾峦, 顾大龙
2012, 38(9): 1513-1519. doi: 10.3724/SP.J.1004.2012.01513
摘要:
提出了一种在圆形区域内基于扇形区域分割的特征描述符构建方法. 首先, 针对SIFT描述符维数过高, 导致匹配速度慢的弱点, 提出在半径为9像素的圆形特征区域内划分为8个扇区, 在这些扇形特征邻域内统计8个方向的灰度梯度直方图, 形成64维描述符的方法,降低了描述符的维数. 同时, 针对SIFT构建描述符的运算复杂性较高的事实, 提出在圆形区域内计算像素灰度梯度主方向, 以主方向为基准点把该区域划分为8个等面积扇区的方法, 取消了对特征区域的旋转变换, 降低了构建描述符的运算复杂性. 通过与OpenCV SIFT和Lowe SIFT进行多方面对比实验, 结果表明该方法的综合匹配速度具有显著提升, 在两幅图像存在一定程度的视点、模糊、旋转、比例、光照变化等情形下, 匹配性能有所增强.
改进强跟踪滤波算法及其在汽车状态估计中的应用
周聪, 肖建
2012, 38(9): 1520-1527. doi: 10.3724/SP.J.1004.2012.01520
摘要:
准确实时地获取汽车行驶过程中的状态变量,对汽车底盘控制有着重要的意义,而这些关键状态往往难以直接测量或 者成本较高.结合纵向、侧向和横摆三自由度非线性汽车模型,将改进强跟踪滤波(Improved strong track filter, ISTF)算法应用到汽车的状态估计中,并改进了算 法的稳定性.与扩展卡尔曼滤波(Extended Kalman filter, EKF)算法进行比较分析.通过Carsim和Matlab/Simulink联合仿真和实车双移线实验验证算法,结果 表明,该算法在估计精度、跟踪速度、抑制噪声等方面均优于扩展卡尔曼滤波算法,满足汽车状态估计器的软件性能要求.
反舰导弹航路规划的OACRR-PSO算法
刘钢, 老松杨, 袁灿, 侯绿林, 谭东风
2012, 38(9): 1528-1537. doi: 10.3724/SP.J.1004.2012.01528
摘要:
为了提高反舰导弹航路规划算法的搜素效率,从几何学角度对航路规划空间进行了研究,在将功能区域概念融入 逆向航路规划的过程中发现了功能区域的几何学渐变规律,据此提出功能区域簇作为其物理载体.将功能区域簇引入粒子群优化(Particle swarm optimization, PSO)算法,提出了功能区域簇实时约束(Operational area cluster real-time restriction, OACRR)的PSO算法(OACRR-PSO).为了便于表示功能区域簇,采用航路极坐标编码方式.与传统的PSO算法不同的是,考虑到 粒子中分量之间的关联性,该算法在优化过程中并不是对粒子的整个速度分量同时进行更新,而是引入一种分步递归进化 策略对粒子的分量逐步进行更新.在粒子的更新过程中,使用功能区域簇来实时限定粒子位置分量的准确更新范围,使得 算法搜索空间逐步减小,从而加速算法收敛.仿真实验结果表明,分步递归进化策略能够非常显著地提高算法的全局搜索 性能,并且算法收敛速度快、稳定性好.
短文
自组织状态空间模型参数初始分布搜索算法
甘敏, 彭辉, 黄云志, 董学平
2012, 38(9): 1538-1543. doi: 10.3724/SP.J.1004.2012.01538
摘要:
自组织状态空间模型为估计非线性非高斯状态空间模型中的未知参数提供了一种有效方法. 针对自组织状态空间模型中参数的初始分布难以确定的难点,提出了一种搜索自组织状态空间模型参数初始分布的算法. 所用搜索算法基于一种高效的进化模型,具有全局搜索能力,使得参数的初始分布向真实参数"移动". 数值实验分析结果验证了提出方法的有效性.
基于多角度LBP特征的三维0.3人脸性别分类
赵海英, 杨一帆, 徐正光
2012, 38(9): 1544-1549. doi: 10.3724/SP.J.1004.2012.01544
摘要:
人脸性别分类是一个富有挑战的研究方向,目前的研究尚不完善.本文提出一种三维人脸的性别分类方法, 首先对数据集进行局部区域最近邻点迭代算法(Iterative closest point, ICP)匹配,自动实现人脸正向姿态校正;对数据集人脸统一做俯仰角度的旋转, 从不同视角上提取基于深度缩略图的多角度LBP (Local binary patterns)特征;再由支持向量机(Support vector machine, SVM)分类器完成训练分类. 该方法在CASIA数据库上实验,对全库中性表情人脸进行性别分类,可以得到最高98.374%的正确率.
压电陶瓷驱动平台自适应输出反馈控制
张利军, 杨立新, 郭立东, 孙立宁
2012, 38(9): 1550-1556. doi: 10.3724/SP.J.1004.2012.01550
摘要:
压电陶瓷驱动平台的精度和动态特性主要取决于所设计的控制器是否可以有效地补偿压电陶瓷固有的迟滞特性. 针对这一问题, 提出了一种基于神经网络 (Neural network, NN)的自适应输出反馈控制策略. 为了避免压电陶瓷速度测量噪声的影响, 采用高增益观测器对压电陶瓷平台的速度状态进行估计; 为了克服压电陶瓷的迟滞非线性特征, 采用神经网络动态补偿策略; 针对神经网络逼近误差和观测器估计误差, 控制器设计中增加了鲁棒控制项. 最后应用Lyapunov 稳定性理论证明了所提出的控制器的收敛性问题. 仿真实验表明了所提控制方法的有效性.