2011年 第37卷 第7期
2011, 37(7): 773-786.
doi: 10.3724/SP.J.1004.2011.00773
摘要:
针对一类不确定的离散时间零动态不稳定的单输入-单输出(Single-input single-output, SISO)非线性系统,提出了一种基于未建模动态补偿的非线性控制器. 采用自适应神经模糊推理系统(Adaptive-network-based fuzzy inference system, ANFIS)和一一映射相结合的方法估计未建模动态.在此基础上,提出了由线性自 适应控制器、非线性自适应控制器以及切换机制组成的自适应切换控制方法.该方法通过对上述两种控制器的切换, 保证闭环系统输入输出信号有界的同时,改善系统性能.本文将要求未建模动态全局有界的条件放宽为线性增长, 建立了所提自适应控制方法的稳定性和收敛性分析.通过仿真比较和水箱的液位控制实验,验证了所提方法的有效性.
针对一类不确定的离散时间零动态不稳定的单输入-单输出(Single-input single-output, SISO)非线性系统,提出了一种基于未建模动态补偿的非线性控制器. 采用自适应神经模糊推理系统(Adaptive-network-based fuzzy inference system, ANFIS)和一一映射相结合的方法估计未建模动态.在此基础上,提出了由线性自 适应控制器、非线性自适应控制器以及切换机制组成的自适应切换控制方法.该方法通过对上述两种控制器的切换, 保证闭环系统输入输出信号有界的同时,改善系统性能.本文将要求未建模动态全局有界的条件放宽为线性增长, 建立了所提自适应控制方法的稳定性和收敛性分析.通过仿真比较和水箱的液位控制实验,验证了所提方法的有效性.
2011, 37(7): 787-793.
doi: 10.3724/SP.J.1004.2011.00787
摘要:
实际图像检索过程中,用户提供的相关反馈有限,但存在大量未标记图像数据. 本文在前期半监督流形图像检索工作的基础上,提出一种基于Nystrm低阶 近似的半监督流形排序图像检索方法.通过采用半监督的流形正则化框架, 将图像数据嵌入到低维流形结构中进行分类排序,以充分利用大量未标记数据, 并兼顾分类误差、数据分布的几何结构以及分类函数的复杂性.针对半监督学习速度缓慢的问题, 基于Nystrm低阶近似对学习过程进行加速.在较大规模的Corel图像数据集上进行了检索实验, 实验结果表明该方法能获得较好的效果.
实际图像检索过程中,用户提供的相关反馈有限,但存在大量未标记图像数据. 本文在前期半监督流形图像检索工作的基础上,提出一种基于Nystrm低阶 近似的半监督流形排序图像检索方法.通过采用半监督的流形正则化框架, 将图像数据嵌入到低维流形结构中进行分类排序,以充分利用大量未标记数据, 并兼顾分类误差、数据分布的几何结构以及分类函数的复杂性.针对半监督学习速度缓慢的问题, 基于Nystrm低阶近似对学习过程进行加速.在较大规模的Corel图像数据集上进行了检索实验, 实验结果表明该方法能获得较好的效果.
2011, 37(7): 794-799.
doi: 10.3724/SP.J.1004.2011.00794
摘要:
介绍了一种基于低维反对称矩阵指数的快速独立分量分析算法. 由于算法中牵涉到的矩阵指数具有解析闭合形式的表达, 因而算法中使用到的矩阵指数以及最优下降方向均可解析地得到. 另外, 我们纠正了在别的文献中建立的四维反对称矩阵指数表达式中的两个错误. 最后, 我们用仿真验证了算法. 实验结果表明: 相比于广为应用的Extended InfoMax和FastICA算法, 本文算法能得到更佳的分离性能.
介绍了一种基于低维反对称矩阵指数的快速独立分量分析算法. 由于算法中牵涉到的矩阵指数具有解析闭合形式的表达, 因而算法中使用到的矩阵指数以及最优下降方向均可解析地得到. 另外, 我们纠正了在别的文献中建立的四维反对称矩阵指数表达式中的两个错误. 最后, 我们用仿真验证了算法. 实验结果表明: 相比于广为应用的Extended InfoMax和FastICA算法, 本文算法能得到更佳的分离性能.
2011, 37(7): 800-810.
doi: 10.3724/SP.J.1004.2011.00800
摘要:
面向非均匀光照图像, 提出了基于向心自动波交叉皮质模型(Centripetal-autowave intersecting cortical model, CA-ICM)的图像增强算法. 为了解决原始交叉皮质模型(Intersecting cortical model, ICM)固有自动波效应在图像增强应用中易导致边缘模糊的问题, 首先,设计了基于形态学中值集的向心自动波(Centripetal autowave, CA)实现方式. 提出了基于图像特征---键值(Key)的自适应S形状映射函数, 以此作为CA-ICM模型的输入输出的映射关系. 为了增强算法的鲁棒性, 对未点火位置进行了标注和修复. 最后提出了非线性变换的颜色恢复方法. 同时对模型参数设计进行了细致讨论. 仿真结果表明, 该模型可以有效进行光照动态范围的调整, 向心自动波约束产生了邻域内的侧抑制作用, 输出图像对比度得到大幅提升, 细节边缘清晰, 颜色恢复充分自然, 客观评价值高.
面向非均匀光照图像, 提出了基于向心自动波交叉皮质模型(Centripetal-autowave intersecting cortical model, CA-ICM)的图像增强算法. 为了解决原始交叉皮质模型(Intersecting cortical model, ICM)固有自动波效应在图像增强应用中易导致边缘模糊的问题, 首先,设计了基于形态学中值集的向心自动波(Centripetal autowave, CA)实现方式. 提出了基于图像特征---键值(Key)的自适应S形状映射函数, 以此作为CA-ICM模型的输入输出的映射关系. 为了增强算法的鲁棒性, 对未点火位置进行了标注和修复. 最后提出了非线性变换的颜色恢复方法. 同时对模型参数设计进行了细致讨论. 仿真结果表明, 该模型可以有效进行光照动态范围的调整, 向心自动波约束产生了邻域内的侧抑制作用, 输出图像对比度得到大幅提升, 细节边缘清晰, 颜色恢复充分自然, 客观评价值高.
2011, 37(7): 811-819.
doi: 10.3724/SP.J.1004.2011.00811
摘要:
客观图像质量评价研究的目的是设计一种和视觉感知保持一致,且适用于各种失真模型的质量评价方法. 传统的结构相似度量质量评价方法忽视了自然图像本身的特点,不能很好地评判某些失真类型图像. 本文根据人眼视觉系统(Human visual system, HVS)在感知图像质量过程中的特点,探索自然图像的本征几何结构特征, 考虑像素点的方向失真、幅度失真和方差失真,提出了一种新型的基于图像几何结构失真模型的完全参考质量评价方法. 在标准数据库上的实验结果表明,本文方法适用于所有失真模型图像数据的质量评价, 计算复杂度相对较低,得到的图像客观评价结果和主观评价方法具有更好的一致性, 能够很好地反映人眼对图像质量的主观感受.
客观图像质量评价研究的目的是设计一种和视觉感知保持一致,且适用于各种失真模型的质量评价方法. 传统的结构相似度量质量评价方法忽视了自然图像本身的特点,不能很好地评判某些失真类型图像. 本文根据人眼视觉系统(Human visual system, HVS)在感知图像质量过程中的特点,探索自然图像的本征几何结构特征, 考虑像素点的方向失真、幅度失真和方差失真,提出了一种新型的基于图像几何结构失真模型的完全参考质量评价方法. 在标准数据库上的实验结果表明,本文方法适用于所有失真模型图像数据的质量评价, 计算复杂度相对较低,得到的图像客观评价结果和主观评价方法具有更好的一致性, 能够很好地反映人眼对图像质量的主观感受.
2011, 37(7): 820-827.
doi: 10.3724/SP.J.1004.2011.00820
摘要:
提出了一种新的基于多尺度压缩感知(Compressed sensing, CS)金字塔的分类方法, 用于合成孔径雷达(Synthetic aperture radar, SAR)图像的分类. 首先通过原始图像上的小波平滑和特征提取构建多尺度极化干涉特征空间, 然后利用压缩感知提取每一个尺度上图像子块的观测域特征并在数据域重建稀疏特征, 最后组合多尺度的稀疏特征生成最终用于分类的多尺度金字塔表达. 针对稀疏编码和一般金字塔算法的局限性, 提出了基于压缩感知和多尺度金字塔的方法, 利用观测矩阵降低特征维数的优势的同时, 对SAR图像的纹理特征进行不同尺度的分析. 在国内首批极化干涉SAR数据上的实验证明了上述算法的有效性.
提出了一种新的基于多尺度压缩感知(Compressed sensing, CS)金字塔的分类方法, 用于合成孔径雷达(Synthetic aperture radar, SAR)图像的分类. 首先通过原始图像上的小波平滑和特征提取构建多尺度极化干涉特征空间, 然后利用压缩感知提取每一个尺度上图像子块的观测域特征并在数据域重建稀疏特征, 最后组合多尺度的稀疏特征生成最终用于分类的多尺度金字塔表达. 针对稀疏编码和一般金字塔算法的局限性, 提出了基于压缩感知和多尺度金字塔的方法, 利用观测矩阵降低特征维数的优势的同时, 对SAR图像的纹理特征进行不同尺度的分析. 在国内首批极化干涉SAR数据上的实验证明了上述算法的有效性.
2011, 37(7): 828-835.
doi: 10.3724/SP.J.1004.2011.00828
摘要:
目前大多数流形学习算法都以距离来度量数据间的相似度, 并取得满意的效果,但都难以处理噪音造成的子空间偏离.针对此问题, 提出了一种基于角度优化的全局降维算法.通过给出多样本增量的协方差阵更新方式, 从理论上证明了中心化样本长度与其偏离低维空间角度为子空间偏离的主要因素, 进而解决了噪音造成的子空间偏离问题.同时,与主成分分析相比, 能够更好地与其他算法融合解决小样本问题.实验证实了该算法在手工和真实数据集上的有效性.
目前大多数流形学习算法都以距离来度量数据间的相似度, 并取得满意的效果,但都难以处理噪音造成的子空间偏离.针对此问题, 提出了一种基于角度优化的全局降维算法.通过给出多样本增量的协方差阵更新方式, 从理论上证明了中心化样本长度与其偏离低维空间角度为子空间偏离的主要因素, 进而解决了噪音造成的子空间偏离问题.同时,与主成分分析相比, 能够更好地与其他算法融合解决小样本问题.实验证实了该算法在手工和真实数据集上的有效性.
2011, 37(7): 836-848.
doi: 10.3724/SP.J.1004.2011.00836
摘要:
Skyline查询是基于位置服务(Location based service, LBS)的一项重要操作,其目的是发现数据集中不被其他点支配的点的集合.移动对象在运动过 程中,其位置信息具有不确定性,导致各数据点间的支配关系不稳定,从而影响Skyline操作.本文针对以位置不确定移动对象为查 询点的Skyline查询进行研究,首先,定义了查询点移动时各对象间支配概率,提出了支配概率和Skyline概率的微元计算方法.在此基 础上,提出一种面向不确定移动对象进行连续概率Skyline查询的有效算法U_CPSC.该算法首先快速计算初始时刻的p-Skyline集合; 然后,定义了两类可能引起p-Skyline变动的事件,通过对这些事件的跟踪计算快速更新p-Skyline集合,无需在移动对象的每一运动 时刻去遍历整个数据集,实现了对p-Skyline的连续更新操作,大大减少了算法的查找和计算开销,提高了运算效率;最后,提出一 种静态算法U_SPSC,与U_CPSC进行了对比试验,实验结果证明了算法的有效性.
Skyline查询是基于位置服务(Location based service, LBS)的一项重要操作,其目的是发现数据集中不被其他点支配的点的集合.移动对象在运动过 程中,其位置信息具有不确定性,导致各数据点间的支配关系不稳定,从而影响Skyline操作.本文针对以位置不确定移动对象为查 询点的Skyline查询进行研究,首先,定义了查询点移动时各对象间支配概率,提出了支配概率和Skyline概率的微元计算方法.在此基 础上,提出一种面向不确定移动对象进行连续概率Skyline查询的有效算法U_CPSC.该算法首先快速计算初始时刻的p-Skyline集合; 然后,定义了两类可能引起p-Skyline变动的事件,通过对这些事件的跟踪计算快速更新p-Skyline集合,无需在移动对象的每一运动 时刻去遍历整个数据集,实现了对p-Skyline的连续更新操作,大大减少了算法的查找和计算开销,提高了运算效率;最后,提出一 种静态算法U_SPSC,与U_CPSC进行了对比试验,实验结果证明了算法的有效性.
2011, 37(7): 849-856.
doi: 10.3724/SP.J.1004.2011.00849
摘要:
为了使联合因子分析适用于多种信道条件下的文本无关说话人识别,提出了一种本征信道空间的正交拼接法.在多信道条件下,可以通过混合数据法或简单拼接法估计本征信道空间,但前者存在空间掩盖,后者虽解决了空间掩盖但引入了空间重叠.本文首先证明说话人建模和测试的核心运算是斜投影,基于上述证明,通过将待拼接空间正交的方法移除了空间重叠.在NIST SRE 2008核心评测数据库上的实验表明,本文所提算法优于混合数据法和简单拼接法.
为了使联合因子分析适用于多种信道条件下的文本无关说话人识别,提出了一种本征信道空间的正交拼接法.在多信道条件下,可以通过混合数据法或简单拼接法估计本征信道空间,但前者存在空间掩盖,后者虽解决了空间掩盖但引入了空间重叠.本文首先证明说话人建模和测试的核心运算是斜投影,基于上述证明,通过将待拼接空间正交的方法移除了空间重叠.在NIST SRE 2008核心评测数据库上的实验表明,本文所提算法优于混合数据法和简单拼接法.
2011, 37(7): 857-864.
doi: 10.3724/SP.J.1004.2011.00857
摘要:
研究了带有固定在天花板上的摄像机系统的非完整动态移动机器人的镇定问题. 首先, 利用针孔摄像机模型引入了基于摄像机目标的视觉伺服运动学模型,并针对该运动学模型给出了一个运动学镇定控制器. 然后,在摄像机参数不确定的情形下设计了一个自适应滑模控制器实现了不确定动态移动机器人的镇定. 提出的控制器不仅对结构不确定性如质量变化, 而且对无结构不确定性如外部扰动都具有鲁棒性. 通过Lyapunov方法严格证明了提出的控制系统的稳定性和估计参数的有界性. 仿真结果证实了控制律的有效性.
研究了带有固定在天花板上的摄像机系统的非完整动态移动机器人的镇定问题. 首先, 利用针孔摄像机模型引入了基于摄像机目标的视觉伺服运动学模型,并针对该运动学模型给出了一个运动学镇定控制器. 然后,在摄像机参数不确定的情形下设计了一个自适应滑模控制器实现了不确定动态移动机器人的镇定. 提出的控制器不仅对结构不确定性如质量变化, 而且对无结构不确定性如外部扰动都具有鲁棒性. 通过Lyapunov方法严格证明了提出的控制系统的稳定性和估计参数的有界性. 仿真结果证实了控制律的有效性.
2011, 37(7): 865-872.
doi: 10.3724/SP.J.1004.2011.00865
摘要:
并行多任务分配是多agent系统中极具挑战性的课题, 主要面向资源分配、灾害应急管理等应用需求, 研究如何把一组待求解任务分配给相应的agent联盟去执行. 本文提出了一种基于自组织、自学习agent的分布式并行多任务分配算法, 该算法引入P学习设计了单agent寻找任务的学习模型, 并给出了agent之间通信和协商策略. 对比实验说明该算法不仅能快速寻找到每个任务的求解联盟, 而且能明确给出联盟中各agent成员的实际资源承担量, 从而可以为实际的控制和决策任务提供有价值的参考依据.
并行多任务分配是多agent系统中极具挑战性的课题, 主要面向资源分配、灾害应急管理等应用需求, 研究如何把一组待求解任务分配给相应的agent联盟去执行. 本文提出了一种基于自组织、自学习agent的分布式并行多任务分配算法, 该算法引入P学习设计了单agent寻找任务的学习模型, 并给出了agent之间通信和协商策略. 对比实验说明该算法不仅能快速寻找到每个任务的求解联盟, 而且能明确给出联盟中各agent成员的实际资源承担量, 从而可以为实际的控制和决策任务提供有价值的参考依据.
2011, 37(7): 873-882.
doi: 10.3724/SP.J.1004.2011.00873
摘要:
基于遗传算法的复杂网络社区探测是当前的研究热点. 针对该问题,本文在分析网络模块性函数Q的局部单调性的基础上, 给出一种快速、有效的局部搜索变异策略, 同时为兼顾初始种群的精度和多样性以达到进一步提高搜索效率的目的, 采用了标签传播作为初始种群的产生方法;综上,提出了一个结合局部搜索的遗传算法(Genetic algorithm with local search, LGA). 在基准网络及大规模复杂网络上对LGA进行测试, 并与当前具有代表性的社区探测算法进行比较, 实验结果表明了文中算法的有效性与高效性.
基于遗传算法的复杂网络社区探测是当前的研究热点. 针对该问题,本文在分析网络模块性函数Q的局部单调性的基础上, 给出一种快速、有效的局部搜索变异策略, 同时为兼顾初始种群的精度和多样性以达到进一步提高搜索效率的目的, 采用了标签传播作为初始种群的产生方法;综上,提出了一个结合局部搜索的遗传算法(Genetic algorithm with local search, LGA). 在基准网络及大规模复杂网络上对LGA进行测试, 并与当前具有代表性的社区探测算法进行比较, 实验结果表明了文中算法的有效性与高效性.
2011, 37(7): 883-890.
doi: 10.3724/SP.J.1004.2011.00883
摘要:
由于动态测量坐标系的存在, 使得数字笔在不同的握笔姿态下, 引起书写平面内摩擦力的分解不同. 由此本文提出采用书写摩擦力进行在线签名识别. 该方法将摩擦力的方向在直角坐标系内进行特征量表示, 并与三维书写力的大小相结合, 实现概率值和距离测度信度级的融合. 在进行真假签名的判别中, 加入快速剔除的方法, 进行两级判别, 以提高识别效率. 实验结果表明, 基于签名书写力大小和方向特征的融合识别方法互相补充, 相对于单个方法具有更高的识别率, 系统性能得到显著改善.
由于动态测量坐标系的存在, 使得数字笔在不同的握笔姿态下, 引起书写平面内摩擦力的分解不同. 由此本文提出采用书写摩擦力进行在线签名识别. 该方法将摩擦力的方向在直角坐标系内进行特征量表示, 并与三维书写力的大小相结合, 实现概率值和距离测度信度级的融合. 在进行真假签名的判别中, 加入快速剔除的方法, 进行两级判别, 以提高识别效率. 实验结果表明, 基于签名书写力大小和方向特征的融合识别方法互相补充, 相对于单个方法具有更高的识别率, 系统性能得到显著改善.
2011, 37(7): 891-900.
doi: 10.3724/SP.J.1004.2011.00891
摘要:
CAPTCHA是一种阻止机器人滥用自然人资源的网络安全机制.研究CAPTCHA识别技术有助于发现CAPTCHA自身的缺陷,促使其变得更加安全. 针对现有方法难以识别的高粘着CAPTCHA,本文提出了一种新的识别算法. 该算法首先使用递归神经网络(Recurrent neural network, RNN) 对CAPTCHA进行识别,然后为了提高识别结果的可靠性, 提出了一种基于SVM的拒识新算法,并使用数据降维方法对拒识特征进行降维. 实验结果表明: 1)本文所提识别算法能够识别高粘着型CAPTCHA,并且识别结果具有高可靠性; 2)新的拒识算法相对于其他拒识算法具有明显优势; 3)数据降维方法能够进一步改善拒识算法的性能,从而取得更高的可靠性.
CAPTCHA是一种阻止机器人滥用自然人资源的网络安全机制.研究CAPTCHA识别技术有助于发现CAPTCHA自身的缺陷,促使其变得更加安全. 针对现有方法难以识别的高粘着CAPTCHA,本文提出了一种新的识别算法. 该算法首先使用递归神经网络(Recurrent neural network, RNN) 对CAPTCHA进行识别,然后为了提高识别结果的可靠性, 提出了一种基于SVM的拒识新算法,并使用数据降维方法对拒识特征进行降维. 实验结果表明: 1)本文所提识别算法能够识别高粘着型CAPTCHA,并且识别结果具有高可靠性; 2)新的拒识算法相对于其他拒识算法具有明显优势; 3)数据降维方法能够进一步改善拒识算法的性能,从而取得更高的可靠性.