2011年 第37卷 第11期
2011, 37(11): 1285-1289.
doi: 10.3724/SP.J.1004.2011.01285
摘要:
为了提高智能优化方法的优化性能,国内外学者通过知识来加强对优化过程的引导.对基于 知识的智能优化引导方法进行了综述:一方面通过传统人工智能手段来实现对智能优化方法的引导; 另一方面通过特定知识模型来实现对智能优化方法的引导.从前期优化过程中挖掘有用知识,采用知识来引导后续优化过程,极大地提高了智能优化方法的优化性能.
为了提高智能优化方法的优化性能,国内外学者通过知识来加强对优化过程的引导.对基于 知识的智能优化引导方法进行了综述:一方面通过传统人工智能手段来实现对智能优化方法的引导; 另一方面通过特定知识模型来实现对智能优化方法的引导.从前期优化过程中挖掘有用知识,采用知识来引导后续优化过程,极大地提高了智能优化方法的优化性能.
2011, 37(11): 1290-1295.
doi: 10.3724/SP.J.1004.2011.01290
摘要:
针对多分类器系统设计中最优子集选择效率低下、集成方法缺乏灵活性等问题, 提出了分类器的动态选择与循环集成方法 (Dynamic selection and circulating combination, DSCC). 该方法利用不同分类器模型之间的互补性, 动态选择出对目标有较高识别率的分类器组合, 使参与集成的分类器数量能够随识别目标的复杂程度而自适应地变化, 并根据可信度实现系统的循环集成. 在手写体数字识别实验中, 与其他常用的分类器选择方法相比, 所提出的方法灵活高效, 识别率更高.
针对多分类器系统设计中最优子集选择效率低下、集成方法缺乏灵活性等问题, 提出了分类器的动态选择与循环集成方法 (Dynamic selection and circulating combination, DSCC). 该方法利用不同分类器模型之间的互补性, 动态选择出对目标有较高识别率的分类器组合, 使参与集成的分类器数量能够随识别目标的复杂程度而自适应地变化, 并根据可信度实现系统的循环集成. 在手写体数字识别实验中, 与其他常用的分类器选择方法相比, 所提出的方法灵活高效, 识别率更高.
2011, 37(11): 1296-1305.
doi: 10.3724/SP.J.1004.2011.01296
摘要:
一条空间直线的单光心反射折射图像是一个二次曲线段, 大多数利用直线进行单光心反射折射摄像机标定的方法都需要对直线的像进行二次曲线拟合, 曲线拟合的精度严重影响着标定的精度. 然而, 一条空间直线的像仅占整个二次曲线的一小段, 这使得曲线拟合的效果非常差. 本文利用空间三个共线点的反射折射投影给出了摄像机内参数的一个非线性约束. 当反射镜面为抛物面时, 在主点已知的情况下, 该约束变为线性约束. 如其他参数已知, 该约束变为关于有效焦距的多项式约束. 由此, 本文提出了三种不同条件下的标定算法, 算法中无需对直线的像进行二次曲线拟合, 无需场景的任何信息, 标定精度较高. 实验验证了算法的有效性.
一条空间直线的单光心反射折射图像是一个二次曲线段, 大多数利用直线进行单光心反射折射摄像机标定的方法都需要对直线的像进行二次曲线拟合, 曲线拟合的精度严重影响着标定的精度. 然而, 一条空间直线的像仅占整个二次曲线的一小段, 这使得曲线拟合的效果非常差. 本文利用空间三个共线点的反射折射投影给出了摄像机内参数的一个非线性约束. 当反射镜面为抛物面时, 在主点已知的情况下, 该约束变为线性约束. 如其他参数已知, 该约束变为关于有效焦距的多项式约束. 由此, 本文提出了三种不同条件下的标定算法, 算法中无需对直线的像进行二次曲线拟合, 无需场景的任何信息, 标定精度较高. 实验验证了算法的有效性.
2011, 37(11): 1306-1312.
doi: 10.3724/SP.J.1004.2011.01306
摘要:
近几年局部流形学习算法研究得到了广泛的关注, 如局部线性嵌入以及局部切空间排列算法等.这些算法都是基于局部可线性化的假设而提出的, 但局部是否可线性化的问题没有得到很好有效的解决, 使得目前的降维算法对自然数据效果不佳. 自然数据中有很多是稀疏的,对稀疏数据的降维是局部线性嵌入算法所面临的一个问题. 基于对数据自然属性的考虑,利用数据的统计信息动态确定局部线性化范围, 依据数据的分布提出一种排列的稀疏局部线性嵌入算法(Sparse local linear embedding algorithm, SLLEA). 在数据集稀疏的情况下,该算法能够很好地把握数据的局部和整体信息. 将该算法应用于手工流形及图像检索等试验中,验证了该算法的有效性.
近几年局部流形学习算法研究得到了广泛的关注, 如局部线性嵌入以及局部切空间排列算法等.这些算法都是基于局部可线性化的假设而提出的, 但局部是否可线性化的问题没有得到很好有效的解决, 使得目前的降维算法对自然数据效果不佳. 自然数据中有很多是稀疏的,对稀疏数据的降维是局部线性嵌入算法所面临的一个问题. 基于对数据自然属性的考虑,利用数据的统计信息动态确定局部线性化范围, 依据数据的分布提出一种排列的稀疏局部线性嵌入算法(Sparse local linear embedding algorithm, SLLEA). 在数据集稀疏的情况下,该算法能够很好地把握数据的局部和整体信息. 将该算法应用于手工流形及图像检索等试验中,验证了该算法的有效性.
2011, 37(11): 1313-1321.
doi: 10.3724/SP.J.1004.2011.01313
摘要:
针对概率假设密度(Probability hypothesis density, PHD)高斯混合实现算法中的分量删减问题, 提出了基于Dirichlet分布的分量删减算法以改进概率假设密度高斯混合实现算法的性能. 算法采用极大后验准则估计混合参数, 采用仅依赖于混合权重的负指数Dirichlet分布作为混合参数的先验分布, 利用拉格朗日乘子推导了混合权重的更新公式. 算法利用负指数Dirichlet分布的不稳定性,在极大后验迭代过程中驱使与目标强度不相关的分量消亡. 该不稳定性还能够解决多个相近分量共同描述一个强度峰值的问题, 有利于后续多目标状态的提取. 仿真结果表明, 基于Dirichlet分布的分量删减算法优于典型高斯混合实现中的删减算法.
针对概率假设密度(Probability hypothesis density, PHD)高斯混合实现算法中的分量删减问题, 提出了基于Dirichlet分布的分量删减算法以改进概率假设密度高斯混合实现算法的性能. 算法采用极大后验准则估计混合参数, 采用仅依赖于混合权重的负指数Dirichlet分布作为混合参数的先验分布, 利用拉格朗日乘子推导了混合权重的更新公式. 算法利用负指数Dirichlet分布的不稳定性,在极大后验迭代过程中驱使与目标强度不相关的分量消亡. 该不稳定性还能够解决多个相近分量共同描述一个强度峰值的问题, 有利于后续多目标状态的提取. 仿真结果表明, 基于Dirichlet分布的分量删减算法优于典型高斯混合实现中的删减算法.
2011, 37(11): 1322-1331.
doi: 10.3724/SP.J.1004.2011.01322
摘要:
针对网络中受丢包损伤的视频提出了一种基于视觉注意力变化的全参考客观质量评估方法.该方法基于视觉显著性检测在视频数据上的应用,考察受网络丢包失真影响的视频数据与标准参考数据在空间和时间上引起的视觉注意力变化,并根据此变化相应的视觉显著性在空间和时间上的差异,提出了一组客观质量评估方法.文中采用17个受丢包损伤的视频数据进行测试,并实施了主观评价实验作为评价标准.与传统的没有考虑人眼视觉显著特性的质量评估方法,以及目前主流的基于视觉显著区域/感兴趣区域对失真像素进行加权的方法进行对比,实验结果表明, 基于视觉注意力变化的方法较后两者与主观质量评估结果有更好的相关性, 能够更有效地评估丢包损伤视频的质量.
针对网络中受丢包损伤的视频提出了一种基于视觉注意力变化的全参考客观质量评估方法.该方法基于视觉显著性检测在视频数据上的应用,考察受网络丢包失真影响的视频数据与标准参考数据在空间和时间上引起的视觉注意力变化,并根据此变化相应的视觉显著性在空间和时间上的差异,提出了一组客观质量评估方法.文中采用17个受丢包损伤的视频数据进行测试,并实施了主观评价实验作为评价标准.与传统的没有考虑人眼视觉显著特性的质量评估方法,以及目前主流的基于视觉显著区域/感兴趣区域对失真像素进行加权的方法进行对比,实验结果表明, 基于视觉注意力变化的方法较后两者与主观质量评估结果有更好的相关性, 能够更有效地评估丢包损伤视频的质量.
2011, 37(11): 1332-1343.
doi: 10.3724/SP.J.1004.2011.01332
摘要:
针对基于拟关键路径法的综合调度算法按路径长度确定工序的调度次序,形成工序组间的并行处理, 使设备产生较多空闲时间的问题,提出可回退抢占的设备驱动综合调度算法. 该算法以每次工序加工结束作为一次可调度工序的寻找事件,若此时新出现的可调度工序具备抢占能力,则产生回退事 件进行重调度;若不产生回退事件,如果可调度工序唯一,则调度此工序;如果可调度工序不唯一, 选择父结点路径长的工序;如果父结点最长路径相同,选择用时长的工序. 由于该算法在调度工序时形成工序间的并行处理,缩小基于拟关键路径的综合调度算法形成的并行处理单位,进而减少加工过程中产生较多的设备空闲时间,提高设备利用率;同时,由于采用抢占式的回退调度策略,优先调度对调度结果有重要影响的长路径工序,达到对拟关键路径法的扬长避短,进一步提高设备利用率.
针对基于拟关键路径法的综合调度算法按路径长度确定工序的调度次序,形成工序组间的并行处理, 使设备产生较多空闲时间的问题,提出可回退抢占的设备驱动综合调度算法. 该算法以每次工序加工结束作为一次可调度工序的寻找事件,若此时新出现的可调度工序具备抢占能力,则产生回退事 件进行重调度;若不产生回退事件,如果可调度工序唯一,则调度此工序;如果可调度工序不唯一, 选择父结点路径长的工序;如果父结点最长路径相同,选择用时长的工序. 由于该算法在调度工序时形成工序间的并行处理,缩小基于拟关键路径的综合调度算法形成的并行处理单位,进而减少加工过程中产生较多的设备空闲时间,提高设备利用率;同时,由于采用抢占式的回退调度策略,优先调度对调度结果有重要影响的长路径工序,达到对拟关键路径法的扬长避短,进一步提高设备利用率.
2011, 37(11): 1344-1350.
doi: 10.3724/SP.J.1004.2011.01344
摘要:
针对极端学习机 (Extreme learning machine, ELM)算法的不适定问题和模型规模控制问题,本文提出基于1范数正则项的改进型ELM算法. 通过在二次损失函数基础上引入1范数正则项以控制模型规模,改善ELM的泛化能力.此外,为简化1范数 正则化方法的求解过程,利用边际优化方法,构建适当的替代函数,以便于采用贝叶斯方法代替计算复杂的 交叉检验方法,并实现正则化参数的自适应估计.仿真结果表明,本文所提算法能够有效简化模型结构,并 保持较高的预测精度.
针对极端学习机 (Extreme learning machine, ELM)算法的不适定问题和模型规模控制问题,本文提出基于1范数正则项的改进型ELM算法. 通过在二次损失函数基础上引入1范数正则项以控制模型规模,改善ELM的泛化能力.此外,为简化1范数 正则化方法的求解过程,利用边际优化方法,构建适当的替代函数,以便于采用贝叶斯方法代替计算复杂的 交叉检验方法,并实现正则化参数的自适应估计.仿真结果表明,本文所提算法能够有效简化模型结构,并 保持较高的预测精度.
2011, 37(11): 1351-1355.
doi: 10.3724/SP.J.1004.2011.01351
摘要:
为了有效提高信息安全管理措施的有效性, 采用平行控制方法来研究信息安全管理措施的优化问题. 采用仿真软件Extend来构建信息安全管理系统的人工系统, 基于人工系统来评估信息安全管理措施的效果; 使用平行控制系统实现真实系统和人工系统之间的交互, 尽可能地使真实系统和人工系统之间的差异最小化; 采用计算实验方法来不断调整信息安全管理措施, 最终得到一套有效的信息安全管理措施. 以互联网管理为例, 证明本方法能够实现信息安全管理措施的实时仿真、评估和优化.
为了有效提高信息安全管理措施的有效性, 采用平行控制方法来研究信息安全管理措施的优化问题. 采用仿真软件Extend来构建信息安全管理系统的人工系统, 基于人工系统来评估信息安全管理措施的效果; 使用平行控制系统实现真实系统和人工系统之间的交互, 尽可能地使真实系统和人工系统之间的差异最小化; 采用计算实验方法来不断调整信息安全管理措施, 最终得到一套有效的信息安全管理措施. 以互联网管理为例, 证明本方法能够实现信息安全管理措施的实时仿真、评估和优化.
2011, 37(11): 1356-1359.
doi: 10.3724/SP.J.1004.2011.01356
摘要:
针对目前图像搜索引擎难以正确把握用户真正意图的问题, 从爬虫Web图像搜索引擎检索结果入手,提出三种聚类算法来提取海量Web图像中的语义区域. 这三种聚类算法包括确定初始化中心的K-means聚类、确定参数的最大期望聚类以及基于半监督的K-means聚类算法. 然后选取显著值较大的显著区域作为语义区域.实验分析比较了三种聚类算法的有效性, 最终实现的图像重排系统能比网络搜索引擎更好地反馈给用户精确而且有序的查询结果.
针对目前图像搜索引擎难以正确把握用户真正意图的问题, 从爬虫Web图像搜索引擎检索结果入手,提出三种聚类算法来提取海量Web图像中的语义区域. 这三种聚类算法包括确定初始化中心的K-means聚类、确定参数的最大期望聚类以及基于半监督的K-means聚类算法. 然后选取显著值较大的显著区域作为语义区域.实验分析比较了三种聚类算法的有效性, 最终实现的图像重排系统能比网络搜索引擎更好地反馈给用户精确而且有序的查询结果.
2011, 37(11): 1360-1367.
doi: 10.3724/SP.J.1004.2011.01360
摘要:
提出一种基于Harris角点检测的全自动内窥镜图像变形校正算法. 对一幅黑白棋格图像进行Harris特征点检测并将特征按所属直线进行自动归类. 引入关于全体变形参数的Harris角点子集直线度函数并对它进行Levenberg-Marquardt迭代优化来寻找最优变形参数. 获取图像时无需限定相机与标定图案的相对姿态,算法执行中无需用户交互式干预. 实验结果表明本文算法的校正结果使得内窥镜成像很好地满足线性相机模型,具有亚像素级精 度,是一种快速简单灵活的校正方法,尤其适合临床应用.
提出一种基于Harris角点检测的全自动内窥镜图像变形校正算法. 对一幅黑白棋格图像进行Harris特征点检测并将特征按所属直线进行自动归类. 引入关于全体变形参数的Harris角点子集直线度函数并对它进行Levenberg-Marquardt迭代优化来寻找最优变形参数. 获取图像时无需限定相机与标定图案的相对姿态,算法执行中无需用户交互式干预. 实验结果表明本文算法的校正结果使得内窥镜成像很好地满足线性相机模型,具有亚像素级精 度,是一种快速简单灵活的校正方法,尤其适合临床应用.
2011, 37(11): 1368-1380.
doi: 10.3724/SP.J.1004.2011.01368
摘要:
尽管过去十多年鲁棒数字水印取得了长足的进展,然而如何有效地抵抗几何变换仍然是鲁棒数字水印的关键问题之一. 本文通过设计具有平移不变性、可旋转和可缩放特性的可变形多尺度变换(Deformable multi-scale transform, DMST)来抵抗全局几何攻击. 基于此变换,本文从理论上推导几何同步机制,然后进一步利用它并辅助于模板来设计能有效估计几何攻击参数的算法. 此外,将常规(双)正交小波域隐马尔科夫模型进一步推广到可旋转小波域,以提高水印的检测性能. 实验结果表明本文算法对于常见信号处理攻击、全局几何攻击及其联合攻击具有很好的鲁棒性.
尽管过去十多年鲁棒数字水印取得了长足的进展,然而如何有效地抵抗几何变换仍然是鲁棒数字水印的关键问题之一. 本文通过设计具有平移不变性、可旋转和可缩放特性的可变形多尺度变换(Deformable multi-scale transform, DMST)来抵抗全局几何攻击. 基于此变换,本文从理论上推导几何同步机制,然后进一步利用它并辅助于模板来设计能有效估计几何攻击参数的算法. 此外,将常规(双)正交小波域隐马尔科夫模型进一步推广到可旋转小波域,以提高水印的检测性能. 实验结果表明本文算法对于常见信号处理攻击、全局几何攻击及其联合攻击具有很好的鲁棒性.
2011, 37(11): 1381-1386.
doi: 10.3724/SP.J.1004.2011.01381
摘要:
考虑图形处理中的一类两台处理器上的Flow-shop调度问题, 目标是极小化最早完工时间. 每个任务包含两道工序, 第一道工序可以在两台处理器中的任何一台上处理, 而第二道则只能在第二台处理器上处理, 且必须在第一道工序完工之后才能进行. 对该问题, 设计了一个改进的多项式时间近似算法, 在绝对性能方面, 该算法的最坏情况界为3/2; 而从实例计算的平均效果方面, 该算法所得的结果比原有的贪婪算法所得的结果要好20% 左右.
考虑图形处理中的一类两台处理器上的Flow-shop调度问题, 目标是极小化最早完工时间. 每个任务包含两道工序, 第一道工序可以在两台处理器中的任何一台上处理, 而第二道则只能在第二台处理器上处理, 且必须在第一道工序完工之后才能进行. 对该问题, 设计了一个改进的多项式时间近似算法, 在绝对性能方面, 该算法的最坏情况界为3/2; 而从实例计算的平均效果方面, 该算法所得的结果比原有的贪婪算法所得的结果要好20% 左右.
2011, 37(11): 1387-1394.
doi: 10.3724/SP.J.1004.2011.01387
摘要:
在分析了分数阶系统稳定性与传递函数分母相角增量的关系的基础上, 提出了一种线性分数阶系统的频域稳定性判别定理.定义了关于分数阶系统分母各项系数的两个函数,通过分析这两个函数正实数解的大小关系以及解的数目与分母最高阶数的关系,给出了分数阶系统稳定所需满足的条件.将用于在频域上对整数阶系统稳定性判别的Hermite-Biehler定理推广到对分数阶系统稳定性的判定.最后,通过对两个数值算例的分析,说明了提出的稳定性判别准则的正确性.
在分析了分数阶系统稳定性与传递函数分母相角增量的关系的基础上, 提出了一种线性分数阶系统的频域稳定性判别定理.定义了关于分数阶系统分母各项系数的两个函数,通过分析这两个函数正实数解的大小关系以及解的数目与分母最高阶数的关系,给出了分数阶系统稳定所需满足的条件.将用于在频域上对整数阶系统稳定性判别的Hermite-Biehler定理推广到对分数阶系统稳定性的判定.最后,通过对两个数值算例的分析,说明了提出的稳定性判别准则的正确性.
2011, 37(11): 1395-1401.
doi: 10.3724/SP.J.1004.2011.01395
摘要:
针对一类具有控制和状态有界约束的连续非线性系统, 提出了一种基于单向辅助面滑模控制的正不变集设计方法. 该方法通过将约束条件引入单向辅助面的设计中, 利用单向辅助面构造系统状态的正不变集, 以保证系统状态和控制输入在整个过程中都能满足约束条件. 同时, 滑模控制器设计不再受到切换面的限制, 一些不稳定的超平面也可以作为单向辅助面以设计控制器. 随后给出该方法的稳定性分析以及正不变集的理论证明, 并且通过仿真验证了设计方法的有效性.
针对一类具有控制和状态有界约束的连续非线性系统, 提出了一种基于单向辅助面滑模控制的正不变集设计方法. 该方法通过将约束条件引入单向辅助面的设计中, 利用单向辅助面构造系统状态的正不变集, 以保证系统状态和控制输入在整个过程中都能满足约束条件. 同时, 滑模控制器设计不再受到切换面的限制, 一些不稳定的超平面也可以作为单向辅助面以设计控制器. 随后给出该方法的稳定性分析以及正不变集的理论证明, 并且通过仿真验证了设计方法的有效性.
2011, 37(11): 1402-1406.
doi: 10.3724/SP.J.1004.2011.01402
摘要:
针对脱机文字识别,提出了一种基于线性合成的双粒度递归神经网络(Recurrent neural net work, RNN)集成系统.首先,使用单词RNN对未知图 像进行识别;然后,依据识别结果进行字符分割,使用字符RNN对分割后的字符进行识别,并利用查表法计算字符的后验概率;最后,综合两个RNN的识别结果决定最终单词输出.在CAPTCHA识别 和手写识别上的实验结果证明了该系统的有效性.
针对脱机文字识别,提出了一种基于线性合成的双粒度递归神经网络(Recurrent neural net work, RNN)集成系统.首先,使用单词RNN对未知图 像进行识别;然后,依据识别结果进行字符分割,使用字符RNN对分割后的字符进行识别,并利用查表法计算字符的后验概率;最后,综合两个RNN的识别结果决定最终单词输出.在CAPTCHA识别 和手写识别上的实验结果证明了该系统的有效性.
2011, 37(11): 1407-1412.
doi: 10.3724/SP.J.1004.2011.01407
摘要:
针对带钢表面缺陷识别问题,提出一种基于动态演化复杂网络特性的特征描述方法, 这些特征同时具有位移、旋转不变性、大小不变性、较强的抗干扰能力和鲁棒性,为 缺陷识别提供良好的分类特征;为了提高分类器的效率,应用主成分分析法 (Principal component analysis, PCA) 对复杂网络特 征向量进行特征降维处理;采用最优有向无环图支持向量机 (Directed acyclic graph support vector machine, DAG-SVM)算法进行缺陷分类.结果表明该方法识别率高而且识别速度快.
针对带钢表面缺陷识别问题,提出一种基于动态演化复杂网络特性的特征描述方法, 这些特征同时具有位移、旋转不变性、大小不变性、较强的抗干扰能力和鲁棒性,为 缺陷识别提供良好的分类特征;为了提高分类器的效率,应用主成分分析法 (Principal component analysis, PCA) 对复杂网络特 征向量进行特征降维处理;采用最优有向无环图支持向量机 (Directed acyclic graph support vector machine, DAG-SVM)算法进行缺陷分类.结果表明该方法识别率高而且识别速度快.