2014年 第40卷 第12期
2014, 40(12): 2673-2686.
doi: 10.3724/SP.J.1004.2014.02673
摘要:
近年来, 距离度量学习已成为计算机视觉和模式识别等领域最为活跃的研究课题之一. 如何利用训练数据学习得到有效的距离度量来衡量目标之间的相似性是该类研究的关键问题. 针对有监督的距离度量学习问题,目前已提出了大量的研究算法. 结合近年已发表相关文献对有监督的距离度量学习算法进行了详细的介绍和讨论. 根据样本信息利用方式的不同, 将其划分成基于成对约束和非成对约束的距离度量学习算法, 重点介绍了一些常用的典型算法, 分析了每种算法的原理和优缺点, 最后是未来发展方向和趋势的展望.
近年来, 距离度量学习已成为计算机视觉和模式识别等领域最为活跃的研究课题之一. 如何利用训练数据学习得到有效的距离度量来衡量目标之间的相似性是该类研究的关键问题. 针对有监督的距离度量学习问题,目前已提出了大量的研究算法. 结合近年已发表相关文献对有监督的距离度量学习算法进行了详细的介绍和讨论. 根据样本信息利用方式的不同, 将其划分成基于成对约束和非成对约束的距离度量学习算法, 重点介绍了一些常用的典型算法, 分析了每种算法的原理和优缺点, 最后是未来发展方向和趋势的展望.
2014, 40(12): 2687-2696.
doi: 10.3724/SP.J.1004.2014.02687
摘要:
死锁是资源分配系统中极不希望出现的现象,目前死锁控制的一个重要的方法是信标控制法,信标控制法的基础是信标可控性的定义.对于普通Petri网,已有一个完善的信标可控性定义,而对于一般Petri网,这方面的工作还需改进和完善.近年来,学者们针对一般Petri 网及其子类提出了不少信标可控性定义,但这些定义并不完善,仍有大量的问题亟待解决.首先回顾了文献中的各个信标可控性定义,提出了两个新的信标可控性定义,然后从可控性定义的宽松程度、应用范围以及等价性等方面分析比较了现有的信标可控性定义优缺点.最后给出了今后的研究方向.
死锁是资源分配系统中极不希望出现的现象,目前死锁控制的一个重要的方法是信标控制法,信标控制法的基础是信标可控性的定义.对于普通Petri网,已有一个完善的信标可控性定义,而对于一般Petri网,这方面的工作还需改进和完善.近年来,学者们针对一般Petri 网及其子类提出了不少信标可控性定义,但这些定义并不完善,仍有大量的问题亟待解决.首先回顾了文献中的各个信标可控性定义,提出了两个新的信标可控性定义,然后从可控性定义的宽松程度、应用范围以及等价性等方面分析比较了现有的信标可控性定义优缺点.最后给出了今后的研究方向.
2014, 40(12): 2697-2705.
doi: 10.3724/SP.J.1004.2014.02697
摘要:
考虑具有乘型不确定性的离散随机系统约束控制问题, 设计了一种基于多层概率集的随机预测控制算法. 多层概率集描述了状态在多步反馈控制律下的一系列不同概率的分布区域, 因此能够同时保证多个不同概率要求的软约束. 通过动态优化多步反馈律, 算法具有较大的可行范围. 之后设计的简化算法在降低计算负担的同时保证了算法的可行范围.
考虑具有乘型不确定性的离散随机系统约束控制问题, 设计了一种基于多层概率集的随机预测控制算法. 多层概率集描述了状态在多步反馈控制律下的一系列不同概率的分布区域, 因此能够同时保证多个不同概率要求的软约束. 通过动态优化多步反馈律, 算法具有较大的可行范围. 之后设计的简化算法在降低计算负担的同时保证了算法的可行范围.
2014, 40(12): 2706-2715.
doi: 10.3724/SP.J.1004.2014.02706
摘要:
针对单目视觉移动机器人系统, 本文提出了一种基于二维三焦点张量(2D trifocal tensor, 2DTT)的视觉伺服镇定控制方法. 具体而言, 首先描述了2D三焦点张量的导出过程, 并给出了基于图像特征点的估计方法. 在此基础上根据2D三焦点张量的元素, 设计了一种反馈线性化控制器以实现机器人的位置镇定, 以及一种比例控制器来实现姿态镇定, 因而在场景信息与平移信息均未知情况下完成了移动机器人的视觉镇定控制. 通过理论分析证明了本文设计的镇定控制算法具有指数收敛性能. 相比现有方法, 这种基于2D 三焦点张量的方法在图像特征识别方面具有更强的鲁棒性, 并且在平面场景与立体场景情况下均适用. 最后利用仿真与实验结果验证了本文提出的视觉伺服方法的优良性能.
针对单目视觉移动机器人系统, 本文提出了一种基于二维三焦点张量(2D trifocal tensor, 2DTT)的视觉伺服镇定控制方法. 具体而言, 首先描述了2D三焦点张量的导出过程, 并给出了基于图像特征点的估计方法. 在此基础上根据2D三焦点张量的元素, 设计了一种反馈线性化控制器以实现机器人的位置镇定, 以及一种比例控制器来实现姿态镇定, 因而在场景信息与平移信息均未知情况下完成了移动机器人的视觉镇定控制. 通过理论分析证明了本文设计的镇定控制算法具有指数收敛性能. 相比现有方法, 这种基于2D 三焦点张量的方法在图像特征识别方面具有更强的鲁棒性, 并且在平面场景与立体场景情况下均适用. 最后利用仿真与实验结果验证了本文提出的视觉伺服方法的优良性能.
2014, 40(12): 2716-2725.
doi: 10.3724/SP.J.1004.2014.02716
摘要:
针对重复运行的未知非最小相位系统的轨迹跟踪问题, 结合时域稳定逆特点, 提出了一种新的基函数型自适应迭代学习控制(Basis function based adaptive iterative learning control, BFAILC)算法. 该算法在迭代控制过程中应用自适应迭代学习辨识算法估计基函数模型, 采用伪逆型学习律逼近系统的稳定逆, 保证了迭代学习控制的收敛性和鲁棒性. 以傅里叶基函数为例, 通过在非最小相位系统上的控制仿真, 验证了算法的有效性.
针对重复运行的未知非最小相位系统的轨迹跟踪问题, 结合时域稳定逆特点, 提出了一种新的基函数型自适应迭代学习控制(Basis function based adaptive iterative learning control, BFAILC)算法. 该算法在迭代控制过程中应用自适应迭代学习辨识算法估计基函数模型, 采用伪逆型学习律逼近系统的稳定逆, 保证了迭代学习控制的收敛性和鲁棒性. 以傅里叶基函数为例, 通过在非最小相位系统上的控制仿真, 验证了算法的有效性.
2014, 40(12): 2726-2736.
doi: 10.3724/SP.J.1004.2014.02726
摘要:
提出了一种线性系统在线或者离线的可重构控制分析方法,该方法基于功能目标模型,能够定性分析线性系统的可重构控制问题, 包括发生多个故障时是否具有可重构能力,采用哪些组件和何种控制方法,以及重构后系统是否能达到期望的控制目标等.首先定义了功能、目标、最小重构单元状态、可行集等概念,并基于这些概念建立系统功能目标模型.该模型由功能目标关系和各个目标的可行集组成. 总目标的可行集为系统顶层可行集,可重构控制方案的选择基于顶层可行集.应用本文方法,离线建立起控制系统的功能目标模型后, 可以在线或离线分析其多种故障模式下的可重构问题,还可以用于指导可重构性设计.最后,给出一个卫星控制系统可重构控制分析的例子.
提出了一种线性系统在线或者离线的可重构控制分析方法,该方法基于功能目标模型,能够定性分析线性系统的可重构控制问题, 包括发生多个故障时是否具有可重构能力,采用哪些组件和何种控制方法,以及重构后系统是否能达到期望的控制目标等.首先定义了功能、目标、最小重构单元状态、可行集等概念,并基于这些概念建立系统功能目标模型.该模型由功能目标关系和各个目标的可行集组成. 总目标的可行集为系统顶层可行集,可重构控制方案的选择基于顶层可行集.应用本文方法,离线建立起控制系统的功能目标模型后, 可以在线或离线分析其多种故障模式下的可重构问题,还可以用于指导可重构性设计.最后,给出一个卫星控制系统可重构控制分析的例子.
2014, 40(12): 2737-2746.
doi: 10.3724/SP.J.1004.2014.02737
摘要:
为应对严峻复杂的安全形势, 我国通过构建安全防范系统实现对公共安全的防护. 安全防范系统是由人和安防设备组成的复杂系统, 安全防范系统风险评估是判断其防护效能好坏的重要度量标准. 本文将部署在一个区域的安全防范系统抽象看成由多个安防节点组成的网络, 根据熵理论和Neyman-Pearson准则, 提出一种利用防护最薄弱路径定量度量安全防范系统风险的模型, 并给出安全防范网络防护最弱路径的表达式, 以及基于Dijkstra最短路径算法求解防护最薄弱路径的方法. 最后本文研究模型参数和安全防范系统部署的数量与安全防范网络的风险之间的关系, 给出相应的仿真结果, 并进行实际应用场景的风险评估实验. 实验结果表明, 本文提出的模型可以定量评估多节点的安全防范系统的风险, 提高评估结果的科学性.
为应对严峻复杂的安全形势, 我国通过构建安全防范系统实现对公共安全的防护. 安全防范系统是由人和安防设备组成的复杂系统, 安全防范系统风险评估是判断其防护效能好坏的重要度量标准. 本文将部署在一个区域的安全防范系统抽象看成由多个安防节点组成的网络, 根据熵理论和Neyman-Pearson准则, 提出一种利用防护最薄弱路径定量度量安全防范系统风险的模型, 并给出安全防范网络防护最弱路径的表达式, 以及基于Dijkstra最短路径算法求解防护最薄弱路径的方法. 最后本文研究模型参数和安全防范系统部署的数量与安全防范网络的风险之间的关系, 给出相应的仿真结果, 并进行实际应用场景的风险评估实验. 实验结果表明, 本文提出的模型可以定量评估多节点的安全防范系统的风险, 提高评估结果的科学性.
2014, 40(12): 2747-2755.
doi: 10.3724/SP.J.1004.2014.02747
摘要:
无线网络分布式链路调度技术通过发掘无线传输间的复用达到提高吞吐量的目的. 链路调度策略的形成需要节点间公平地交互含有如节点ID、队列长度等信息的短报文,并且这些短报文同步传输,导致信道拥挤.由于存在信道空闲侦听开销,在拥挤信道中频繁后退,以及隐藏终端和暴露终端的问题,传统的CSMA/CA (Carrier sense multiple access with collision avoidance)协议传输性能低下,难以为分布式无线链路调度技术服务. 针对链路调度策略形成期间报文短、信道拥挤以及公平性要求的挑战.提出了一个简单的随机MAC (Media access control)协议DLSOMAC (Distributed link scheduling oriented MAC). DLSOMAC协议没有信道侦听过程,以降低短报文的传输延迟开销;基于分布式息票收集算法,均匀分散传输时刻来降低冲撞概率和提高公平性,以满足分布式链路调度技术对MAC层的需求.用排队论分析了DLSOMAC的报文传输延迟性能.仿真实验表明, 在短报文情况下,无论网络负载轻重与否, DLSOMAC协议的报文传输延迟明显优于CSMA/CA,并且报文越短,性能相对越好.即使在长报文的情况下,当网络负载很重时, DLOSMAC协议也稍优于CSMA/CA协议,适合于为自组织网络的分布式链路调度技术服务.
无线网络分布式链路调度技术通过发掘无线传输间的复用达到提高吞吐量的目的. 链路调度策略的形成需要节点间公平地交互含有如节点ID、队列长度等信息的短报文,并且这些短报文同步传输,导致信道拥挤.由于存在信道空闲侦听开销,在拥挤信道中频繁后退,以及隐藏终端和暴露终端的问题,传统的CSMA/CA (Carrier sense multiple access with collision avoidance)协议传输性能低下,难以为分布式无线链路调度技术服务. 针对链路调度策略形成期间报文短、信道拥挤以及公平性要求的挑战.提出了一个简单的随机MAC (Media access control)协议DLSOMAC (Distributed link scheduling oriented MAC). DLSOMAC协议没有信道侦听过程,以降低短报文的传输延迟开销;基于分布式息票收集算法,均匀分散传输时刻来降低冲撞概率和提高公平性,以满足分布式链路调度技术对MAC层的需求.用排队论分析了DLSOMAC的报文传输延迟性能.仿真实验表明, 在短报文情况下,无论网络负载轻重与否, DLSOMAC协议的报文传输延迟明显优于CSMA/CA,并且报文越短,性能相对越好.即使在长报文的情况下,当网络负载很重时, DLOSMAC协议也稍优于CSMA/CA协议,适合于为自组织网络的分布式链路调度技术服务.
2014, 40(12): 2756-2765.
doi: 10.3724/SP.J.1004.2014.02756
摘要:
城市客运交通枢纽系统是一个典型的复杂巨系统, 传统的管理方法难以形成具有动态适应能力的有效解决方案. 运用复杂系统研究中的ACP (人工系统、计算机实验、平行执行)方法, 首次给出城市客运交通枢纽平行控制与管理系统研究框架. 以该框架为基础, 首先,分析了人工交通枢纽系统中模型的构成及支撑条件; 进而对人工交通枢纽系统计算实验中涉及的实验场景设计、实验内容设计进行了详细阐述; 最后,对人工交通枢纽系统平行执行内容进行了说明. 该体系框架的提出, 对于城市客运交通枢纽管控水平的提高具有重要指导意义.
城市客运交通枢纽系统是一个典型的复杂巨系统, 传统的管理方法难以形成具有动态适应能力的有效解决方案. 运用复杂系统研究中的ACP (人工系统、计算机实验、平行执行)方法, 首次给出城市客运交通枢纽平行控制与管理系统研究框架. 以该框架为基础, 首先,分析了人工交通枢纽系统中模型的构成及支撑条件; 进而对人工交通枢纽系统计算实验中涉及的实验场景设计、实验内容设计进行了详细阐述; 最后,对人工交通枢纽系统平行执行内容进行了说明. 该体系框架的提出, 对于城市客运交通枢纽管控水平的提高具有重要指导意义.
2014, 40(12): 2766-2781.
doi: 10.3724/SP.J.1004.2014.02766
摘要:
针对复杂系统故障诊断建模及推理的复杂性、数据不足、领域知识及监测信息不完备等问题, 本文基于动态不确定因果图(Dynamic uncertain causality graph, DUCG)进行权重逻辑推理(Weighted logical inference, WLI)及其数理基础的系统化研究. WLI引入绑定权重系数的逻辑事件推理机制, 可确保变量状态概率的自动归一性和链式推理的自我依赖性, 为多赋值因果关系的简洁、不完备表达提供了解决方案. 由于WLI在信息不完全性和命题真值空间的高维性等方面突破了经典数理逻辑, 为使其理论基础更为坚实, 本文进行了WLI的规范化定义、推理算法补充、运算性质探析, 并就理论相容性和自洽性开展了详细论证. 算法分析及故障诊断实验结果表明, 其高效、准确、较少依赖于参数精确性和数据完备性等特征.
针对复杂系统故障诊断建模及推理的复杂性、数据不足、领域知识及监测信息不完备等问题, 本文基于动态不确定因果图(Dynamic uncertain causality graph, DUCG)进行权重逻辑推理(Weighted logical inference, WLI)及其数理基础的系统化研究. WLI引入绑定权重系数的逻辑事件推理机制, 可确保变量状态概率的自动归一性和链式推理的自我依赖性, 为多赋值因果关系的简洁、不完备表达提供了解决方案. 由于WLI在信息不完全性和命题真值空间的高维性等方面突破了经典数理逻辑, 为使其理论基础更为坚实, 本文进行了WLI的规范化定义、推理算法补充、运算性质探析, 并就理论相容性和自洽性开展了详细论证. 算法分析及故障诊断实验结果表明, 其高效、准确、较少依赖于参数精确性和数据完备性等特征.
2014, 40(12): 2782-2796.
doi: 10.3724/SP.J.1004.2014.02782
摘要:
提出一种高精度的基于匹配扩散的稠密深度图估计算法. 算法分为像素级与区域级两阶段的匹配扩散过程.前者主要对视图间的稀疏特征点匹配进行扩散以获取相对稠密的初始深度图; 而后者则在多幅初始深度图的基础上, 根据场景分段平滑的假设, 在能量函数最小化框架下利用平面拟合及多方向平面扫描等方法解决存在匹配多义性问题区域(如弱纹理区域)的深度推断问题. 在标准数据集及真实数据集上的实验表明, 本文算法对视图中的光照变化、透视畸变等因素具有较强的适应性, 并能有效地对弱纹理区域的深度信息进行推断, 从而可以获得高精度、稠密的深度图.
提出一种高精度的基于匹配扩散的稠密深度图估计算法. 算法分为像素级与区域级两阶段的匹配扩散过程.前者主要对视图间的稀疏特征点匹配进行扩散以获取相对稠密的初始深度图; 而后者则在多幅初始深度图的基础上, 根据场景分段平滑的假设, 在能量函数最小化框架下利用平面拟合及多方向平面扫描等方法解决存在匹配多义性问题区域(如弱纹理区域)的深度推断问题. 在标准数据集及真实数据集上的实验表明, 本文算法对视图中的光照变化、透视畸变等因素具有较强的适应性, 并能有效地对弱纹理区域的深度信息进行推断, 从而可以获得高精度、稠密的深度图.
2014, 40(12): 2797-2807.
doi: 10.3724/SP.J.1004.2014.02797
摘要:
光谱相似性是指高光谱图像中的大量像元具有相似光谱的性质.提出了一种基于光谱相似性的高光谱遥感图像超分辨率算法,利用遥感图像中广泛存在的结构自相似性提升图像的空间分辨率,利用高光谱图像的低维子空间性通过主成分分析降低光谱维数提高运算效率,利用具有相似光谱的像元构建光谱约束项保证重建图像光谱的准确性.该算法在将单波段图像超分辨率方法推广到处理具有数百、乃至上千波段的高光谱图像过程中,既保证了重建图像光谱的准确性,又具有较高的运算效率.实验表明,与双三次插值和基于稀疏表示与光谱正则化约束的高光谱图像超分辨率算法相比,该算法具有更高的空间分辨率提升能力和更好的光谱保真能力.
光谱相似性是指高光谱图像中的大量像元具有相似光谱的性质.提出了一种基于光谱相似性的高光谱遥感图像超分辨率算法,利用遥感图像中广泛存在的结构自相似性提升图像的空间分辨率,利用高光谱图像的低维子空间性通过主成分分析降低光谱维数提高运算效率,利用具有相似光谱的像元构建光谱约束项保证重建图像光谱的准确性.该算法在将单波段图像超分辨率方法推广到处理具有数百、乃至上千波段的高光谱图像过程中,既保证了重建图像光谱的准确性,又具有较高的运算效率.实验表明,与双三次插值和基于稀疏表示与光谱正则化约束的高光谱图像超分辨率算法相比,该算法具有更高的空间分辨率提升能力和更好的光谱保真能力.
2014, 40(12): 2808-2814.
doi: 10.3724/SP.J.1004.2014.02808
摘要:
在资源相对匮乏的自动语音识别(Automatic speech recognition, ASR)领域, 如面向电话交谈的语音识别系统中, 统计语言模型(Language model, LM)存在着严重的数据稀疏问题. 本文提出了一种基于等概率事件的采样语料生成算法, 自动生成领域相关的语料, 用来强化统计语言模型建模. 实验结果表明, 加入本算法生成的采样语料可以缓解语言模型的稀疏性, 从而提升整个语音识别系统的性能. 在开发集上语言模型的困惑度相对降低7.5%, 字错误率(Character error rate, CER)绝对降低0.2个点; 在测试集上语言模型的困惑度相对降低6%, 字错误率绝对降低0.4点.
在资源相对匮乏的自动语音识别(Automatic speech recognition, ASR)领域, 如面向电话交谈的语音识别系统中, 统计语言模型(Language model, LM)存在着严重的数据稀疏问题. 本文提出了一种基于等概率事件的采样语料生成算法, 自动生成领域相关的语料, 用来强化统计语言模型建模. 实验结果表明, 加入本算法生成的采样语料可以缓解语言模型的稀疏性, 从而提升整个语音识别系统的性能. 在开发集上语言模型的困惑度相对降低7.5%, 字错误率(Character error rate, CER)绝对降低0.2个点; 在测试集上语言模型的困惑度相对降低6%, 字错误率绝对降低0.4点.
2014, 40(12): 2815-2823.
doi: 10.3724/SP.J.1004.2014.02815
摘要:
针对发音错误检测的发音字典生成提出基于联合序列多阶模型(Joint-sequence multi-gram, JSM)和多层神经感知(Multi-layer perception, MLP)的方法. 首先使用JSM模型对发音错误进行建模, 将标准发音和错误发音组合为发音对, 表示它们之间的对应关系, 再使用N元文法来统计各发音对之间的关系, 描述错误发音对上下文关系的依赖. 最后使用MLP对发音对之间的关系进行重新建模, 以学习到在相似的上下文条件下发生的相似的错误. 实验证明使用MLP对高阶模型进行概率重估能有效的平滑概率空间, 提高了发音错误检测的性能.
针对发音错误检测的发音字典生成提出基于联合序列多阶模型(Joint-sequence multi-gram, JSM)和多层神经感知(Multi-layer perception, MLP)的方法. 首先使用JSM模型对发音错误进行建模, 将标准发音和错误发音组合为发音对, 表示它们之间的对应关系, 再使用N元文法来统计各发音对之间的关系, 描述错误发音对上下文关系的依赖. 最后使用MLP对发音对之间的关系进行重新建模, 以学习到在相似的上下文条件下发生的相似的错误. 实验证明使用MLP对高阶模型进行概率重估能有效的平滑概率空间, 提高了发音错误检测的性能.
2014, 40(12): 2824-2835.
doi: 10.3724/SP.J.1004.2014.02824
摘要:
膨胀图(Expander graphs, EG) 理论与压缩感知(Compressive sensing, CS)理论相结合是近几年发展起来的一个新方向, 其优点在于能设计出具有确定结构的0-1测量矩阵, 且可根据膨胀图的结构协同设计重建算法, 相当于在重建算法中引入了先验知识, 能更快更准确地重构出稀疏信号. 本文从非均匀采样的必要性和合理性分析出发, 在已有的膨胀图压缩感知理论基础上, 将膨胀图的定义拓展到左顶点度数不相等的边膨胀图, 并建立起边膨胀图邻接矩阵与有限等距性质 (Restricted isometry property, RIP)条件之间的联系, 又进一步给出了边膨胀图邻接矩阵的列相关系数的上限值. 同时根据边膨胀图的特性, 协同设计了两种压缩感知重建算法. 通过仿真实验对比边膨胀图代表的非均匀采样模式与现有膨胀图代表的均匀采样模式, 以及本文设计的算法与传统算法在重建稀疏信号上的性能, 实验结果验证了边膨胀图压缩感知理论的有效性.
膨胀图(Expander graphs, EG) 理论与压缩感知(Compressive sensing, CS)理论相结合是近几年发展起来的一个新方向, 其优点在于能设计出具有确定结构的0-1测量矩阵, 且可根据膨胀图的结构协同设计重建算法, 相当于在重建算法中引入了先验知识, 能更快更准确地重构出稀疏信号. 本文从非均匀采样的必要性和合理性分析出发, 在已有的膨胀图压缩感知理论基础上, 将膨胀图的定义拓展到左顶点度数不相等的边膨胀图, 并建立起边膨胀图邻接矩阵与有限等距性质 (Restricted isometry property, RIP)条件之间的联系, 又进一步给出了边膨胀图邻接矩阵的列相关系数的上限值. 同时根据边膨胀图的特性, 协同设计了两种压缩感知重建算法. 通过仿真实验对比边膨胀图代表的非均匀采样模式与现有膨胀图代表的均匀采样模式, 以及本文设计的算法与传统算法在重建稀疏信号上的性能, 实验结果验证了边膨胀图压缩感知理论的有效性.
2014, 40(12): 2836-2850.
doi: 10.3724/SP.J.1004.2014.02836
摘要:
对领域知识挖掘利用的充分与否,直接影响到面向特定领域的词义消歧(Word sense disambiguation, WSD)的性能.本文提出一种基于领域知识的图模型词义消歧方法,该方法充分挖掘领域知识,为目标领域收集文本领域关联词作为文本领域知识,为目标歧义词的各个词义获取词义领域标注作为词义领域知识;利用文本领域关联词和句子上下文词构建消歧图,并根据词义领域知识对消歧图进行调整;使用改进的图评分方法对消歧图的各个词义结点的重要度进行评分,选择正确的词义.该方法能有效地将领域知识整合到图模型中,在Koeling数据集上,取得了同类研究的最佳消歧效果.本文亦对多种图模型评分方法做了改进,进行了详细的对比实验研究.
对领域知识挖掘利用的充分与否,直接影响到面向特定领域的词义消歧(Word sense disambiguation, WSD)的性能.本文提出一种基于领域知识的图模型词义消歧方法,该方法充分挖掘领域知识,为目标领域收集文本领域关联词作为文本领域知识,为目标歧义词的各个词义获取词义领域标注作为词义领域知识;利用文本领域关联词和句子上下文词构建消歧图,并根据词义领域知识对消歧图进行调整;使用改进的图评分方法对消歧图的各个词义结点的重要度进行评分,选择正确的词义.该方法能有效地将领域知识整合到图模型中,在Koeling数据集上,取得了同类研究的最佳消歧效果.本文亦对多种图模型评分方法做了改进,进行了详细的对比实验研究.
2014, 40(12): 2851-2861.
doi: 10.3724/SP.J.1004.2014.02851
摘要:
针对多帧图像超分辨率重建问题, 利用一阶泰勒展式, 在亚像素级上对图像退化过程进行建模, 并建立极小化能量函数, 选择Graph-cut算法进行能量极小化求解. 为了验证本文算法的有效性, 采用模拟图像退化过程和直接用相机拍摄两种方式获得低分辨率图像序列. 从4×4倍重建结果的比较来看, 本文算法不仅对模拟退化过程产生的低分辨率图像序列有效, 而且在提高真实低分辨率图像的分辨能力方面也有很好的效果. 此外, 实验结果表明本文算法对噪声有较好的抗干扰能力.
针对多帧图像超分辨率重建问题, 利用一阶泰勒展式, 在亚像素级上对图像退化过程进行建模, 并建立极小化能量函数, 选择Graph-cut算法进行能量极小化求解. 为了验证本文算法的有效性, 采用模拟图像退化过程和直接用相机拍摄两种方式获得低分辨率图像序列. 从4×4倍重建结果的比较来看, 本文算法不仅对模拟退化过程产生的低分辨率图像序列有效, 而且在提高真实低分辨率图像的分辨能力方面也有很好的效果. 此外, 实验结果表明本文算法对噪声有较好的抗干扰能力.
2014, 40(12): 2862-2876.
doi: 10.3724/SP.J.1004.2014.02862
摘要:
针对姿态多变化的飞机自动目标识别中的低识别率问题, 提出了一种基于DSmT (Dezert-Smarandache theory)与隐马尔可夫模型(Hidden Markov model, HMM)的飞机多特征序列信息融合识别算法(Multiple features and sequential information fusion, MFSIF). 其创新性在于将单幅图像的多特征信息融合识别和序列图像信息融合识别进行有机结合.首先, 对图像进行二值化预处理, 并提取目标的Hu矩和轮廓局部奇异值特征; 然后, 利用概率神经网络(Probabilistic neural networks, PNN)构造基本信度赋值(Basic belief assignment, BBA); 接着, 利用DSmT对该图像的不同特征进行融合,从而获得HMM的观察值序列;再接着, 利用隐马尔可夫模型对飞机序列信息融合, 计算观察值序列与各隐马尔可夫模型之间的相似度, 从而实现姿态多变化的飞机目标自动识别;最后, 通过仿真实验, 验证了该算法在飞机姿态发生较大变化时, 依然可以获得较高的正确识别率,同时在实时性方面也可以满足飞机目标识别的要求. 另外, 在飞机序列发生连续遮挡帧数τ ≤ 6的情况下, 也具有较高的飞机目标正确识别率.
针对姿态多变化的飞机自动目标识别中的低识别率问题, 提出了一种基于DSmT (Dezert-Smarandache theory)与隐马尔可夫模型(Hidden Markov model, HMM)的飞机多特征序列信息融合识别算法(Multiple features and sequential information fusion, MFSIF). 其创新性在于将单幅图像的多特征信息融合识别和序列图像信息融合识别进行有机结合.首先, 对图像进行二值化预处理, 并提取目标的Hu矩和轮廓局部奇异值特征; 然后, 利用概率神经网络(Probabilistic neural networks, PNN)构造基本信度赋值(Basic belief assignment, BBA); 接着, 利用DSmT对该图像的不同特征进行融合,从而获得HMM的观察值序列;再接着, 利用隐马尔可夫模型对飞机序列信息融合, 计算观察值序列与各隐马尔可夫模型之间的相似度, 从而实现姿态多变化的飞机目标自动识别;最后, 通过仿真实验, 验证了该算法在飞机姿态发生较大变化时, 依然可以获得较高的正确识别率,同时在实时性方面也可以满足飞机目标识别的要求. 另外, 在飞机序列发生连续遮挡帧数τ ≤ 6的情况下, 也具有较高的飞机目标正确识别率.
2014, 40(12): 2877-2886.
doi: 10.3724/SP.J.1004.2014.02877
摘要:
网络舆情分析中需要处理大量时效性较强的文本数据流. 针对在线时效性较强的文本数据流, 提出基于LDA (Latent Dirichlet allocation)的双通道在线主题演化模型(Bi-path evolution online-LDA, BPE-OLDA), 在下一时间片生成文本时考虑文本的内容遗传和强度遗传, 很好地模拟了人在生成时效性较强的文本时的特征. 估算模型参数时对 Gibbs 采样算法进行了简化, 实验证明, 使用简化后的在线 Gibbs 重采样算法, BPE-OLDA 模型在提取时效性较强的文本数据流的主题方面具有明显的效果.
网络舆情分析中需要处理大量时效性较强的文本数据流. 针对在线时效性较强的文本数据流, 提出基于LDA (Latent Dirichlet allocation)的双通道在线主题演化模型(Bi-path evolution online-LDA, BPE-OLDA), 在下一时间片生成文本时考虑文本的内容遗传和强度遗传, 很好地模拟了人在生成时效性较强的文本时的特征. 估算模型参数时对 Gibbs 采样算法进行了简化, 实验证明, 使用简化后的在线 Gibbs 重采样算法, BPE-OLDA 模型在提取时效性较强的文本数据流的主题方面具有明显的效果.
2014, 40(12): 2887-2898.
doi: 10.3724/SP.J.1004.2014.02887
摘要:
图像中含有阴影区域对后续处理任务影响较大, 根据阴影特性, 提出基于交叉皮质模型(Intersecting cortical model, ICM)的单幅图像阴影检测算法. 通过在点火连接矩阵构造上考虑邻域像素值依赖关系, 融入局部二值模式(Local binary pattern, LBP)表征的纹理信息形成了Te-ICM模型. 根据阴影检测流程,利用模型迭代特性, 通过设计停止条件自动检测本影, 在本影修复后生成附着半影. 同时优化模型参数, 设计了基于分层聚类直方图划分的阈值下降策略. 仿真结果表明: 对于典型影像集, Te-ICM模型及相应参数设计可以较好地实现阴影检测, 输出阴影掩模准确度高, 为后续阴影去除提供了基础.
图像中含有阴影区域对后续处理任务影响较大, 根据阴影特性, 提出基于交叉皮质模型(Intersecting cortical model, ICM)的单幅图像阴影检测算法. 通过在点火连接矩阵构造上考虑邻域像素值依赖关系, 融入局部二值模式(Local binary pattern, LBP)表征的纹理信息形成了Te-ICM模型. 根据阴影检测流程,利用模型迭代特性, 通过设计停止条件自动检测本影, 在本影修复后生成附着半影. 同时优化模型参数, 设计了基于分层聚类直方图划分的阈值下降策略. 仿真结果表明: 对于典型影像集, Te-ICM模型及相应参数设计可以较好地实现阴影检测, 输出阴影掩模准确度高, 为后续阴影去除提供了基础.
2014, 40(12): 2899-2907.
doi: 10.3724/SP.J.1004.2014.02899
摘要:
提出了一种基于动态加权的数据选取方法, 并应用到连续语音识别的声学模型区分性训练中. 该方法联合后验概率和音素准确率选取数据, 首先, 采用后验概率的Beam算法裁剪词图, 在此基础上依据候选词所在候选路径的错误率, 基于后验概率动态的赋予候选词不同的权值; 其次, 通过统计音素对之间的混淆程度, 给易混淆音素对动态地加以不同的惩罚权重, 计算音素准确率; 最后, 在估计得到弧段期望准确率分布的基础上, 采用高斯函数形式对所有竞争弧段的期望音素准确率软加权.实验结果表明, 与最小音素错误准则相比, 该动态加权方法识别准确率提高了0.61%, 可有效减少训练时间.
提出了一种基于动态加权的数据选取方法, 并应用到连续语音识别的声学模型区分性训练中. 该方法联合后验概率和音素准确率选取数据, 首先, 采用后验概率的Beam算法裁剪词图, 在此基础上依据候选词所在候选路径的错误率, 基于后验概率动态的赋予候选词不同的权值; 其次, 通过统计音素对之间的混淆程度, 给易混淆音素对动态地加以不同的惩罚权重, 计算音素准确率; 最后, 在估计得到弧段期望准确率分布的基础上, 采用高斯函数形式对所有竞争弧段的期望音素准确率软加权.实验结果表明, 与最小音素错误准则相比, 该动态加权方法识别准确率提高了0.61%, 可有效减少训练时间.
2014, 40(12): 2908-2915.
doi: 10.3724/SP.J.1004.2014.02908
摘要:
传统的ε-支持向量回归机(ε-support vector regression, ε-SVR)只是根据样本点处的响应值来构建模型, 并没考虑样本点处的梯度信息. 如果样本点处的梯度信息容易获得或者获得的成本并不高, 那就应该将梯度信息应用到模型的构建中. 已有的基于梯度信息的 ε-支持向量回归机模型的构建是从泰勒展开的角度着手, 简单地将梯度信息插入到泰勒展开式中; 本研究另辟蹊径, 并没有去估计样本点邻域内的函数值, 而是将梯度信息作为第二类变量融入到核矩阵中直接构建优化模型, 使模型的构建更为简捷直观, 并据此得到一种新的基于梯度信息的 ε-支持向量回归机(Gradient-enhanced ε-support vector regression, GESVR) 模型. 所提模型通过了常用分析函数及精算领域中的生命表数据的验证, 实验表明, 与传统的 ε-SVR相比, 考虑梯度信息的GESVR模型显著地提高了其预测精度.
传统的ε-支持向量回归机(ε-support vector regression, ε-SVR)只是根据样本点处的响应值来构建模型, 并没考虑样本点处的梯度信息. 如果样本点处的梯度信息容易获得或者获得的成本并不高, 那就应该将梯度信息应用到模型的构建中. 已有的基于梯度信息的 ε-支持向量回归机模型的构建是从泰勒展开的角度着手, 简单地将梯度信息插入到泰勒展开式中; 本研究另辟蹊径, 并没有去估计样本点邻域内的函数值, 而是将梯度信息作为第二类变量融入到核矩阵中直接构建优化模型, 使模型的构建更为简捷直观, 并据此得到一种新的基于梯度信息的 ε-支持向量回归机(Gradient-enhanced ε-support vector regression, GESVR) 模型. 所提模型通过了常用分析函数及精算领域中的生命表数据的验证, 实验表明, 与传统的 ε-SVR相比, 考虑梯度信息的GESVR模型显著地提高了其预测精度.
2014, 40(12): 2916-2925.
doi: 10.3724/SP.J.1004.2014.02916
摘要:
提出基于改进的在线多示例学习算法(Improved multiple instance learning, IMIL)的移动机器人目标跟踪方法. 该方法利用射频识别系统(Radio frequency identification, RFID)粗定位IMIL算法的搜索区域, 然后应用IMIL算法实现目标跟踪. 该方法保证了机器人跟踪系统的连续性, 解决了目标突然转弯时的跟踪问题. IMIL算法采用从低维空间提取的压缩特征描述包中示例, 以降低算法耗时. 通过最大化弱分类器与极大似然概率的内积, 选择判别能力强的弱分类器, 避免了弱分类器选择过程中多次计算包概率和示例概率, 进一步提高算法的实时处理能力. 计算包概率时该算法平等对待各示例, 保证概率高的示例对包概率的贡献度, 克服跟踪漂移问题. 跟踪过程中, 结合当前跟踪结果与目标模板间的相似性分数在线实时调整分类器, 提高了算法的自适应能力. 最后将本文方法在视频和移动机器人上进行实验. 实验结果表明, 该方法在目标运动突变及外观改变时具有较强的鲁棒性和准确性, 并满足系统的实时性要求.
提出基于改进的在线多示例学习算法(Improved multiple instance learning, IMIL)的移动机器人目标跟踪方法. 该方法利用射频识别系统(Radio frequency identification, RFID)粗定位IMIL算法的搜索区域, 然后应用IMIL算法实现目标跟踪. 该方法保证了机器人跟踪系统的连续性, 解决了目标突然转弯时的跟踪问题. IMIL算法采用从低维空间提取的压缩特征描述包中示例, 以降低算法耗时. 通过最大化弱分类器与极大似然概率的内积, 选择判别能力强的弱分类器, 避免了弱分类器选择过程中多次计算包概率和示例概率, 进一步提高算法的实时处理能力. 计算包概率时该算法平等对待各示例, 保证概率高的示例对包概率的贡献度, 克服跟踪漂移问题. 跟踪过程中, 结合当前跟踪结果与目标模板间的相似性分数在线实时调整分类器, 提高了算法的自适应能力. 最后将本文方法在视频和移动机器人上进行实验. 实验结果表明, 该方法在目标运动突变及外观改变时具有较强的鲁棒性和准确性, 并满足系统的实时性要求.
2014, 40(12): 2926-2935.
doi: 10.3724/SP.J.1004.2014.02926
摘要:
为解决高维滤波中存在的边缘特征模糊和细节保持问题, 创新性提出了一种基于混合梯度最小化Mumford-Shah模型的平滑算法. 通过最小化包含梯度的L0、L1范数的正则化函数, 实现边缘保持和局部光滑的滤波分解效果. 从二维图像来看, 梯度的L0范数刻画了图像中非光滑像素的个数, 最小化梯度的L0范数可以实现图像分片同质的效果, 即可对应Mumford-Shah模型中要求的边缘内部尽量均匀; 梯度的L1范数, 即全变差项, 刻画了图像中所有水平集的长度, 最小化梯度的L1范数可以实现控制图像边缘锐利度的目的, 即Mumford-Shah模型中关于图像边缘保持的约束. 由于Mumford-Shah模型具有鲁棒的信号平滑和边缘特征描述能力, 因此在进行高维信号分解等处理时,可以取得良好分离效果. 实验结果表明, 混合梯度Mumford-Shah模型在滤波过程中可以实现边缘保持和纹理平滑相统一的特性, 获得优异的图像结构纹理分解效果, 对多个图像应用的处理效果有显著的提升, 在三维网格数据上也获得良好的去噪性能.
为解决高维滤波中存在的边缘特征模糊和细节保持问题, 创新性提出了一种基于混合梯度最小化Mumford-Shah模型的平滑算法. 通过最小化包含梯度的L0、L1范数的正则化函数, 实现边缘保持和局部光滑的滤波分解效果. 从二维图像来看, 梯度的L0范数刻画了图像中非光滑像素的个数, 最小化梯度的L0范数可以实现图像分片同质的效果, 即可对应Mumford-Shah模型中要求的边缘内部尽量均匀; 梯度的L1范数, 即全变差项, 刻画了图像中所有水平集的长度, 最小化梯度的L1范数可以实现控制图像边缘锐利度的目的, 即Mumford-Shah模型中关于图像边缘保持的约束. 由于Mumford-Shah模型具有鲁棒的信号平滑和边缘特征描述能力, 因此在进行高维信号分解等处理时,可以取得良好分离效果. 实验结果表明, 混合梯度Mumford-Shah模型在滤波过程中可以实现边缘保持和纹理平滑相统一的特性, 获得优异的图像结构纹理分解效果, 对多个图像应用的处理效果有显著的提升, 在三维网格数据上也获得良好的去噪性能.
2014, 40(12): 2936-2943.
doi: 10.3724/SP.J.1004.2014.02936
摘要:
提出一种基于图像内容的空域隐写分析方法, 该方法对图像进行分割, 使分割得到的每一类子图像具有相同的统计特性, 并对每一类子图像提取更加敏感的隐写分析特征, 分别构造分类器进行训练和测试, 由此对分割所得到的每一幅子图像都可以得到一个检测结果. 对整幅图像的判决结果通过加权融合得到. 实验结果表明,该方法具有良好的性能, 尤其是针对自适应隐写方法, 该算法的检测准确率提高更加明显.
提出一种基于图像内容的空域隐写分析方法, 该方法对图像进行分割, 使分割得到的每一类子图像具有相同的统计特性, 并对每一类子图像提取更加敏感的隐写分析特征, 分别构造分类器进行训练和测试, 由此对分割所得到的每一幅子图像都可以得到一个检测结果. 对整幅图像的判决结果通过加权融合得到. 实验结果表明,该方法具有良好的性能, 尤其是针对自适应隐写方法, 该算法的检测准确率提高更加明显.
2014, 40(12): 2944-2949.
doi: 10.3724/SP.J.1004.2014.02944
摘要:
提出了一种在层次化分割框架下,通过结合图像的底层局部特征以及高层的上下文特征,进行图像自动语义标注的新算法. 该算法的核心思想在于对较大的图像区域的识别结果有利于对其包含的较小图像区域进行识别.算法首先对每层分割后的图像区域进行识别, 然后利用贝叶斯定理将各层区域识别的结果通过线性加权的方式进行融合,从而达到对整幅图像进行自动语义标注的目的.与现有的图像标注算法相比,仿真实验表明本文算法获得了最好的标注精度以及最快的标注速度.
提出了一种在层次化分割框架下,通过结合图像的底层局部特征以及高层的上下文特征,进行图像自动语义标注的新算法. 该算法的核心思想在于对较大的图像区域的识别结果有利于对其包含的较小图像区域进行识别.算法首先对每层分割后的图像区域进行识别, 然后利用贝叶斯定理将各层区域识别的结果通过线性加权的方式进行融合,从而达到对整幅图像进行自动语义标注的目的.与现有的图像标注算法相比,仿真实验表明本文算法获得了最好的标注精度以及最快的标注速度.
2014, 40(12): 2950-2958.
doi: 10.3724/SP.J.1004.2014.02950
摘要:
提出高速列车非线性模型的极大似然(Maximum likelihood, ML)辨识方法,适合于高速列车在非高斯噪声干扰下的非线性模型的参数估计.首先,构建了描述高速列车单质点力学行为的随机离散非线性状态空间模型,并将高速列车参数的极大似然(ML)估计问题转化为期望极大(Expectation maximization, EM)的优化问题; 然后,给出高速列车状态估计的粒子滤波器和粒子平滑器的设计方法,据此构造列车的条件数学期望,并给出最大化该数学期望的梯度搜索方法,进而得到列车参数的辨识算法,分析了算法的收敛速度; 最后,进行了高速列车阻力系数估计的数值对比实验. 结果表明, 所提出的辨识方法的有效性.
提出高速列车非线性模型的极大似然(Maximum likelihood, ML)辨识方法,适合于高速列车在非高斯噪声干扰下的非线性模型的参数估计.首先,构建了描述高速列车单质点力学行为的随机离散非线性状态空间模型,并将高速列车参数的极大似然(ML)估计问题转化为期望极大(Expectation maximization, EM)的优化问题; 然后,给出高速列车状态估计的粒子滤波器和粒子平滑器的设计方法,据此构造列车的条件数学期望,并给出最大化该数学期望的梯度搜索方法,进而得到列车参数的辨识算法,分析了算法的收敛速度; 最后,进行了高速列车阻力系数估计的数值对比实验. 结果表明, 所提出的辨识方法的有效性.
2014, 40(12): 2959-2967.
doi: 10.3724/SP.J.1004.2014.02959
摘要:
研究了噪声环境下具有向网络拓扑结构的时滞多智能体系统的非线性编队控制问题. 首先, 建立了一类随机时滞微分方程的稳定性理, 并提出了三类含多层领导者的非线性编队控制协议, 即时不变编队、时变编队以及时变编队轨迹追踪; 其次, 基于上述稳定性理论给出了这三类编队控制协议分别引导受控系统实现均方指数稳定和几乎必然指数稳定的充分性条件; 最后, 给出的仿真实例进一步验证了文中理论结果的有效性.
研究了噪声环境下具有向网络拓扑结构的时滞多智能体系统的非线性编队控制问题. 首先, 建立了一类随机时滞微分方程的稳定性理, 并提出了三类含多层领导者的非线性编队控制协议, 即时不变编队、时变编队以及时变编队轨迹追踪; 其次, 基于上述稳定性理论给出了这三类编队控制协议分别引导受控系统实现均方指数稳定和几乎必然指数稳定的充分性条件; 最后, 给出的仿真实例进一步验证了文中理论结果的有效性.
2014, 40(12): 2968-2972.
doi: 10.3724/SP.J.1004.2014.02968
摘要:
基于神经网络(NN)研究了一类含有未知非线性项的高阶随机不确定系统的自适应状态反馈控制问题. 通过引入径向基函数神经网络(RBF NN) 逼近方法, 运用 backstepping 技术以及选择合适的 Lyapunov 函数, 我们构造了一个自适应状态反馈控制器使得闭环系统是半全局一致最终有界的. 仿真例子验证了设计方法的有效性.
基于神经网络(NN)研究了一类含有未知非线性项的高阶随机不确定系统的自适应状态反馈控制问题. 通过引入径向基函数神经网络(RBF NN) 逼近方法, 运用 backstepping 技术以及选择合适的 Lyapunov 函数, 我们构造了一个自适应状态反馈控制器使得闭环系统是半全局一致最终有界的. 仿真例子验证了设计方法的有效性.
2014, 40(12): 2972-2976.
doi: 10.3724/SP.J.1004.2014.02972
摘要:
针对一类具有输入时滞的随机前馈非线性系统, 首次研究了它的状态反馈镇定问题. 首先引入一个变量变换, 将其与齐次占优方法巧妙结合, 通过构造合适的 Lyapunov-Krasovskii 泛函, 设计了一个状态反馈控制器, 使得闭环系统的平衡点依概率全局渐近稳定.
针对一类具有输入时滞的随机前馈非线性系统, 首次研究了它的状态反馈镇定问题. 首先引入一个变量变换, 将其与齐次占优方法巧妙结合, 通过构造合适的 Lyapunov-Krasovskii 泛函, 设计了一个状态反馈控制器, 使得闭环系统的平衡点依概率全局渐近稳定.