自动化学报

姓名
邮箱
手机号码
标题
留言内容
验证码

2014, 40(8).

[封面浏览] [PDF 1643KB](478)

杨锦锋, 于秋滨, 关毅, 蒋志鹏

2014, 40(8): 1537-1562. doi: 10.3724/SP.J.1004.2014.01537

[摘要](4365) [PDF 1379KB](5116)

摘要:
电子病历（Electronic medical records，EMR）产生于临床治疗过程，其中命名实体和实体关系反映了患者健康状况，包含了大量与患者健康状况密切相关的医疗知识，因而对它们的识别和抽取是信息抽取研究在医疗领域的重要扩展. 本文首先讨论了电子病历文本的语言特点和结构特点，然后在梳理了命名实体识别和实体关系抽取研究一般思路的基础上，分析了电子病历命名实体识别、实体修饰识别和实体关系抽取研究的具体任务和对应任务的主要研究方法. 本文还介绍了相关的共享评测任务和标注语料库以及医疗领域几个重要的词典和知识库等资源. 最后对这一研究领域仍需解决的问题和未来的发展方向作了展望.

压缩感知及其图像处理应用研究进展与展望

任越美, 张艳宁, 李映

2014, 40(8): 1563-1575. doi: 10.3724/SP.J.1004.2014.01563

[摘要](3704) [PDF 4187KB](2149)

摘要:
压缩感知理论（Compressed sensing，CS）通过少量的线性测量值感知信号的原始结构，并通过求解最优化问题精确地重构原信号.该理论减少了数字图像及视频获取时的存储及传输代价，也为后续的图像处理及识别的研究提供了新的契机，促进了理论和工程应用的结合. 阐述了CS的基本原理，综述了其关键技术稀疏变换、观测矩阵设计、重构算法的一系列最新理论成果和发展，深入分析和比较了CS理论应用到图像处理领域的研究和发展状况，总结了其中存在的问题，并对未来的应用前景进行了展望.

域自适应学习研究进展

刘建伟, 孙正康, 罗雄麟

2014, 40(8): 1576-1600. doi: 10.3724/SP.J.1004.2014.01576

[摘要](3727) [PDF 2600KB](2369)

摘要:
传统的机器学习假设测试样本和训练样本来自同一概率分布. 但当前很多学习场景下训练样本和测试样本可能来自不同的概率分布. 域自适应学习能够有效地解决训练样本和测试样本概率分布不一致的学习问题，作为机器学习新出现的研究领域在近几年受到了广泛的关注. 鉴于域自适应学习技术的重要性，综述了域自适应学习的研究进展. 首先概述了域自适应学习的基本问题，并总结了近几年出现的重要的域自适应学习方法. 接着介绍了近几年提出的较为经典的域自适应学习理论和当下域自适应学习的热门研究方向，包括样例加权域自适应学习、特征表示域自适应学习、参数和特征分解域自适应学习和多源域自适应学习. 然后对域自适应学习进行了相关的理论分析，讨论了高效的度量判据，并给出了相应的误差界. 接着对当前域自适应学习在算法、模型结构和实际应用这三个方面的研究新进展进行了综述. 最后分别探讨了域自适应学习在特征变换和假设、训练优化、模型和数据表示、NLP 研究中存在的问题这四个方面的有待进一步解决的问题.

含有平面结构场景的捆绑调整

谢远帆, 吴毅红, 范力欣

2014, 40(8): 1601-1611. doi: 10.3724/SP.J.1004.2014.01601

[摘要](2727) [PDF 3641KB](1526)

摘要:
捆绑调整是计算机视觉中三维结构恢复过程的重要步骤. 捆绑调整通常将空间中点与点坐标的调整视为相互独立的过程，但是在包含有自然物和人工物的场景中，由于存在多余的自由度，这种调整方法会导致优化结果偏离真值. 提出了一种带有共面约束和平面夹角约束的捆绑调整，用于优化带有平面的场景. 借助新的参数化方法，共面约束和夹角约束可以方便地进行表示，并且带有这两类约束的捆绑调整求解过程，仍然是一个无约束的非线性最小二乘问题. 实验结果表明，这种带有先验信息的捆绑调整提供了对结构的更准确估计. 由于先验信息的加入，增强型法方程的维度变高，借助了稀疏的求解技术和预条件子方法，大大降低了求解时间. 最后，为了在实际应用中能够自动寻找出夹角约束，提出了一种基于最大完全图的贪心方法，该方法尽可能多地保留了夹角约束.

基于局部连续性与全局相似性的光谱保持型亚像元映射

黄慧娟, 禹晶, 肖创柏, 孙卫东

2014, 40(8): 1612-1622. doi: 10.3724/SP.J.1004.2014.01612

[摘要](2259) [PDF 2692KB](754)

摘要:
遥感图像的像元级分类精度受混合像元的影响. 亚像元映射以像元分解获得的丰度值为基础，在地物分布规律的约束下，细化估计各类地物的亚像元级分布模式. 本文同时考虑了地物分布的空间与光谱信息，提出了一种基于局部连续性与全局相似性的光谱保持型亚像元映射算法. 针对地物的空间分布特性，提出了利用类内离散度对局部连续性进行建模，并通过相似分布像元表示误差引入全局相似性约束项. 针对地物的光谱特性，采用最小化光谱误差约束了亚像元映射过程中的光谱无失真性. 模拟数据与真实数据上的实验结果表明，本文算法比其他同类算法具有更高的估计精度，且更适合于实际应用.

自适应融合颜色和深度信息的人体轮廓跟踪

徐玉华, 田尊华, 张跃强, 朱宪伟, 张小虎

2014, 40(8): 1623-1634. doi: 10.3724/SP.J.1004.2014.01623

[摘要](2411) [PDF 5822KB](2046)

摘要:
采用活动轮廓对人体目标建模，提出一种新的水平集框架下自适应融合RGB-D图像的颜色和深度信息的人体轮廓跟踪方法. 设计了一种基于超像素的局部自适应权重计算方法，自动确定深度信息在水平集演化中的重要性. 基于深度信息的活动轮廓驱动外力包括由边缘生成的梯度向量流和由目标/背景深度模型生成的置信图，基于颜色信息的驱动外力由目标/背景颜色模型生成的置信图，这三种外力通过局部自适应权重融合，驱动活动轮廓向目标的边界演化.为了得到更加精确的目标轮廓和防止误差漂移，基于本文观察到的人体表面在深度图像中的两个特性，提出两个简单但有效的算法对水平集方法得到的结果进行精化调整. 最后，通过实验验证了本文算法的优越性.

基于标签集相关性学习的大规模网络图像在线标注

田枫, 沈旭昆

2014, 40(8): 1635-1643. doi: 10.3724/SP.J.1004.2014.01635

[摘要](1946) [PDF 1007KB](1060)

摘要:
传统的网络图像标注方法忽视了标签集整体相关性对标注结果的影响，导致标签集整体相关性缺乏和语义冗余. 为了解决上述问题，提出了一种基于标签集相关性学习的大规模网络图像在线语义标注方法. 给出了标签集对图像相关性和标签集内部相关性的概率估计算法，将上述约束形成一个优化问题，采用贪心搜索策略获取近似最优解，找到能合理地平衡上述因素的标签集，并针对大规模图像集和概念集进行了优化. 真实环境下大规模网络图像集上的测试表明，相比于目前的代表性网络图像标注方法，该方法获得的标签集能够更好的描述图像语义，性能提升明显.

单目视觉下目标三维行为的时间尺度不变建模及识别

王蒙, 戴亚平, 王庆林

2014, 40(8): 1644-1653. doi: 10.3724/SP.J.1004.2014.01644

[摘要](2128) [PDF 4895KB](1122)

摘要:
提出一种单目视觉下在线识别目标三维行为的方法. 该方法用匹配的标记点估计帧间相似变换，然后转换相似矩阵到对数空间以获取一致的四自由度运动参数序列. 为解决持续时间敏感问题，提出基于多边形近似算法的时间尺度不变特征，并用动态规划实现特征序列的在线提取. 在行为识别阶段，基于动态时间规整训练有限类别行为模板用于匹配测试行为序列. 实验结果表明，该行为模板较对比方法类别可分性平均提高60%以上，并且可用于在线识别连续视频中的未知行为.

基于用户搜索行为的query-doc关联挖掘

朱亮, 陆静雅, 左万利

2014, 40(8): 1654-1666. doi: 10.3724/SP.J.1004.2014.01654

[摘要](2162) [PDF 1604KB](1977)

摘要:
query和doc之间的关联关系是搜索引擎期望获取的一类有价值的信息. query和doc间准确的关联分析不仅可以帮助搜索结果排序，也在query和doc之间的桥接中起到重要作用，以实现相关query和doc之间的信息传递，有利于更深入的query理解和doc理解，并在此基础上开展相关应用.本文提出了一种基于用户搜索行为的query和doc关联关系挖掘算法，该方法首先对用户搜索点击日志中的数据进行整理与分析，构建query与doc间的二部图，再通过采用马尔可夫随机游走模型对二部图数据进行建模，挖掘二部图中的点击数据和session数据，最终挖掘出点击日志中用户没有点击到的doc数据，从而预测出query和doc间的隐含关联关系，同时也可以利用该算法得到query和query潜在的关联关系.基于以上理论基础，我们实现了一套完整的日志挖掘系统，通过大量的实验对比，该系统在各方面均取得了优异的表现，其中对检索结果相关性的性能提升可以达到71.23%，这充分表明，本文所提出的理论和算法能够很好地解决query和doc之间的隐含关系挖掘问题，为提高搜索结果的召回率、实现查询推荐和检索结果聚类奠定了良好的前提基础.

基于反向P-M扩散的钢轨表面缺陷视觉检测

贺振东, 王耀南, 毛建旭, 印峰

2014, 40(8): 1667-1679. doi: 10.3724/SP.J.1004.2014.01667

[摘要](2516) [PDF 10775KB](2293)

摘要:
研制了一种基于反向P-M（Perona-Malik）扩散的钢轨表面缺陷视觉检测装置，该装置可自动获取钢轨表面图像，并实现实时检测与定位钢轨表面缺陷. 钢轨图像具有光照变化、反射不均、特征少等特点，为了在运动过程中从复杂的钢轨表面图像提取缺陷，首先将图像进行反向P-M扩散，然后将扩散后的图像与原图像进行差分，从而减小了上述因素的影响，最后将差分图像进行二值化操作，根据缺陷边缘特性和面积进行滤波，分割出缺陷图像. 实验仿真和现场测试结果表明，该方法能很好地识别块状缺陷和线状缺陷，并且检测速度、精度、识别率和误检率都能很好地满足要求.

一种基于多视立体视觉的多视图直线匹配方法

傅康平, 申抒含, 胡占义

2014, 40(8): 1680-1689. doi: 10.3724/SP.J.1004.2014.01680

[摘要](2923) [PDF 6240KB](2066)

摘要:
提出了一种基于多视立体视觉（Multiple view stereo，MVS）进行多视图直线匹配的方法. 本文方法首先利用MVS所得到的三维点云及其可见性信息，建立三维点与图像直线的对应关系. 根据此对应关系，为每条图像直线建立由一个三维点集和一个三维单位向量构成的描述子，用以衡量图像直线之间的相似性及一致性. 之后，本文方法以所有图像直线为顶点建立一个图，并引入了图谱分析来获取统一的顶点距离度量. 最后，本方法对DBSCAN聚类算法进行了修改，并用修改后的算法从图谱分析结果中获取可靠的直线匹配. 实验显示，本方法比已有方法更加鲁棒，并且有更高的准确率.

基于模糊操作模式的砷盐除钴过程操作参数协同优化

伍铁斌, 阳春华, 李勇刚, 朱红求, 桂卫华

2014, 40(8): 1690-1698. doi: 10.3724/SP.J.1004.2014.01690

[摘要](2184) [PDF 1558KB](927)

摘要:
针对湿法炼锌砷盐除钴过程工况变化频繁和操作参数之间具有强耦合关系，导致操作参数优化困难的问题，提出了一种基于模糊操作模式的操作参数协同优化方法.根据大量的砷盐除钴工业运行数据，提炼初始操作模式库，根据入口工况参数，采用模糊匹配方法检索出相似操作模式，在操作模式重用时综合考虑系统参数缓慢变化和资源消耗的特点，然后采用灰色模糊最小二乘支持向量机（Least squares support vector machine，LSSVM）评估操作模式重用后的操作参数的可行性，并根据评估结果采用模糊专家规则修正操作参数.在工况发生变化时，系统能自动优化设定操作参数.工业验证结果表明，本文提出的操作参数协同优化方法保证了生产稳定，可有效提高净化后溶液中钴离子浓度的合格率和降低锌粉的消耗.

用于提高谷歌图像搜索结果的二分类器在线学习方法

万玉钗, 刘峡壁, 韩菲霏, 童坤琦, 刘宇

2014, 40(8): 1699-1708. doi: 10.1004/SP.J.1004.2014.01699

[摘要](1960) [PDF 3977KB](1595)

摘要:
对于基于关键词的图像检索，利用检索结果的视觉相似性学习二分类器有望成为改善检索结果的最有效途径之一. 为改善搜索引擎的搜索结果，本文提出一种算法框架并且基于此框架着重研究训练数据选择这一关键问题. 训练数据选择过程由两个阶段组成：1）训练数据初始化以开始分类器学习过程；2）分类器迭代学习过程中的动态数据选择. 对于初始训练数据的选择，我们探讨了基于聚类和基于排序两种方法，并且对比了自动训练数据选择与人工标注的结果. 对于动态数据选择，我们比较了支持向量机和基于最大最小后验伪概率的贝叶斯分类器的分类效果. 组合上述两个阶段的不同方法，我们得到了8种不同的算法，并将其用于谷歌搜索引擎进行基于关键词的图像检索. 实验结果证明，如何从含有噪声的搜索结果中选择训练数据是搜索结果改善的关键问题. 实验显示我们的方法能够有效的改善谷歌搜索的结果，尤其是排序在前的结果. 尽早为用户提供更相关的结果能够更大程度的减少用户逐个翻页查看结果的工作. 另外，如何使自动训练数据选择与人工标注媲美仍是需要继续研究的一个问题.

高分辨率遥感影像阴影的自动检测与自动补偿

高贤君, 万幼川, 杨元维, 何培培

2014, 40(8): 1709-1720. doi: 10.3724/SP.J.1004.2014.01709

[摘要](2363) [PDF 15928KB](660)

摘要:
提出了高分辨率遥感影像中阴影的检测与补偿的全自动处理方法. 首先，利用简单阴影特征构造复合特征的方法联合构建多种光谱阈值检测条件，结合相应自动阈值获取方案实现阴影自动初检测，并设计自动形态学处理方法对初检测结果进行后处理；然后，以补偿模型为基础，通过统计阴影与非阴影区域的亮度均值与均方差、采用特征点提取与匹配的方法自动获取模型参数，再综合区域级整体补偿和窗口级局部补偿两种结果实现阴影的全自动补偿.结果表明，多条件联合检测与自动形态学处理可提升检测结果的总体精度和区域完整性，补偿模型参数自动获取方法可靠有效，综合补偿法充分结合整体与局部补偿的优势，提升整体亮度，突显纹理细节，使得被阴影遮挡的信息得以真实再现.

基于非理性博弈的舆情传播仿真建模研究

郭东伟, 乌云娜, 邹蕴, 孟祥燕

2014, 40(8): 1721-1732. doi: 10.3724/SP.J.1004.2014.01721

[摘要](2202) [PDF 1620KB](1247)

摘要:
随着社交网络的不断发展，借助社交网络进行传播的舆情信息的威胁越来越大. 本文利用博弈论的方法研究了舆情信息的传播机制，从理性博弈和非理性博弈的角度出发对个体与邻居的交互行为进行建模. 随后以目前较为成熟的传染病模型为基础，通过引入传播学中的社会威慑因素来构建基于非理性博弈的舆情传播模型，以实现适应舆情传播研究的仿真系统，继而将基于非理性博弈的舆情传播模型在无标度网络和小世界网络上的动力学特征进行理论分析. 在仿真环境中对非理性博弈的舆情传播模型进行实验，分析模型参数、网络密度和舆情传播源对舆情传播的影响，其结果符合理论分析结果. 最后对无标度网络上舆情传播的控制策略进行了研究，包括：社会威慑方法、目标免疫方法和正面消息方法，为社交网络上的政策制定提供了理论基础.

一种结合双区域滤波和图像融合的单幅图像去雾算法

张小刚, 唐美玲, 陈华, 汤红忠

2014, 40(8): 1733-1739. doi: 10.3724/SP.J.1004.2014.01733

[摘要](2582) [PDF 9967KB](1021)

摘要:
基于大气散射物理模型和暗原色先验原理，提出一种结合双区域滤波和图像融合的单幅图像去雾算法.首先在计算暗通道函数时，定义了一类暗区域对图像边缘的低强度像素点进行描述，该区域像素点的暗原色中值取其三原色通道的最小值，以代替原来的中值滤波运算值.此滤波方法不仅能有效去除Halo效应，而且避免了黑斑效应；然后基于大气散射物理模型定义一种伪去雾图，将其与原去雾图进行像素级融合对原图进行色度校正，实现了柔性去雾，改善了现有方法易出现过去雾的缺陷.实验结果表明，该算法去雾后图像具有较好清晰度及色彩恢复度，去雾鲁棒性强.在大雾和图像色彩失真严重的情况下，仍可有效恢复图像.

一种基于IDEF1x模型的层次多关系聚类算法

黄少滨, 程媛, 万庆生, 刘国峰, 申林山

2014, 40(8): 1740-1753. doi: 10.3724/SP.J.1004.2014.01740

[摘要](2442) [PDF 1711KB](891)

摘要:
多关系聚类仍存在利用统计方法提取一对多联系对应的信息时会忽略数据的原始特征、不同关系表间的联系出现的回路可能导致信息重复利用等问题，且尚未见有效的解决方法. 本文认为利用IDEF1x模型中不同联系的特点，可重构有助于解决上述问题的模型. 因此基于IDEF1x模型构建多关系数据集中表间关联关系层次模型的框架，然后定义框架中不同种类的联系对聚类结果传递的影响，以及整合多个子节点聚类结果的方法，并以此为基础提出新的多关系聚类算法.在真实的以及人工数据集上的实验效果表明，相较于单关系聚类算法以及对比的多关系聚类算法，所提算法可获得较准确的聚类结果.

基于图像片马尔科夫随机场的脑MR图像分割算法

宋艳涛, 纪则轩, 孙权森

2014, 40(8): 1754-1763. doi: 10.3724/SP.J.1004.2014.01754

[摘要](2730) [PDF 2828KB](1518)

摘要:
传统的高斯混合模型（Gaussian mixture model，GMM）算法在图像分割中未考虑像素的空间信息，导致其对于噪声十分敏感.马尔科夫随机场（Markov random field，MRF）模型通过像素类别标记的Gibbs分布先验概率引入了图像的空间信息，能较好地分割含有噪声的图像，然而MRF模型的分割结果容易出现过平滑现象.为了解决上述缺陷，提出了一种新的基于图像片权重方法的马尔科夫随机场图像分割模型，对邻域内的不同图像片根据相似度赋予不同的权重，使其在克服噪声影响的同时能保持图像细节信息.同时，采用KL距离引入先验概率与后验概率关于熵的惩罚项，并对该惩罚项进行平滑，得到最终的分割结果.实验结果表明，算法具有较强的自适应性，能够有效克服噪声对于分割结果的影响，并获得较高的分割精度.

乳腺X线图像结构扭曲检测的研究

张胜君, 陈后金, 李艳凤, 姚畅, 程琳

2014, 40(8): 1764-1772. doi: 10.3724/SP.J.1004.2014.01764

[摘要](2153) [PDF 3135KB](698)

摘要:
针对乳腺X线图像结构扭曲（Architectural distortion，AD）检测假阳性率偏高的问题，提出了一种新的乳腺X线图像结构扭曲检测方法相似度收敛指数（Similarity convergence index，SCI）方法.首先利用马氏距离比计算出毛刺的相似度，然后通过计算相似度加权的收敛指数增强放射状毛刺，最后提取出收敛指数的局部最大值作为候选点，并对这些候选点进行分类，检测出结构扭曲. 该方法在Mini-MIAS （Mammographic Image Analysis Society）乳腺图像和北京大学人民医院乳腺中心乳腺图像上进行验证，实验结果表明，本文提出的方法有效降低了假阳性率，同时适用于脂肪型乳腺X线图像和致密型乳腺X线图像.

高斯尺度空间下估计背景的自适应阈值分割算法

龙建武, 申铉京, 臧慧, 陈海鹏

2014, 40(8): 1773-1782. doi: 10.3724/SP.J.1004.2014.01773

[摘要](2879) [PDF 6091KB](1408)

摘要:
为有效分割非均匀光照图像，提出一种在高斯尺度空间下估计背景的自适应阈值分割算法. 首先，利用二维高斯函数对待处理图像进行卷积操作来构建一个高斯尺度空间，在此空间下进行背景估计，并采用背景差法来消除非均匀光照干扰，从而提取出目标图像；然后，采用矫正进行增强处理以突出较暗目标信息；最后，经强调谷底的最大类间方差法进行全局分割得到最终结果. 为验证算法的有效性，对非均匀光照条件下文本图像以及非文本图像进行了测试，并与基于偏移场的模糊C均值方法、灰度波动变换自适应阈值分割算法和自适应最小误差阈值分割算法，在错误分割率和运行时间上进行了对比. 实验结果表明，对比以上三种方法，该算法的分割结果更为理想.

新型基于分层多假设跟踪的冠脉骨架提取算法

朱文博, 李彬, 田联房, 陈侃, 鲍盈含

2014, 40(8): 1783-1792. doi: 10.3724/SP.J.1004.2014.01783

[摘要](2159) [PDF 2382KB](1056)

摘要:
为解决大多数脉管骨架提取算法中存在的运算复杂、准确率低以及无法同步获取脉管半径问题，提出了一种新型基于分层多假设跟踪的冠脉骨架提取算法. 首先，提出改进局部形状分析方法用于冠脉预分割，通过引入单连通约束和体积约束和降低非血管型结构及细小类血管型结构误分割率；其次，定义新的中心检测能量函数，增强骨架定位能力，并提出分层多假设策略，避免跟踪过程产生局部最优解和实现脉管半径同步获取；此外，通过生成水平集图，使算法可根据脉管树分支情况自动初始化多条跟踪路径，具有较好的拓扑适应性. 实验表明，与其他骨架提取算法相比，该算法可以同步获取冠脉骨架及半径等信息，且结果精度较高.

基于多角度光学投影表面重建的三维自发荧光光源定位算法

宁楠楠, 刘侠, 邓可欣, 吴萍, 王坤, 田捷

2014, 40(8): 1793-1803. doi: 10.3724/SP.J.1004.2014.01793

[摘要](2159) [PDF 11866KB](725)

摘要:
在自发荧光断层成像（Bioluminescent tomography imaging，BLT）中，双模态融合（光学模态与结构模态）可充分利用结构模态提供的高精度3D几何结构，重建三维表面荧光光通量分布，进而实现小动物内部荧光光源定位.然而，与纯光学模态相比，双模态融合存在采集系统复杂、成本高、数据处理繁琐及存在电离辐射（如CT）等问题.因此，研究基于纯光学3D几何结构的自发荧光光源定位方法对BLT具有重要意义. 本文在搭建纯光学自发荧光断层系统（All-optical bioluminescence tomography system，AOBTS）的基础上，提出一种基于多角度光学投影表面重建的三维自发荧光光源定位方法. 本方法由基于多角度光学投影的3D表面重建、多角度荧光无缝融合、荧光光通量的量化校正以及自发荧光内部光源重建4部分组成. 通过真实小鼠内部植入荧光光源实验表明，与传统纯光学方法相比，本文提出方法不仅改进了3D表面重建方法，而且增加了多角度荧光无缝融合，可实现真实小鼠的三维自发荧光光源定位，初步实验证明具有小动物预临床实验潜力.

区间约束的全变差图像复原和自动参数估计

何川, 胡昌华, 张伟, 师彪

2014, 40(8): 1804-1811. doi: 10.3724/SP.J.1004.2014.01804

[摘要](1872) [PDF 1724KB](1004)

摘要:
因为数字图像的像素仅能取得给定动态范围内的有限值，像素值的区间约束在图像复原中引起广泛关注. 该文研究了带有正则化参数自动估计的区间约束全变差图像复原问题. 通过变量分裂并引入多组辅助变量，区间约束的全变差最小化问题被分解为一系列更易求解的子问题. 随后，交替方向法被用以求解相关的子问题. 根据Morozov偏差准则，在每步迭代中，正则化参数以闭合形式实现自适应更新. 图像复原实验表明，当较高比例的图像像素值位于给定动态范围的边界时，所提方法可以获得更为精确的复原结果.

正交拉普拉斯语种识别方法

杨绪魁, 屈丹, 张文林

2014, 40(8): 1812-1818. doi: 10.3724/SP.J.1004.2014.01812

[摘要](2188) [PDF 907KB](1469)

摘要:
提出了一种正交拉普拉斯语种识别方法，即在提取语音的i-vector后，采用正交局部保持投影进行子空间映射，将信号整体空间映射到语言信息加信道信息子空间，然后对映射后的矢量进行信道补偿处理，最后用支持向量机进行识别. 尽管i-vector最大限度地保留了语音的声学信息，但是并没有发现这些信息之间的内在结构. 利用正交局部保持投影在去除声学无关信息的基础上，进一步发现声学特征的内在结构，能够有效地提高特征的区分性. 在对NIST LRE 2003测试数据库实验后，发现新方法相较于基线系统来说，平均代价降低了28.91%.

香农熵加权稀疏表示图像融合方法研究

李奕, 吴小俊

2014, 40(8): 1819-1835. doi: 10.3724/SP.J.1004.2014.01819

[摘要](2244) [PDF 6693KB](1637)

摘要:
针对传统稀疏表示同步超分图像融合模型中对于 LL （Low-low frequency）、LH （Low-high frequency）、H （High frequency）三部分等比例加权，不能突出重点信息之不足，本文提出一种香农熵多视角加权稀疏表示同步超分图像融合方法. 该方法引入香农熵加权技术，针对 LL、LH、H三部分根据图像特征进行自适应加权，突出重点频率段的影响，从而提高了图像融合的效果. 在多组不同类型图像上进行了实验，实验结果表明所提方法无论从融合视觉效果还是评价指标上均显示出有效性.

基于总体变化子空间自适应的i-vector说话人识别系统研究

栗志意, 张卫强, 何亮, 刘加

2014, 40(8): 1836-1840. doi: 10.3724/SP.J.1004.2014.01836

[摘要](3757) [PDF 377KB](2281)

摘要:
在说话人识别研究中，基于身份认证矢量（identity vector，i-vector）的子空间建模被证明是目前最前沿最有效的说话人建模技术，其中如何有效准确地估计总体变化子空间矩阵T 成为影响系统性能好坏的关键问题. 本文针对i-vector 技术如何在新的应用环境下进行总体变化子空间矩阵T 的自适应估计问题进行了研究，并提出了两种行之有效的自适应估计算法. 在由美国国家标准技术局（American NationalInstitute of Standard and Technology，NIST）组织的2008 年说话人识别核心评测数据库以及自行采集的测试数据库上的实验结果显示，不论采用测试集数据本身还是与测试集较匹配的开发集数据，通过本文所提的自适应算法来更新总体变化子空间矩阵均可以使更新后的子空间更有利于新测试数据下的低维子空间描述，在新的测试环境下都更有利于说话人分类. 此外实验结果还表明基于多子空间拼接的子空间自适应方法性能明显优于迭代自适应方法，而且两者的结合可达到最优的识别性能，且此时利用开发集数据进行自适应可以接近其利用测试集数据进行自适应得到的最优性能.

留言板

2014年第40卷第8期

特别推荐

公告More

相关链接

访问统计

留言板

2014年 第40卷 第8期

特别推荐

公告More

相关链接

访问统计

2014年第40卷第8期