2011年 第37卷 第12期
2011, 37(12): 1413-1421.
doi: 10.3724/SP.J.1004.2011.01413
摘要:
贪婪算法以其重建速度快、重建方法实现简便的特点在压缩感知(Compressed sensing, CS)理论中获得了广泛的应用. 本文首先介绍压缩感知的基本理论;然后,着重介绍现有几种重要的贪 婪重建算法,包括MP, OMP, IBOOMP, StOMP, SP, ROMP和CoSaMP等, 详细给出每种算法的数学框架和本质思想,着重从最优匹配原子的选择策略和残差信号的更新 方式这两个方面对各种算法进行对比分析,以限制等容常数为条件讨论各种算法在实现重建时的性能,包括重建时间、 重建的稳定性等;最后,通过模拟实验进一步验证了 各种算法的重建效果,同时模拟实验结果还进一步得出各种算法的重建效果与待重建信号 本身的稀疏度及测量次数这三者之间的关系,这也为新的更优算法的提出打下理论基础.
贪婪算法以其重建速度快、重建方法实现简便的特点在压缩感知(Compressed sensing, CS)理论中获得了广泛的应用. 本文首先介绍压缩感知的基本理论;然后,着重介绍现有几种重要的贪 婪重建算法,包括MP, OMP, IBOOMP, StOMP, SP, ROMP和CoSaMP等, 详细给出每种算法的数学框架和本质思想,着重从最优匹配原子的选择策略和残差信号的更新 方式这两个方面对各种算法进行对比分析,以限制等容常数为条件讨论各种算法在实现重建时的性能,包括重建时间、 重建的稳定性等;最后,通过模拟实验进一步验证了 各种算法的重建效果,同时模拟实验结果还进一步得出各种算法的重建效果与待重建信号 本身的稀疏度及测量次数这三者之间的关系,这也为新的更优算法的提出打下理论基础.
2011, 37(12): 1422-1434.
doi: 10.3724/SP.J.1004.2011.01422
摘要:
首先证明了快速核密度估计 (Fast kernel density estimate, FKDE) 定理: 基于抽样子集的高斯核密度估计(KDE)与原数据集的KDE间的误差与抽样容量和核参数相关, 而与总样本容量无关. 接着本文揭示了基于高斯核形式的图论松弛聚类(Graph-based relaxed clustering, GRC)算法的目标表达式可分解成“Parzen窗加权和 + 平方熵”的形式, 即此时GRC可视作一个核密度估计问题, 这样基于KDE近似策略, 本文提出了大规模图论松弛聚类方法(Scaling up GRC by KDE approximation, SUGRC-KDEA). 较之先前的工作, 这一方法的优势在于为GRC作用于大规模数据集提供了更简单和易于实现的方案.
首先证明了快速核密度估计 (Fast kernel density estimate, FKDE) 定理: 基于抽样子集的高斯核密度估计(KDE)与原数据集的KDE间的误差与抽样容量和核参数相关, 而与总样本容量无关. 接着本文揭示了基于高斯核形式的图论松弛聚类(Graph-based relaxed clustering, GRC)算法的目标表达式可分解成“Parzen窗加权和 + 平方熵”的形式, 即此时GRC可视作一个核密度估计问题, 这样基于KDE近似策略, 本文提出了大规模图论松弛聚类方法(Scaling up GRC by KDE approximation, SUGRC-KDEA). 较之先前的工作, 这一方法的优势在于为GRC作用于大规模数据集提供了更简单和易于实现的方案.
2011, 37(12): 1435-1444.
doi: 10.3724/SP.J.1004.2011.01435
摘要:
传统的动态贝叶斯网络(Dynamic Bayesian networks, DBNs)描述的是一个稳态过程,而处理非稳态过程,变结构动态贝叶斯网络更适 用、更灵活、更有效.为了克服现有变结构离散 动态贝叶斯网络推理算法只能处理硬证据的缺陷,本文在深入分析变结构动态贝叶斯网络机制及其特 征的基础上,提出了变结构离散动态贝叶斯网络的 快速推理算法.此外,对变结构动态贝叶斯网络的特例,即数据缺失动态贝叶斯网络进行了定义并构建 了相应的模型.仿真实验验证了变结构离散动态贝 叶斯网络快速推理算法的有效性及计算效率.
传统的动态贝叶斯网络(Dynamic Bayesian networks, DBNs)描述的是一个稳态过程,而处理非稳态过程,变结构动态贝叶斯网络更适 用、更灵活、更有效.为了克服现有变结构离散 动态贝叶斯网络推理算法只能处理硬证据的缺陷,本文在深入分析变结构动态贝叶斯网络机制及其特 征的基础上,提出了变结构离散动态贝叶斯网络的 快速推理算法.此外,对变结构动态贝叶斯网络的特例,即数据缺失动态贝叶斯网络进行了定义并构建 了相应的模型.仿真实验验证了变结构离散动态贝 叶斯网络快速推理算法的有效性及计算效率.
2011, 37(12): 1445-1454.
doi: 10.3724/SP.J.1004.2011.01445
摘要:
提出了一种新的基于复合梯度向量(Composite gradient vector, CGV)描述的人脸识别算法. 该算法首先在定位后的人脸图像中标定目标区域, 并在目标区域内划分特征子区域, 然后,以特征子区域的边缘奇异点作为向量的起点和终点进行正交采样得到基向量, 将目标区域内所有基向量组建向量簇, 通过对基向量的多维复合得到向量簇内所有极大梯度向量, 最后,以极大梯度向量作为元素组建复合梯度向量并统计复合梯度向量的维度和梯度信息, 将复合梯度向量、复合梯度向量维度和梯度进行人脸库对比, 识别出人脸身份. 该算法抓住了人脸面部特征分散性的特点, 继而对分散性特征采用具有连续性规律约束的复合梯度向量进行描述识别. 实验结果表明, 该算法克服了特征域旋转、光照强度变化及多姿态、多表情对人脸识别的影响, 具有速度快、识别准确、适应性强的特点.
提出了一种新的基于复合梯度向量(Composite gradient vector, CGV)描述的人脸识别算法. 该算法首先在定位后的人脸图像中标定目标区域, 并在目标区域内划分特征子区域, 然后,以特征子区域的边缘奇异点作为向量的起点和终点进行正交采样得到基向量, 将目标区域内所有基向量组建向量簇, 通过对基向量的多维复合得到向量簇内所有极大梯度向量, 最后,以极大梯度向量作为元素组建复合梯度向量并统计复合梯度向量的维度和梯度信息, 将复合梯度向量、复合梯度向量维度和梯度进行人脸库对比, 识别出人脸身份. 该算法抓住了人脸面部特征分散性的特点, 继而对分散性特征采用具有连续性规律约束的复合梯度向量进行描述识别. 实验结果表明, 该算法克服了特征域旋转、光照强度变化及多姿态、多表情对人脸识别的影响, 具有速度快、识别准确、适应性强的特点.
2011, 37(12): 1455-1463.
doi: 10.3724/SP.J.1004.2011.01455
摘要:
针对传统的Gabor特征表征全局特征能力弱以及特征数据存在冗余性的缺点, 提出一种新颖的采用Gabor多方向特征融合与分块直方图统计相结合的方法来提取表情特征. 为了提取局部方向信息并降低特征维数, 首先采用Gabor滤波器提取人脸表情图像的多尺度和多方向特征, 然后按照两个融合规则将相同尺度不同方向的特征融合到一起. 为了能够有效地表征图像全局特征, 将融合图像进一步划分为若干矩形不重叠且大小相等的子块, 分别计算每个子块区域内融合特征的直方图分布, 将其联合起来实现图像表征. 实验结果表明, 这种方法无论在计算量上还是识别性能上都比传统的Gabor滤波器组更具有优势. 该方法的创新处在于提出了两个Gabor多方向特征融合规则, 应用在JAFFE表情库上最高平均识别率达到98.24%, 表明其适用于人脸表情图像的分析.
针对传统的Gabor特征表征全局特征能力弱以及特征数据存在冗余性的缺点, 提出一种新颖的采用Gabor多方向特征融合与分块直方图统计相结合的方法来提取表情特征. 为了提取局部方向信息并降低特征维数, 首先采用Gabor滤波器提取人脸表情图像的多尺度和多方向特征, 然后按照两个融合规则将相同尺度不同方向的特征融合到一起. 为了能够有效地表征图像全局特征, 将融合图像进一步划分为若干矩形不重叠且大小相等的子块, 分别计算每个子块区域内融合特征的直方图分布, 将其联合起来实现图像表征. 实验结果表明, 这种方法无论在计算量上还是识别性能上都比传统的Gabor滤波器组更具有优势. 该方法的创新处在于提出了两个Gabor多方向特征融合规则, 应用在JAFFE表情库上最高平均识别率达到98.24%, 表明其适用于人脸表情图像的分析.
2011, 37(12): 1464-1473.
doi: 10.3724/SP.J.1004.2011.01464
摘要:
空间直方图是直方图的一种推广, 它能更精确地描述图像(或目标), 被应用到目标跟踪和图像检索等多个领域, 选择一种合适的度量两个空间直方图之间相似性的方法至关重要. 本文提出一种基于改进Jensen-Shannon divergence (JSD) 距离的空间直方图相似性度量, 将空间直方图中每个区间所对应像素的颜色特征和空间特征的联合分布看作一个带权重的高斯分布, 然后计算两个空间直方图对应区间之间的相似度, 即计算两个带权重的高斯分布之间的改进的JSD距离. 本文在计算JSD距离时充分利用高斯分布的权重, 从而提高了度量方法的区分能力. 理论和实验证明了本文提出的相似性度量的区分能力优于Ulges的度量方法, 视频跟踪结果也更稳定、更精确.
空间直方图是直方图的一种推广, 它能更精确地描述图像(或目标), 被应用到目标跟踪和图像检索等多个领域, 选择一种合适的度量两个空间直方图之间相似性的方法至关重要. 本文提出一种基于改进Jensen-Shannon divergence (JSD) 距离的空间直方图相似性度量, 将空间直方图中每个区间所对应像素的颜色特征和空间特征的联合分布看作一个带权重的高斯分布, 然后计算两个空间直方图对应区间之间的相似度, 即计算两个带权重的高斯分布之间的改进的JSD距离. 本文在计算JSD距离时充分利用高斯分布的权重, 从而提高了度量方法的区分能力. 理论和实验证明了本文提出的相似性度量的区分能力优于Ulges的度量方法, 视频跟踪结果也更稳定、更精确.
2011, 37(12): 1474-1482.
doi: 10.3724/SP.J.1004.2011.01474
摘要:
为了有效地估算点模型的微分属性,提出了一种基于几何特征相似性的估算方法. 首先,利用Mean shift (MS)聚类法,对点模型进行几何特征相似性聚类;然后,基于径向基函数(Radial basis functions, RBF),重构各聚类单元的局部隐式曲面; 最后,依据经典微分几何理论,在径向基函数 曲面上便捷地求解采样点的微分属性并给出具体应用. 实验与应用结果表明,该方法能够比较精确地估算出点模型的微分属性且得到有效应用.
为了有效地估算点模型的微分属性,提出了一种基于几何特征相似性的估算方法. 首先,利用Mean shift (MS)聚类法,对点模型进行几何特征相似性聚类;然后,基于径向基函数(Radial basis functions, RBF),重构各聚类单元的局部隐式曲面; 最后,依据经典微分几何理论,在径向基函数 曲面上便捷地求解采样点的微分属性并给出具体应用. 实验与应用结果表明,该方法能够比较精确地估算出点模型的微分属性且得到有效应用.
2011, 37(12): 1483-1494.
doi: 10.3724/SP.J.1004.2011.01483
摘要:
基于增量子空间的目标跟踪算法多数不加选择地将检测到的目标作为模板训练的样本, 并以固定频率更新模板, 这种无反馈闭环机制使得算法在目标外观模型发生变化、 光照变化等复杂条件下难以鲁棒跟踪目标, 一旦跟踪失败很难从错误中恢复. 为此, 我们提出一种反馈闭环跟踪算法, 在增量子空间粒子滤波跟踪框架下, 引入跟踪状态判决作为后续模板更新依据. 通过判决反馈信息选择合适的样本适时更新模板, 有效克服目标外观模型的变化, 持续跟踪目标. 实验结果表明, 由于引入跟踪状态判决, 在目标外观变化、光照变化等情况下, 本算法能够以与环境相适应的频率及时更新模板, 提高跟踪精度, 实验结果验证了本文算法的鲁棒性和有效性.
基于增量子空间的目标跟踪算法多数不加选择地将检测到的目标作为模板训练的样本, 并以固定频率更新模板, 这种无反馈闭环机制使得算法在目标外观模型发生变化、 光照变化等复杂条件下难以鲁棒跟踪目标, 一旦跟踪失败很难从错误中恢复. 为此, 我们提出一种反馈闭环跟踪算法, 在增量子空间粒子滤波跟踪框架下, 引入跟踪状态判决作为后续模板更新依据. 通过判决反馈信息选择合适的样本适时更新模板, 有效克服目标外观模型的变化, 持续跟踪目标. 实验结果表明, 由于引入跟踪状态判决, 在目标外观变化、光照变化等情况下, 本算法能够以与环境相适应的频率及时更新模板, 提高跟踪精度, 实验结果验证了本文算法的鲁棒性和有效性.
2011, 37(12): 1495-1502.
doi: 10.3724/SP.J.1004.2011.01495
摘要:
提出了一种新的基于子空间的快速说话人自适应方法.该方法在本征音(Eigen-voice, EV)自适应方法基础上,进一步在音子空间寻找低维子空间, 得到更为紧凑的“说话人--音子”联合子空间.该子空间不仅包含了说话人间的模型参数相关性信息,而且对音子间的模型参数相关 性信息也进行了显式建模,在大大降低模型存储量的同时更为全面地反映模型参数的先验信息.在基于连续语音识别的无监督自适应实验中,在少量的自适应数据条件下,新方法取得了比最大似然线性回归和聚类最大似然线性基方法更好的效果.
提出了一种新的基于子空间的快速说话人自适应方法.该方法在本征音(Eigen-voice, EV)自适应方法基础上,进一步在音子空间寻找低维子空间, 得到更为紧凑的“说话人--音子”联合子空间.该子空间不仅包含了说话人间的模型参数相关性信息,而且对音子间的模型参数相关 性信息也进行了显式建模,在大大降低模型存储量的同时更为全面地反映模型参数的先验信息.在基于连续语音识别的无监督自适应实验中,在少量的自适应数据条件下,新方法取得了比最大似然线性回归和聚类最大似然线性基方法更好的效果.
2011, 37(12): 1503-1513.
doi: 10.3724/SP.J.1004.2011.01503
摘要:
探讨了说话人认证特征级融合策略的可行性. 根据关系度量融合框架,构建该策略认证系统. 通过与传统融合、单模态算法比较,本算法性能优于以上算法. 为进一步分析特征级融合算法优于现有融合算法的原因,本文利用最大Kullback-Leibler距离计算融合算法融合信息量. 该距离弥补了传统Kullback-Leibler距离不具有对称性的缺憾, 更加精准地获取信息量. 分析结果验证了本算法实验结论, 说明特征级融合可获取比现有匹配分数级融合更多的信息量,从而取得更优精度.
探讨了说话人认证特征级融合策略的可行性. 根据关系度量融合框架,构建该策略认证系统. 通过与传统融合、单模态算法比较,本算法性能优于以上算法. 为进一步分析特征级融合算法优于现有融合算法的原因,本文利用最大Kullback-Leibler距离计算融合算法融合信息量. 该距离弥补了传统Kullback-Leibler距离不具有对称性的缺憾, 更加精准地获取信息量. 分析结果验证了本算法实验结论, 说明特征级融合可获取比现有匹配分数级融合更多的信息量,从而取得更优精度.
2011, 37(12): 1514-1519.
doi: 10.3724/SP.J.1004.2011.01514
摘要:
针对小样本数据集下学习贝叶斯网络 (Bayesian networks, BN)结构的不足, 以及随着条件集的增大, 利用统计方法进行条件独立 (Conditional independence, CI) 测试不稳定等问题, 提出了一种基于先验节点序学习网络结构的优化方法. 新方法通过定义优化目标函数和可行域空间, 首次将贝叶斯网络结构学习问题转化为求解目标函数极值的数学规划问题, 并给出最优解的存在性及唯一性证明, 为贝叶斯网络的不断扩展研究提出了新的方案. 理论证明以及实验结果显示了新方法的正确性和有效性.
针对小样本数据集下学习贝叶斯网络 (Bayesian networks, BN)结构的不足, 以及随着条件集的增大, 利用统计方法进行条件独立 (Conditional independence, CI) 测试不稳定等问题, 提出了一种基于先验节点序学习网络结构的优化方法. 新方法通过定义优化目标函数和可行域空间, 首次将贝叶斯网络结构学习问题转化为求解目标函数极值的数学规划问题, 并给出最优解的存在性及唯一性证明, 为贝叶斯网络的不断扩展研究提出了新的方案. 理论证明以及实验结果显示了新方法的正确性和有效性.
2011, 37(12): 1520-1529.
doi: 10.3724/SP.J.1004.2011.01520
摘要:
复杂网络是复杂系统的典型表现形式, 社区结构是复杂网络最重要的结构特征之一. 针对复杂网络的社区结构发现问题, 本文提出一种新的局部相似性度量, 并结合层次聚类算法用于社区结构发现. 相对全局的相似性度量, 本文提出的相似性度量具有较低的计算开销; 同时又能很好地刻画网络的结构特征, 克服了传统局部相似性度量在某些情形下对节点相似性的低估倾向. 为了将局部相似性度量用于社区结构发现, 推广了传统的Ward层次聚类算法, 使之适用于具有相似性度量的任意对象, 并将其用于复杂网络社区结构发现. 在合成和真实世界的网络上进行了实验, 并与典型算法进行了比较, 实验结果表明所提算法的可行性和有效性.
复杂网络是复杂系统的典型表现形式, 社区结构是复杂网络最重要的结构特征之一. 针对复杂网络的社区结构发现问题, 本文提出一种新的局部相似性度量, 并结合层次聚类算法用于社区结构发现. 相对全局的相似性度量, 本文提出的相似性度量具有较低的计算开销; 同时又能很好地刻画网络的结构特征, 克服了传统局部相似性度量在某些情形下对节点相似性的低估倾向. 为了将局部相似性度量用于社区结构发现, 推广了传统的Ward层次聚类算法, 使之适用于具有相似性度量的任意对象, 并将其用于复杂网络社区结构发现. 在合成和真实世界的网络上进行了实验, 并与典型算法进行了比较, 实验结果表明所提算法的可行性和有效性.
2011, 37(12): 1530-1536.
doi: 10.3724/SP.J.1004.2011.01530
摘要:
研究了一类依赖于不可量测状态增长非线性系统的输出反馈自适应扰动抑制问题. 与现有文献不同, 所研究的系统具有更多的未知参数, 尤其是不确定控制系数. 为了解决该 问题, 引入了动态高增益K-滤波器, 进而构造了基于K-滤波器的状态观测器. 在输出反馈控制器的设计过程中, 引入了待定设计参数, 增加了设计的自由度. 结果表明, K-滤 波器的动态增益和设计参数的恰当选择可以保证闭环系统的全局稳定性, 从而实现系统 L2-增益意义的扰动抑制.
研究了一类依赖于不可量测状态增长非线性系统的输出反馈自适应扰动抑制问题. 与现有文献不同, 所研究的系统具有更多的未知参数, 尤其是不确定控制系数. 为了解决该 问题, 引入了动态高增益K-滤波器, 进而构造了基于K-滤波器的状态观测器. 在输出反馈控制器的设计过程中, 引入了待定设计参数, 增加了设计的自由度. 结果表明, K-滤 波器的动态增益和设计参数的恰当选择可以保证闭环系统的全局稳定性, 从而实现系统 L2-增益意义的扰动抑制.
2011, 37(12): 1536-1540.
doi: 10.3724/SP.J.1004.2011.01536
摘要:
为克服传统储备池方法缺乏良好在线学习算法的问题, 同时考虑到储备池本身存在的不适定问题, 本文提出一种储备池在线稀疏学习算法, 对储备池目标函数施加L1正则化约束,并采用截断梯度算法在线近似求解.所提算法在对储备池输出权值进行在线调整的同时, 可对储备池输出权值的稀疏性进行有效控制, 有效保证了网络的泛化性能.理论分析和仿真实例证明所提算法的有效性.
为克服传统储备池方法缺乏良好在线学习算法的问题, 同时考虑到储备池本身存在的不适定问题, 本文提出一种储备池在线稀疏学习算法, 对储备池目标函数施加L1正则化约束,并采用截断梯度算法在线近似求解.所提算法在对储备池输出权值进行在线调整的同时, 可对储备池输出权值的稀疏性进行有效控制, 有效保证了网络的泛化性能.理论分析和仿真实例证明所提算法的有效性.