2009年 第35卷 第12期
2009, 35(12): 1481-1487.
doi: 10.3724/SP.J.1004.2009.01481
摘要:
针对麦克风阵列信号子空间语音增强算法的不足, 结合人耳的听觉掩蔽效应, 提出了改进的信号子空间算法. 提出了通过置信度判断来确定噪声子空间维度的方法, 在噪声子空间上, 通过条件概率的方法估计出噪声功率谱. 在此基础上, 结合人耳的听觉掩蔽效应给出了线性滤波器的一种合理估计. 实验结果表明所提的方法相对于传统算法, 更有效地抑制了噪声, 在多项语音质量评价指标上都有明显的改进.
针对麦克风阵列信号子空间语音增强算法的不足, 结合人耳的听觉掩蔽效应, 提出了改进的信号子空间算法. 提出了通过置信度判断来确定噪声子空间维度的方法, 在噪声子空间上, 通过条件概率的方法估计出噪声功率谱. 在此基础上, 结合人耳的听觉掩蔽效应给出了线性滤波器的一种合理估计. 实验结果表明所提的方法相对于传统算法, 更有效地抑制了噪声, 在多项语音质量评价指标上都有明显的改进.
2009, 35(12): 1488-1495.
doi: 10.3724/SP.J.1004.2009.01488
摘要:
图像区域复制篡改就是将数字图像中一部分区域进行复制并粘贴到同一幅图像的另外一个区域, 是一种简单而又常见的图像篡改技术. 现有的算法大多对区域复制后处理的鲁棒性比较差, 并且时间复杂度高. 本文针对该篡改技术, 提出一种有效快速的检测与定位篡改区域算法. 该算法首先将图像进行高斯金字塔分解, 将低频图像进行块分解, 提取每块的Hu矩不变特征, 并将特征向量排序, 然后为每个特征向量搜索符合阈值的相似特征向量; 最后利用区域面积阈值去除错误的相似块, 并结合数学形态学定位篡改区域. 实验结果表明该算法不仅能有效地对抗如高斯白噪声、高斯模糊以及JPEG压缩这些后处理操作, 而且减少了块总数, 缩小了块匹配搜索空间, 提高了运算效率.
图像区域复制篡改就是将数字图像中一部分区域进行复制并粘贴到同一幅图像的另外一个区域, 是一种简单而又常见的图像篡改技术. 现有的算法大多对区域复制后处理的鲁棒性比较差, 并且时间复杂度高. 本文针对该篡改技术, 提出一种有效快速的检测与定位篡改区域算法. 该算法首先将图像进行高斯金字塔分解, 将低频图像进行块分解, 提取每块的Hu矩不变特征, 并将特征向量排序, 然后为每个特征向量搜索符合阈值的相似特征向量; 最后利用区域面积阈值去除错误的相似块, 并结合数学形态学定位篡改区域. 实验结果表明该算法不仅能有效地对抗如高斯白噪声、高斯模糊以及JPEG压缩这些后处理操作, 而且减少了块总数, 缩小了块匹配搜索空间, 提高了运算效率.
2009, 35(12): 1496-1502.
doi: 10.3724/SP.J.1004.2009.01496
摘要:
提出了一种新的静脉图像分割方法, 该方法以方向场分布率(Distribution ratio of directional fields, DRDF)作为区分静脉纹路和背景的分割准则. 首先利用邻域信息和邻域分块模板计算图像中每个像素点的方向场以生成方向场图像, 然后根据方向场图像中像素点互补半圆区域内的方向场分布率和分布判定函数计算出8灰度级图像, 最后确定二值化参数将8灰度级图像二值化得到最终图像分割结果. 该方法结合静脉图像特征, 充分利用方向场图像的空间属性,克服了照度不均、粗细不均以及边界模糊等因素对分割造成的影响. 实验结果表明该方法对于静脉图像具有很好的分割效果.
提出了一种新的静脉图像分割方法, 该方法以方向场分布率(Distribution ratio of directional fields, DRDF)作为区分静脉纹路和背景的分割准则. 首先利用邻域信息和邻域分块模板计算图像中每个像素点的方向场以生成方向场图像, 然后根据方向场图像中像素点互补半圆区域内的方向场分布率和分布判定函数计算出8灰度级图像, 最后确定二值化参数将8灰度级图像二值化得到最终图像分割结果. 该方法结合静脉图像特征, 充分利用方向场图像的空间属性,克服了照度不均、粗细不均以及边界模糊等因素对分割造成的影响. 实验结果表明该方法对于静脉图像具有很好的分割效果.
2009, 35(12): 1503-1512.
doi: 10.3724/SP.J.1004.2009.01503
摘要:
针对现有车牌定位算法准确率不高、步骤多和速度慢等问题, 提出一种彩色图像车牌定位方法(License plate locating based on CNN color edge detection, LPLCCED). 首先利用细胞神经网络(Cell neural network, CNN)模型导出一种与车牌颜色特征相结合的车牌定位专用边缘检测算法, 将车牌的颜色对约束条件融合到边缘检测算法中, 本文专用边缘检测算法可以大大缩小车牌初步定位的范围. 接下来提出一种针对车牌特征的边缘滤波算法, 最后根据车牌结构和纹理特征对候选区域进行判别验证. 该流程的各个环节都可以通过硬件实现, 为面向智能交通领域的实时车牌识别系统的前期车牌定位处理提供了依据.
针对现有车牌定位算法准确率不高、步骤多和速度慢等问题, 提出一种彩色图像车牌定位方法(License plate locating based on CNN color edge detection, LPLCCED). 首先利用细胞神经网络(Cell neural network, CNN)模型导出一种与车牌颜色特征相结合的车牌定位专用边缘检测算法, 将车牌的颜色对约束条件融合到边缘检测算法中, 本文专用边缘检测算法可以大大缩小车牌初步定位的范围. 接下来提出一种针对车牌特征的边缘滤波算法, 最后根据车牌结构和纹理特征对候选区域进行判别验证. 该流程的各个环节都可以通过硬件实现, 为面向智能交通领域的实时车牌识别系统的前期车牌定位处理提供了依据.
2009, 35(12): 1513-1519.
doi: 10.3724/SP.J.1004.2009.01513
摘要:
Fisher判别分析寻找一个使样本数据类间散度与样本数据类内散度比值最大的子空间, 是一种很流行的监督式特征降维方法. 标注样本数据所属的类别通常需要大量的人工, 消耗大量的时间, 付出昂贵的成本. 为了解决同时利用有类别信息的样本数据和没有类别信息的样本数据用于寻找降维子空间的问题, 我们提出了一种子空间半监督Fisher判别分析方法. 子空间半监督Fisher判别分析寻找这样一个子空间, 这个子空间即保留了从有类别信息的样本数据中学习的类别判别结构, 也保留了从有类别信息的样本数据和没有类别信息的样本数据中学习的样本结构信息. 我们还推导了基于核的子空间半监督Fisher判别分析方法. 通过人脸识别实验验证了本文算法的有效性.
Fisher判别分析寻找一个使样本数据类间散度与样本数据类内散度比值最大的子空间, 是一种很流行的监督式特征降维方法. 标注样本数据所属的类别通常需要大量的人工, 消耗大量的时间, 付出昂贵的成本. 为了解决同时利用有类别信息的样本数据和没有类别信息的样本数据用于寻找降维子空间的问题, 我们提出了一种子空间半监督Fisher判别分析方法. 子空间半监督Fisher判别分析寻找这样一个子空间, 这个子空间即保留了从有类别信息的样本数据中学习的类别判别结构, 也保留了从有类别信息的样本数据和没有类别信息的样本数据中学习的样本结构信息. 我们还推导了基于核的子空间半监督Fisher判别分析方法. 通过人脸识别实验验证了本文算法的有效性.
2009, 35(12): 1520-1527.
doi: 10.3724/SP.J.1004.2009.01520
摘要:
在非均匀采样系统辨识方法中, 通常利用重采样、数值积分等方法来处理非均匀采样数据, 所用模型多为连续有理分式传递函数, 在递推形式下非均匀采样对象又常局限于``数据缺失''的情况. 本文研究更为一般的异步非均匀采样的多变量系统, 采用连续时间状态空间模型描述, 推导了模型参数、参数梯度和系统状态之间的相互递推关系, 构成一种可变迭代间隔的递推辨识算法, 在每次输出采样点上仅更新模型中受当前采样数据影响的参数. 这种辨识方法可以适用于任意非均匀采样系统, 多采样率系统也可作为一种特例适用于本算法. 仿真结果表明, 所提的方法是可行有效的.
在非均匀采样系统辨识方法中, 通常利用重采样、数值积分等方法来处理非均匀采样数据, 所用模型多为连续有理分式传递函数, 在递推形式下非均匀采样对象又常局限于``数据缺失''的情况. 本文研究更为一般的异步非均匀采样的多变量系统, 采用连续时间状态空间模型描述, 推导了模型参数、参数梯度和系统状态之间的相互递推关系, 构成一种可变迭代间隔的递推辨识算法, 在每次输出采样点上仅更新模型中受当前采样数据影响的参数. 这种辨识方法可以适用于任意非均匀采样系统, 多采样率系统也可作为一种特例适用于本算法. 仿真结果表明, 所提的方法是可行有效的.
2009, 35(12): 1528-1533.
doi: 10.3724/SP.J.1004.2009.01528
摘要:
研究n维多面体上自治仿射系统的可达性问题. 目的在于得到多面体上最大正不变集和每个极大面的反向可达集(吸引域). 研究最大稳定不变仿射子空间, 并给出不变集和吸引域的性质, 最后通过分割算法确定两者的边界.
研究n维多面体上自治仿射系统的可达性问题. 目的在于得到多面体上最大正不变集和每个极大面的反向可达集(吸引域). 研究最大稳定不变仿射子空间, 并给出不变集和吸引域的性质, 最后通过分割算法确定两者的边界.
2009, 35(12): 1534-1540.
doi: 10.3724/SP.J.1004.2009.01534
摘要:
研究了时变时滞不确定连续模糊大系统的采样可靠双曲控制. 首先对一类复杂大系统进行模糊双曲建模, 然后根据李亚普诺夫直接方法和大系统的分散控制理论, 得出了基于线性矩阵不等式的条件, 该条件不仅在所有控制元件都有效工作时, 而且在执行器可能存在故障的情况下都能保证系统的性能. 且不需要执行器的精确故障参数, 只需要故障参数的上下界. 该条件只依赖于时滞的上界, 不依赖于时变时滞的导数. 因此得到的条件有更小的保守性. 最后应用两个例子验证了设计过程及其有效性.
研究了时变时滞不确定连续模糊大系统的采样可靠双曲控制. 首先对一类复杂大系统进行模糊双曲建模, 然后根据李亚普诺夫直接方法和大系统的分散控制理论, 得出了基于线性矩阵不等式的条件, 该条件不仅在所有控制元件都有效工作时, 而且在执行器可能存在故障的情况下都能保证系统的性能. 且不需要执行器的精确故障参数, 只需要故障参数的上下界. 该条件只依赖于时滞的上界, 不依赖于时变时滞的导数. 因此得到的条件有更小的保守性. 最后应用两个例子验证了设计过程及其有效性.
2009, 35(12): 1541-1549.
doi: 10.13724/SP.J.1004.2009.01541
摘要:
研究了在有向通信连接下二阶积分器描述的多智能体沿多条给定路径编队运动的控制器设计及其稳定性分析问题. 智能体的动态和指定路径都是在固定直角坐标系下描述的. 通过引入路径函数来设计路径跟踪控制, 根据路径函数与弧长的关系来设计编队控制律, 使得多智能体沿期望路径的位置和速度在规定队形下达到一致. 利用图论证明, 当通信拓扑对应的有向图具有全局可达点时, 设计的编队控制系统是渐近稳定的. 本文设计的有向协同控制律可以应用于区域的信息优化采集.
研究了在有向通信连接下二阶积分器描述的多智能体沿多条给定路径编队运动的控制器设计及其稳定性分析问题. 智能体的动态和指定路径都是在固定直角坐标系下描述的. 通过引入路径函数来设计路径跟踪控制, 根据路径函数与弧长的关系来设计编队控制律, 使得多智能体沿期望路径的位置和速度在规定队形下达到一致. 利用图论证明, 当通信拓扑对应的有向图具有全局可达点时, 设计的编队控制系统是渐近稳定的. 本文设计的有向协同控制律可以应用于区域的信息优化采集.
2009, 35(12): 1550-1557.
doi: 10.3724/SP.J.1004.2009.01550
摘要:
研究了一种基于主元分析故障检测确定主元数的新方法. 提出了信噪比并基于信噪比确定最优主元数. 通过最大化信噪比最优主元数被选择, 使故障检测性能得到改进. 这种方法被应用到TE过程中并与累积方差贡献率方法进行比较, 结果显示了此方法的优越性.
研究了一种基于主元分析故障检测确定主元数的新方法. 提出了信噪比并基于信噪比确定最优主元数. 通过最大化信噪比最优主元数被选择, 使故障检测性能得到改进. 这种方法被应用到TE过程中并与累积方差贡献率方法进行比较, 结果显示了此方法的优越性.
2009, 35(12): 1558-1563.
doi: 10.3724/SP.J.1004.2009.01558
摘要:
对状态和输入受约束的Hammerstein系统, 提出一种新的可保证闭环指数稳定的非线性模型预测控制策略. 基于线性子系统镇定的最优控制律, 滚动预测非线性代数方程的解算误差, 继而在线优化计算满足约束的预测控制量. 进一步, 得到闭环系统指数稳定的解算误差上界. 从而闭环系统不仅满足约束而且对解算误差具有鲁棒性. 最后以工业聚丙烯牌号切换控制为例, 仿真验证本文算法的有效性.
对状态和输入受约束的Hammerstein系统, 提出一种新的可保证闭环指数稳定的非线性模型预测控制策略. 基于线性子系统镇定的最优控制律, 滚动预测非线性代数方程的解算误差, 继而在线优化计算满足约束的预测控制量. 进一步, 得到闭环系统指数稳定的解算误差上界. 从而闭环系统不仅满足约束而且对解算误差具有鲁棒性. 最后以工业聚丙烯牌号切换控制为例, 仿真验证本文算法的有效性.
2009, 35(12): 1564-1567.
doi: 10.3724/SP.J.1004.2009.01564
摘要:
Nowadays, digital images can be easily tampered due to the availability of powerful image processing software. As digital cameras continue to replace their analog counterparts, the importance of authenticating digital images, identifying their sources, and detecting forgeries is increasing. Blind image forensics is used to analyze an image in the complete absence of any digital watermark or signature. Image compositing is the most common form of digital tampering. Assuming that image compositing operations affect the inherent statistics of the image, we propose an image compositing detection method on based on a statistical model for natural image in the wavelet transform domain. The generalized Gaussian model (GGD) is employed to describe the marginal distribution of wavelet coefficients of images, and the parameters of GGD are obtained using maximum-likelihood estimator. The statistical features include GGD parameters, prediction error, mean, variance, skewness, and kurtosis at each wavelet detail subband. Then, these feature vectors are used to discriminate between natural images and composite images using support vector machine (SVM). To evaluate the performance of our proposed method, we carried out tests on the Columbia Uncompressed Image Splicing Detection Dataset and another advanced dataset, and achieved a detection accuracy of 92% and 79%, respectively. The detection performance of our method is better than that of the method using camera response function on the same dataset.
Nowadays, digital images can be easily tampered due to the availability of powerful image processing software. As digital cameras continue to replace their analog counterparts, the importance of authenticating digital images, identifying their sources, and detecting forgeries is increasing. Blind image forensics is used to analyze an image in the complete absence of any digital watermark or signature. Image compositing is the most common form of digital tampering. Assuming that image compositing operations affect the inherent statistics of the image, we propose an image compositing detection method on based on a statistical model for natural image in the wavelet transform domain. The generalized Gaussian model (GGD) is employed to describe the marginal distribution of wavelet coefficients of images, and the parameters of GGD are obtained using maximum-likelihood estimator. The statistical features include GGD parameters, prediction error, mean, variance, skewness, and kurtosis at each wavelet detail subband. Then, these feature vectors are used to discriminate between natural images and composite images using support vector machine (SVM). To evaluate the performance of our proposed method, we carried out tests on the Columbia Uncompressed Image Splicing Detection Dataset and another advanced dataset, and achieved a detection accuracy of 92% and 79%, respectively. The detection performance of our method is better than that of the method using camera response function on the same dataset.
2009, 35(12): 1568-1573.
doi: 10.3724/SP.J.1004.2009.01568
摘要:
提出了一种描述自然图像小尺度模式的新方法. 其中心思想是将小尺度信息的建模问题转化为图像区域上Sobolev空间的序列能量极小化问题, 进而转化为序列特征值问题. 从数学上分析了小尺度模式的多层次结构及模型的收敛性. 本文还提出一种新的自适应多层次化图像表示方法, 并可应用于图像合成及视觉感知等方面. 从数值计算的角度上, 通过稀疏对称矩阵特征值分解可方便地获得不同层次的小尺度模式.
提出了一种描述自然图像小尺度模式的新方法. 其中心思想是将小尺度信息的建模问题转化为图像区域上Sobolev空间的序列能量极小化问题, 进而转化为序列特征值问题. 从数学上分析了小尺度模式的多层次结构及模型的收敛性. 本文还提出一种新的自适应多层次化图像表示方法, 并可应用于图像合成及视觉感知等方面. 从数值计算的角度上, 通过稀疏对称矩阵特征值分解可方便地获得不同层次的小尺度模式.
2009, 35(12): 1573-1579.
doi: 10.3724/SP.J.1004.2009.01573
摘要:
受湍流影响, 室内通风环境下的烟羽分布表现出波动变化且不连续的特性; 在一些角落处, 较大的漩涡会产生长时间的局部浓度极值区; 另外室内的障碍物也会改变烟羽的分布状况. 因此室内有障碍通风环境下的机器人气味源搜索问题变得很复杂. 本文提出了基于概率适应度函数的粒子群优化(Probability-fitness-function based particle swarm optimization, P-PSO)算法并用于多机器人气味源搜索. P-PSO算法的特点是采用概率而非确定数来表达适应度函数值. 针对气味源搜索问题, P-PSO算法的适应度函数值由贝叶斯和变论域模糊推理估计的气味源概率表达. 为验证提出的搜索策略, 构建了对应实际边界条件的室内通风环境的烟羽模型. 仿真研究证明了本文提出的P-PSO搜索算法用于解决气味源搜索问题的可行性.
受湍流影响, 室内通风环境下的烟羽分布表现出波动变化且不连续的特性; 在一些角落处, 较大的漩涡会产生长时间的局部浓度极值区; 另外室内的障碍物也会改变烟羽的分布状况. 因此室内有障碍通风环境下的机器人气味源搜索问题变得很复杂. 本文提出了基于概率适应度函数的粒子群优化(Probability-fitness-function based particle swarm optimization, P-PSO)算法并用于多机器人气味源搜索. P-PSO算法的特点是采用概率而非确定数来表达适应度函数值. 针对气味源搜索问题, P-PSO算法的适应度函数值由贝叶斯和变论域模糊推理估计的气味源概率表达. 为验证提出的搜索策略, 构建了对应实际边界条件的室内通风环境的烟羽模型. 仿真研究证明了本文提出的P-PSO搜索算法用于解决气味源搜索问题的可行性.
2009, 35(12): 1580-1586.
doi: 10.3724/SP.J.1004.2009.01580
摘要:
针对随机有限缓冲区流水线调度问题(Flow shop scheduling problem, FSSP), 提出混合差分进化(Differential evolution, DE)算法OHTDE, 用来最小化提前/拖后指标和最小化总体完成时间指标. OHTDE将DE和最优计算量分配(Optimal computing budget allocation, OCBA)技术以及假设检验(Hypothesis test, HT)有效结合. DE用于执行全局搜索和局部搜索; OCBA用于对有限计算量进行合理分配, 从而保证优质解得到较多仿真计算量, 提高了在噪声环境下获得优质解的置信度; HT用于在统计意义上比较解的性能, 从而一定程度上避免在解空间相近区域进行重复搜索. 进而, 对由OCBA和HT确定的优质解执行一种特殊的交叉操作, 加强DE的局部开发能力. 同时也采用有限马氏链理论对OHTDE的随机收敛性进行了分析. 仿真实验和算法比较验证了算法的有效性和鲁棒性.
针对随机有限缓冲区流水线调度问题(Flow shop scheduling problem, FSSP), 提出混合差分进化(Differential evolution, DE)算法OHTDE, 用来最小化提前/拖后指标和最小化总体完成时间指标. OHTDE将DE和最优计算量分配(Optimal computing budget allocation, OCBA)技术以及假设检验(Hypothesis test, HT)有效结合. DE用于执行全局搜索和局部搜索; OCBA用于对有限计算量进行合理分配, 从而保证优质解得到较多仿真计算量, 提高了在噪声环境下获得优质解的置信度; HT用于在统计意义上比较解的性能, 从而一定程度上避免在解空间相近区域进行重复搜索. 进而, 对由OCBA和HT确定的优质解执行一种特殊的交叉操作, 加强DE的局部开发能力. 同时也采用有限马氏链理论对OHTDE的随机收敛性进行了分析. 仿真实验和算法比较验证了算法的有效性和鲁棒性.
2009, 35(12): 1586-1592.
doi: 10.3724/SP.J.1004.2009.01586
摘要:
在文本分割的基础上, 确定片段主题, 进而总结全文的中心主题, 使文本的主题脉络呈现出来, 主题以词串的形式表示. 为了分析准确, 利用LDA (Latent dirichlet allocation)为语料库及文本建模, 以Clarity度量块间相似性, 并通过局部最小值识别片段边界. 依据词汇的香农信息提取片段主题词, 采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外, 尝试挖掘隐藏于字词表面之下的文本内涵. 实验表明, 文本分析的结果明显好于其他方法, 可以为下一步文本推理的工作提供有价值的预处理.
在文本分割的基础上, 确定片段主题, 进而总结全文的中心主题, 使文本的主题脉络呈现出来, 主题以词串的形式表示. 为了分析准确, 利用LDA (Latent dirichlet allocation)为语料库及文本建模, 以Clarity度量块间相似性, 并通过局部最小值识别片段边界. 依据词汇的香农信息提取片段主题词, 采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外, 尝试挖掘隐藏于字词表面之下的文本内涵. 实验表明, 文本分析的结果明显好于其他方法, 可以为下一步文本推理的工作提供有价值的预处理.