2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于PCA和ICA模式融合的非高斯特征检测识别

葛泉波 程惠茹 张明川 郑瑞娟 朱军龙 吴庆涛

葛泉波, 程惠茹, 张明川, 郑瑞娟, 朱军龙, 吴庆涛. 基于PCA和ICA模式融合的非高斯特征检测识别. 自动化学报, 2024, 50(1): 169−180 doi: 10.16383/j.aas.c230326
引用本文: 葛泉波, 程惠茹, 张明川, 郑瑞娟, 朱军龙, 吴庆涛. 基于PCA和ICA模式融合的非高斯特征检测识别. 自动化学报, 2024, 50(1): 169−180 doi: 10.16383/j.aas.c230326
Ge Quan-Bo, Cheng Hui-Ru, Zhang Ming-Chuan, Zheng Rui-Juan, Zhu Jun-Long, Wu Qing-Tao. Non-Gaussian feature detection and recognition based on PCA and ICA pattern fusion. Acta Automatica Sinica, 2024, 50(1): 169−180 doi: 10.16383/j.aas.c230326
Citation: Ge Quan-Bo, Cheng Hui-Ru, Zhang Ming-Chuan, Zheng Rui-Juan, Zhu Jun-Long, Wu Qing-Tao. Non-Gaussian feature detection and recognition based on PCA and ICA pattern fusion. Acta Automatica Sinica, 2024, 50(1): 169−180 doi: 10.16383/j.aas.c230326

基于PCA和ICA模式融合的非高斯特征检测识别

doi: 10.16383/j.aas.c230326
基金项目: 国家自然科学基金(62033010, U23B2061), 中原科技创新领军人才(224200510004), 江苏高校青蓝工程(R2023Q07), 龙门实验室重大项目(231100220600), 河南省高校科技创新团队(24IRTSTHN022)资助
详细信息
    作者简介:

    葛泉波:南京信息工程大学教授. 主要研究方向为状态估计与信息融合, 自主智能无人系统, 飞行器测试数据分析和电力IOT技术. E-mail: 003535@nuist.edu.cn

    程惠茹:河南科技大学信息工程学院硕士研究生. 主要研究方向为状态估计与信息融合. E-mail: 210321050404@stu.haust.edu.cn

    张明川:河南科技大学信息工程学院教授. 主要研究方向为新型网络, 智能信息处理, 医疗辅助诊断和机器学习. 本文通信作者. E-mail: zhang_mch@haust.edu.cn

    郑瑞娟:河南科技大学信息工程学院教授. 主要研究方向为移动云计算, 生物启发的网络安全, 物联网安全和智能电网. E-mail: zhengruijuan@haust.edu.cn

    朱军龙:河南科技大学信息工程学院副教授. 主要研究方向为大规模优化, 分布式多智能体优化, 随机优化及其在机器学习中的应用. E-mail: jlzhu@haust.edu.cn

    吴庆涛:河南科技大学信息工程学院教授. 主要研究方向为工业互联网, 智能系统, 模式识别和机器学习. E-mail: wqt8921@hauet.edu.cn

Non-Gaussian Feature Detection and Recognition Based on PCA and ICA Pattern Fusion

Funds: Supported by National Natural Science Foundation of China (62033010, U23B2061), Leading Talents of Science and Technology in the Central Plain of China (224200510004), Qing Lan Project of Jiangsu Province (R2023Q07), Major Project of Longmen Laboratory (231100220600), and Scientific and Technological Innovation Team of Colleges and Universities in Henan Province (24IRTSTHN022)
More Information
    Author Bio:

    GE Quan-Bo Professor at Nanjing University of Information Science & Technology. His research interest covers state estimation and information fusion, autonomous intelligent unmanned system, aircraft test data analysis, and power IOT technology

    CHENG Hui-Ru Master student at the School of Information Engineering, Henan University of Science and Technology. Her research interest covers state estimation and information fusion

    ZHANG Ming-Chuan Professor at the School of Information Engineering, Henan University of Science and Technology. His research interest covers new generation network, intelligent information processing, medical aided diagnosis, and machine learning. Corresponding author of this paper

    ZHENG Rui-Juan Professor at the School of Information Engineering, Henan University of Science and Technology. Her research interest covers mobile cloud computing, biologically network security, internet of things security, and smart grid

    ZHU Jun-Long Associate professor at the School of Information Engineering, Henan University of Science and Technology. His research interest covers large-scale optimization, distributed multi-agent optimization, stochastic optimization, and their applications to machine learning

    WU Qing-Tao Professor at the School of Information Engineering, Henan University of Science and Technology. His research interest covers industrial internet, intelligent system, pattern recognition, and machine learning

  • 摘要: 针对无人船(Unmanned surface vehicle, USV)航行位姿观测数据的非高斯性/高斯性判别问题, 提出一种基于主成分分析(Principal component analysis, PCA)和独立成分分析(Independent component analysis, ICA) 模式融合的非高斯特征检测识别方法. 首先, 采用基于标准化加权平均和信息熵的数据预处理方法. 其次, 引入混合加权核函数并使用灰狼优化(Grey wolf optimization, GWO)算法进行参数优化, 以提高PCA方法的准确性. 同时, 该算法采用一种新的非线性控制因子策略, 提高全局和局部搜索能力. 最后, 建立了一种基于ICA和PCA联合的相关性分析方法来实现多维数据的降维, 在降维数据的基础上综合T型多维偏度峰度检验法和KS (Kolmogorov-Smirnov)检验法进行非高斯性/高斯性特征检测识别. 该方法考虑了非线性非高斯的噪声对降维结果精确度的影响, 有效降低了多维数据非高斯检测的复杂度, 同时也为后续在实际USV位姿估计等应用中提供了保障. 实验表明, 该方法具有较高的准确性和稳定性, 可为 USV 航行位姿观测数据处理提供支持.
  • 在复杂水域中, 无人船(Unmanned surface vehicle, USV)需要准确地了解自身的位置、姿态和运动状态, 以便进行自主导航和避障. 位姿测量是无人船实现自主导航和避障的关键技术之一. 位姿测量可以通过多种传感器来实现, 如GPS、惯性测量单元、视觉传感器等. 这些传感器可以提供无人船的位置、速度、加速度、角速度等信息. 在无人机−无人船协同降落场景中, 无人船需要面对各种复杂的环境 (风浪流), 这些环境会对无人船的运动状态以及后续无人机相对位姿的准确估计产生影响, 因此需要准确的位姿测量来保证无人船的安全和稳定性.

    在位姿估计或目标跟踪状态估计算法中, 通常使用的是基于卡尔曼滤波的方法, 文献[1]中基于EKF给出了三种典型非线性集中式融合算法, 并在非线性系统中推广与完善; Fu等[2]提出了一种基于动态递归标称协方差估计和改进变分贝叶斯推理的增强自适应卡尔曼滤波; Gao等[3]提出了一种基于马氏距离的自适应加权联邦卡尔曼滤波方法, 提高了导航滤波计算的精度; 文献[4]中提出一种复合自适应滤波算法, 解决了一类过程噪声统计特性未知且系统状态分量可观测度差的状态估计问题. 在卡尔曼滤波中, 存在过程噪声和测量噪声两个噪声源. 如果过程噪声和测量噪声都服从高斯分布, 那么卡尔曼滤波器能够提供一个最优的线性无偏估计; 如果噪声是非高斯的, 那么卡尔曼滤波器可能无法准确地描述数据的真实分布, 从而导致估计误差的增大. 因此, 对这些不确定噪声的高斯性和非高斯性进行判别是后续建模的关键, 而随机噪声变量的非高斯性/高斯性判别主要依赖于随机变量概率分布曲线的峰度与偏度系数的检验, 因此, 对峰度与偏度系数的高性能估计成为关键.

    近些年, 有许多学者对基于峰度和偏度的非高斯判别方法进行研究[5-8], Mardia[5]基于偏度和峰度建立了多维正态性检验统计量. 此后, 许多学者对这一类型的检验进行了研究, 使其理论不断丰富和发展. Srivastava[6]对偏度和峰度在多维情形下做出了不同的推广, 提出了自己的多维正态性检验统计量; 文献[6]中所提到的多维正态性检验方法, 对于高维和大样本情形, 可以考虑T型多维峰度作为正态性检验统计量, 许多国内学者也针对多维数据降维技术进行了研究和实验[9-12]. 孙平安和王备战[13]验证了主成分分析(Principal component analysis, PCA) 存在会损失部分有用信息并且容易受到噪声影响的缺陷; Zhou等[14]对基于PCA和CCA的特征降维算法进行了有效的研究. Sharma和Saroha[15]将PCA方法与特征排序相结合, 最终验证将PCA与特征排序相结合的方式可以在提升分类精度的基础上实现降维. 刘文博等[16]提出一种基于加权核主成分分析的维度约简算法, 证明随着数据维度的增加, 多核学习的优势更明显. 如何构造更加多样化的核函数以提高数据处理效率成为了研究重点.

    本文在现有技术的基础上, 提出了一种基于PCA和独立成分分析 (Independent component analysis, ICA)模式融合的非高斯特征检测识别方法, 以期得到更优的检测效果.

    1) 提出一种基于标准化加权平均和信息熵的数据预处理方法. 首先采用标准化加权平均对数据进行规范化处理, 然后通过计算信息熵和信息偏差度来消除一些数据的不确定性.

    2) 提出一种基于混合加权核函数的主成分分析方法. 该方法使用加权核函数对PCA进行改进, 旨在对高维数据特征进行维度约简, 降低数据的复杂度, 从而实现简便的数据降维, 同时提出一种改进的灰狼优化(Grey wolf optimization, GWO)算法来优化参数.

    3) 提出一种基于ICA和PCA联合的相关性分析方法进行数据降维. 该方法使用改进的PCA算法对数据进行降维, 将降维后的数据与经过ICA处理的数据进行相关性分析, 以确定最终的降维成分.

    4) 在降维数据的基础上综合T型多维偏度峰度检验方法和KS (Kolmogorov-Smirnov)检验方法进行检测识别, 对数据进行多元正态分布拟合并且考虑到样本容量和样本分布状况.

    PCA是一种数据分析技术, 它可以高效地找出数据中的主要部分, 将原有的数据降维并去除整个数据中的噪声和冗余.

    1) 传统利用PCA进行降维处理的方法用零均值化对数据进行特征缩放. 简单的均值相减并不能达到数据预处理的目的, 因此需要考虑对数据预处理过程进行改进和完善, 以保障后续的计算结果.

    2) PCA只能解决数据分布是线性的情况. 实际工程系统中, 需要考虑到非线性噪声的处理. 文献[17]中通过使用核主成分分析把非线性的数据映射到高维空间实现线性模式转化, 然后用PCA来进行降维处理[18], 但其计算相对复杂, 需考虑提高其处理效率.

    3) PCA整个计算过程就是通过一个协方差矩阵的特征值分解来起到降维效果的. PCA降维是选取方差最大的主成分, 难免会损失一些信息[19], 因此, 研究过程中需要考虑的是如何有效降维并且获得精确的降维结果.

    本文主要研究基于PCA降维的非高斯特征判别在多维数据中的应用. PCA在数据特征提取方面具有一定优势, 但在多维数据降维处理过程中, 仍存在以下几个问题:

    1) 零均值化处理得到的数据难以很好地全面表征原始数据的综合特征[20]. 由于均值容易受到极端值的影响, 所以在对数据完全无知的情况下, 简单的均值处理并不能较好地保留数据特征信息.

    2) 现有非高斯检测方法中, 基于PCA的协方差矩阵求解技术难以保证协方差矩阵不受非线性噪声的影响, 从而将严重影响最终的降维效果[21-23]. 在实际应用中, 采用主成分降维后进行正态检验可能会受到非线性噪声影响, 从而极易影响检验效果.

    3) 非高斯数据求解得到的特征值和特征向量不一定是最优解, 难以很好地表达原始数据的基本特征[24-25]. PCA主要通过寻找数据矩阵的特征值和特征向量, 然后使用坐标旋转得到主成分, 所以如果输入数据不是高斯分布, 特征值和特征向量就不能代表数据的特征, 这样PCA也就失去了它的意义[26].

    面对上述多维数据PCA降维中存在的问题, 针对性地提出以下解决方案, 改进后方案的具体过程如图1所示.

    图 1  主成分分析改进方案过程
    Fig. 1  Principal component analysis improvement plan process

    在对数据完全无知的情况下, 本文通过对原始数据集采用特征加权平均值进行改进, 保留了特征间差异性, 使降维后保留的信息量也更具有价值, 此外, 为了提高数据预处理的可靠性, 本文使用熵权法进行数据筛选, 筛除对结果贡献率较低的数据.

    2.1.1   加权平均的数据处理过程

    将原始数据按列组成$ n $行$ m $列矩阵$ X_{(n\times m )} $, 以当前值减去数据集中该特征的加权平均值$ D_{x} $, $ D_{x} $的计算如式 (2) 所示, 其中的权重分配方式参考每个特征算出的均方差$ \sigma _{d} $, 加权平均处理后得到矩阵$ X'_{(n\times m )} $, 具体计算公式如下所示

    $$ \omega _{d} = \frac{\sigma _{d}}{\sum \sigma _{d}} = \sqrt{ { \sum\limits_{i = 1}^{n}(x_{i}-\bar{x})^{2}}} $$ (1)
    $$ \bar{x} = \frac{1}{n}\sum\limits_{i = 1}^{n}x_{i}, D_{x} = \sum D_{d} \times \omega _{d} $$ (2)
    $$ X'_{(n\times m )} = X_{(n\times m )}-D_{(n\times m )} $$ (3)

    式 (2) 为数据平均值和加权平均值, 式(3)为得到的数据预处理结果, $ x_{i} $为每行各个元素, $ \bar{x} $为对应的均值, $ D_{d} $为每行各个元素与均值之差, 每行均值之差构造矩阵$D _{(n\times m )}$, $ \omega _{d} $为每个元素对应$ \sigma _{d} $所分配的权重值并且$ \omega _{d} $之和为1, 其中$ \omega _{d} $利用均方差计算各指标的权重, $ X'_{(n\times m )} $为对加权平均值进行处理后的数据矩阵, 避免了数据处理结果受到极端值的影响, 为后续降维提供好的数据保障.

    2.1.2   熵权法数据筛选过程

    采用熵权法进行数据处理的目的就是筛除掉对结果贡献率较低的数据, 对加权平均值进行处理后的数据$ X'_{(n\times m )} $继续进行熵权法的数据筛选, 式 (4) 中$ E_{j} $为信息熵, $ r_{ij} $为第 $ i $ 个数据的评价指标且满足$ 0\le r_{ij} \le1 $, 式 (5) 中$ \omega _{j} $为各个特征的权重, 式(6)中$ Z_{(n\times p)} $为数据预处理后输出的矩阵

    $$ E_{j} = -k\sum\limits_{i = 1}^{n}r_{ij}{\rm{ln}}(r_{ij}) $$ (4)

    式中, $r_{ij} = x_{ij}/{ \sum_{i = 1}^{n}x_{ij}}, k = 1/{\rm{ln}}(n)$

    $$ \omega _{j} = \frac{1-E_{j}}{ \sum\limits_{j = 1}^{m}(1-E_{j})} = \frac{1-E_{j}}{m-\sum\limits_{j = 1}^{m}E_{j} } $$ (5)
    $$ Z_{(n\times p)} = \omega _{j}x_{ij} , i = 1, \cdots, n, j = 1, \cdots, m $$ (6)

    对数据进行预处理标准化通常考虑标准差的影响, 尤其是对被噪声污染的数据而言, 噪声的标准差对数据的放大作用更显著, 而没被噪声污染的数据其在标准化的过程中放大作用较小. 因此, 为数据集中每个特征计算出信息熵值而后利用信息熵计算得出特征权重, 这样可以筛除掉作用小的数据以得到更高的降维精度.

    改进的主成分分析过程引入加权核函数, 通过选取核函数并构造多样化的核函数来提高数据处理效率, 使得混合后的核函数性能更佳[16].

    2.2.1   构造混合加权核函数

    本文通过组合两种具有代表性的高斯径向核函数和多项式核函数的映射特性, 构造一种混合核函数. 该混合核函数拥有高斯径向核函数的局部特性, 也拥有多项式核函数的全局特性, 多项式核函数选择二阶. 传统的高斯径向核函数、多项式核函数以及混合核函数表达式分别为[16]

    $$ K(x_{i}, x_{j}) = \exp \left(-\frac{\left \| x_{i}-x_{j}\right \| ^{2}}{2\sigma ^{2}}\right) $$ (7)
    $$ K(x_{i}, x_{j}) = (\gamma (x_{i}\cdot x_{j})+1)^{q} $$ (8)
    $$ \begin{split} K(x_{i}, x_{j}) = \; & \lambda \exp \left(-\frac{\left \| x_{i}-x_{j}\right \| ^{2}}{2\sigma ^{2}}\right)\; +\\ & (1-\lambda )(\gamma (x_{i}\cdot x_{j})+1)^{q} \end{split} $$ (9)

    由上述公式可以看出, 涉及到的参数有高斯径向核函数参数$ \sigma $、多项式核函数系数$ q $和混合核函数的权重系数$ \lambda $. 文献[27]中通过训练和测试支持向量机找出效果最好的参数, 但求解相对比较耗时. 文献[28]中采用粒子群优化算法进行寻优, 后期易陷入局部最优. 针对参数寻优问题, 本文提出一种改进的灰狼优化算法, 减少主观经验选择的盲目性并在一定程度上提高算法的全局搜索和局部开发能力. 由此依据加权核函数构建目标函数过程如下[9]

    $$ \min J(\omega, e) = \frac{1}{2}\left(\omega^{{\rm{T}}} \omega\right)+\frac{1}{2} c \sum\limits_{i = 1}^{n} e_{i}^{2} $$ (10)
    $$ y_{i}\left(\omega^{{\rm{T}}} \phi(x)+b\right) = 1-e_{i} $$ (11)
    $$ y(x) = \sum\limits_{i = 1}^{n} \alpha_{i} K+b $$ (12)

    式(8)中$ \gamma $用来对内积进行缩放; $ K $为式 (9) 的加权核函数; 式 (10) 中$ \omega $为超平面法向量, $ c $为惩罚因子, $ e_{i} $为松弛变量; 式 (11) 中$ y_{i} $为约束条件, $ \phi(x) $为对应的函数映射, $ b $为函数中截距变量; 式 (12) 中$ y(x) $为目标函数, $ \alpha_{i} $为拉格朗日因子.

    2.2.2   基于改进灰狼算法的混合核函数参数优化

    GWO算法是一种群智能优化算法. 该算法的优化过程将包围、追捕、攻击三个阶段的任务分配给各等级的灰狼群来完成捕食行为, 从而实现全局优化的搜索过程[29-30]. 改进的灰狼算法注重全局搜索与局部开发能力的协调, 以便于较快获得全局最优

    $$ a = 2- \frac{2t}{t_{\max}} $$ (13)
    $$ a = \frac{4}{\pi} \arcsin \frac{t_{\max}-t}{t_{\max}} $$ (14)

    式 (13) 为标准GWO算法中参数$ a $的计算策略, 其变化过程是线性递减的, 但是在整个算法搜索过程中并非是线性变化的, 因此在式 (14) 中提出一种非线性控制因子策略. 式中$ t $表示当前迭代次数, $ t_{\max} $为最大迭代次数. 如图2所示, 当$ |{A} |>1 $时, 进行全局搜索, 当$ |{A} | \le1 $时, 进行局部搜索. 由式 (15) 可知, 参数${A} $随着控制因子$ a $的变化而变化, 因此在算法搜索过程中主要通过参数$ a $的变化来完成. 根据式(14), 在迭代初期$ a $的收敛速度较小, 式(15)中$ {A} $的值波动较大, 避免了算法的早熟收敛, 从而提升了算法的全局搜索能力. 迭代后期$ a $的收敛速度较大, 算法有较强的局部开发能力. 因此, 改进的非线性控制因子策略能较好地协调算法的全局搜索与局部开发能力.

    图 2  变量$ {A} $与算法搜索的关系
    Fig. 2  The relationship between variable ${A} $ and algorithm search

    图3为使用不同非线性控制因子策略的迭代结果, 图中分别为利用不同控制策略对数据集CEC2005中函数F11[30]进行迭代的结果, 横坐标为迭代次数, 纵坐标为函数值, 其中$ {\rm{GWO}}_{X} $为利用式 (14) 的迭代结果, 由结果可以看出本文提出的控制因子策略收敛速度快, 迭代时间短[27].

    图 3  不同控制因子策略的迭代结果
    Fig. 3  Iterative results of different control factor strategies

    灰狼在捕食猎物过程中的位置变化如式(15) ~ 式 (17)所示

    $$ {C} = 2{r}_{2},\;\;{A} = {a} ( 2{r}_{1}-{\boldsymbol{1}}) $$ (15)
    $$ {D} = \left|{C} \times {X}_{p}(t)-{X}(t)\right| $$ (16)
    $$ {X}(t+1) = {X}_{p}(t)-{A} \times {D} $$ (17)

    式中, $ {A} $和$ {C} $是系数向量, $ {X}_{p} $是猎物的位置向量, 而$ {X} $表示灰狼的位置向量, ${D} $是一个矢量并且依赖于$ {X}_{p} $, $ a $为控制因子且在迭代过程中从2线性减少到0, $ {r_1} $, $ {r_2} $是[0, 1] 中的随机向量, 式(14) ~ 式(18) 为灰狼的位置变化, 最后对位置求平均得到灰狼的最终位置$ {X}(t+1) $. 灰狼位置更新的具体过程如式(18) ~ 式 (20)所示[27]

    $$ \left\{\begin{aligned} &{D}_{\alpha} = \left|{C}_{1}\times{X}_{\alpha}-{X}\right| \\ &{D}_{\beta} = \left|{C}_{2}\times{X}_{\beta}-{X}\right| \\ &{D}_{\delta} = \left|{C}_{3}\times{X}_{\delta}-{X}\right| \end{aligned}\right. $$ (18)
    $$ \left\{\begin{aligned} &{X}_{1} = {X}_{\alpha}-{A}_{1} \times\left|{D}_{\alpha}\right| \\ &{X}_{2} = {X}_{\beta}-{A}_{2} \times\left|{D}_{\beta}\right| \\ &{X}_{3} = {X}_{\delta}-{A}_{3} \times\left|{D}_{\delta}\right| \end{aligned}\right. $$ (19)
    $$ {X}(t+1) = \frac{{X}_{1}+{X}_{2}+{X}_{3}}{3} $$ (20)

    其中, $ {D}_{\alpha} $, $ {D}_{\beta} $, $ {D}_{\delta} $为三个最佳解, $ {X}_{\alpha} $, $ {X}_{\beta} $, $ {X}_{\delta} $为本次迭代适应度前三的灰狼的位置, $ {A}_{1} $, $ {A}_{2} $, $ {A}_{3} $以及$ {C}_{1} $, $ {C}_{2} $, $ {C}_{3} $为每次迭代时产生的系数, $ {X}_{1} $, $ {X}_{2} $, $ {X}_{3} $为各灰狼的位置.

    根据上述分析, 可以得到改进GWO的参数优化算法原理, 如算法1所示. 其中, 加权核函数中参数设置: 高斯径向核函数参数$ \sigma \in [0.01,100] $, 多项式核函数参数$ q \in [0.1,4] $, 惩罚系数$ c \in [0.01,1\,000] $, 混合权重系数$ \lambda \in [0,1] $. 基于改进的GWO进行参数优化的流程如图4所示.

    算法1. 改进的 GWO参数优化算法

    1) 初始化种群规模$ N $, 随机产生初始化种群, 初始化$ t = 0 $, 初始化$ a $, $A$, $C$, $ \sigma $, $ \lambda $, $ c $, $ q $等参数;

    2) 计算种群中每个个体的适应度, 将适应度排名前三的个体分别记为$ {X}_\alpha $, ${X}_\beta$, $ {X}_\delta $;

    3) 由式 (14) ~ 式(17) 计算种群中其他个体与${X}_\alpha$, ${X}_\beta$和${X}_\delta$的距离, 根据式(18) ~ 式(20)更新个体位置;

    4) 更新算法中$ a $, $ A$, $ C$, $ \sigma $, $ \lambda $, $ c $, $ q $等参数;

    5) 判定算法是否满足收敛条件, 如果满足, 则算法结束; 否则, 令$ t = t+1 $, 返回步骤 3).

    图 4  GWO参数优化流程图
    Fig. 4  GWO parameter optimization flowchart

    对原始数据进行独立成分分析, $ n $为样本量, $ p $为数据维度. 设有$ m $条$ n $维数据($ n $行$ m $列), 则构成$ n $行$ m $列矩阵$ X $, $ X = HS $, 其中$ H $是混合源分量的某个未知可逆方阵, $S $为解出的独立成分, ICA的目标是找到混合矩阵$ H$, 以便从观测数据中恢复原始信号H [31].

    2.3.1   独立成分分析基本原理

    1) 数据预处理, 按行去中心化

    $$ \overline{x}_{j} = x_{j}-\sum\limits_{i = 1}^{m} x_{ij}, j = 1,2,\cdots, n $$ (21)

    2) 数据白化处理, 去除数据集中所有线性相关性并沿所有维度归一化方差.

    a) 求协方差矩阵

    $$ cov = {\rm{E}}(X X^{\rm{T}}) $$ (22)

    b) 奇异值分解, 化简得到最终表达式

    $$ X X^{\rm{T}} = U \varSigma^{2} U^{\rm{T}} $$ (23)

    c) 得到原数据的白化数据$ X_{w} $并将式(23)代入下式

    $$ X_{w} = D^{-\frac{1}{2}} {\rm{E}}^{{\rm{T}}} X ,\hat{S} = V X_{w} $$ (24)

    d) 假设所有的数据源相互独立, 那么也就可知

    $$ p(S) = \prod\limits_{i=1}^m S_{i} $$ (25)

    3) 利用信息论求解, 找到一个旋转矩阵$ V $, 使得多重信息$ I(\hat{S}) = {\bf{0}} $, 那么$ \hat{S} $是条件独立的, 则$W = V D^{-{1/2}} {\rm{E}}^{\rm{T}}$.

    ICA处理数据过程中, $ V $是正交矩阵, 为唯一未知的旋转矩阵, $ D $为对角矩阵, 对角线上的元素为对应的特征值, $ {\rm{E}} $是对应的特征向量形成的一个正交基, $ U $为奇异值矩阵, 其中$ U^{{\rm{T}}} U = {\boldsymbol{1}} $, $ p(S) $表示概率分布.

    2.3.2   改进ICA-PCA的融合方法

    本文提出一种ICA和PCA的融合模式, 对两种降维结果进行相关性计算和分析, 具体流程如图5所示.

    图 5  ICA-PCA融合过程图
    Fig. 5  ICA-PCA fusion process diagram

    文献[32]中提到使用皮尔逊相关系数和斯皮尔曼相关系数来描述两组变量的相关性, 两者相比, 皮尔逊相关系数需要数据服从正态分布, 反之, 斯皮尔曼相关系数适用于分布不明变量的相关性分析且没有过多数据条件要求, $ x_{i}' $, $ y_{i}' $分别为改进后PCA降维后得到的分量以及ICA降维后得到的分量, 因此, 本文ICA-PCA融合改进应用斯皮尔曼相关系数来处理和分析. 式 (26) 为相关系数$ r_{s} $的计算公式

    $$ r_{s} = \frac{\sum\limits_{i = 1}^{N}\left(x_{i}'-\bar{x}'\right)\left(y_{i}'-\bar{y}'\right)}{\sqrt{\sum\limits_{i = 1}^{N}\left(x_{i}'-\bar{x}'\right)^{2} \sum\limits_{i = 1}^{N}\left(y_{i}'-\bar{y}'\right)^{2}}} $$ (26)

    斯皮尔曼相关系数的取值范围为[−1, 1], $ r_{s} $绝对值越大, 相关性越强. 斯皮尔曼相关系数$ r_{s}>0 $时, 认为两组变量存在正相关; 斯皮尔曼相关系数$ r_{s}<0 $时, 则认为两组变量存在负相关. 依据$ r_{s} $相关系数的计算进行相关性检验, 式 (27) 为具体检验公式, $ r_{s} $的分布可近似地用均值为0、标准差为$ 1/ \sqrt{n-1} $的正态分布曲线表示, $ Z $为正态检验值

    $$ r_{s} \sqrt{n-1}\sim {\rm{N}}(0,1),{{Z}} = {{r}}_{{{s}}} \sqrt{{{n}}-1} $$ (27)

    通过计算$ Z $可以根据正态分布密度函数求得检验值$ P $, 通过比较$ P $值与0.05之间的大小, 可以判断$ r_{s}<0 $的显著性. 如果$ P $值小于0.05, 可以认为存在显著性的差异, 即两者具有相关性. 当样本数小于30时, 参照临界值表[33]该样本数所对应的斯皮尔曼相关系数临界值, 当计算的斯皮尔曼相关系数大于临界值时, 认为两者之间相关性是显著的, 是有统计学意义的.

    本文研究无人船航行观测数据的非高斯特征识别, 因此, 对降维后的数据基于偏度和峰度进行非高斯性判别. T型多维偏度峰度检验是将多维数据转化为一维数据后进行检验, 但该方法对数据分布有要求; 而使用非参数检验方法不需要假设数据服从特定的分布, 适用于各种类型的数据, 例如KS检验. 因此, 本文使用T型多维峰度统计量[8]并综合KS方法[33]进行检验.

    第一, 对数据进行多元正态分布拟合[34]后得到均值向量和协方差矩阵; 第二, 使用KS检验和T型多维偏度峰度检验来检验拟合后的数据是否符合正态分布; 第三, 使用KS检验来检验拟合后的数据, 检验两个样本是否来自同一分布, 其检验统计量为KS统计量; 第四, 如果KS检验和T型多维偏度峰度检验都表明数据符合正态分布, 则可以认为数据符合正态分布, 具体计算公式如下[34]

    $$ f(X) = \frac{\exp \left(-\frac{1}{2}(x-\mu)^{\rm{T}} \varSigma^{-1}(x-\mu)\right)}{(2 \pi)^{\frac{n}{2}}|\varSigma|^{\frac{1}{2}}} $$ (28)
    $$ L(\mu,\varSigma) = \prod\limits_{i = 1}^m f(x_i;\mu,\varSigma) $$ (29)
    $$ \begin{split} \ln L(\mu, \varSigma) =\;& -\frac{m}{2} \ln (2 \pi)-\frac{m}{2} \ln |\varSigma|\;- \\ & \frac{1}{2} \sum\limits_{i = 1}^{m}\left(x_{i}-\mu\right)^{\rm{T}} \varSigma^{-1}\left(x_{i}-\mu\right) \end{split} $$ (30)
    $$ b_{1} = (b_{11}, b_{21},\cdots , b_{m1})^{\rm{T}} , b_{i1} = \sum\limits_{j = 1}^{n}\frac{y_{ij}^{3} }{n} $$ (31)
    $$ b_{2} = (b_{12}, b_{22},\cdots , b_{m2})^{\rm{T}} , b_{i2} = \sum\limits_{j = 1}^{n}\frac{y_{ij}^{4} }{n} $$ (32)

    其中, $ x_1, x_2,\cdots, x_n $为$ n $个$ m $维数据, $ \mu $是$ m $维向量, 表示随机变量的均值向量; $ \varSigma $是$ n\times n $的协方差矩阵, $ f(x_i;\mu,\varSigma) $表示$ \mu $和$ \varSigma $下样本$ x_i $的概率密度函数, $ \ln L $为对数似然函数, 对对数似然函数求偏导数, 令其等于零, 解出参数$ {\mu} $和${\varSigma} $的估计值, $ b_{1} $, $ b_{2} $分别为样本的偏度和峰度, $ y_{ij}^{3} $, $ y_{ij}^{4} $分别为数据的三阶矩和四阶距.

    为验证本文所提方法对复杂情形下的USV传感器受到不确定噪声的非高斯性/高斯性检测的优越性, 进行仿真实验的平台配置: 硬件环境为CPU Intel(R) Core(TM)-i5-8265U 1.80 GHz, 运行在Windows10操作系统, 运行软件为Matlab R2019b. 为了保证实验的真实性和可靠性, 本次实验在千岛湖水域对无人船的数据进行采集, 以280 Hz的频率采集无人艇在行驶中的正常数据集. 数据集包括无人船位置数据和姿态角数据, 具体如下: $X $方向的加速度$ a_{x} $; $Y $方向的加速度$ a_{y} $; $Z $方向的加速度$ a_{z} $; 围绕$X $轴旋转的俯仰角$ \alpha $; 围绕$Y $轴旋转的偏航角$ \beta $; 围绕$Z $轴旋转的翻滚角$ \theta $. 将以上6个值作为待处理的值, 从而很大程度地仿真了无人船在真实运动场景下受到噪声的实际情况, 实验中使用无人船采集数据的环境如图6所示, 图6(a)为静止状态的无人船, 图6(b)为运动状态的无人船. 为评估所提出的改进方法在不同改进阶段的性能, 本文通过对比相同数据集在不同方法下的结果, 共做了5组实验, 实验一验证数据预处理方法的必要性; 实验二验证改进灰狼优化算法相较于其他优化算法的优越性; 实验三对改进的ICA-PCA方法进行分析并验证ICA和PCA联合的优势; 实验四对比验证对改进方法降维后的结果进行非高斯性检测的效果; 实验五验证整个方法在实际应用中的有效性.

    图 6  实际数据采集环境
    Fig. 6  Actual data collection environment

    实验一验证数据预处理方法的必要性. 将本文提出的方法与EW-PCA以及PCA方法的结果进行比较, 从而验证数据预处理对降维效果的影响. 这里选取Arcene数据集进行验证, Arcene共700个样本, 数据维度为10000. $ K $值表示降维后主成分的个数, 在主成分个数更少的情况下, 更大程度地保证了所含有的原有信息量. 在相同贡献率时, 本文提出的方法主成分个数$ K $值能够取到更小, 代表保留数据的能力更强. 表1为应用PCA、EW-PCA以及本文改进的PCA方法对相同数据集降维的结果, 观察表1可见改进后的实验效果优于现有的方法. 当贡献率同样都为95%时, PCA方法的$ K $值取110, EW-PCA方法的$ K $值取45, 本文改进的PCA方法的$ K $值取36. 在对相同数据集处理的情况下, 本文提出的改进PCA方法保留有用信息的能力更强.

    表 1  降维结果对比表
    Table 1  Comparison table of dimensionality reduction results
    方法名称累计方差贡献率 (%)
    8085909599
    原PCA方法576970110155
    EW-PCA方法67114578
    本文改进的PCA方法5693659
    下载: 导出CSV 
    | 显示表格

    实验二验证改进灰狼优化算法相较于其他优化算法的优越性. 与近几年改进后的灰狼优化算法NGWO1等进行对比, 将单峰函数、多峰函数以及固定维数的多峰函数三类函数分别进行测试, 对PSO、GWO以及NGWO1等优化算法结果从收敛性能、迭代次数等方面进行比较, 实验的测试集使用CEC2005. 图7为单峰函数测试结果对比图, 横坐标为迭代次数, 纵坐标为函数值, 从对比结果看, 改进的GWO算法相较于$ {\rm{NGWO}}_{1} $和PSO收敛速度更快; 图8为多峰函数测试结果对比图, 从对比结果看, 改进的GWO算法前期收敛速度慢, 后期收敛速度较快; 图9为固定维度的多峰函数测试结果对比图, 从对比结果不难看出, 改进的GWO算法具有收敛速度快以及迭代时间短等特点. 因此本文方法在求解精度、收敛速度以及时间成本方面都有良好的性能, 在一定程度上减少了主观经验选择的盲目性.

    图 7  单峰函数结果对比图
    Fig. 7  Comparison chart of unimodal function results
    图 8  多峰函数结果对比图
    Fig. 8  Comparison chart of multimodal function results
    图 9  固定维数多峰函数结果对比图
    Fig. 9  Comparison chart of fixed dimension multimodal function results

    实验三对改进的ICA-PCA方法进行分析并验证其优势, 使用主成分个数、累计贡献率和运行时间三个指标进行评价. 通过比较本文方法和现有ICA-PCA方法的结果, 验证本文方法在实时性和降维效果等方面的优势. 通过表2表3图10, 对比累计贡献率和运行时间两个指标, 当保留48个主成分时, 累计贡献率达到了95%, 相比改进之前的方法, 保留有用信息的能力更强, 时间成本更低.

    表 2  ICA-PCA方法对比结果
    Table 2  ICA-PCA method comparison results
    评价指标ICA-PCA方法本文改进方法
    主成分个数5348
    累计贡献率95%95%
    运行时间(s)64
    下载: 导出CSV 
    | 显示表格
    表 3  降维结果
    Table 3  Dimensionality reduction results
    序数特征值方差百分比 (%)累计贡献率 (%)
    1542214.88938.96538.965
    2401455.50828.84967.814
    369059.8594.96372.777
    449084.3603.52776.304
    529370.8552.11178.414
    $ \vdots$$ \vdots$$ \vdots$$ \vdots$
    148118.4450.58387.186
    157161.2890.51587.701
    下载: 导出CSV 
    | 显示表格
    图 10  降维主成分结果
    Fig. 10  Dimensionality reduction principal component results

    实验四将降维后的数据的非高斯性判别结果与现有的非高斯性检测方法的判别结果进行比较, 从结果的精确度和检测效果等方面进行比较. 对原始数据集进行非高斯性检测, 判断数据变量是否服从高斯分布, 如果$ H_0 $ = 0且$ P $在5%置信水平上, 则过程变量服从高斯分布; 反之, 则服从非高斯分布. 表4为应用现有的非高斯性检测方法 Kolmogorov-Smirnov 检验和 Shapiro-Wilk 检验进行判别的结果. 其中, 统计量$D $为两条累计分布曲线之间的最大垂直差, 描述两组数据之间的差异; 统计量$W $为峰度, 验证一个随机样本数据是否来自正态分布. 当数据呈现出显著性$P<0.05 $时, 意味着数据不具有正态性.

    为了验证方法在实际应用中的有效性, 对采集到的无人船航行姿态数据进行处理和检测. 其中包括无人船进行圆形运动、矩形运动的线加速度、水平坐标和偏航角等信息. 图11为无人船圆形运动时$X $, $Y $, $Z $方向的速度变化, 其中横轴代表采集样点数, 纵轴为速度变化; 图12为降维后的结果; 图13为非高斯性判别的结果, 其中纵坐标频率描述数据集中每个数值出现相对频率的统计量. 表5中显示渐进显著性为0, 则表明样本量的增加不会影响检测结果的显著性.

    图 11  三个方向的速度图
    Fig. 11  Chart of speed in three directions
    图 12  降维结果
    Fig. 12  Dimensionality reduction results
    图 13  检测结果1
    Fig. 13  Test result 1
    表 4  正态性检验结果
    Table 4  Normality test results
    名称样本量平均值标准差偏度峰度Kolmogorov-Smirnov检验Shapiro-Wilk检验
    统计量DP统计量WP
    $x_{1}$10034.8252.5311.5281.2280.254**0.712**
    $x_{2}$10042.1638.8810.9361.0630.139**0.902**
    $x_{3}$10070.1867.3370.493−1.0390.166**0.881**
    $x_{4}$100311.51179.2140.138−1.1730.0830.0860.954**
    $ \vdots$$ \vdots$$ \vdots$$ \vdots$$ \vdots$$ \vdots$$ \vdots$$ \vdots$$ \vdots$$ \vdots$
    $x_{148}$10091.0162.455−0.092−0.8070.157**0.924**
    $x_{149}$1003.8013.2065.68840.0940.473**0.321**
    $x_{150}$10025.8928.4401.0150.2900.181**0.852**
    * 表示P < 0.05, ** 表示P < 0.01
    下载: 导出CSV 
    | 显示表格
    表 5  非高斯检测结果
    Table 5  Non-Gaussian detection results
    检验结果
    总计N11643
    最大极差绝对0.049
    0.049
    −0.020
    检验统计量0.049
    渐进显著性(双边检验)0
    下载: 导出CSV 
    | 显示表格

    针对复杂情形下传感器观测数据的非高斯性/高斯性检测判别问题, 改进传统PCA方法实现数据的降维处理, 而后采用T型多维峰度检验和KS检验方法进行非高斯特征的识别. 该方法考虑到数据预处理的重要性、噪声数据的复杂性以及非线性非高斯的噪声对降维精确度的影响. 实验验证改进后的方法能有效降低多维数据检测的复杂度, 保证了最终结果的精确性和完整性. 需要注意的是, 本文分析时着重考虑对多维数据的降维处理, 并未考虑更多基于偏度和峰度判别的方法, 在下一步的研究中, 将深入展开更细致化的研究, 使方法在精度和完整性方面得到进一步提升.

  • 图  1  主成分分析改进方案过程

    Fig.  1  Principal component analysis improvement plan process

    图  2  变量$ {A} $与算法搜索的关系

    Fig.  2  The relationship between variable ${A} $ and algorithm search

    图  3  不同控制因子策略的迭代结果

    Fig.  3  Iterative results of different control factor strategies

    图  4  GWO参数优化流程图

    Fig.  4  GWO parameter optimization flowchart

    图  5  ICA-PCA融合过程图

    Fig.  5  ICA-PCA fusion process diagram

    图  6  实际数据采集环境

    Fig.  6  Actual data collection environment

    图  7  单峰函数结果对比图

    Fig.  7  Comparison chart of unimodal function results

    图  8  多峰函数结果对比图

    Fig.  8  Comparison chart of multimodal function results

    图  9  固定维数多峰函数结果对比图

    Fig.  9  Comparison chart of fixed dimension multimodal function results

    图  10  降维主成分结果

    Fig.  10  Dimensionality reduction principal component results

    图  11  三个方向的速度图

    Fig.  11  Chart of speed in three directions

    图  12  降维结果

    Fig.  12  Dimensionality reduction results

    图  13  检测结果1

    Fig.  13  Test result 1

    表  1  降维结果对比表

    Table  1  Comparison table of dimensionality reduction results

    方法名称累计方差贡献率 (%)
    8085909599
    原PCA方法576970110155
    EW-PCA方法67114578
    本文改进的PCA方法5693659
    下载: 导出CSV

    表  2  ICA-PCA方法对比结果

    Table  2  ICA-PCA method comparison results

    评价指标ICA-PCA方法本文改进方法
    主成分个数5348
    累计贡献率95%95%
    运行时间(s)64
    下载: 导出CSV

    表  3  降维结果

    Table  3  Dimensionality reduction results

    序数特征值方差百分比 (%)累计贡献率 (%)
    1542214.88938.96538.965
    2401455.50828.84967.814
    369059.8594.96372.777
    449084.3603.52776.304
    529370.8552.11178.414
    $ \vdots$$ \vdots$$ \vdots$$ \vdots$
    148118.4450.58387.186
    157161.2890.51587.701
    下载: 导出CSV

    表  4  正态性检验结果

    Table  4  Normality test results

    名称样本量平均值标准差偏度峰度Kolmogorov-Smirnov检验Shapiro-Wilk检验
    统计量DP统计量WP
    $x_{1}$10034.8252.5311.5281.2280.254**0.712**
    $x_{2}$10042.1638.8810.9361.0630.139**0.902**
    $x_{3}$10070.1867.3370.493−1.0390.166**0.881**
    $x_{4}$100311.51179.2140.138−1.1730.0830.0860.954**
    $ \vdots$$ \vdots$$ \vdots$$ \vdots$$ \vdots$$ \vdots$$ \vdots$$ \vdots$$ \vdots$$ \vdots$
    $x_{148}$10091.0162.455−0.092−0.8070.157**0.924**
    $x_{149}$1003.8013.2065.68840.0940.473**0.321**
    $x_{150}$10025.8928.4401.0150.2900.181**0.852**
    * 表示P < 0.05, ** 表示P < 0.01
    下载: 导出CSV

    表  5  非高斯检测结果

    Table  5  Non-Gaussian detection results

    检验结果
    总计N11643
    最大极差绝对0.049
    0.049
    −0.020
    检验统计量0.049
    渐进显著性(双边检验)0
    下载: 导出CSV
  • [1] 葛泉波, 李文斌, 孙若愚, 徐姿. 基于EKF的集中式融合估计研究[J]. 自动化学报, 2013, 39(6): 816-825

    Ge Quan-Bo, Li Wen-Bin, Sun Ruo-Yu, Xu Zi. Centralized fusion algorithms based on EKF for multisensor non-linear systems. Acta Automatica Sinica, 2013, 39(6): 816-825
    [2] Fu H P, Cheng Y M. An enhanced adaptive Kalman filtering for linear systems with inaccurate noise statistics. Asian Journal of Control, 2023, 25(4): 3269-3281 doi: 10.1002/asjc.2964
    [3] Gao Y, Gao Z, Zong H, Gao S S, Hong G Y. Adaptive weighted federated Kalman filtering based on Mahalanobis distance and its application in navigation. IET Communications, 2023, 17(17): 1962-1973 doi: 10.1049/cmu2.12664
    [4] 徐小良, 汤显峰, 葛泉波, 管冰蕾. 基于量化新息的容积粒子滤波融合目标跟踪算法. 自动化学报, 2014, 40(9): 1867-1874

    Xu Xiao-Liang, Tang Xian-Feng, Ge Quan-Bo, Guan Bing-Lei. Target tracking algorithm based on cubature particle filtering fusion with quantized innovation. Acta Automatica Sinica, 2014, 40(9): 1867-1874
    [5] Mardia K V. Measures of multivariate skewness and kurtosis with applications. Biometrika, 1970, 57(3): 519-530 doi: 10.1093/biomet/57.3.519
    [6] Srivastava M S. A measure of skewness and kurtosis and a graphical method for assessing multivariate normality. Statistics Probability Letters, 1984, 2(5): 263-267 doi: 10.1016/0167-7152(84)90062-2
    [7] Mardia K V. Applications of some measures of multivariate skewness and kurtosis in testing normality and robustness studies. Sankhyā: The Indian Journal of Statistics, Series B, 1974: 115-128
    [8] 田禹. 基于偏度和峰度的正态性检验 [硕士学位论文], 上海交通大学, 中国, 2012.

    Tian Yu. Tests for Normality Based on Skewness and Kurtosis [Master thesis], Shanghai Jiao Tong University, China, 2012.
    [9] 梁少军, 张世荣, 孙澜琼. 基于最优密度方向的等距映射降维算法. 控制理论与应用, 2021, 38(4): 467-478

    Liang Shao-Jun, Zhang Shi-Rong, Sun Lan-Qiong. Optimal density direction based isometric mapping dimensionality reduction algorithm. Control Theory & Applications, 2021, 38(4): 467-478
    [10] 王继奎, 杨正国, 刘学文, 易纪海, 李冰, 聂飞平. 一种基于极大熵的快速无监督线性降维方法. 软件学报, 2023, 34(4): 1779-1795

    Wang Ji-Kui, Yang Zheng-Guo, Liu Xue-Wen, Yi Ji-Hai, Li Bing, Nie Fei-Ping. Fast unsupervised dimension reduction method based on maximum entropy. Journal of Software, 2023, 34(4): 1779-1795
    [11] 高月, 宿翀, 李宏光. 一类基于非线性PCA和深度置信网络的混合分类器及其在PM2.5浓度预测和影响因素诊断中的应用. 自动化学报, 2018, 44(2): 318-329

    Gao Yue, Su Chong, Li Hong-Guang. A kind of deep belief networks based on nonlinear features extraction with application to PM2.5 concentration prediction and diagnosis. ACTA AUTOMATICA SINICA, 2018, 44(2): 318-329
    [12] Yang Z L, Shi Y Q, Li P L, Pan K H, Li G Q, Li X Q, et al. Application of principal component analysis(PCA) to the evaluation and screening of multiactivity fungi.Journal of Ocean University of China, 2022, 21(3): 763-772 doi: 10.1007/s11802-022-5096-x
    [13] 孙平安, 王备战. 机器学习中的PCA降维方法研究及其应用. 湖南工业大学学报, 2019, 33(1): 80-85

    Sun Ping-An, Wang Bei-Zhan. Research on PCA dimension reduction with its application in machine learning.Joural of Hunan University of Technology, 2019, 33(1): 80-85
    [14] Zhou Y H, Zhang X W, Wang J M, Gong Y. Research on speaker feature dimension reduction based on CCA and PCA. In: Proceedings of the International Conference on Wireless Communications & Signal Processing (WCSP). Suzhou, China: IEEE, 2010. 1−4
    [15] Sharma N, Saroha K. A novel dimensionality reduction method for cancer dataset using PCA and feature ranking. In: Proceedings of the International Conference on Advances in Computing, Communications and Informatics (ICACCI). Kochi, India: IEEE, 2015. 2261−2264
    [16] 刘文博, 梁盛楠, 董小刚. 基于t类加权核函数的主成分分析维度约简算法. 统计与决策, 2022, 38(9): 52-56

    Liu Wen-Bo, Liang Sheng-Nan, Dong Xiao-Gang. PCA dimension reduction algorithm based on t class weighted kernel function.Statistics & Decision, 2022, 38(9): 52-56
    [17] Li X H, Jia R C, Zhang R R, Yang S Y, Chen G M. A KPCA-BRANN based data-driven approach to model corrosion degradation of subsea oil pipelines. Reliability Engineering System Safety, 2022, 219: Article No. 108231 doi: 10.1016/j.ress.2021.108231
    [18] 张成, 高宪文, 李元. 基于k近邻主元得分差分的故障检测策略. 自动化学报, 2020, 46(10): 2229-2238

    Zhang Cheng, Gao Xian-Wen, Li Yuan. Fault detection strategy based on principal component score difference of k nearest neighbors. Acta Automatica Sinica, 2020, 46(10): 2229-2238
    [19] 左益宏, 王远亮, 何红丽等. 基于GA-BPNN的自适应抗野值无迹Kalman滤波方法. 空军工程大学学报(自然科学版), 2021, 22(05): 30-36

    Zuo Yi-Hong, Wang Yuan-Liang, He Hong-Li. An Adaptive Anti-Outliter Unscented Kalman Filtering Method Based on GA-BPNN.Journal of Air Force Engineering University(Natural Science Edition), 2021, 22(05): 30-36
    [20] 常海涛, 蔡静, 温悦, 朱玉梅. 一种基于主成分分析的TDLAS高频噪声滤波. 计量学报, 2022, 43(10): 1285-1290

    Chang Hai-Tao, Cai Jing, Wen Yue, Zhu Yu-Mei. A principal component analysis method for TDLAS to remove high frequency noise. Acta Metrologica Sinica, 2022, 43(10): 1285-1290
    [21] Yuan J J, Shao H, Cai Y, Shi X H. Energy efficiency state identification of milling processing based on EEMD-PCA-ICA. Measurement, 2021, 174.
    [22] 韩丽黎. 基于非高斯特征提取的复杂工业过程建模与监控方法研究 [硕士学位论文], 中国计量大学, 中国, 2020.

    Han Li-Li. Research on Modeling and Monitoring of Complex Industrial Processes Based on Non-Gaussian Feature Extraction [Master thesis], China Jiliang University, China, 2020.
    [23] 王肖锋, 陆程昊, 郦金祥等. 广义余弦二维主成分分析[J]. 自动化学报, 2022, 48(11): 2836-2851

    Wang Xiaofeng, Lu Chenghao, Li Jinxiang, Liu Jun. Generalized cosine two-dimensional principal component analysis. Acta Automatica Sinica, 2022, 48(11): 2836-2851
    [24] 马兴亮. 建筑结构表面风压非高斯特性分析方法研究 [博士学位论文], 大连理工大学, 中国, 2019.

    Ma Xing-Liang. Study on Non-Gaussian Characteristic Analysis Methods of Wind Pressures on Building Surface [Ph.D. dissertation], Dalian University of Technology, China, 2019.
    [25] 高山. 海洋工程结构物的非高斯响应极值与疲劳研究 [博士学位论文], 大连理工大学, 中国, 2019.

    Gao Shan. Non-Gaussian Response Extrema and Fatigue of Marine Stuctures [Ph.D. dissertation], Dalian University of Technology, China, 2019.
    [26] 江伟华, 童峰, 王彬, 刘世刚. 采用主分量分析的非合作水声通信信号调制识别. 兵工学报, 2016, 37(9): 1670-1676

    Jiang Wei-Hua, Tong Feng, Wang Bin, Liu Shi-Gang. Method of recognition non-cooperation underwater acoustic communication signals using principal component analysis.Acta Armamentarii, 2016, 37 (9): 1670-1676
    [27] Yan X C, Lin Z, Lin Z H, Lin Z Y, Vucetic B. A novel exploitative and explorative GWO-SVM algorithm for smart emotion recognition. IEEE Internet of Things Journal, 2023, 10(11): 9999-10011 doi: 10.1109/JIOT.2023.3235356
    [28] Jain M, Saihjpal V, Singh N, Singh S B. An overview of variants and advancements of PSO algorithm. Applied Sciences, 2022, 12, 17: Article No. 8392 doi: 10.3390/app12178392
    [29] 张新明, 姜云, 刘尚旺, 刘国奇, 窦智, 刘艳. 灰狼与郊狼混合优化算法及其聚类优化. 自动化学报, 2022, 48, 11: 2757-2776

    Zhang Xin-Ming, Jiang Yun, Liu Shang-Wang, Liu Guo-Qi, Dou Zhi, Liu Yan. Hybrid coyote optimization algorithm with grey wolf optimizer and its application to clustering optimization. Acta Automatica Sinica, 2022, 48(11): 2757-2776
    [30] Gupta S, Deep K. Hybrid grey wolf optimizer with mutation operator. In: Proceedings of the Soft Computing for Problem Solving. Singapore: Springer Singapore, 2019. 961−968
    [31] 汤影, 李建平, 吴淮. 一种分离低维信号的ICA快速算法. 自动化学报, 2011, 37(7): 794-799 doi: 10.1016/S1874-1029(11)60210-3

    Tang Ying, Li Jian-Ping, Wu Huai. A simple and accurate ICA algorithm for separating mixtures of Up to Four Independent Components. Acta Automatica Sinica, 2011, 37(7): 794-799. doi: 10.1016/S1874-1029(11)60210-3
    [32] Zhang L, Wang L. Optimization of site investigation program for reliability assessment of undrained slope using Spearman rank correlation coefficient[J]. Computers and Geotechnics, 2023, 155: Article No. 105208 doi: 10.1016/j.compgeo.2022.105208
    [33] 杨斌. 正态性检验的几种方法比较. 统计与决策, 2015, 14:72-74

    Yang Bin.Comparison of Several Methods for Testing Normality. Statistics & Decision, 2015, 14:72-74
    [34] 丁勇. 多元正态分布的一个特殊积分和拟合优度检验. 统计与决策, 2020, 36(4): 18-21

    Ding Yong. A special integral and goodness-of-fit test for multivariate normal distribution, Statistics & decision, 2020, 36(4): 18-21
  • 加载中
图(13) / 表(5)
计量
  • 文章访问数:  583
  • HTML全文浏览量:  152
  • PDF下载量:  193
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-06-02
  • 录用日期:  2023-10-27
  • 网络出版日期:  2023-12-18
  • 刊出日期:  2024-01-29

目录

/

返回文章
返回