2015年 第41卷 第12期
2015, 41(12): 1981-2002.
doi: 10.16383/j.aas.2015.c150426
摘要:
本文梳理了粒子滤波理论基本内容、发展脉络和最新研究进展, 特别是对其在多目标跟踪应用中的一系列难点问题与主流解决思路进行了详细分析和报道. 常规粒子滤波研究重点主要围绕重要性采样函数、计算效率、权值退化/样本匮乏和复杂系统建模展开. 作为一类复杂估计问题,多目标跟踪一方面需要准确的目标新生/消亡与演变、虚警/漏检等建模技术, 另一方面需要多传感器信息融合、航迹管理等复杂决策方法.暨有限集统计学应用于多目标跟踪后,粒子 滤波进入一个新的发展阶段---随机集粒子滤波.基于不同的背景假设,可以构建不同近似形式的随机集贝 叶斯滤波器并采用粒子滤波实现.但机动目标、未知场景、多目标航迹管理以及跟踪性能评价等仍是多 目标粒子滤波的研究难点和重点.
本文梳理了粒子滤波理论基本内容、发展脉络和最新研究进展, 特别是对其在多目标跟踪应用中的一系列难点问题与主流解决思路进行了详细分析和报道. 常规粒子滤波研究重点主要围绕重要性采样函数、计算效率、权值退化/样本匮乏和复杂系统建模展开. 作为一类复杂估计问题,多目标跟踪一方面需要准确的目标新生/消亡与演变、虚警/漏检等建模技术, 另一方面需要多传感器信息融合、航迹管理等复杂决策方法.暨有限集统计学应用于多目标跟踪后,粒子 滤波进入一个新的发展阶段---随机集粒子滤波.基于不同的背景假设,可以构建不同近似形式的随机集贝 叶斯滤波器并采用粒子滤波实现.但机动目标、未知场景、多目标航迹管理以及跟踪性能评价等仍是多 目标粒子滤波的研究难点和重点.
2015, 41(12): 2003-2016.
doi: 10.16383/j.aas.2015.c150259
摘要:
分析推动工业进程和能源进程交互发展的因素和趋势, 结合能源互联网的发展要求, 提出了建立能源5.0的迫切性和必要性. 着重讨论了在网络化之后, 能源系统呈现的社会性问题, 认为在传统方式之外, 必须引入人类社会学、管理学等软科学进行分析建模; 指出了虚拟人工系统根本不同于传统仿真系统等理念, 只有利用虚拟人工模型, 采用平行系统, 才能建立能源5.0. 阐述了能源5.0的理论、框架和技术, 明确了能源5.0、基于社会物理信息系统(Cyber-physical-social system, CPSS) 的平行能源是等价的概念. 指出能源5.0核心是构建与实际能源系统同构的虚拟人工能源系统, 通过虚拟人工能源系统的计算实验, 确定优化控制策略, 引导实际能源系统运行, 并使虚拟人工系统和实际系统平行执行、共同演化, 形成智能能源系统. 最后以华电集团已经完成的分布式能源5.0示范项目和正在实施的火力发电5.0项目及智能家居能源系统, 探讨了能源5.0的研究内容、技术途径及应用前景.
分析推动工业进程和能源进程交互发展的因素和趋势, 结合能源互联网的发展要求, 提出了建立能源5.0的迫切性和必要性. 着重讨论了在网络化之后, 能源系统呈现的社会性问题, 认为在传统方式之外, 必须引入人类社会学、管理学等软科学进行分析建模; 指出了虚拟人工系统根本不同于传统仿真系统等理念, 只有利用虚拟人工模型, 采用平行系统, 才能建立能源5.0. 阐述了能源5.0的理论、框架和技术, 明确了能源5.0、基于社会物理信息系统(Cyber-physical-social system, CPSS) 的平行能源是等价的概念. 指出能源5.0核心是构建与实际能源系统同构的虚拟人工能源系统, 通过虚拟人工能源系统的计算实验, 确定优化控制策略, 引导实际能源系统运行, 并使虚拟人工系统和实际系统平行执行、共同演化, 形成智能能源系统. 最后以华电集团已经完成的分布式能源5.0示范项目和正在实施的火力发电5.0项目及智能家居能源系统, 探讨了能源5.0的研究内容、技术途径及应用前景.
2015, 41(12): 2017-2025.
doi: 10.16383/j.aas.2015.c150290
摘要:
针对当前复杂网络动态社区发现的热点问题, 提出一种面向静态网络社区发现的链接相关线性谱聚类算法, 并在此基础上提出一种基于增量式谱聚类的动态社区自适应发现算法. 动态社区发现算法引入归一化图形拉普拉斯矩阵呈现复杂网络节点之间的关 系,采用拉普拉斯本征映射将节点投影到k维欧式空间.为解决离群节点影响谱聚类的效果和启发式确定复杂网络社区数量的问题, 利用提出的链接相关线性谱聚类算法发现初始时间片的社区结构, 使发现社区的过程能够以较低的时间开销自适应地挖掘复杂网络社区结构. 此后, 对于后续相邻的时间片, 提出的增量式谱聚类算法以前一时间片聚类获得的社区特征为基础, 通过调整链接相关线性谱聚类算法实现对后一时间片的增量聚类, 以达到自适应地发现复杂网络动态社区的目的. 在多个数据集的实验表明, 提出的链接相关线性谱聚类算法能够有效地检测出复杂网络中的社区结构以及基于 增量式谱聚类的动态社区自适应发现算法能够有效地挖掘网络中动态社区的演化过程.
针对当前复杂网络动态社区发现的热点问题, 提出一种面向静态网络社区发现的链接相关线性谱聚类算法, 并在此基础上提出一种基于增量式谱聚类的动态社区自适应发现算法. 动态社区发现算法引入归一化图形拉普拉斯矩阵呈现复杂网络节点之间的关 系,采用拉普拉斯本征映射将节点投影到k维欧式空间.为解决离群节点影响谱聚类的效果和启发式确定复杂网络社区数量的问题, 利用提出的链接相关线性谱聚类算法发现初始时间片的社区结构, 使发现社区的过程能够以较低的时间开销自适应地挖掘复杂网络社区结构. 此后, 对于后续相邻的时间片, 提出的增量式谱聚类算法以前一时间片聚类获得的社区特征为基础, 通过调整链接相关线性谱聚类算法实现对后一时间片的增量聚类, 以达到自适应地发现复杂网络动态社区的目的. 在多个数据集的实验表明, 提出的链接相关线性谱聚类算法能够有效地检测出复杂网络中的社区结构以及基于 增量式谱聚类的动态社区自适应发现算法能够有效地挖掘网络中动态社区的演化过程.
2015, 41(12): 2026-2035.
doi: 10.16383/j.aas.2015.c140794
摘要:
在随机有限集框架下给出了当杂波和漏检存在时,群目标联合检 测与估计(Joint detection and estimation, JDE)误差界的递推形式. 首先,将多个群目标运动过程建模为一个多Bernoulli过程, 并采用连续个体目标数假设建模群目标观测似然函数; 其次,采用最优子模式 分配距离定义群目标JDE误差; 最终,利用信息不等式推导获得了建议的误差界. 仿真实验在不同杂波密度和检测概率场景下利用群势概率假设密度 和群势平衡多目标多Bernoulli滤波器对该误差界的有效性进行了验证.
在随机有限集框架下给出了当杂波和漏检存在时,群目标联合检 测与估计(Joint detection and estimation, JDE)误差界的递推形式. 首先,将多个群目标运动过程建模为一个多Bernoulli过程, 并采用连续个体目标数假设建模群目标观测似然函数; 其次,采用最优子模式 分配距离定义群目标JDE误差; 最终,利用信息不等式推导获得了建议的误差界. 仿真实验在不同杂波密度和检测概率场景下利用群势概率假设密度 和群势平衡多目标多Bernoulli滤波器对该误差界的有效性进行了验证.
2015, 41(12): 2036-2046.
doi: 10.16383/j.aas.2015.c150192
摘要:
湿法炼锌沉铁过程针铁矿沉淀形成的条件要求苛刻, 亚铁离子的氧化速率必须控制在合理的范围内才能保证溶液中的铁离子以针铁矿形式除去. 本文在沉铁过程动态模型的基础上, 根据针铁矿沉淀形成的条件和结合流程工艺要求, 优化设定每个反应器出口的亚铁离子浓度, 进而建立针铁矿法沉铁过程氧化速率优化控制模型. 采用控制参数化方法将最优控制求解问题转化为非线性规划, 通过状态转移优化算法求取最优的氧气和氧化锌控制率, 以合理控制沉铁过程亚铁离子的氧化速率. 仿真结果表明, 优化控制模型计算所得的控制量不仅可以保证反应过程的氧化速率符合生成针铁矿沉淀的条件, 而且可以稳定生产流程.
湿法炼锌沉铁过程针铁矿沉淀形成的条件要求苛刻, 亚铁离子的氧化速率必须控制在合理的范围内才能保证溶液中的铁离子以针铁矿形式除去. 本文在沉铁过程动态模型的基础上, 根据针铁矿沉淀形成的条件和结合流程工艺要求, 优化设定每个反应器出口的亚铁离子浓度, 进而建立针铁矿法沉铁过程氧化速率优化控制模型. 采用控制参数化方法将最优控制求解问题转化为非线性规划, 通过状态转移优化算法求取最优的氧气和氧化锌控制率, 以合理控制沉铁过程亚铁离子的氧化速率. 仿真结果表明, 优化控制模型计算所得的控制量不仅可以保证反应过程的氧化速率符合生成针铁矿沉淀的条件, 而且可以稳定生产流程.
2015, 41(12): 2047-2057.
doi: 10.16383/j.aas.2015.c150184
摘要:
最优转矩法因其所需测量状态较少、易于实现的特点,被广泛应用于风力机的最大功率点跟踪(Maximum power point tracking, MPPT)控制. 传统的最优转矩法只考虑系统的稳态工作点,依靠系统本身的特性进行转速调节,在一定程度上限制了转速调节速度. 本文使用滑模变结构控制的思想,在最优转矩法的基础上设计得到 一种变结构控制器,增大了转速跟踪过程中的不平衡转矩,缩短了系统的调节时间. 仿真结果表明本文提出的改进方法可以获得良好的转速跟踪效果,从而提高风力机的风能捕获效率.
最优转矩法因其所需测量状态较少、易于实现的特点,被广泛应用于风力机的最大功率点跟踪(Maximum power point tracking, MPPT)控制. 传统的最优转矩法只考虑系统的稳态工作点,依靠系统本身的特性进行转速调节,在一定程度上限制了转速调节速度. 本文使用滑模变结构控制的思想,在最优转矩法的基础上设计得到 一种变结构控制器,增大了转速跟踪过程中的不平衡转矩,缩短了系统的调节时间. 仿真结果表明本文提出的改进方法可以获得良好的转速跟踪效果,从而提高风力机的风能捕获效率.
2015, 41(12): 2058-2071.
doi: 10.16383/j.aas.2015.c140838
摘要:
着重研究了小数据集条件下结合凸约束的离散贝叶斯网络(Bayesian network, BN)参数学习问题, 主要任务是用先验知识弥补数据的不足以提高参数学习精度. 已有成果认为数据和先验知识是独立的, 在参数学习算法中仅将二者机械结合. 经过理论研究后, 本文认为数据和先验知识并不独立, 原有算法浪费了这部分有用信息. 本文立足于数据信息分类, 深入挖掘数据和先验知识之间的约束信息来提高参数学习精度, 提出了新的BN 参数学习算法 --凸约束条件下基于数据再利用的贝叶斯估计. 通过仿真实验展示了所提算法在精度和其他性能上的优势, 进一步证明数据和先验知识不独立思想的合理性.
着重研究了小数据集条件下结合凸约束的离散贝叶斯网络(Bayesian network, BN)参数学习问题, 主要任务是用先验知识弥补数据的不足以提高参数学习精度. 已有成果认为数据和先验知识是独立的, 在参数学习算法中仅将二者机械结合. 经过理论研究后, 本文认为数据和先验知识并不独立, 原有算法浪费了这部分有用信息. 本文立足于数据信息分类, 深入挖掘数据和先验知识之间的约束信息来提高参数学习精度, 提出了新的BN 参数学习算法 --凸约束条件下基于数据再利用的贝叶斯估计. 通过仿真实验展示了所提算法在精度和其他性能上的优势, 进一步证明数据和先验知识不独立思想的合理性.
2015, 41(12): 2072-2080.
doi: 10.16383/j.aas.2015.c150058
摘要:
传统基于典型变量分析的过程监控方法无法判断故障是否影响产 品质量.为此,本文提出一种基于动态输入输出典型变量分析(Dynamic input-output canonical variate analysis, DIOCVA)的过程监控方法.该方法利用典型变量分析提取数据之间的相关性,并进一步考虑方差信息和时序相关性, 将过程数据和质量数据映射到5个子空间:输入输出相关子空间,不相关输入主元子空间, 不相关输入残差子空间,不相关输出主元子空间和不相关输出残差 子空间.所提方法能够精细区分影响质量的过程故障和不影响质量的过程故障.以Tennessee Eastman过程为例对所提方法的有效性进行了验证.
传统基于典型变量分析的过程监控方法无法判断故障是否影响产 品质量.为此,本文提出一种基于动态输入输出典型变量分析(Dynamic input-output canonical variate analysis, DIOCVA)的过程监控方法.该方法利用典型变量分析提取数据之间的相关性,并进一步考虑方差信息和时序相关性, 将过程数据和质量数据映射到5个子空间:输入输出相关子空间,不相关输入主元子空间, 不相关输入残差子空间,不相关输出主元子空间和不相关输出残差 子空间.所提方法能够精细区分影响质量的过程故障和不影响质量的过程故障.以Tennessee Eastman过程为例对所提方法的有效性进行了验证.
2015, 41(12): 2081-2091.
doi: 10.16383/j.aas.2015.c140526
摘要:
研究具有 Markov 跳变参数的闭环供应链(Closed-loop supply chain, CLSC)切换系 统建模以及具有抑制牛鞭效应的H∞控制问题. 针对再制造过程中的不确定性问题, 在考虑库存衰减因素的条件下, 根据库存水平的不同状态将系统建模为切换系统, 子系统间的切换服从 于一个Markov过程. 基于输入滞后的控制策略, 应用Markov切换思想对 系统进行控制器设计与性能分析, 在保证闭环供应链系统稳定的情形 下有效抑制牛鞭效应. 仿真例子说明所得结果的有效性.
研究具有 Markov 跳变参数的闭环供应链(Closed-loop supply chain, CLSC)切换系 统建模以及具有抑制牛鞭效应的H∞控制问题. 针对再制造过程中的不确定性问题, 在考虑库存衰减因素的条件下, 根据库存水平的不同状态将系统建模为切换系统, 子系统间的切换服从 于一个Markov过程. 基于输入滞后的控制策略, 应用Markov切换思想对 系统进行控制器设计与性能分析, 在保证闭环供应链系统稳定的情形 下有效抑制牛鞭效应. 仿真例子说明所得结果的有效性.
2015, 41(12): 2092-2099.
doi: 10.16383/j.aas.2015.c150254
摘要:
针对多智能体系统在动态演化过程中容易出现的"局部聚集"现象,融 合复杂网络中的拓扑结构优化理论与多智能体系统协调蜂拥控制研究,提出了一种基 于邻域交互结构优化的多智能体快速蜂拥控制算法.该算法首先从宏观上分析多智 能体的局部聚集现象,利用社团划分算法将局部相对密集的多个智能体聚类成一个 社团,整个多智能体系统可以划分成多个相对稀疏的社团,并为每个社团选择度 最大的个体作为信息智能体,该个体可以获知虚拟领导者信息;随后从多智能体 系统中不同社团相邻个体间的局部交互结构入手,取消社团间相邻个体的交 互作用,设计仅依赖于社团内部邻居个体交互作用的蜂拥控制律;理论分 析表明,只要每个社团存在一个信息智能体,在虚拟领导者的引导作用下,整个多 智能体系统就可以实现收敛的蜂拥控制行为;仿真实验也证实了对多智 能体系统进行邻域交互结构优化可以有效提高整个系统的收敛速度.
针对多智能体系统在动态演化过程中容易出现的"局部聚集"现象,融 合复杂网络中的拓扑结构优化理论与多智能体系统协调蜂拥控制研究,提出了一种基 于邻域交互结构优化的多智能体快速蜂拥控制算法.该算法首先从宏观上分析多智 能体的局部聚集现象,利用社团划分算法将局部相对密集的多个智能体聚类成一个 社团,整个多智能体系统可以划分成多个相对稀疏的社团,并为每个社团选择度 最大的个体作为信息智能体,该个体可以获知虚拟领导者信息;随后从多智能体 系统中不同社团相邻个体间的局部交互结构入手,取消社团间相邻个体的交 互作用,设计仅依赖于社团内部邻居个体交互作用的蜂拥控制律;理论分 析表明,只要每个社团存在一个信息智能体,在虚拟领导者的引导作用下,整个多 智能体系统就可以实现收敛的蜂拥控制行为;仿真实验也证实了对多智 能体系统进行邻域交互结构优化可以有效提高整个系统的收敛速度.
2015, 41(12): 2100-2114.
doi: 10.16383/j.aas.2015.c140735
摘要:
主辅部件并联普遍存在于机电系统中, 部件间存在故障相关性等因素使得针对系统的可靠性建模和维修策略优化尤为困难. 本文以部件间存在I类和III类故障相关性及因检测系统的不完备引起主部件累积损伤速率分布改变的主辅并联系统为对象, 通过对系统退化过程的分析建立其可靠性模型. 依据所建模型和观测的辅助部件的故障次数及系统的运行时间, 建立(T, N)预防性更换策略优化模型. 通过案例分析检测系统的完备性、累积损伤速率等参数对系统可靠性及预防性维修策略的影响.
主辅部件并联普遍存在于机电系统中, 部件间存在故障相关性等因素使得针对系统的可靠性建模和维修策略优化尤为困难. 本文以部件间存在I类和III类故障相关性及因检测系统的不完备引起主部件累积损伤速率分布改变的主辅并联系统为对象, 通过对系统退化过程的分析建立其可靠性模型. 依据所建模型和观测的辅助部件的故障次数及系统的运行时间, 建立(T, N)预防性更换策略优化模型. 通过案例分析检测系统的完备性、累积损伤速率等参数对系统可靠性及预防性维修策略的影响.
2015, 41(12): 2115-2124.
doi: 10.16383/j.aas.2015.c150218
摘要:
针对优化函数未知的昂贵区间多目标优化, 根据决策空间数据挖掘, 提出了一种基于最近邻法和主成分分析法(Principal component analysis, PCA)的NSGA-II算法. 该算法首先通过约束条件将待测解集分为可行解和非可行解, 利用最近邻法对待测解和样本解进行相似性计算, 判断待测解是否满足约束. 然后对于两个解的Pareto支配性同样利用最近邻法来区分解之间的被支配和非被支配关系. 由于目标空间拥挤距离无法求出, 为此在决策空间利用主成分分析法将K-均值聚类后的解集降维, 找出待测解的前、后近距离解, 通过决策空间拥挤距离对同序值解进行筛选. 实现NSGA-II算法的改进.
针对优化函数未知的昂贵区间多目标优化, 根据决策空间数据挖掘, 提出了一种基于最近邻法和主成分分析法(Principal component analysis, PCA)的NSGA-II算法. 该算法首先通过约束条件将待测解集分为可行解和非可行解, 利用最近邻法对待测解和样本解进行相似性计算, 判断待测解是否满足约束. 然后对于两个解的Pareto支配性同样利用最近邻法来区分解之间的被支配和非被支配关系. 由于目标空间拥挤距离无法求出, 为此在决策空间利用主成分分析法将K-均值聚类后的解集降维, 找出待测解的前、后近距离解, 通过决策空间拥挤距离对同序值解进行筛选. 实现NSGA-II算法的改进.
2015, 41(12): 2125-2137.
doi: 10.16383/j.aas.2015.c150064
摘要:
文本情绪分析属于细颗粒度文本情感分析范畴.传统的基于 监督学习的方法,大多注重从表面词形提取特征,对语言的结构化特征 考虑较少,无法应对特征稀疏问题,也无法挖掘文本中隐含的深层语 言信息(包括词语搭配和语义韵).上述问题的存在导致现有系统 的分类性能不高,尤其对隐性文本情绪分类问题表现出较大的局限 性.本文尝试将基于依存句法的词语搭配特征和基于组合语义的深度 特征应用于文本情绪分类,提出了一种以短语为主要线索的半马 尔科夫条件随机场文本情绪分析模型.为了验证模型的有效性,利 用实际构建的相关实验语料,开展了相关实验研究.实验结果表 明,本文方法不仅可以显著提高文本情绪分类的准确率,而且对解 决隐性情感分析问题也具有重要作用.
文本情绪分析属于细颗粒度文本情感分析范畴.传统的基于 监督学习的方法,大多注重从表面词形提取特征,对语言的结构化特征 考虑较少,无法应对特征稀疏问题,也无法挖掘文本中隐含的深层语 言信息(包括词语搭配和语义韵).上述问题的存在导致现有系统 的分类性能不高,尤其对隐性文本情绪分类问题表现出较大的局限 性.本文尝试将基于依存句法的词语搭配特征和基于组合语义的深度 特征应用于文本情绪分类,提出了一种以短语为主要线索的半马 尔科夫条件随机场文本情绪分析模型.为了验证模型的有效性,利 用实际构建的相关实验语料,开展了相关实验研究.实验结果表 明,本文方法不仅可以显著提高文本情绪分类的准确率,而且对解 决隐性情感分析问题也具有重要作用.
2015, 41(12): 2138-2146.
doi: 10.16383/j.aas.2015.c150239
摘要:
针对深度信念网(Deep belief network, DBN)学习连续数据时预测精度较差问题, 提出一种双隐层连续型深度信念网. 该网络首先对输入数据进行无监督训练, 利用连续型传递函数实现数据特征提取, 设计基于对比分歧算法的权值训练方法, 并通过误差反传对隐层权值进行局部寻优, 给出稳定性分析, 保证训练输出结果稳定在规定区域. 利用 Lorenz 混沌序列、CATS 序列和大气 CO2 预测实验对该网络进行测试, 结果表明, 连续型深度信念网具有结构精简、 收敛速度快、 预测精度高等优点.
针对深度信念网(Deep belief network, DBN)学习连续数据时预测精度较差问题, 提出一种双隐层连续型深度信念网. 该网络首先对输入数据进行无监督训练, 利用连续型传递函数实现数据特征提取, 设计基于对比分歧算法的权值训练方法, 并通过误差反传对隐层权值进行局部寻优, 给出稳定性分析, 保证训练输出结果稳定在规定区域. 利用 Lorenz 混沌序列、CATS 序列和大气 CO2 预测实验对该网络进行测试, 结果表明, 连续型深度信念网具有结构精简、 收敛速度快、 预测精度高等优点.
2015, 41(12): 2147-2154.
doi: 10.16383/j.aas.2015.c150264
摘要:
仿射不变的特征提取在目标识别和配准中起关键作用, 图像矩是提取仿射不变特征的重要方法, 高阶矩对噪声较敏感, 实际中仅有几个由整数阶矩构造的仿射不变量可用. 本文引入分数阶矩, 它由变形累次积分定义, 不仅充分利用仿射变换映直线为直线这一特性,而且能方便地消除仿射变换前后极角因子的影响. 利用分数阶矩给出了仿射不变量的构造, 传统矩构造的不变量仅是这种构造的特例. 实验结果表明低次矩构造的不变量一般有较好的抗噪性能.
仿射不变的特征提取在目标识别和配准中起关键作用, 图像矩是提取仿射不变特征的重要方法, 高阶矩对噪声较敏感, 实际中仅有几个由整数阶矩构造的仿射不变量可用. 本文引入分数阶矩, 它由变形累次积分定义, 不仅充分利用仿射变换映直线为直线这一特性,而且能方便地消除仿射变换前后极角因子的影响. 利用分数阶矩给出了仿射不变量的构造, 传统矩构造的不变量仅是这种构造的特例. 实验结果表明低次矩构造的不变量一般有较好的抗噪性能.
2015, 41(12): 2155-2163.
doi: 10.16383/j.aas.2015.c150187
摘要:
考虑到不同类型的相互作用对于功能预测的作用各不相同, 结合蛋白质相互作用网络和蛋白质结构域信息构建多关系蛋白质网络, 并为每种类型的相互作用赋予不同的遍历优先级.基于多关系网络, 提出一种蛋白质功能预测方法FPM (Functions prediction based on multi-relational networks).对于未注释的蛋白质, 算法遍历与该蛋白质相连的, 具有最高优先级的所有相互作用, 形成一个候选邻居节点集合.最后根据邻居节点集合形成预测的功能集合, 并为每一项功能评分、排序.与其他算法对比结果表明, FPM方法的性能优于其他的功能预测方法.
考虑到不同类型的相互作用对于功能预测的作用各不相同, 结合蛋白质相互作用网络和蛋白质结构域信息构建多关系蛋白质网络, 并为每种类型的相互作用赋予不同的遍历优先级.基于多关系网络, 提出一种蛋白质功能预测方法FPM (Functions prediction based on multi-relational networks).对于未注释的蛋白质, 算法遍历与该蛋白质相连的, 具有最高优先级的所有相互作用, 形成一个候选邻居节点集合.最后根据邻居节点集合形成预测的功能集合, 并为每一项功能评分、排序.与其他算法对比结果表明, FPM方法的性能优于其他的功能预测方法.
2015, 41(12): 2164-2176.
doi: 10.16383/j.aas.2015.c150106
摘要:
针对基于一元高斯函数估计属性边缘密度的朴素贝叶斯分类器不能有效利 用属性之间的依赖信息和使用多元高斯函数估计属性联合密度的完全贝叶斯分类器 易于导致对数据的过度拟合而且高阶协方差矩阵的计算也非常困难等情况,在建立 属性联合密度分解与组合定理和属性条件密度计算定理的基础上,将朴素贝叶斯分类 器的属性选择、分类准确性标准和属性父结点的贪婪选择相结合,进行约束高斯 分类网学习与优化,并依据贝叶斯网络理论,对贝叶斯衍生分类器中属性为类提供 的信息构成进行分析.使用UCI数据库中连续属性分类数据进行实验,结果显示,经过 优化的约束高斯分类网具有良好的分类准确性.
针对基于一元高斯函数估计属性边缘密度的朴素贝叶斯分类器不能有效利 用属性之间的依赖信息和使用多元高斯函数估计属性联合密度的完全贝叶斯分类器 易于导致对数据的过度拟合而且高阶协方差矩阵的计算也非常困难等情况,在建立 属性联合密度分解与组合定理和属性条件密度计算定理的基础上,将朴素贝叶斯分类 器的属性选择、分类准确性标准和属性父结点的贪婪选择相结合,进行约束高斯 分类网学习与优化,并依据贝叶斯网络理论,对贝叶斯衍生分类器中属性为类提供 的信息构成进行分析.使用UCI数据库中连续属性分类数据进行实验,结果显示,经过 优化的约束高斯分类网具有良好的分类准确性.