李娟 王宇平

严求真, 孙明轩. 非线性不确定系统准最优学习控制. 自动化学报, 2015, 41(9): 1659-1668. doi: 10.16383/j.aas.2015.c140781
引用本文: 李娟, 王宇平. 基于样本密度和分类误差率的增量学习矢量量化算法研究. 自动化学报, 2015, 41(6): 1187-1200. doi: 10.16383/j.aas.2015.c140311
YAN Qiu-Zhen, SUN Ming-Xuan. Suboptimal Learning Control for Nonlinear Systems with Both Parametric and Nonparametric Uncertainties. ACTA AUTOMATICA SINICA, 2015, 41(9): 1659-1668. doi: 10.16383/j.aas.2015.c140781
Citation: LI Juan, WANG Yu-Ping. An Incremental Learning Vector Quantization Algorithm Based on Pattern Density and Classification Error Ratio. ACTA AUTOMATICA SINICA, 2015, 41(6): 1187-1200. doi: 10.16383/j.aas.2015.c140311


doi: 10.16383/j.aas.2015.c140311

国家自然科学基金(61203372, 61472297)资助


    李娟 西安电子科技大学计算机学院博士研究生, 陕西师范大学远程教育学院讲师. 主要研究方向为数据挖掘, 模式识别.E-mail: ally 2004@126.com


    王宇平 西安电子科技大学计算机学院教授. 主要研究方向为进化计算, 运筹学,模式识别, 机器学习. E-mail: ywang@xidian.edu.cn

An Incremental Learning Vector Quantization Algorithm Based on Pattern Density and Classification Error Ratio


Supported by National Natural Science Foundation of China (61203372, 61472297)

  • 摘要: 作为一种简单而成熟的分类方法, K最近邻(K nearest neighbor, KNN)算法在数据挖掘、模式识别等领域获得了广泛的应用, 但仍存在计算量大、高空间消耗、运行时间长等问题. 针对这些问题, 本文在增量学习型矢量量化(Incremental learning vector quantization, ILVQ)的单层竞争学习基础上, 融合样本密度和分类误差率的邻域思想, 提出了一种新的增量学习型矢量量化方法, 通过竞争学习策略对代表点邻域实现自适应增删、合并、分裂等操作, 快速获取原始数据集的原型集, 进而在保障分类精度基础上, 达到对大规模数据的高压缩效应. 此外, 对传统近邻分类算法进行了改进, 将原型近邻集的样本密度和分类误差率纳入到近邻判决准则中. 所提出算法通过单遍扫描学习训练集可快速生成有效的代表原型集, 具有较好的通用性. 实验结果表明, 该方法同其他算法相比较, 不仅可以保持甚至提高分类的准确性和压缩比, 且具有快速分类的优势.
  • 文章访问数:  1414
  • HTML全文浏览量:  65
  • PDF下载量:  1029
  • 被引次数: 0
  • 收稿日期:  2014-05-08
  • 修回日期:  2014-09-27
