2.765

2022影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于特征类别属性分析的文本分类器分类噪声裁剪方法

王强 关毅 王晓龙

王强, 关毅, 王晓龙. 基于特征类别属性分析的文本分类器分类噪声裁剪方法. 自动化学报, 2007, 33(8): 809-816. doi: 10.1360/aas-007-0809
引用本文: 王强, 关毅, 王晓龙. 基于特征类别属性分析的文本分类器分类噪声裁剪方法. 自动化学报, 2007, 33(8): 809-816. doi: 10.1360/aas-007-0809
WANG Qiang, GUAN Yi, WANG Xiao-Long. A Method for Eliminating Class Noise in Text Classification Based on Feature Class Attribute. ACTA AUTOMATICA SINICA, 2007, 33(8): 809-816. doi: 10.1360/aas-007-0809
Citation: WANG Qiang, GUAN Yi, WANG Xiao-Long. A Method for Eliminating Class Noise in Text Classification Based on Feature Class Attribute. ACTA AUTOMATICA SINICA, 2007, 33(8): 809-816. doi: 10.1360/aas-007-0809

基于特征类别属性分析的文本分类器分类噪声裁剪方法

doi: 10.1360/aas-007-0809
详细信息
    通讯作者:

    王强

  • 中图分类号: TP391

A Method for Eliminating Class Noise in Text Classification Based on Feature Class Attribute

More Information
    Corresponding author: WANG Qiang
  • 摘要: 提出一种应用文本特征的类别属性进行文本分类过程中的类别噪声裁剪 (Eliminating class noise, ECN) 的算法. 算法通过分析文本关键特征中蕴含的类别指示信息, 主动预测待分类文本可能归属的类别集, 从而减少参与决策的分类器数目, 降低分类延迟,提高分类精度. 在中、英文测试语料上的实验表明, 该算法的 F 值分别达到 0.76 与 0.93, 而且分类器运行效率也有明显提升, 整体性能较好. 进一步的实验表明,此算法的扩展性能较好, 结合一定的反馈学习策略, 分类性能可进一步提高, 其 F 值可达到 0.806 与 0.943.
  • 加载中
计量
  • 文章访问数:  2097
  • HTML全文浏览量:  59
  • PDF下载量:  1118
  • 被引次数: 0
出版历程
  • 收稿日期:  2006-04-24
  • 修回日期:  2006-12-18
  • 刊出日期:  2007-08-20

目录

    /

    返回文章
    返回