2.765

2022影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于LDA模型的主题分析

石晶 范猛 李万龙

石晶, 范猛, 李万龙. 基于LDA模型的主题分析. 自动化学报, 2009, 35(12): 1586-1592. doi: 10.3724/SP.J.1004.2009.01586
引用本文: 石晶, 范猛, 李万龙. 基于LDA模型的主题分析. 自动化学报, 2009, 35(12): 1586-1592. doi: 10.3724/SP.J.1004.2009.01586
SHI Jing, FAN Meng, LI Wan-Long. Topic Analysis Based on LDA Model. ACTA AUTOMATICA SINICA, 2009, 35(12): 1586-1592. doi: 10.3724/SP.J.1004.2009.01586
Citation: SHI Jing, FAN Meng, LI Wan-Long. Topic Analysis Based on LDA Model. ACTA AUTOMATICA SINICA, 2009, 35(12): 1586-1592. doi: 10.3724/SP.J.1004.2009.01586

基于LDA模型的主题分析

doi: 10.3724/SP.J.1004.2009.01586
详细信息
    通讯作者:

    石晶

  • 中图分类号: TP301

Topic Analysis Based on LDA Model

More Information
    Corresponding author: SHI Jing
  • 摘要: 在文本分割的基础上, 确定片段主题, 进而总结全文的中心主题, 使文本的主题脉络呈现出来, 主题以词串的形式表示. 为了分析准确, 利用LDA (Latent dirichlet allocation)为语料库及文本建模, 以Clarity度量块间相似性, 并通过局部最小值识别片段边界. 依据词汇的香农信息提取片段主题词, 采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外, 尝试挖掘隐藏于字词表面之下的文本内涵. 实验表明, 文本分析的结果明显好于其他方法, 可以为下一步文本推理的工作提供有价值的预处理.
  • 加载中
计量
  • 文章访问数:  2402
  • HTML全文浏览量:  108
  • PDF下载量:  2776
  • 被引次数: 0
出版历程
  • 收稿日期:  2008-07-16
  • 修回日期:  2009-03-25
  • 刊出日期:  2009-12-20

目录

    /

    返回文章
    返回