基于局部主题判定与抽取的多文档文摘技术

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于局部主题判定与抽取的多文档文摘技术

秦兵, 刘挺, 李生

文章导航 > 自动化学报 > 2004 > 30(6): 905-910

秦兵, 刘挺, 李生. 基于局部主题判定与抽取的多文档文摘技术. 自动化学报, 2004, 30(6): 905-910.

引用本文:

秦兵, 刘挺, 李生. 基于局部主题判定与抽取的多文档文摘技术. 自动化学报, 2004, 30(6): 905-910.

QIN Bing, LIU Ting, LI Sheng. Multi-document Summarization Based on Local Topics Identification and Extraction. ACTA AUTOMATICA SINICA, 2004, 30(6): 905-910.

Citation:

QIN Bing, LIU Ting, LI Sheng. Multi-document Summarization Based on Local Topics Identification and Extraction. ACTA AUTOMATICA SINICA, 2004, 30(6): 905-910.

秦兵, 刘挺, 李生. 基于局部主题判定与抽取的多文档文摘技术. 自动化学报, 2004, 30(6): 905-910.

引用本文:

秦兵, 刘挺, 李生. 基于局部主题判定与抽取的多文档文摘技术. 自动化学报, 2004, 30(6): 905-910.

QIN Bing, LIU Ting, LI Sheng. Multi-document Summarization Based on Local Topics Identification and Extraction. ACTA AUTOMATICA SINICA, 2004, 30(6): 905-910.

Citation:

QIN Bing, LIU Ting, LI Sheng. Multi-document Summarization Based on Local Topics Identification and Extraction. ACTA AUTOMATICA SINICA, 2004, 30(6): 905-910.

基于局部主题判定与抽取的多文档文摘技术

1.
哈尔滨工业大学计算机科学与技术学院,哈尔滨

通讯作者:
秦兵

中图分类号: TP391
计量
- 文章访问数: 2941
- HTML全文浏览量: 115
- PDF下载量: 963
- 被引次数: 0
出版历程
- 收稿日期: 2003-10-09
- 刊出日期: 2004-06-20

Multi-document Summarization Based on Local Topics Identification and Extraction

1.
School of Computer Science and Tecchology,Harbin Institute of Technalogy,Harbin

More Information

Corresponding author: QIN Bing

摘要: 提出了一个通过对同一主题的多文档集合内局部主题的判定和抽取生成多文档文摘的方法.首先在对多文档集合中句子依存分析和语义分析的基础上进行相似度计算,将相似句子经过聚类形成多文档集合内不同的局部主题,然后进行每个局部主题中质心句的抽取和排序,生成多文档文摘.该方法实现了文摘长度随文档内容自动确定,从而保证了文摘中包含的信息的全面和简洁.最后文中还给出了多文档文摘的评价方法和实验结果,文摘的平均精确率和平均压缩率分别为71.4%和25.2%.
- 多文档文摘 /
- 局部主题 /
- 聚类
Abstract: This paper describes a multi-document summarization method based on local topics identification and extraction. The similarity of sentences is measured by analysis of dependency and semantics. Local topics are found by sentence clustering. The centroid sentence is extracted from each local topic and is ordered to generate summarization. The size of summarization is determined according to content of multiple documents, as a result, the summarization becomes general and concise. Finally, the evaluation and experiment are given, the average precision of summarization and the average ratio of compressibility are 71.4% and 25.2%, respectively.
- Multi-document summarization /
- local topic /
- clustering

参考文献(0)

资源附件(0)

计量

文章访问数: 2941
HTML全文浏览量: 115
PDF下载量: 963
被引次数: 0

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

返回

版权所有 © 《自动化学报》编辑部京ICP备14019135号-6

地址：北京中关村东路95号邮政编码：100190E-mail：aas_editor@ia.ac.cn

电话：010-82544677 (日常咨询和稿件处理)，010-82544653(费用管理、寄刊)

本系统由北京仁和汇智信息技术有限公司开发技术支持： info@rhhz.net