期刊文献+

面向冗余度控制的中文多文档自动文摘 被引量:6

Chinese Multi-document Summarization Based on Redundancy Control
在线阅读 下载PDF
导出
摘要 多文档自动文摘能够帮助人们自动、快速地获取信息,是目前的一个研究热点。相比于单文档自动文摘,多文档自动文摘需要更多考虑文档之间的相关性,以及文档信息之间的冗余性。因此如何控制信息冗余是多文档自动文摘的一个关键所在。该文在考虑文摘特性的基础上提出了一个冗余度控制模型,该模型通过计算文本单元在主题概率分布之间的相似度来决定句子的选择,从而达到控制冗余的目的。实验结果表明,该方法能够有效降低冗余度,且总体性能优于现有的自动文摘系统。 Multi-document summarization can help people to access information automatically and fast.Compared to single-document summarization,multi-document lays more emphasis on the correlation and redundancy between documents.Therefore,how to control information redundancy is a key problem to multi-document summarization.This paper proposes a model of redundancy control based on the features of summary.In this model,various similarities among the text units over topic's probability distribution are used to determine the choice of a sentence.Experimental results show that this method can reduce redundancy effectively,and produce better overall performance than existing systems.
出处 《中文信息学报》 CSCD 北大核心 2012年第2期92-96,共5页 Journal of Chinese Information Processing
基金 国家自然科学基金资助项目(60873150 60970056) 江苏省高校自然科学基金资助项目(10KJB520016)
关键词 冗余度控制 多文档自动文摘 中文自动文摘 reduandancy control multi-document summarization Chinese automatic summarization
  • 相关文献

参考文献9

二级参考文献67

共引文献57

同被引文献106

引证文献6

二级引证文献24

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部