基于文本聚类的自动文摘系统的研究与实现被引量：8

Research and Implementation About Automatic Abstract System Based on Text Clustering

下载PDF

导出

摘要针对当前自动文摘方法的不足,提出了基于文本聚类和自然语言理解的自动文摘实现方法。可以克服常规自动文摘方法的不足,使文摘的质量和效果得到大大的提高。将文本聚类引入自动文摘中,不但使单文档的文摘质量得到提高,而且能够实现多文档的自动文摘,这是现有的自动文摘技术所没有涉及的。实现了面向“塑料”行业的基于文本聚类和自然语言理解的自动文摘系统TCAAS。 This dissertation brings forward the method of automatic abstracting＇s realization based on text clustering and natural language understanding. This method can overcolne the shortage of the automatic abstracting＇s generic realization, and improve greatly the quality of automatic abstracting. Especially, this method uses text clustering, it can not only ilnprove greatly the quality of single document＇s automatic abstracting, but also realize multi-document＇s automatic abstracting. For a specific plastic domain, an antomatic abstracting system TCAAC is implemented.

作者郭庆琳樊孝忠柳长安

机构地区华北电力大学(北京)计算机系北京理工大学计算机系

出处《计算机工程》 EI CAS CSCD 北大核心 2006年第4期30-32,121,共4页 Computer Engineering

基金国家自然科学基金资助项目(60305009) 华北电力大学博士学位教师科研基金资助项目

关键词自动文摘文本聚类自然语言理解 Automatic abstract Text cluster Natural language understanding

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Califf M E,Mooney R J.Relational Learning of Pattern-match Rules for Information Extraction[C].Proceedings of the 19th National Conference on Artificial Intelligence.New York:Holy Publishing Company,2003:87-90.
2刘挺,王开铸.自动文摘的四种主要方法[J].情报学报,1999,18(1):10-19. 被引量：55
3姚天顺.自然语言理解[M].北京：清华大学出版社,2002.81.
4李锦乾,张冬茉,姚天方.自然语言生成中的句子结构优化处理[J].计算机应用研究,1998,15(1):52-56. 被引量：6
5刘昌钰,唐常杰,于中华,杜永萍,郭颖.基于潜在语义分析的BBS文档Bayes鉴别器[J].计算机学报,2004,27(4):566-572. 被引量：17

二级参考文献27

1苏海菊,王永成.中文科技文献文摘的自动编写[J].情报学报,1989,8(6):433-439. 被引量：26
2莫燕,王永成.中文文献摘要的自动编制[J].现代图书情报技术,1993(3):10-12. 被引量：15
3李明.从字频统计出发的中文文摘自动编写[J].现代图书情报技术,1996(3):42-45. 被引量：20
4杨晓兰，全国第四届计算语言学联合学术会议论文集，1997年，313页
5刘挺，情报学报，1997年，16卷，增刊，24页
6姚天顺，自然语言理解.一种让机器懂得人类语言的研究，1995年
7李俊杰，博士学位论文，1995年
8王建波，博士学位论文，1992年
9赖茂生（译），文摘的概念和方法，1991年
10王永成，中文信息处理技术及其基础，1991年

共引文献84

1刘茂福,李淑君,金可佳,张晓龙.多文档自动文摘中的特征组合优化[J].计算机系统应用,2008,17(8):59-63. 被引量：3
2郑佳谦,徐隽,姚静,牛军钰.论坛社区用户时空特征建模与挖掘[J].计算机研究与发展,2007,44(z3):7-12. 被引量：1
3郭庆琳,樊孝忠.基于文本聚类和NLU的自动文摘系统的研究与实现[J].现代电力,2004,21(4):76-80. 被引量：1
4金旭,杨炳儒,菅志刚.自动文摘方法分析[J].计算机应用研究,2004,21(9):5-6. 被引量：8
5李玉红,寇兴权.基于关键词集合的产品信息描述与检索系统[J].控制工程,2005,12(2):168-169. 被引量：1
6王志琪,王永成,刘传汉.论自动文摘及其分类[J].情报学报,2005,24(2):214-221. 被引量：2
7郭庆琳,樊孝忠,柳长安.文本聚类在自动文摘中的应用研究[J].计算机应用,2005,25(5):1036-1038. 被引量：4
8郭庆琳,樊孝忠,柳长安.基于文本聚类和NLU的自动文摘研究[J].北京理工大学学报,2005,25(8):705-709. 被引量：1
9尹存燕,戴新宇,陈家骏.Internet上文本的自动摘要技术[J].计算机工程,2006,32(3):88-90. 被引量：13
10董建设,任丽,周燕玲.中文自动文摘在搜索引擎中的应用[J].情报科学,2006,24(2):267-269. 被引量：2

同被引文献66

1欧健文,董守斌,蔡斌.模板化网页主题信息的提取方法[J].清华大学学报（自然科学版）,2005,45(S1):1743-1747. 被引量：71
2田俊华.基于自然语言提问的自动答疑系统设计[J].现代远程教育研究,2005,17(1):48-51. 被引量：10
3刘德荣 ,王永成 ,刘传汉 .基于主题概念的多文档自动摘要研究[J].情报学报,2005,24(1):69-74. 被引量：7
4张奇,黄萱菁,吴立德.一种新的句子相似度度量及其在文本自动摘要中的应用[J].中文信息学报,2005,19(2):93-99. 被引量：35
5金博,史彦军,滕弘飞.基于语义理解的文本相似度算法[J].大连理工大学学报,2005,45(2):291-297. 被引量：80
6郭庆琳,樊孝忠,柳长安.文本聚类在自动文摘中的应用研究[J].计算机应用,2005,25(5):1036-1038. 被引量：4
7胡佳妮,徐蔚然,郭军,邓伟洪.中文文本分类中的特征选择算法研究[J].光通信研究,2005(3):44-46. 被引量：48
8傅间莲,陈群秀.一种基于遗传算法的主题划分方法[J].计算机工程,2006,32(11):209-210. 被引量：1
9傅间莲,陈群秀.一种新的自动文摘系统评价方法[J].计算机工程与应用,2006,42(18):176-177. 被引量：9
10张其文,李明.文本主题的自动提取方法研究与实现[J].计算机工程与设计,2006,27(15):2744-2746. 被引量：6

引证文献8

1李建锋,陈佳良,张美华.一种基于聚类-遗传算法的文摘提取方法研究[J].计算技术与自动化,2007,26(3):38-40. 被引量：1
2赵鸣,吴磊.改进性的文本聚类算法研究[J].长江大学学报（自科版）（上旬）,2009,6(2):73-75.
3陈燕,龙建勋.基于明确语义分析的自动文摘算法[J].计算机工程,2011,37(3):183-185. 被引量：6
4程传鹏,杨要科.自动文摘中的冗余句消除方法[J].计算机应用,2011,31(12):3275-3277. 被引量：2
5龙珑,邓伟.绿色网络智能文摘算法研究[J].计算机应用,2012,32(7):2030-2032. 被引量：1
6卢玲,杨武,曹琼.基于多重映射的自动短文摘方法[J].计算机应用,2016,36(2):432-436.
7于童.文本聚类在搜索引擎中的应用研究[J].科技经济市场,2016(8):187-188.
8刘美玲,王慧强,陈广胜,于洋.中文文本挖掘的动态文摘建模方法[J].哈尔滨工程大学学报,2019,40(4):820-826. 被引量：1

二级引证文献11

1龙珑,邓伟.绿色网络智能文摘算法研究[J].计算机应用,2012,32(7):2030-2032. 被引量：1
2刘萍,陈烨.词汇相似度研究进展综述[J].现代图书情报技术,2012(7):82-89. 被引量：16
3郝晓玲.网络舆情研判技术的研究进展[J].情报科学,2012,30(12):1901-1906. 被引量：8
4肖升,何炎祥.改进的潜在语义分析中文摘录方法[J].计算机应用研究,2012,29(12):4507-4511. 被引量：8
5龙珑,邓伟.绿网摘要提取系统算法研究[J].微型机与应用,2013,32(12):14-16.
6王连喜.自动摘要研究中的若干问题[J].图书情报工作,2014,58(20):13-22. 被引量：7
7革家象,刘子豪,许斌.基于Mashup和服务语义的可组合服务推荐[J].小型微型计算机系统,2015,36(11):2434-2438. 被引量：1
8张祯,樊兴悦,郭禹田,吴国华.基于Topic Signature的动态文摘更新方法[J].计算机工程,2018,44(6):169-175. 被引量：2
9朱军涛,苗蕾,胡晓红,邓仁.文本挖掘在期刊评价中的应用研究[J].企业技术开发,2018,37(12):125-127. 被引量：1
10李娜娜,刘培玉,刘文锋,刘伟童.基于TextRank的自动摘要优化算法[J].计算机应用研究,2019,36(4):1045-1050. 被引量：17

1郭庆琳,吴克河,吴慧芳,李存斌.基于文本聚类的多文档自动文摘研究[J].计算机研究与发展,2007,44(z2):140-144. 被引量：5
2郭庆琳,樊孝忠,柳长安.文本聚类在自动文摘中的应用研究[J].计算机应用,2005,25(5):1036-1038. 被引量：4

计算机工程

2006年第4期

浏览历史

内容加载中请稍等...

基于文本聚类的自动文摘系统的研究与实现被引量：8

参考文献5

二级参考文献27

共引文献84

同被引文献66

引证文献8

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于文本聚类的自动文摘系统的研究与实现 被引量：8

参考文献5

二级参考文献27

共引文献84

同被引文献66

引证文献8

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于文本聚类的自动文摘系统的研究与实现被引量：8