基于特征选择的句子聚类算法

Algorithm of the Sentence Clustering Based on Feature Selection

下载PDF

导出

摘要受信息抽取工作的驱动,利用事件相关文档的特点,在分析各种文本特征的基础上,综合利用词语、语义和词串信息进行句子相似度计算,并在此基础上进行句子聚类,提出了基于特征选择的句子聚类方法,为抽取事件侧面信息提供更好的基础资源。实验表明,采用多特征后,句子聚类的效果得到明显提高。 Motivated by the information extraction, according to the characteristics of the related texts, analyzes all kinds of the features of the texts, calculates the senten cesimilarity using the information of the word, the semantic and the word string, processes sentence clustering, which aims to provide better basic research on extracting the profile information of the event. The Experiment shows that the method can obviously improve the effect of sentence clustering.

作者方莹

机构地区河南商丘师范学院计算机科学系

出处《现代计算机》 2007年第5期23-25,共3页 Modern Computer

关键词信息抽取句子相似度句子聚类向量空间模型 Information Extraction Sentence Similarity Sentence Clustering Vector Space Model

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1袁毓林.信息抽取的语义知识资源研究[J].中文信息学报,2002,16(5):8-14. 被引量：18
2董振东董强.[EB/OL].知网.http://www.keenage.com,.
3王洋,秦兵,郑实福.句子相似度计算在FAQ中的应用.第一届学生计算语言学研讨会论文集.北京:北京大学出版社,2002,175～181

二级参考文献4

1顾阳.论元结构理论介绍[J].当代语言学,1994(1):1-11. 被引量：117
2袁毓林.流水句中否定的辖域及其警示标志[J].世界汉语教学,2000,14(3):22-33. 被引量：37
3朱德熙.汉语句法中的歧义现象[J].中国语文,1980,(2).
4孙斌.继承-归纳机制及其在对象系统中和信息提取技术中的应用，北京大学计算机系博士学位论文[M].,2000,6..

共引文献29

1刘德荣 ,王永成 ,刘传汉 .基于主题概念的多文档自动摘要研究[J].情报学报,2005,24(1):69-74. 被引量：7
2袁毓林.用逻辑和篇章知识来约束模板匹配——逻辑结构和篇章结构知识在信息抽取中的运用[J].中文信息学报,2005,19(4):39-45. 被引量：5
3薛永增,杨沐昀,赵铁军,韩习武,齐浩亮.面向体育领域的句子主干翻译技术研究[J].中文信息学报,2005,19(5):24-30. 被引量：1
4袁毓林.用动词的论元结构跟事件模板相匹配——一种由动词驱动的信息抽取方法[J].中文信息学报,2005,19(5):37-43. 被引量：23
5金珠,林鸿飞,赵晶.基于HowNet的话题跟踪及倾向性分类研究[J].情报学报,2005,24(5):555-561. 被引量：21
6熊静娴,李生红.基于概念网络的文本信息监控技术[J].信息安全与通信保密,2005,27(10):57-59. 被引量：2
7赵丰年,刘林,商建云.基于概念的文本过滤模型[J].计算机工程与应用,2006,42(4):186-188. 被引量：11
8徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100. 被引量：125
9彭京,杨冬青,唐世渭,付艳,蒋汉奎.一种基于语义内积空间模型的文本聚类算法[J].计算机学报,2007,30(8):1354-1363. 被引量：45
10周凯,李芳,盛焕烨.基于向量空间模型的中文搜索引擎评测系统研究与实现[J].计算机应用研究,2007,24(12):16-19. 被引量：3

1菅小艳.基于特征词的农作物文本的句子聚类[J].太原师范学院学报（自然科学版）,2008,7(1):77-79.
2陈戈,段建勇,陆汝占.基于潜在语义索引和句子聚类的中文自动文摘[J].计算机仿真,2008,25(7):82-85. 被引量：5
3刘子平,李学明.基于改进LDA和K-means算法的主题句聚类[J].计算机应用,2016,36(A02):239-241. 被引量：4
4王萌,李春贵,唐培和,王晓荣.一种主题句发现的中文自动文摘研究[J].计算机工程,2007,33(8):180-181. 被引量：8
5吴平博,陈群秀,马亮.基于事件框架的事件相关文档的智能检索研究[J].中文信息学报,2003,17(6):25-30. 被引量：30
6肖述才,欧智坚,王作英.语音识别中的一种说话人聚类算法[J].中文信息学报,2005,19(4):84-88. 被引量：4
7郭红建,黄兵.潜在语义分析聚类算法在文摘句子排序中的应用[J].计算机应用研究,2013,30(11):3299-3301. 被引量：3
8方莹,葛寒松.基于聚类的分级信息抽取方法初探[J].电脑知识与技术（技术论坛）,2005(10):7-9.
9李宏伟,林萍,洪小娟.食品安全网络舆情本体学习研究[J].南京邮电大学学报（社会科学版）,2013,15(4):72-77. 被引量：5
10杨帆,孙强.从Web网页上获取一价事件常识的方法[J].科学技术与工程,2010,10(25):6300-6304. 被引量：1

现代计算机

2007年第5期

浏览历史

内容加载中请稍等...

基于特征选择的句子聚类算法

参考文献3

二级参考文献4

共引文献29

相关作者

相关机构

相关主题

浏览历史