结合语境与布朗聚类特征的上下位关系验证被引量：1

Hyponymy Relation Validation Combined with Context and Brown Clustering Feature

下载PDF

导出

摘要对海量文本语料进行上下位语义关系自动抽取是自然语言处理的重要内容,利用简单模式匹配方法抽取得到候选上下位关系后,对其进行验证过滤是难点问题。为此,分别通过对词汇语境相似度与布朗聚类相似度计算,提出一种结合语境相似度和布朗聚类相似度特征对候选下位词集合进行聚类的上下位关系验证方法。通过对少量已标注训练语料的语境相似度和布朗聚类相似度进行计算,得到验证模型和2种相似度的结合权重系数。该方法无需借助现有的词汇关系词典和知识库,可对上下位关系抽取结果进行有效过滤。在CCF NLP&2012词汇语义关系评测语料上进行实验,结果表明,与模式匹配和上下文比较等方法相比,该方法可使F值指标得到明显提升。 Hyponymy has many important applications in the field of Natural Language Processing（NLP） and the automatic extraction of hyponym relation from massive text datasets is naturally one of important NLP research tasks.The emphasis and difficult point of the research is how to validate a hyponym which is extracted with simple pattern matching method is really correct.By calculating the context feature similarity（SimCF） and Brown clustering similarity（SimBrown）,this paper proposes a novel approach of hyponymy validation.It applies a clustering on hyponym candidates,and the clustering similarity feature is obtained by combining SimCF and SimBrown.The combination coefficient of two kinds of similarity is derived based on the SimCFs and SimBrowns between all labeled training words and their hyponyms.The model can filter roughly extraction results without any existed lexical relation dictionary or knowledge base.Evaluation on CCF NLPCC2012 word semantic relation corpus shows that the proposed approach in this paper significantly improves the F measure value compared with other approaches including pattern matching and simple context comparison.

作者张志昌陈松毅刘鑫马慧芳

机构地区西北师范大学计算机科学与工程学院

出处《计算机工程》 CAS CSCD 北大核心 2015年第2期145-150,共6页 Computer Engineering

基金国家自然科学基金资助项目(61163039 61163036 61363058) 西北师范大学青年教师科研能力提升计划基金资助项目(NWNU-LKQN-10-2)

关键词上下位关系语境相似度布朗聚类相似度点互信息模式匹配聚类验证 hyponymy relation context similarity Brown clustering similarity Point Mutual Information（PMI） pattern matching clustering validation

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献15

1Hearst M.Automatic Acquisition of Hyponyms from Large Text Corpora[C]//Proceedings of COLING’92.New York,USA:[s.n.],1992:539-545.
2Kozareva Z,Riloff E,Hovy E.Semantic Class Learning from the Web with Hyponym Pattern Linkage Graphs[C]//Proceedings of the 46th Annual Meeting of the Association for Computational Linguistics:Human Language Technologies.Columbus,USA:[s.n.],2008:1048-1056.
3Kozareva Z,Hovy E.A Semi-supervised Method to Learn and Construct Taxonomies Using the Web[C]//Proceedings of EMNLP’10.Boston,USA:[s.n.],2010:1110-1118.
4Zhang Chunxia,Jiang Peng.Automatic Extraction of Definitions[C]//Proceedings of ICCSIT’09.Beijing,China:[s.n.],2009:364-368.
5Westerhout E.Definition Extraction Using Linguistic and Structural Features[C]//Proceedings of the 1st Workshop on Definition Extraction.Borovets,Bulgaria:[s.n.],2009:61-67.
6Akiba T,Sakai T.Japanese Hyponymy Extraction Based on a Term Similarity Graph[R].Tokyo,Japan:IPSJ SIG,Technical Reprot:2011-IFAT-104,2011.
7Miller G A.Word Net:A Lexical Database for English[J].Communications of the ACM,1995,38(11):39-41.
8Suchanek F M,Kasneci G,Weikum G.Yago:A Large Ontology from Wikipedia and Word Net[J].Web Semantics:Science,Services and Agents on the World Wide Web,2008,6(3):203-217.
9Boella G,di Caro L.Extracting Definitions and Hypernym Relations Relying on Syntactic Dependencies and Support Vector Machines[C]//Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics.Sofia,Bulgaria:[s.n.],2013:532-537.
10Zhang Fan,Shi Shuming,Liu Jing,et al.Nonlinear Evidence Fusion and Propagation for Hyponymy Relation Mining[C]//Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics.Portland,USA:[s.n.],2011,1159-1168.

二级参考文献2

1卢志茂,刘挺,李生.统计词义消歧的研究进展[J].电子学报,2006,34(2):333-343. 被引量：28
2鲁松,白硕,黄雄.基于向量空间模型中义项词语的无导词义消歧[J].软件学报,2002,13(6):1082-1089. 被引量：37

共引文献13

1田晓丹,王庆林,李原.基于特征向量的本体概念上下位关系验证[J].中南大学学报（自然科学版）,2013,44(S2):351-354. 被引量：1
2熊忠阳,付玲玲,张玉芳,蒋健.结合语义的特征选择方法[J].计算机应用,2010,30(10):2621-2623. 被引量：3
3张鹏,朱征宇,李存青,曾丽芳,陈烨,徐凯,常红要.意见挖掘中产品特征的层次提取方法[J].微处理机,2010,31(5):81-85.
4熊忠阳,付玲玲,张玉芳.文本分类中基于概念映射的二次特征降维方法[J].计算机工程与应用,2012,48(1):166-169. 被引量：1
5丁远钧,曹存根,王石,符建辉.从中文Web网页中获取实体简称的研究[J].计算机科学,2012,39(3):174-182. 被引量：3
6任巨伟,杨亮,林鸿飞.情感图式构造及其在文本情感计算中的应用[J].江西师范大学学报（自然科学版）,2013,37(2):130-135. 被引量：8
7马海昌,张志昌,赵学锋,孙飞.结合潜在语义分析与点互信息的同义词抽取[J].电脑知识与技术,2014(1):128-132. 被引量：2
8马海昌,赵学锋,杨晏,王济深.潜在语义分析在词汇相似度中的应用[J].甘肃科技纵横,2014,43(3):50-51.
9莫媛媛,郭剑毅,余正涛,蒋年树,线岩团.基于CCRF的领域本体概念上下位关系抽取[J].计算机工程,2014,40(6):138-141. 被引量：3
10李卫平,杨杰,王钢.多变参pLSI文本敏感特征抽取算法[J].计算机应用研究,2015,32(9):2587-2589. 被引量：2

同被引文献24

1宋韶旭,李春平.基于非对称相似度的文本聚类方法[J].清华大学学报（自然科学版）,2006,46(7):1325-1328. 被引量：7
2杨燕,靳蕃,KAMEL Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1630-1632. 被引量：117
3徐建民,王平.小型中文信息检索测试集的构建与分析[J].情报杂志,2009,28(1):13-16. 被引量：13
4蔡东风,白宇,于水,叶娜,任晓娜.一种基于语境的词语相似度计算方法[J].中文信息学报,2010,24(3):24-28. 被引量：12
5常鹏,冯楠.基于词共现的文档表示模型[J].中文信息学报,2012,26(1):51-57. 被引量：8
6唐晓波,向坤.基于LDA模型和微博热度的热点挖掘[J].图书情报工作,2014,58(5):58-63. 被引量：68
7王忠义,谭旭,夏立新.共词分析方法的细粒度化与语义化研究[J].情报学报,2014,33(9):969-978. 被引量：13
8李佳.基于词共现的跨语言检索平台研究[J].情报杂志,2015,34(8):195-198. 被引量：3
9赵宁宁,梁意文.综合结构和内容的XML文档相似度计算方法[J].微电子学与计算机,2016,33(4):69-72. 被引量：4
10关鹏,王曰芬.科技情报分析中LDA主题模型最优主题数确定方法研究[J].现代图书情报技术,2016(9):42-50. 被引量：158

引证文献1

1张国防,王鑫,徐建民.基于主题词共现的文档非对称关系量化研究[J].数据分析与知识发现,2023,7(3):110-120. 被引量：2

二级引证文献2

1马晶晶,肖萌,陈树广.情感视域下突发公共事件网络舆情情感分析与主题演化研究[J].情报探索,2023(8):61-68. 被引量：3
2徐建民,王铭宇.基于内容偏好和情绪倾向的微博用户兴趣画像构建方法[J].河北大学学报(自然科学版),2025,45(1):91-103. 被引量：1

1卢胜军,李法勇,钱建军,真溱.WCONS+:一种基于WCONS的本体集成方法[J].现代图书情报技术,2009(2):18-22. 被引量：5
2刘磊,曹存根.基于混合特征的上下位关系验证方法[J].计算机工程,2008,34(14):12-13. 被引量：4
3范庆虎,昝红英,柴玉梅,张坤丽,贾玉祥.多资源融合的下位词发现[J].计算机工程与设计,2013,34(12):4310-4315. 被引量：1
4武凌.工作流知识管理系统工作流引擎的研究[J].计算机技术与发展,2010,20(8):112-115. 被引量：6
5杜宁,刘胜辉.协议分析技术检测复杂攻击的研究与实现[J].哈尔滨理工大学学报,2006,11(5):79-82.
6应用简单模式的防火墙[J].电脑迷,2007,0(6):111-111.
7李亮.浅谈如何加强计算机教学中的创新教育[J].黑龙江科技信息,2010(16):155-155. 被引量：1
8张永刚.一种基于模块化设计思想构建防火墙的方法[J].信息技术与信息化,2005(3):27-28. 被引量：1
9晋耀红.基于语义的文本过滤系统的设计与实现[J].计算机工程与应用,2003,39(17):22-25. 被引量：18
10赵晨光,蔡东风.基于改进的VSM的词义排歧策略[J].计算机应用,2010,30(6):1671-1672.

计算机工程

2015年第2期

浏览历史

内容加载中请稍等...

结合语境与布朗聚类特征的上下位关系验证被引量：1

参考文献15

二级参考文献2

共引文献13

同被引文献24

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

结合语境与布朗聚类特征的上下位关系验证 被引量：1

参考文献15

二级参考文献2

共引文献13

同被引文献24

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

结合语境与布朗聚类特征的上下位关系验证被引量：1