基于最大熵模型的汉语依存分析被引量：2

Chinese Dependency Parsing with Maximum Entropy Principle

下载PDF

导出

摘要采用最大熵模型实现中文依存语法的分析。用自底而上的方式构建语句的依存关系树,构建过程每一步在向左连接、向右连接以及不连接3种动作选取其一。用最大熵原理判断每个动作的概率,得到依存树中各边的概率,然后找出具有最大概率的依存关系树。实验结果表明,该模型具有较好的分析精度。目前,该模型已被应用于基于自然语言的信息检索项目中。 This paper uses maximum entropy （ME） model to parse chinese sentence with dependency grammar. The dependency-tree is constructed with a bottom-up process, and one of the three actions （left-concatenation, right-concatenation, non concatenation） is selected in every step of the constructing process. The maximum entropy principle is used to compute the probability of the actions. Thus the dependency-tree with maximum probability can be obtained. The model is experimentally proved satisfying in precision and has been applied in a Chinese natural language retrieval project.

作者刘贵全曾宇斌

机构地区中国科学技术大学计算机科学技术系

出处《计算机工程》 EI CAS CSCD 北大核心 2006年第11期216-218,共3页 Computer Engineering

关键词统计句法分析依存文法最大熵原理信息检索 Statistical parsing Dependency grammar Maximum entropy principle

分类号 TP31 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1俞士汶.语法知识在语言信息处理研究中的作用[J].语言文字应用,1997(4):82-88. 被引量：17
2Zhou Ming．A Block-based Robust Dependency Parser for Unrestricted Chinese Text[C]．微软中国研究院2000年论文集．北京：微软中国研究院，2000．
3Ma Jinshan, Zhang Yu, Liu Ting, et al. A Statistical Dependency Parser of Chinese Under Small Training Data[C]. International Joint Conference on Natural Language Processing, Sanya, Hainan, 2004.
4李素建,刘群,杨志峰.基于最大熵模型的组块分析[J].计算机学报,2003,26(12):1722-1727. 被引量：58
5周雅倩,郭以昆,黄萱菁,吴立德.基于最大熵方法的中英文基本名词短语识别[J].计算机研究与发展,2003,40(3):440-446. 被引量：63

二级参考文献33

1[1]Erik F, Tjong Kim Sang,Buchholz S. Introduction to the CoNLL-2000 Shared Task: Chunking. In: Proceedings of CoNLL2000 and LLL-2000, Lisbon, Portugal, 2000. 127～132
2[2]Steven A. Parsing by Chunks. In: Berwick, Abney, Tenny eds. Principle-Based Parsing: Kluwer Academic Publishers,1991. 257～278
3[5]Ratnaparkhi A. A maximum entropy model for part-of-speech tagging. In: Proceedings of the Conference on Empirical Methods in Natural Language Processing, 1996
4[6]Ratnaparkhi A. A simple introduction to maximum entropy models for natural language processing. Institute for Research in Cognitive Science, University of Pennsylvania : Technical Report 9708, 1997
5[7]Berger A, Pietra S D, Pietra V D. A maximum entropy approach to natural language processing. Computational Linguistics, 1996,22(1):39～71
6[8]Skut, Wojciech, Thorsten Brants. A maximum entropy partial parser for unrestricted text. In:Proceedings of the 6th Workshop on Very Large Corpora, Montreal, Canada, 1998. 143～151
7[10]Abney S. Part-of-speech tagging and partial parsing. In:Church K, Young S, Bloothooft G eds. Corpus-Based Methods in Language and Speech, An ELSNET volume, Dordrecht:Kluwer Academic Publishers, 1996. 119～136
8[11]Church K W. A stochastic parts program and noun phrase parser for unrestricted text. In:Proceedings of the 2nd Conference on Applied Natural Language Processing, Texas, USA, 1988.136～143
9[12]Ramshaw L A, Marcus M P. Text chunking using transformation-based learning. In: Proceedings of ACL Third Workshop on Very Large Corpora, Cambridge, USA, 1995. 82～94
10[13]Darroch J N, Ratcliff D. Generalized iterative scaling for loglinear models. Annals of Mathematical Statistics, 1972,43(5):1470～1480

共引文献121

1刘云,俞士汶.“句管控”与中文信息处理[J].汉语学报,2004(2):56-62. 被引量：5
2陆俭明,郭锐.汉语语法研究所面临的挑战[J].世界汉语教学,1998,12(4):3-21. 被引量：97
3李剑锋,胡国平,王仁华.基于最大熵模型的韵律短语边界预测[J].中文信息学报,2004,18(5):56-63. 被引量：20
4许云,樊孝忠,张锋.基于生成语法的英语时态判断[J].计算机工程与应用,2004,40(26):226-228. 被引量：3
5陈晓明,周渝.汉语部分句法分析的研究和发展趋势[J].贵州大学学报（自然科学版）,2004,21(4):384-386. 被引量：2
6干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学报,2005,19(4):17-23. 被引量：14
7王建会,王雷,胡运发.词语间依存关系的定量识别[J].中文信息学报,2005,19(4):31-38. 被引量：3
8冯丽萍,焦莉娟.基于最大熵的中文组织机构名识别模型[J].计算机与数字工程,2010,38(12):36-40. 被引量：2
9余正涛,樊孝忠.基于最大熵模型的汉语问句语义组块分析[J].计算机工程,2005,31(17):3-5. 被引量：5
10余正涛,樊孝忠,郭剑毅.基于支持向量机的汉语问句分类[J].华南理工大学学报（自然科学版）,2005,33(9):25-29. 被引量：20

同被引文献23

1朱群雄,刘光.CBR技术在Multi-Agent故障诊断中的应用[J].计算机工程与应用,2004,40(21):111-113. 被引量：6
2马亮,陈群秀,蔡莲红.一种改进的自适应文本信息过滤模型[J].计算机研究与发展,2005,42(1):79-84. 被引量：18
3王珏,袁小红,石纯一,郝继刚.关于知识表示的讨论[J].计算机学报,1995,18(3):212-224. 被引量：54
4汤廷孝,刘勇,黄翔,廖文和.CBR系统中的实例修改研究[J].机械科学与技术,2006,25(4):390-393. 被引量：8
5李玲娟,王汝传.基于规则的IDS中的CBR研究[J].计算机科学,2006,33(5):117-120. 被引量：3
6杜小勇,李曼,王珊.本体学习研究综述[J].软件学报,2006,17(9):1837-1847. 被引量：243
7李培玉,陈俊伟,王江峰,李喆.一种智能故障诊断系统的研制[J].组合机床与自动化加工技术,2006(10):59-61. 被引量：4
8李建洋,倪志伟,刘慧婷,郑汉垣.基于覆盖算法与多层前馈网络的案例库维护[J].中国科学技术大学学报,2007,37(2):159-163. 被引量：3
9黄大荣,胡必锦.基于专家知识库属性重要度的故障诊断方法研究[J].计算机仿真,2007,24(4):155-157. 被引量：8
10董振东,董强,郝长伶.知网的理论发现[J].中文信息学报,2007,21(4):3-9. 被引量：100

引证文献2

1柳玉,贲可荣.案例推理的故障诊断技术研究综述[J].计算机科学与探索,2011,5(10):865-879. 被引量：14
2曾超,刘晓宇,林艺滨,温若辉.基于电子取证数据的内容分析技术和应用[J].计算机科学,2016,43(B12):228-230.

二级引证文献14

1陈锐,李黔,尹虎.案例推理技术在钻井风险预测中的应用[J].断块油气田,2013,20(2):225-227. 被引量：2
2吴联忠.基于案例推理的危险化学品事故警戒范围研究[J].武警学院学报,2014,30(4):8-12. 被引量：1
3李保刚.基于CBR的航空导弹故障智能诊断模型[J].兵工自动化,2015,34(3):13-17. 被引量：2
4赵鹏,蔡忠春,李晓明.某型飞机环控系统故障诊断系统设计[J].航空维修与工程,2015(4):50-53. 被引量：4
5文天柱,许爱强,孙伟超.基于可拓案例推理的故障诊断方法[J].北京航空航天大学学报,2015,41(11):2124-2130. 被引量：6
6吴彩华,刘畅,张秀峰,于虎.案例推理方法在雷达情报组网系统故障诊断中的应用[J].空军预警学院学报,2016,30(1):26-29.
7章筠.风力发电机组振动故障诊断案例推理系统[J].装备机械,2018(2):13-16. 被引量：2
8门菲.基于案例推理技术的井漏风险识别方法[J].承德石油高等专科学校学报,2019,21(1):22-25. 被引量：3
9蔡德咏,徐弘源,陈福红,刘福军.装备BIT和故障案例融合诊断方法研究[J].计算机测量与控制,2018,26(4):9-10. 被引量：1
10耿志强,景邵星,白菊,王仲凯,朱群雄,韩永明.基于MWSPCA-CBR的智能预警方法研究及其在石化工业中的应用[J].化工学报,2019,70(2):572-580. 被引量：7

1王继曾,任浩征,罗恒,刘宽.基于统计的句法分析方法研究[J].计算机工程与设计,2006,27(12):2207-2210. 被引量：2
2李天颍,刘璘,赵德旺,曹原.一种基于依存文法的需求文本策略依赖关系抽取方法[J].计算机学报,2013,36(1):54-62. 被引量：17
3秦学勇,张润梅.两级相似度计算在主观题机器阅卷中的应用[J].计算机工程,2012,38(11):274-276.
4秦元巧,孙国强.改进的句子相似度计算在问答系统中的应用[J].微计算机信息,2011,27(8):206-208. 被引量：2
5刘宝艳,林鸿飞,赵晶.基于改进编辑距离和依存文法的汉语句子相似度计算[J].计算机应用与软件,2008,25(7):33-34. 被引量：22
6黄勇.使用Scrum框架管理全文检索项目[J].电子技术与软件工程,2014,0(15):68-68.
7沈超.基于子树的确定性依存分析方法[J].计算机应用与软件,2011,28(2):268-270.
8黄昌宁.大规模真实文本处理的理论与方法——记第五届国际极大规模语料库研讨会(WVLC-5)[J].当代语言学,1998(1):45-48. 被引量：2
9孟遥,李生,赵铁军,曹海龙.四种基本统计句法分析模型在汉语句法分析中的性能比较[J].中文信息学报,2003,17(3):1-8. 被引量：10
10易军凯,罗会明.基于依存文法的垃圾短信自动识别[J].北京化工大学学报（自然科学版）,2013,40(B12):81-85. 被引量：2

计算机工程

2006年第11期

浏览历史

内容加载中请稍等...

基于最大熵模型的汉语依存分析被引量：2

参考文献5

二级参考文献33

共引文献121

同被引文献23

引证文献2

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于最大熵模型的汉语依存分析 被引量：2

参考文献5

二级参考文献33

共引文献121

同被引文献23

引证文献2

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于最大熵模型的汉语依存分析被引量：2