一种自组织的汉语词义排歧方法被引量：14

An Adaptive Chinese Word Sense Disambiguation Method

下载PDF

导出

摘要长期以来，词义排歧一直被认为是自然语言处理的难题之一。本文用机器可读词典《现代汉语辞海》提供的搭配实例作为多义词的初始搭配知识，采用适当的统计和自组织方法自动扩大搭配集；为保证学习质量，在学习过程中逐渐增大上下文窗口的长度；提出使用搭配统计表的多元最大对数似然比词义排歧算法。最后，对本文提出的方法进行了实验，实验表明这种算法具有较高的正确率。 Word sense disambiguation has been a difficult problem in natural language processing. This paper presents a method of automatically increasing new collocations by the use of the collocations provided by a machine readable dictionary XianDaiHanYuCiHai; In order to assuring the learning quality, the size of context was enlarged gradually; In the procedure of learning and word sense disambiguating, author gives a multi maximal log word sense disambiguation algorithm. At last, the method was tested and proved that it has higner accurancy.

作者李涓子黄昌宁杨尔弘

机构地区智能技术与系统国家重点实验室清华大学计算机科学与技术系山西大学计算机科学系

出处《中文信息学报》 CSCD 北大核心 1999年第3期1-8,共8页 Journal of Chinese Information Processing

基金国家自然科学基金

关键词自然语言处理词义排歧自组织方法汉语 natural language processingword sense disambigautionadaptive methodcollocation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1倪文杰，现代汉语辞海，1994年

同被引文献200

1黄昌宁.中文信息处理中的分词问题[J].语言文字应用,1997(1):74-80. 被引量：85
2孙茂松,黄昌宁,方捷.汉语搭配定量分析初探[J].中国语文,1997(1):29-38. 被引量：58
3彭可君.说“怎么”[J].语言教学与研究,1993(1):114-125. 被引量：20
4刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：200
5袁毓林.都、也”在“Wh+都/也+VP”中的语义贡献[J].语言科学,2004,3(5):3-14. 被引量：34
6王振华,孔祥龙,陆汝占,刘绍明.结合决策树方法的中文姓名识别[J].中文信息学报,2004,18(6):10-15. 被引量：16
7郭锋,李绍滋,周昌乐,林颖,李胜睿.基于词汇吸引与排斥模型的共现词提取[J].中文信息学报,2004,18(6):16-22. 被引量：8
8张克亮.基于HNC理论的句法结构歧义消解[J].中文信息学报,2004,18(6):43-52. 被引量：9
9曲维光,陈小荷,吉根林.基于框架的词语搭配自动抽取方法[J].计算机工程,2004,30(23):22-24. 被引量：20
10全昌勤,何婷婷,姬东鸿,刘辉.从搭配知识获取最优种子的词义消歧方法[J].中文信息学报,2005,19(1):30-35. 被引量：13

引证文献14

1陈笑蓉,秦进.基于最大熵原理的汉语词义消歧[J].计算机科学,2005,32(5):174-176. 被引量：7
2刘风成,黄德根,姜鹏.基于AdaBoost.MH算法的汉语多义词消歧[J].中文信息学报,2006,20(3):6-13. 被引量：7
3刘亚清,于纯妍.中心词关联法[J].计算机工程与科学,2006,28(10):126-127.
4葛斌,封孝生,汤大权.基于模板的无导词义消歧方法[J].计算机工程与科学,2009,31(12):113-116.
5李纲,蔻广增.自举在词义消歧中的应用及其关键问题[J].情报学报,2010,29(1):93-99.
6陈文,徐庆,袁润章.SrTiO_3复合功能陶瓷的AC阻抗谱研究[J].硅酸盐通报,1999,18(4):18-21. 被引量：5
7张禄彭,易绵竹,周云.中文歧义研究25年——以《中文信息学报》论文为例[J].中文信息学报,2012,26(4):73-84. 被引量：4
8李国臣,张立凡,李茹,刘海静,石佼.基于词元语义特征的汉语框架排歧研究[J].中文信息学报,2013,27(4):44-51. 被引量：7
9侯珺,王作英.一种词义与词的混合语言模型及其应用[J].中文信息学报,2001,15(6):7-12.
10牛长伟,程邦雄.基于规则的汉语疑问词“什么”的语义识别模型构建[J].中文信息学报,2017,31(5):14-20. 被引量：1

二级引证文献34

1蓝德均,陈异,陈强,乐夕,肖定全,朱建国.(1-x)PST-xPZT弛豫铁电陶瓷阻抗谱的研究[J].四川大学学报（自然科学版）,2005,42(S1):385-388.
2吴云芳,金澎,郭涛.基于词典属性特征的粗粒度词义消歧[J].中文信息学报,2007,21(2):3-8. 被引量：10
3顾大国,李国荣,郑嘹赢,丁爱丽,殷庆瑞.锰掺杂CBT压电陶瓷的交流阻抗谱研究[J].电子元件与材料,2007,26(10):18-20. 被引量：2
4樊玉俊,胡熠,陆汝占.基于机器可读词典的词汇知识抽取[J].计算机应用与软件,2008,25(6):8-10.
5陈锦禾,范新,沈闻,沈洁.基于情感词识别的BBS情感分类研究[J].计算机技术与发展,2009,19(7):120-123. 被引量：9
6王达,张坤.贝叶斯模型在词义消歧中的应用[J].计算机时代,2009(7):63-64. 被引量：2
7缪建明,张全.一种基于概念关联式的词义消岐方法[J].计算机科学,2010,37(1):208-210. 被引量：1
8何径舟,王厚峰.基于特征选择和最大熵模型的汉语词义消歧[J].软件学报,2010,21(6):1287-1295. 被引量：37
9张禄彭,易绵竹,周云.中文歧义研究25年——以《中文信息学报》论文为例[J].中文信息学报,2012,26(4):73-84. 被引量：4
10夏静,柴玉梅,昝红英.基于统计和规则的常用词的兼类识别研究[J].计算机工程与设计,2013,34(2):654-659. 被引量：4

1陈佳,罗振声.一种基于语义搭配的汉语词义消歧方法[J].微计算机信息,2008,24(3):187-188. 被引量：1
2刘亚清,于纯妍,张瑾.改进的基于义原同现频率的汉语词义排歧方法[J].计算机工程与科学,2006,28(12):136-138.
3冯素琴,陈惠明.一种自组织的汉语组合型歧义消歧方法[J].计算机工程与设计,2007,28(3):737-739. 被引量：3
4谈文蓉,杨宪泽.MIS智能接口中统计排歧方法的研究与应用[J].西南民族大学学报（自然科学版）,2008,34(5):1035-1038.
5郭志兵,黄广君,卢朝华.一种改进的词义排歧算法[J].计算机工程与应用,2010,46(19):148-150.
6张波,向阳,黄震华.一种基于语义的决策服务协作自组织方法[J].控制与决策,2013,28(9):1414-1418. 被引量：1
7李晓峰.基于自组织方法的人工神经网络经济预测模型的建立[J].预测,2002,21(6):64-66. 被引量：11
8葛瑞芳,李涓子.一个汉语词义自动标注系统的设计与实现[J].计算机工程与应用,2001,37(17):170-173. 被引量：5
9刘光中,李晓峰.人工神经网络BP算法的改进和结构的自调整[J].运筹学学报,2001,5(1):81-88. 被引量：30
10辛日华,辛日峰.探究NVEF义对标识库的构建[J].电脑知识与技术（过刊）,2013,19(12X):8068-8069.

中文信息学报

1999年第3期

浏览历史

内容加载中请稍等...

一种自组织的汉语词义排歧方法被引量：14

参考文献1

同被引文献200

引证文献14

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

一种自组织的汉语词义排歧方法 被引量：14

参考文献1

同被引文献200

引证文献14

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

一种自组织的汉语词义排歧方法被引量：14