汉语单句谓语中心词识别知识的获取及应用被引量：17

The Acquisition and Application of the Knowledge for Recognizing the Predicate Head of a Chinese Simple Sentence

下载PDF

导出

摘要在基于实例的机器翻译（ＥＢＭＴ）的语句相似度研究中，确定谓语中心词以把握句子的整体结构是至关重要的。以标注了谓语中心词的３０００句汉语单句作为训练集，将候选词本身的语法属性以及上下文环境作为该候选词的归类特征，通过建立统计决策树模型获取谓语中心词的识别知识。应用统计决策树进行了谓语中心词的自动识别，并获得了较为满意的测试结果。 It is necessary to grasp the main structure of the sentence through its predicate head for the sentence similarity calculation in EBMT.Taking 3000 tagged Chinese simple sentences as training set and the syntactic attributes and the contextual information as the classification features,this research acquires the knowledge of recognizing the predicate head through constructing a statistical decision tree model.The problem of applying the statistical decision tree to recognize the predicate head is also discussed.

作者穗志方俞士汶

机构地区北京大学计算语言学研究所

出处《北京大学学报（自然科学版）》 CAS CSCD 北大核心 1998年第2期221-230,共10页 Acta Scientiarum Naturalium Universitatis Pekinensis

基金国家863计划国家自然科学基金

关键词自然语言处理机器翻译知识获取谓语中心词 natural language processing corpus machine translation knowledge acquisition predicate head statistical decision tree

分类号 TP391.2 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1俞士汶,朱学锋,王惠,张芸芸.现代汉语语法信息词典规格说明书[J].中文信息学报,1996,10(2):1-22. 被引量：34
2陈小荷，语言工程，1997年，102页
3罗振声，计算语言学进展与应用，1995年，159页
4俞士汶，语文现代化论丛，1995年，193页

共引文献33

1吴先,胡俊峰.基于历时语料库的在线词典编纂系统设计[J].中文信息学报,2020(5):27-35. 被引量：2
2张飞鹏.论汉语表意拼音输入法[J].浙江大学学报（社会科学版）,1997,27(3):121-124.
3杨思春,周云霞.汉英机器翻译中基于实例的歧义结构消解[J].计算机工程与设计,2004,25(5):688-690. 被引量：1
4詹卫东.80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J].当代语言学,2000,2(2):63-73. 被引量：13
5肖明.机器翻译系统中间件模型[J].福建电脑,2006,22(3):122-123.
6张淼淼.“离合词”研究综述[J].忻州师范学院学报,2007,23(1):37-39. 被引量：4
7李培峰,包莉娅,朱巧明.一个基于C/S模式的汉字词属性重组工具的设计[J].苏州大学学报（自然科学版）,1997,13(4):32-37.
8钱培德,朱巧明,李培峰,吕强.一个基于C/S模式的汉字词属性分析和重组系统的数据模型[J].计算机工程与科学,1998,20(3):55-59. 被引量：1
9钱培德,杨季文,吕强,朱巧明.一个基于C/S模式的汉字词属性分析和重组系统的设计[J].中文信息学报,1999,13(1):43-49.
10王海峰,李生,赵铁军,杨沐昀.汉英机器翻译中汉语离合词的处理策略[J].情报学报,1999,18(4):303-307. 被引量：9

同被引文献90

1王红军,徐林,张继宏.一种模糊综合决策汉语谓词识别算法[J].四川大学学报（自然科学版）,2004,41(Z1):630-634.
2何一薇.试析汉语动词作谓语应具备的条件[J].浙江师范大学学报（社会科学版）,1997,23(2):40-43. 被引量：2
3孙茂松,黄昌宁,方捷.汉语搭配定量分析初探[J].中国语文,1997(1):29-38. 被引量：58
4刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：202
5宋枫溪,陈才扣,刘树海,杨静宇.文本表示方式对线性支持向量机分类性能的影响[J].模式识别与人工智能,2004,17(2):161-166. 被引量：4
6陆勇,侯汉清.用于信息检索的同义词自动识别及其进展[J].南京农业大学学报（社会科学版）,2004,4(3):87-93. 被引量：25
7李国臣,孟静.利用主语和谓语的句法关系识别谓语中心词[J].中文信息学报,2005,19(1):1-7. 被引量：11
8罗振声,郑碧霞.汉语句型自动分析和分布统计算法与策略的研究[J].中文信息学报,1994,8(2):1-19. 被引量：21
9刘华梅,侯汉清.基于情报检索的汉语同义词识别初探[J].情报理论与实践,2005,28(4):373-375. 被引量：11
10陈文亮,朱靖波,朱慕华,姚天顺.基于领域词典的文本特征表示[J].计算机研究与发展,2005,42(12):2155-2160. 被引量：23

引证文献17

1佘莉,符红光.基于自然语言处理的计算机几何作图[J].计算机应用,2005,25(1):7-10. 被引量：3
2李国臣,孟静.利用主语和谓语的句法关系识别谓语中心词[J].中文信息学报,2005,19(1):1-7. 被引量：11
3白妙青,郑家恒.利用支持向量机实现动词-动词搭配的自动标注[J].计算机工程与应用,2005,41(35):164-166. 被引量：4
4韦向峰,熊亮,张全.汉语语句核心动词的自动获取研究[J].计算机工程与应用,2007,43(10):179-182.
5王忠林,赵启阳,尹宝林.基于确定信息的直接语法分析[J].中北大学学报（自然科学版）,2008,29(2):131-135. 被引量：1
6许威,赵克,亿珍珍.一个确定汉语句子主干的递归模型[J].航空计算技术,2008,38(4):66-69. 被引量：1
7白妙青,郑家恒.基于最大熵方法进行动词搭配的自动标注[J].计算机工程与应用,2009,45(3):135-137.
8彭爽,俞士汶.现代汉语介词知识库的建设[J].社会科学战线,2009(8):247-249. 被引量：4
9刘长令.近几年开发的国外农药新品种(6)[J].农药,1999,38(8):42-44. 被引量：6
10张宜浩,金澎.谓词自动识别中的特征选择度量研究[J].计算机工程与科学,2012,34(9):188-192. 被引量：2

二级引证文献65

1姜林,李长城,张玉镭,谢协忠.磺酰脲类除草剂的研制与应用[J].山东农业大学学报（自然科学版）,2003,34(4):597-599. 被引量：5
2丁黎庆 ,李生红 ,林祥 ,李建华 ,王开亚 .实时高效邮件过滤系统设计[J].装甲兵工程学院学报,2004,18(4):38-40.
3江宝林,刘永丹,金峰,葛家翔,胡运发.一个基于语义分析的倾向性文档过滤系统[J].计算机应用与软件,2005,22(1):10-11. 被引量：7
4李国臣,孟静.利用主语和谓语的句法关系识别谓语中心词[J].中文信息学报,2005,19(1):1-7. 被引量：11
5李兴鹏,武伟.基于内容和地址的电子邮件过滤系统的研究及实现[J].上海应用技术学院学报（自然科学版）,2005,5(1):35-37.
6陈亮,刘宗田.一个基于向量空间模型的OUTLOOK垃圾邮件过滤器[J].计算机应用与软件,2005,22(12):7-9.
7白菊平.探讨提高中文文献信息检索质量的相关技术[J].农业图书情报学刊,2005,17(12):119-120. 被引量：1
8张建莉.基于特征词驱动的带“的”字名词短语的识别[J].福建电脑,2006,22(5):70-71.
9封春升,郝爱民.基于模式匹配的自然语言识别[J].计算机工程与应用,2006,42(19):144-146. 被引量：8
10范黎林,王晓东.一种用于垃圾邮件过滤的中文关键词匹配算法[J].河南科技大学学报（自然科学版）,2006,27(5):35-37. 被引量：6

1李国臣,孟静.利用主语和谓语的句法关系识别谓语中心词[J].中文信息学报,2005,19(1):1-7. 被引量：11
2穗志方,俞士汶.面向EBMT的汉语单句谓语中心词识别研究[J].中文信息学报,1998,12(4):39-46. 被引量：18
3龚小谨,罗振声,骆卫华.汉语句子谓语中心词的自动识别[J].中文信息学报,2003,17(2):7-13. 被引量：18
4陈丽江,陈小荷.统计和规则结合识别动词的跨分句论元[J].计算机工程与应用,2009,45(16):40-42.
5徐春,杨勇,董兴华.汉维/维汉统计机器翻译中若干问题研究[J].计算机工程与应用,2011,47(35):150-154. 被引量：6
6时百慧.现代汉语四字格“小X小Y”初探[J].求知导刊,2015(6):119-120.
7才让拉毛,安见才让.藏文词一“ ”的消歧研究[J].中国科技博览,2015,0(45):276-277. 被引量：1
8张格伟,胡建,俞烽,廖文和.支持遗忘特征的记忆模型及其在知识管理中的应用[J].信息与控制,2008,37(5):621-626. 被引量：3
9仁青卓么,祁坤钰.藏语动词语法属性计量研究[J].西北民族大学学报（自然科学版）,2014,35(2):37-42. 被引量：1
10李伟.NESO移动硬盘打假[J].新电脑,2009,33(10):162-162.

北京大学学报（自然科学版）

1998年第2期

浏览历史

内容加载中请稍等...

汉语单句谓语中心词识别知识的获取及应用被引量：17

参考文献4

共引文献33

同被引文献90

引证文献17

二级引证文献65

相关作者

相关机构

相关主题

浏览历史

汉语单句谓语中心词识别知识的获取及应用 被引量：17

参考文献4

共引文献33

同被引文献90

引证文献17

二级引证文献65

相关作者

相关机构

相关主题

浏览历史

汉语单句谓语中心词识别知识的获取及应用被引量：17