汉语句子谓语中心词的自动识别被引量：18

Recognizing the Predicate Head of Chinese Sentences

下载PDF

导出

摘要谓语中心词的识别是句法成分分析中的一个非常重要的部分。本文提出了一种规则和特征学习相结合的谓语识别方法 ,将整个谓语识别的过程分为语片捆绑、谓语粗筛选和谓语精筛选三个阶段。在谓语粗筛选中 ,利用规则过滤掉明显不能充当谓语的词 ,得到一个准谓语集 ;在精筛选阶段 ,选择谓语的支持特征 ,根据统计计算得到每个特征对谓语的支持度 ,然后利用准谓语在句子中的上下文出现的特征对准谓语集中的词进行再次筛选 ,从而确定出句子的谓语中心词。经过测试表明。 Recognizing the predicate head is an important part of the syntactic analysis of Chinese sentences.This paper presents a new approach to recognize the predicate head automatically,which combines a rule based method with a multi feature based method.The process of recognizing is broken into three sub process:preprocess,coarse filter and fine filter.We use a rule based method to filter the quasi predicate that may be the predicate of a sentence.In the fine filter,we select and compute a great diversity of features by statistic,then use these features to recognize the real predicate of this sentence.The result of experiments indicates that this approach is feasible and advanced.

作者龚小谨罗振声骆卫华

机构地区清华大学人文学院计算语言学研究室

出处《中文信息学报》 CSCD 北大核心 2003年第2期7-13,共7页 Journal of Chinese Information Processing

关键词计算机应用中文信息处理谓语中心词的识别基于规则特征选择粗筛选精筛选 computer application Chinese information processing recognize the predicate head rule based feature selection

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1穗志方,俞士汶.汉语单句谓语中心词识别知识的获取及应用[J].北京大学学报（自然科学版）,1998,34(2):221-230. 被引量：17
2罗振声,郑碧霞.汉语句型自动分析和分布统计算法与策略的研究[J].中文信息学报,1994,8(2):1-19. 被引量：21
3罗振声孙长健孙才.汉语句型成分自动分析中谓语识别策略的研究[A]..计算语言学进展与应用[C].清华大学出版社,1995.159-164.
4穗志方,俞士汶.面向EBMT的汉语单句谓语中心词识别研究[J].中文信息学报,1998,12(4):39-46. 被引量：18
5何一薇.试析汉语动词作谓语应具备的条件[J].浙江师范大学学报（社会科学版）,1997,23(2):40-43. 被引量：2
6谭辉.科技论文中的中心谓词的计算机识别原则[J].武汉大学学报（自然科学版）,2000,46(3):301-303. 被引量：2

二级参考文献18

1贺阳.汉语完句成分试探[J].语言教学与研究,1994(4):26-38. 被引量：110
2俞士汶,朱学锋,王惠,张芸芸.现代汉语语法信息词典规格说明书[J].中文信息学报,1996,10(2):1-22. 被引量：34
3赵淑英，80年代与90年代中国现代汉语语法研究，1992年
4团体著者，世界汉语教学，1989年
5吴竞存，现代汉语句法分析，1988年
6朱德熙，语法讲义，1984年
7吕淑湘，中国语文，1984年
8邢福义，论现代汉语句型系统，1983年
9陈小荷，语言工程，1997年，102页
10罗振声，计算语言学进展与应用，1995年，159页

共引文献44

1祖漪清.实现语音数据库科学性的重要环节——篇章断句与连续语音的韵律结构[J].语言文字应用,1998(1):95-99. 被引量：6
2林贤明,李堂秋,史晓东.基于模板的机器翻译系统中模板库的自动构建技术[J].计算机应用,2004,24(9):127-128. 被引量：4
3郭艳华,周昌乐.一种汉语语句依存关系网协动生成方法研究[J].杭州电子工业学院学报,2000,20(4):24-32. 被引量：11
4佘莉,符红光.基于自然语言处理的计算机几何作图[J].计算机应用,2005,25(1):7-10. 被引量：3
5李国臣,孟静.利用主语和谓语的句法关系识别谓语中心词[J].中文信息学报,2005,19(1):1-7. 被引量：11
6李向阳 ,张亚非 .基于语义搭配的汉语短语界定研究[J].情报学报,2005,24(1):100-106. 被引量：1
7詹卫东.80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J].当代语言学,2000,2(2):63-73. 被引量：13
8薛永增,杨沐昀,赵铁军,韩习武,齐浩亮.面向体育领域的句子主干翻译技术研究[J].中文信息学报,2005,19(5):24-30. 被引量：1
9白妙青,郑家恒.利用支持向量机实现动词-动词搭配的自动标注[J].计算机工程与应用,2005,41(35):164-166. 被引量：4
10韦向峰,熊亮,张全.汉语语句核心动词的自动获取研究[J].计算机工程与应用,2007,43(10):179-182.

同被引文献98

1王红军,徐林,张继宏.一种模糊综合决策汉语谓词识别算法[J].四川大学学报（自然科学版）,2004,41(z1):630-634. 被引量：1
2冯志伟.特思尼耶尔的从属关系语法[J].当代语言学,1983(1):63-65. 被引量：51
3王书斌,单胜男,罗雄麟.基于T-S模糊模型与粒子群优化的非线性预测控制[J].化工学报,2012,63(S1):176-187. 被引量：8
4宋枫溪,陈才扣,刘树海,杨静宇.文本表示方式对线性支持向量机分类性能的影响[J].模式识别与人工智能,2004,17(2):161-166. 被引量：4
5张志强,邢春晓,周立柱,孙静,钱乾.SESQ系统的一种查询优化策略[J].计算机研究与发展,2004,41(10):1621-1628. 被引量：1
6信息处理用现代汉语词类标记集规范[J].语言文字应用,2001(3):16-20. 被引量：12
7李国臣,孟静.利用主语和谓语的句法关系识别谓语中心词[J].中文信息学报,2005,19(1):1-7. 被引量：11
8孙宏林,俞士汶.浅层句法分析方法概述[J].当代语言学,2000,2(2):74-83. 被引量：39
9杨泉,冯志伟.面向中文信息处理的现代汉语“v+v”结构歧义问题研究[J].语言文字应用,2005(1):123-129. 被引量：9
10罗振声,郑碧霞.汉语句型自动分析和分布统计算法与策略的研究[J].中文信息学报,1994,8(2):1-19. 被引量：21

引证文献18

1李国臣,孟静.利用主语和谓语的句法关系识别谓语中心词[J].中文信息学报,2005,19(1):1-7. 被引量：11
2白菊平.探讨提高中文文献信息检索质量的相关技术[J].农业图书情报学刊,2005,17(12):119-120. 被引量：1
3张建莉.基于特征词驱动的带“的”字名词短语的识别[J].福建电脑,2006,22(5):70-71.
4封春升,郝爱民.基于模式匹配的自然语言识别[J].计算机工程与应用,2006,42(19):144-146. 被引量：8
5韦向峰,熊亮,张全.汉语语句核心动词的自动获取研究[J].计算机工程与应用,2007,43(10):179-182.
6谌志群.汉语句子谓词的自动识别方法研究[J].计算机工程与应用,2007,43(17):176-178. 被引量：1
7王忠林,赵启阳,尹宝林.基于确定信息的直接语法分析[J].中北大学学报（自然科学版）,2008,29(2):131-135. 被引量：1
8刘长令.近几年开发的国外农药新品种(6)[J].农药,1999,38(8):42-44. 被引量：6
9张宜浩,金澎.谓词自动识别中的特征选择度量研究[J].计算机工程与科学,2012,34(9):188-192. 被引量：2
10李洪政,朱筠,晋耀红.面向汉英专利机器翻译的“V_1+V_2”结构识别方法研究[J].现代语文（下旬．语言研究）,2013(12):123-126.

二级引证文献36

1陈平,匡尧,陈婧.基于BERT-wwm-ext多特征文本表示的经济事件主体抽取方法研究[J].武汉电力职业技术学院学报,2020(2):45-50. 被引量：1
2姜林,李长城,张玉镭,谢协忠.磺酰脲类除草剂的研制与应用[J].山东农业大学学报（自然科学版）,2003,34(4):597-599. 被引量：5
3黄嘉.网络信息检索[J].电脑知识与技术,2006(12):34-35.
4韦向峰,熊亮,张全.汉语语句核心动词的自动获取研究[J].计算机工程与应用,2007,43(10):179-182.
5卢鑫鑫,杨鑫骥,翁建全,沈德隆.新型除草剂玉嘧磺隆的合成研究[J].现代农药,2007,6(3):13-15. 被引量：3
6卢鑫鑫,杨鑫骥,翁建全,沈德隆,陈庆悟.3-乙磺酰基-2-吡啶磺酰胺的合成[J].浙江工业大学学报,2007,35(5):494-496. 被引量：1
7郭万成,王美怡,刘幸海,李永红,王素华,李正名.4,5,6-三取代嘧啶磺酰脲化合物的合成与除草活性[J].高等学校化学学报,2007,28(9):1666-1670. 被引量：4
8田霓光,程伟.深层句法和语义分析[J].咸宁学院学报,2008,28(3):79-81. 被引量：1
9马建峰,刘敏,严隽薇.基于模糊集的Web服务匹配算法[J].制造业自动化,2008,30(12):50-53. 被引量：10
10彭爽,俞士汶.现代汉语介词知识库的建设[J].社会科学战线,2009(8):247-249. 被引量：4

1李国臣,孟静.利用主语和谓语的句法关系识别谓语中心词[J].中文信息学报,2005,19(1):1-7. 被引量：11
2穗志方,俞士汶.面向EBMT的汉语单句谓语中心词识别研究[J].中文信息学报,1998,12(4):39-46. 被引量：18
3穗志方,俞士汶.汉语单句谓语中心词识别知识的获取及应用[J].北京大学学报（自然科学版）,1998,34(2):221-230. 被引量：17
4张惠萍.数字水印在数字图书馆中的应用[J].甘肃农业,2006(1):167-167. 被引量：1
5徐春,杨勇,董兴华.汉维/维汉统计机器翻译中若干问题研究[J].计算机工程与应用,2011,47(35):150-154. 被引量：6
6贾超,陈飞.支持特征的非流形造型数据结构的研究[J].计算机工程与应用,2003,39(36):96-97.
7徐宝文.Ada95与面向对象的程序设计[J].计算机研究与发展,1997,34(1):58-65. 被引量：5
8魏洪钦,吴联银,王小椿.支持特征构成的数据结构及基于特征设计的研究[J].工程图学学报,2000,21(3):48-54. 被引量：2
9程辉,田金文,柳健.支持向量像素抽样的快速图像匹配方法[J].光电工程,2005,32(12):39-42. 被引量：4
10徐宝文,袁明,林钧海,白劲松,杨洪.ASEL：一种基于Ada的可扩充软件工程语言[J].航空学报,1994,15(6):672-678.

中文信息学报

2003年第2期

浏览历史

内容加载中请稍等...

汉语句子谓语中心词的自动识别被引量：18

参考文献6

二级参考文献18

共引文献44

同被引文献98

引证文献18

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

汉语句子谓语中心词的自动识别 被引量：18

参考文献6

二级参考文献18

共引文献44

同被引文献98

引证文献18

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

汉语句子谓语中心词的自动识别被引量：18