摘要
解决蒙古语基本名词短语的定界问题,是在蒙古语词性标注语料库的基础上进行的探索性研究。基本名词短语的内部结构信息对其定界问题具有重要作用。确定基本名词短语内部结构的因素有多种,但基本名词短语成分的词类信息是最基本的因素。我们以词类信息为核心,附加一些限定条件,构建识别基本名词短语的形式规则集,并在实际语料中进行基本名词短语标注测试。
The Boundary Determination of Mongolian BaseNP is an exploratory task based on POS Tagged Mongolian Corpora. The determination of the inner structure of baseNP will be very helpful for BaseNP boundary recognition. The inner structure of BaseNP can be analyzed based on different features, among them, POS tagging information is the most important feature. Using POS tagging information as the core feature, together with other determinative conditions, we construct a rule set for Mongolian BaseNP recognition, which will be a necessary resource for BaseNP recogrition.
出处
《中文信息学报》
CSCD
北大核心
2005年第5期52-58,共7页
Journal of Chinese Information Processing
基金
国家自然科学基金资助项目(60263001)
国家社会科学基金资助项目(02BYY036)
教育部重点资助项目(02JAZJD850003)
关键词
计算机应用
中文信息处理
蒙古语
基本名词短语
短语结构
形式化描述
computer application
Chinese information processing
Mongolian language
base NP
phrase structure
formal description