摘要
1.引言在过去几年中,一种新型的语言处理技术开始出现,并以各种名称为人们所知,如“面向数据的句法分析(Data-Oriented Parsing,DOP)”,“基于语料库的解释”,及“树库文法”等等,统称为面向数据的语言处理或DOP方法。该方法由Scha[1990]提出,并由Bod[1992-1995]发展,是一种概率的分析策略,其中体现一种假设,即人类对语言的理解与创造,依赖于以往具体的语言经验,而不是抽象的语言学规则。因此,在实现这种方法的模型中,保留以往出现言语语言学表示的大语料库。当处理一个新的输入言语时,通过组合来自语料库的片段构造该言语的分析。其中片段的出现频率用于估计最可能的分析。
Data-oriented language processing technique embodies the assumption that human language perception and production works with representation of concrete past language experiences, rather than with abstract grammar rules. So in the implementation, the modle maintains large corpus of linguistic representations of previously occurring utterances. This paper presents the data-oriented language processing technique with the labeled phrase structure tree.
出处
《计算机科学》
CSCD
北大核心
1999年第2期57-61,77,共6页
Computer Science
基金
国家自然科学基金
国家教委博士点专项基金
关键词
语言处理
面向数据
语料库
句法分析
人工智能
Data-oriented language processing, Parsing , Semantic interpretation, Combination operation, Probability computation, Disambiguation