摘要
提出一种汉语分词方法。与其它的如利用单一统计特性的统计方法或者纯规则方法不同,该方法利用字、词、上下文、语法及语义等多种知识源对汉字串中每一隔点的切分可能性进行考察,并在无法彻底消歧的情况下通过模糊综合得出最可能的切分结果。用户可以根据需要修改系统以适应不同文本的特征,并能接收前后词法、语法、语义分析阶段的反馈。因此,该方法具有准确率高、灵活、健壮、回溯迅速的特点。
A new method for Chinese word segmenting based on multiple knowledge sources is proposed The segmenting possibility at each segmentable point of the Chinese character string is figured out by taking advantage of multiple knowledge sources, and the most possible segmenting path is found out by fuzzy synthesis
出处
《计算机工程与设计》
CSCD
北大核心
1998年第2期25-29,共5页
Computer Engineering and Design
关键词
自然语言处理
汉语自动分词
人工智能
Computational linguistics Natural language processing Chinese word segmenting