摘要
中文分词是中文信息处理的基础、前提和关键.通过分析已有的中文分词算法,提出了一种新的分词词典机制,并根据新的分词词典机制提出了一种快速双向中文分词算法.使用该算法可以实现快速查找和双向匹配,从而极大地提高中文分词的速度和准确率.
Chinese word segmentation is the precondition for Chinese information processing. By analyzing the existing algorithms for Chinese word segmentation, a new dictionary mechanism and a fast and two - way algorithm for Chinese word segmentation are put forward. The new algorithm can achieve a rapid search and two - way matching. At the same time, it can also improve the speed and accuracy of Chinese word segmentation.
出处
《山东师范大学学报(自然科学版)》
CAS
2009年第1期75-77,共3页
Journal of Shandong Normal University(Natural Science)
基金
山东省自然科学基金资助项目(Y2005021)
关键词
中文分词
字符串匹配
分词词典机制
自定义类型
chinese word segmentation
chinese word matching
dictionary mechanism tor chinese word segmentation
user- defined type