期刊文献+

基于规则的汉语自动分词系统 被引量:43

A Rule-Based Chinese Automatic Segmenting System
在线阅读 下载PDF
导出
摘要 本文通过对汉语自动分词难点的分析,讨论了词频和词结合力的关系,提出了一套机械切分与语义校正的汉语自动分词方法。 系统包括建立绝对切分标志符表,变长度最大匹配法、2-3-1优先规则集、固有歧义切分和组合歧义切分校正方法等。最后列举了描述语义校正规则的实例。系统作为CETRAN.A的一部分,在SUN3-280工作站上实现。 By means of analysis to the difficulty of the Chinese Automatic segmenting words, this paper discussed the relation between the word frequency and combinational ability. Put forward a set of the Chinese automatic segmenting method, machine segmenting and semantic correction.The system has been set up the list of absolute segmenting marks; changable length maximum matching method;2-3-1 priority rule set; intrinsic ambiguous correction and combinational ambiguous correction, etc.Some examples used the rules are given. This system is a part of CETRAN.A and programmed in C language at SUN 3-280 workstation.
机构地区 东北工学院
出处 《中文信息学报》 CSCD 1990年第1期37-43,共7页 Journal of Chinese Information Processing
  • 相关文献

参考文献4

  • 1张潮生,中文信息处理国际会议论文集,1987年
  • 2梁南元,中文信息,1986年,1期
  • 3姚天顺,计算机的汉字信息处理,1985年
  • 4管纪文,中文信息处理国际研讨论文集,1983年

同被引文献274

引证文献43

二级引证文献451

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部