期刊文献+

基于语言知识的手写汉语文本自动识别初探 被引量:4

AUTOMATIC RECOGNITION OF HANDWRITTEN CHINESE TEXT BASED ON LINGUISTIC KNOWLEDGE
在线阅读 下载PDF
导出
摘要 文中首先从信息开销的角度分析了识别一个汉字所需要的信息量.研究表明,单字识别算法是一种等概模型,需要的信息最多.因此,可把汉字文本当作Markov模型来处理,当前汉字的发生仅依赖于前m个汉字.根据对文本的统计,得到许多语言统计信息,在此基础上,设计了利用语言知识基于句子的文本自动识别方法.识别时当前待识字的匹配仅在前一个字的后邻接字集里进行;当一个句子识别完后,对其进行语言知识处理后再输出结果.因而识别速度和识别率比单字识别方法都有明显提高. It is first analyzed how much information is used when recognizing a Chinese character. It is indicated that the single character recognition algorithm is an equal probability model and needs the most information. So the Chinese text is regarded as a Markov model, which means that the character is determined by the last m characters. On the basis of the statistics of the text, a lot of Chinese linguistic knowledge is obtained. An automatic recognition is designed, in which the character is matched in the next neighboring character set of the last character. After recognized, the sentence is treated as the linguistic knowledge before it is output. So the recognition speed and recognition rate are higher than that of the single character recognition algorithm.
作者 杨经 方应谦
出处 《计算机研究与发展》 EI CSCD 北大核心 1998年第7期668-672,共5页 Journal of Computer Research and Development
关键词 语言知识 汉语文本 汉字识别 汉字信息处理 linguistic knowledge, Chinese text, Chinese character recognition, Markov model
  • 相关文献

参考文献7

  • 1姜珊,第六届全国汉字识别学术会议论文集,1996年,44页
  • 2罗振声,第六届全国汉字识别学术会议论文集,1996年,187页
  • 3韩布新,中文信息学报,1993年,7卷,4期,61页
  • 4张彩录,第四届全国汉字识别学术会议论文集,1992年,7页
  • 5张忻中,第四届全国汉字识别学术会议论文集,1992年,15页
  • 6吴佑寿,汉字识别.原理、方法与实现,1992年
  • 7刘迎建,中文信息学报,1989年,2卷,4期,1页

同被引文献23

  • 1张青,尹俊勋.小波变换在手写体汉字识别中的应用[J].电路与系统学报,1996,1(3):63-67. 被引量:8
  • 2路浩如,杨源远.手写体汉字识别问题综论[J].计算机应用与软件,1994,11(2):1-8. 被引量:5
  • 3[3]张忻中.汉字识别技术.北京:清华大学出版社,1992,129-132
  • 4马少平,夏莹,朱小燕.基于模糊方向线素特征的手写体汉字识别[J].清华大学学报(自然科学版),1997,37(3):42-45. 被引量:37
  • 5张炘中.汉字识别技术[M].北京:清华大学出版社,1992..
  • 6刘迎建 戴如为.联机手写汉字识别的理论与实践[J].中文信息学报,1989,2(4):1-13.
  • 7李国华等.基于词间字二元语法模型的汉字识别后处理方法[A].第六届全国汉字识别学术会议论文集[C],1996,181~186.
  • 8杜林等.基于统计模型的汉字识别后处理[A].第六届全国汉字识别学术会议论文集[c],1996,175~180.
  • 9姜珊.从单识别走向集群识别—手写汉字识别策略探讨[A].第六届全国汉字识别学术会议论文集[C],1996.44~48.
  • 10张彩录,郭玉兰等.汉字识别的双信源模型[A].第四届全国汉字识别学术会议论文集[C].1992,7—12.

引证文献4

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部