摘要
任何一种中文输入法的研究中都会遇到码本的处理问题。在不同的时期 ,由于应用需求的不同 ,使得码本呈现出不同的表现形式。本文首先提出了汉字码本数据库的概念 ,它是指能够实现汉字字符信息到其相应属性的对应关系的数据结构。之后 ,本文讨论了不同层次上的两种码本 :数据库码本和二进制码本。根据实践的经验 ,文中将不同阶段的汉字码本数据库分成文本文件形式、数据库码本形式和二进制文件形式 。
Chinese Character Reference Database is playing an important role at Chinese information processing,especiallySat input method development. Because of the different user requirements,Chinese Character Reference Database must be represented in different views. First,this paper advances the concept of Chinese Character Reference Database. Then it explains two different types of Chinese Character Reference Database. This paper categorizes Chinese Character Reference Database,which exists in different period,into three types:text file,database file and binary file,and presents some management technologies on these files.
出处
《中文信息学报》
CSCD
北大核心
2003年第2期48-53,共6页
Journal of Chinese Information Processing
关键词
计算机应用
中文信息处理
码本
数据库
汉字码本数据库
管理技术
computer application
Chinese information processing
Reference
Database
Chinese Character Reference Database
management technology