摘要
针对基于统计的中文信息处理中,利用语料库作为唯一的信息源,目前还没有较好的方法能够实现语料库的质量评估的问题,提出利用植入模型和抽样估计相结合的方法,实现对语料库质量的评估.该模型是客观的评估模型,通过分析可知,该方法适用于任何语种的语料库质量评估.
In Chinese information disiposal, corpus has to be used as exclusive resource. A better method importing both planting model and sample estemate in corpus evaluation is designed in this research.
出处
《哈尔滨理工大学学报》
CAS
2007年第3期62-64,68,共4页
Journal of Harbin University of Science and Technology
关键词
质量评估
语料库
植入模型
分别测试
抽样估计
evaluating quality
corpus
planting model
separate testing
sample estimate