摘要
采用最大熵原理实现汉语实体提取。在信息处理中信息提取具有越来越重要的作用 ,其中实体提取是一个重要研究方向。文中首先介绍了实体的基本概念、实体提取的一般方法以及性能评价指标 ,然后基于最大熵原理对汉语实体提取建立了随机过程模型。实验结果表明 ,最大熵方法提取汉语实体具有较好的性能。
In this paper, the maximum entropy principle is used to extract Chinese entity from free text. Nowadays information extraction plays important role in information processing, and entity extraction is the essential research area in information extraction. At First, the concept of entity, general entity extraction method and metric of performance evaluation are introduced. After that, based on maximum entropy principle, a stochastic model for entity extraction is established. The experimental results show that the proposed approach can improve performance of entity extraction.
出处
《铁道学报》
EI
CAS
CSCD
北大核心
2001年第5期34-37,共4页
Journal of the China Railway Society
基金
国家自然科学基金资助项目 (6978930 1 )
关键词
最大熵原理
汉语
实体
提取方法
entity
stochastic process
maximum entropy principle