期刊文献+

基于条件随机场的中文人名识别研究 被引量:3

Study on the Recognition of Names of Chinese People Based on Conditional Random Fields
在线阅读 下载PDF
导出
摘要 利用条件随机场能够任意添加特征的优点,基于条件随机场模型在字粒度一级进行中文人名识别的研究.根据中文人名在文本中出现的基本特征和上下文特征,结合模型的综合性能,合理构造条件随机场的特征模板,在大规模标注语料上进行训练,统计中文人名在文本中的条件概率分布,获得模型参数,并采用序列标注的方式完成中文人名识别任务.多次闭合测试和开放测试结果表明,F值基本都高于90%. Taking advantage of the ability of using arbitrary features as input in CRFs, the task of the name of Chinese people recognition was discussed based on the Conditional Random Fields on the character level. According to the basic and context features of the Chinese people's names, the feature template of CRFs was built reasonably combining the comprehensive performance of the model which was trained on the large scale corpus to obtain the model's parameters by counting the Chinese names' conditional probability distribution in the texts. By sequence labeling, it implemented the recognition of Chinese names. It obtained promising results on different closed and opened test corpus with the F measurement value of almost 90% above.
出处 《昆明学院学报》 2011年第6期64-66,共3页 Journal of Kunming University
基金 昆明学院科研课题资助项目(2009G012)
关键词 命名实体识别 中文人名识别 条件随机场 条件概率 特征模板 序列标注 named entity recognition Chinese people' s name recognition conditional random fields conditional probability feature template sequence labeling
  • 相关文献

参考文献9

  • 1史树敏,王志强,周浪,等.基于条件随机域的中文命名实体识别[c]//中国中文信息学会.第三届学生计算语言学研讨会沦文集.北京,2006:446-449.
  • 2俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量:168
  • 3贾品贵,杨一平,卢朋.基于统计方法的中文姓名识别研究[J].计算机工程与应用,2006,42(31):168-170. 被引量:3
  • 4毛婷婷,李丽双,黄德根.基于混合模型的中国人名自动识别[J].中文信息学报,2007,21(2):22-28. 被引量:10
  • 5LAFFERTY J, MCCALLUM A, PEREIRA F. Conditional Random Fields:Probabilistic Models for Segmenting and Labeling Sequence Data[ C ]//Proceedings of 18th International Conference on Machine Learning. San Francisco : Morgan Kaufman,2001:282 - 289.
  • 6WALLACH H M. Conditional Random Fields: An Introduetion[ R ]. Pennsylvania: University of Pennsylvania.2004.
  • 7KLINGER R,TOMANEK K. Classical Probabilistic ModeLs and Con- ditional Random Fields [ R]. Dortmund: Dortmund University ,2007 : 1864 - 4503.
  • 8张祝玉,任飞亮,朱靖波.基于条件随机场的中文命名实体识别特征比较研究[C].见:第4届全国信息检索与内容安全学术会议论文集.2008.
  • 9冯元勇,孙乐,张大鲲,李文波.基于小规模尾字特征的中文命名实体识别研究[J].电子学报,2008,36(9):1833-1838. 被引量:27

二级参考文献37

共引文献193

同被引文献26

引证文献3

二级引证文献23

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部