期刊文献+

藏族人名汉译名识别研究 被引量:3

Research on Recognition of Tibetan Names
在线阅读 下载PDF
导出
摘要 藏族人名汉译名识别属于人名识别的范畴,但现有的人名识别方法并不能完全切合藏族人名命名特点:藏族人名具有浓厚的宗教文化内涵,字(串)特征和内部构成复杂 其次,藏族人名中含有大量高频单字,使得藏族人名和普通词语之间歧义冲突变得十分突出,同时也使得藏族人名和上下文之间的边界变得非常模糊。本文在大规模藏族人名实例和语料库调查基础上,统计分析了藏族人名的用字(串)特征,并构建了藏族人名属性特征库 通过藏族人名的命名规则及属性特征将藏族人名形式化表示,实现了藏族人名汉译名自动识别系统。真实语料库开放测试F值达到87.12%。 Though recognition of Tibetan names is a kind of person-name recognition, current method for recognition of person-names isn't fit to the characters of Tibetan names: Tibetan names have strong religious and cultural meaning, which results in complicated character (string) features and internal structure of Tibetan names; Secondly, Tibetan names contain a lot of frequent single-character words, which makes the ambiguous conflict more outstanding between names and common words, and blurs the border around the Tibetan names. In this paper, we analysis the attributes of Tibetan names, and make full use of these statistics attributes to build a attributes library; then we build automatic identification system for Tibetan names according to the naming hales and attributes. Test on large scale real corpus shows that the system archives 87.12% for F-measure.
出处 《情报学报》 CSSCI 北大核心 2009年第3期475-480,共6页 Journal of the China Society for Scientific and Technical Information
基金 基金项目:本文得到国家自然科学基金(60572159)、教育部科学技术研究重点项目(107017)的资助.
关键词 藏族人名识别 未登录词 可信度 自动分词 recognition of Tibetan names, out-of-vocabulary words, reliability, segmentation
  • 相关文献

参考文献4

二级参考文献12

共引文献147

同被引文献26

  • 1张素香,高国洋,戚银城.基于条件随机场的中国人名识别方法[J].郑州大学学报(理学版),2009,41(2):40-43. 被引量:7
  • 2钱晶,张杰,张涛.基于最大熵的汉语人名地名识别方法研究[J].小型微型计算机系统,2006,27(9):1761-1765. 被引量:27
  • 3李中国,刘颖.边界模板和局部统计相结合的中国人名识别[J].中文信息学报,2006,20(5):44-50. 被引量:13
  • 4毛婷婷,李丽双,黄德根.基于混合模型的中国人名自动识别[J].中文信息学报,2007,21(2):22-28. 被引量:10
  • 5罗智勇,宋柔.现代汉语自动分词中专名的一体化、快速识别方法[C]//Ji Dong-Hong.国际中文电脑学术会议,新加坡,2001:323-328.
  • 6孙萌,刘群等.基于判别式分类和重排序技术的藏文分词[c]//第十二届全国少数民族语言文字信息处理学术研讨会论文集,2011.
  • 7Collins M.Discriminative training methods for hidden mar- kov models:theory and experiments with perceptron algo- rithms[C]//Proceedings of the Empirical Methods in Nat- ural Language Processing Conference,Philadelphia,Amer- ica,2002 : 1-8.
  • 8McDonald R, Pereira F, Online learning of approximate dependency parsing algorithms[C]//Proceedings of EACL, 2006:81-88.
  • 9Collins M,Roark B.Incremental parsing with the percep- tron algorithm[C]//Proc ACL,2004.
  • 10KoehnP统计机器翻译[M].宗成庆,张霄军,译.北京:电子工业出版社,2012.

引证文献3

二级引证文献51

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部