期刊文献+

最大熵和条件随机场模型相融合的藏文人名识别 被引量:22

A Hybrid Approach to Tibetan Person Name Identification by Maximum Entropy Model and Conditional Random Fields
在线阅读 下载PDF
导出
摘要 藏文人名识别是藏文信息处理领域研究的难点之一,其识别效果直接影响到藏文自动分词的精度和相关应用系统的性能,包括藏汉翻译、藏文信息检索、文本分类等。该文在分析藏文人名构成规律和特点的基础上,提出了一种最大熵和条件随机场相融合的藏文人名识别方法。实验表明,该方法可以获取较好的识别效果,在我们的测试集上F-测度值到达了93.08%。 Tibetan person name recognition is one of the most difficult tasks in the area of Tibetan information pro- cessing, with a direct impact on the precision of Tibetan word segmentation. Based on the analysis of wording rules and features of Tibetan names, this paper proposes a method combining maximum entropy and conditional random fields to identify Tibetan person names. The experiment shows that this approach works significant well reaching 93. 08% in Fl-measure.
出处 《中文信息学报》 CSCD 北大核心 2014年第1期107-112,共6页 Journal of Chinese Information Processing
基金 国家自然基金重点项目(61032008) 西北民族大学中央高校基本科研业务费专项资金资助项目(ycx12003) 模式识别国家重点实验室开放课题(201001051)
关键词 藏文人名识别 最大熵 条件随机场 Tibetan name identification maximum entropy conditional random fields
  • 相关文献

参考文献10

二级参考文献47

共引文献178

同被引文献162

引证文献22

二级引证文献99

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部