期刊文献+

藏文数词识别与翻译 被引量:7

Tibetan Number Identification and Translation
在线阅读 下载PDF
导出
摘要 通过对藏文数词内部构词规律及外部边界信息进行分析,提出对藏文数词基本构件定义的方案。采取最优路径决策模型判断数词构件边界,然后通过有限自动机模型识别并翻译基本数词,最后用模板匹配算法处理复杂数词。结果表明,提出的方法对数词识别与翻译的F值达到98.73%,在藏汉机器翻译的测试集上的BLEU提高了2.64%。 The authors propose a definition of Tibetan number basic component through analyzing the inner structure and the boundary information. A best path decision was applied in judging basic component, then the number was recognized and translated by a finite automation model, finally a template matching algorithm was used for processing complicated number. The F-score of identification and translation is 98.73% and the BLEU score of Tibetan-Chinese translation obtains an improvement of 2.64%.
出处 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第1期75-80,共6页 Acta Scientiarum Naturalium Universitatis Pekinensis
基金 863计划(2011AA01A207)资助
关键词 藏文 数词基本构件 自动机 数词识别 数词翻译 Tibetan number basic component automation number indentification number translation
  • 相关文献

参考文献8

  • 1陈玉忠,李保利,俞士汶.藏文自动分词系统的设计与实现[J].中文信息学报,2003,17(3):15-20. 被引量:53
  • 2才智杰.藏文自动分词系统中紧缩词的识别[J].中文信息学报,2009,23(1):35-37. 被引量:74
  • 3Sun Yuan, Yan Xiaodong, Zhao Xiaobing, et al. Aresolution of overlapping ambiguity in Tibetan word segmentation // Proceedings of the 3rd International Conference on Computer Science and Information Technology. Chengdu, 2010:222-225.
  • 4刘汇丹,诺明花,赵维纳,吴健,贺也平.SegT:一个实用的藏文分词系统[J].中文信息学报,2012,26(1):97-103. 被引量:27
  • 5Liu Huidan, Nuo Minghua, Ma Longlong, et al. Tibetan Word segmentation as syllable tagging using conditional random fields // Proceedings of the 25th Pacific Asia Conference on Language, Information and Computation. Singapore, 2011 : 168-177.
  • 6高定国,关白.回顾藏文信息处理技术的发展[J].西藏大学学报(社会科学版),2009,24(3):18-27. 被引量:17
  • 7Liu Huidan, Zhao Weina, Nuo Minghua, et al. Tibetan number identification based on classification of number components in Tibetan word segmentation // Proceedings of the 23rd International Conference on Computational Linguistics. Beijing, 2010:719-724.
  • 8Chiang D. Hierarchical phrase-based translation. Computational Linguistics, 2007, 33:201-228.

二级参考文献62

共引文献131

同被引文献117

引证文献7

二级引证文献79

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部