藏文数词识别与翻译被引量：7

Tibetan Number Identification and Translation

下载PDF

导出

摘要通过对藏文数词内部构词规律及外部边界信息进行分析,提出对藏文数词基本构件定义的方案。采取最优路径决策模型判断数词构件边界,然后通过有限自动机模型识别并翻译基本数词,最后用模板匹配算法处理复杂数词。结果表明,提出的方法对数词识别与翻译的F值达到98.73%,在藏汉机器翻译的测试集上的BLEU提高了2.64%。 The authors propose a definition of Tibetan number basic component through analyzing the inner structure and the boundary information. A best path decision was applied in judging basic component, then the number was recognized and translated by a finite automation model, finally a template matching algorithm was used for processing complicated number. The F-score of identification and translation is 98.73% and the BLEU score of Tibetan-Chinese translation obtains an improvement of 2.64%.

作者孙萌华却才让刘凯吕雅娟刘群

机构地区中国科学院计算技术研究所中国科学院研究生院青海师范大学藏文信息研究中心

出处《北京大学学报（自然科学版）》 EI CAS CSCD 北大核心 2013年第1期75-80,共6页 Acta Scientiarum Naturalium Universitatis Pekinensis

基金 863计划(2011AA01A207)资助

关键词藏文数词基本构件自动机数词识别数词翻译 Tibetan number basic component automation number indentification number translation

分类号 TP391.2 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1陈玉忠,李保利,俞士汶.藏文自动分词系统的设计与实现[J].中文信息学报,2003,17(3):15-20. 被引量：53
2才智杰.藏文自动分词系统中紧缩词的识别[J].中文信息学报,2009,23(1):35-37. 被引量：74
3Sun Yuan, Yan Xiaodong, Zhao Xiaobing, et al. Aresolution of overlapping ambiguity in Tibetan word segmentation // Proceedings of the 3rd International Conference on Computer Science and Information Technology. Chengdu, 2010:222-225.
4刘汇丹,诺明花,赵维纳,吴健,贺也平.SegT:一个实用的藏文分词系统[J].中文信息学报,2012,26(1):97-103. 被引量：27
5Liu Huidan, Nuo Minghua, Ma Longlong, et al. Tibetan Word segmentation as syllable tagging using conditional random fields // Proceedings of the 25th Pacific Asia Conference on Language, Information and Computation. Singapore, 2011 : 168-177.
6高定国,关白.回顾藏文信息处理技术的发展[J].西藏大学学报（社会科学版）,2009,24(3):18-27. 被引量：17
7Liu Huidan, Zhao Weina, Nuo Minghua, et al. Tibetan number identification based on classification of number components in Tibetan word segmentation // Proceedings of the 23rd International Conference on Computational Linguistics. Beijing, 2010:719-724.
8Chiang D. Hierarchical phrase-based translation. Computational Linguistics, 2007, 33:201-228.

二级参考文献62

1李永宏,孔江平,于洪志.藏语文-音自动规则转换及其实现[J].清华大学学报（自然科学版）,2008,48(S1):621-626. 被引量：20
2尼玛扎西,李志蜀,群诺,普顿,拥措,陈安龙.一种在移动电话上实现藏文处理的方法[J].四川大学学报（工程科学版）,2009,41(1):162-167. 被引量：9
3陈小荷.自动分词中未登录词问题的一揽子解决方案[J].语言文字应用,1999(3):103-109. 被引量：26
4王华,丁晓青.一种多字体印刷藏文字符的归一化方法[J].计算机应用研究,2004,21(6):41-43. 被引量：10
5王维兰,陈万军.藏文字丁、音节频度及其信息熵[J].术语标准化与信息技术,2004(2):27-31. 被引量：17
6罗圣仪,江虹.藏文轻印刷系统[J].计算机世界月刊,1993(7):73-73. 被引量：2
7祁坤钰.《机器翻译用现代藏语语义词典》的设计研究[J].西北民族大学学报（自然科学版）,2004,25(3):33-37. 被引量：8
8高定国,龚育昌.现代藏字全集的属性统计研究[J].中文信息学报,2005,19(1):71-75. 被引量：35
9扎西次仁.藏文的排序规则及其计算机自动排序的实现[J].中国藏学,1999(4):128-135. 被引量：16
10才智杰.藏汉英电子词典的开发研究[J].青海师范大学学报（自然科学版）,2005,21(2):48-50. 被引量：8

共引文献131

1华林,陈燕,刘凌慧子.藏族记忆构建视域下藏族档案数字资源跨业界整合研究[J].西藏民族大学学报（哲学社会科学版）,2021,42(2):52-60. 被引量：11
2尼玛扎西,李志蜀,群诺,普顿,拥措,陈安龙.一种在移动电话上实现藏文处理的方法[J].四川大学学报（工程科学版）,2009,41(1):162-167. 被引量：9
3多拉.藏语语义理解中功能性虚词研究[J].西藏大学学报（社会科学版）,2011,26(4):106-112. 被引量：4
4才华.基于小字符集的藏文自动分词技术研究[J].西藏大学学报（社会科学版）,2013,28(5):43-47. 被引量：3
5文庭孝,邱均平,侯经川.汉语自动分词研究展望[J].现代图书情报技术,2004(7):6-10. 被引量：20
6文庭孝,侯经川,邱均平,张洋.汉语自动分词新思维:无词典切分[J].情报杂志,2005,24(2):2-4. 被引量：2
7邱均平,文庭孝,周黎明.汉语自动分词与内容分析法研究[J].情报学报,2005,24(3):309-317. 被引量：11
8刘晓英.汉语自动分词研究的发展趋势[J].高校图书馆工作,2005,25(4):25-28. 被引量：4
9文庭孝.汉语自动分词研究进展[J].图书与情报,2005(5):54-63. 被引量：20
10陈丽娜,祁坤钰,贾彦民,吴健,康丽.藏文拉丁转写的研究与实现[J].计算机工程与设计,2006,27(1):15-17. 被引量：13

同被引文献117

1李永宏,孔江平,于洪志.藏语文-音自动规则转换及其实现[J].清华大学学报（自然科学版）,2008,48(S1):621-626. 被引量：20
2尼玛扎西,李志蜀,群诺,普顿,拥措,陈安龙.一种在移动电话上实现藏文处理的方法[J].四川大学学报（工程科学版）,2009,41(1):162-167. 被引量：9
3索南尖措.藏语动词的黏着性及屈折性变化研究[J].西藏大学学报（社会科学版）,2013,28(4):70-75. 被引量：2
4德吉梅朵.面向藏语语料库建设的数量词的分类研究[J].剑南文学（经典教苑）（下）,2013(1):228-229. 被引量：1
5王维兰,陈万军.藏文字丁、音节频度及其信息熵[J].术语标准化与信息技术,2004(2):27-31. 被引量：17
6罗圣仪,江虹.藏文轻印刷系统[J].计算机世界月刊,1993(7):73-73. 被引量：2
7高定国,龚育昌.现代藏字全集的属性统计研究[J].中文信息学报,2005,19(1):71-75. 被引量：35
8扎西次仁.藏文的排序规则及其计算机自动排序的实现[J].中国藏学,1999(4):128-135. 被引量：16
9江荻,董颖红.藏字叠加结构线性处理统计分析[J].中文信息,1994,11(4):44-46. 被引量：11
10彭寿全,黄可,万国根,袁文君.外挂式藏汉英混合处理系统[J].中文信息学报,1994,8(2):47-53. 被引量：3

引证文献7

1华却才让,姜文斌,赵海兴,刘群.基于感知机模型藏文命名实体识别[J].计算机工程与应用,2014,50(15):172-176. 被引量：31
2张磊,杨雅婷,米成刚,李晓.维吾尔语数词类命名实体的识别与翻译[J].计算机应用与软件,2015,32(8):64-67. 被引量：6
3珠杰,李天瑞,刘胜久.基于条件随机场的藏文人名识别技术研究[J].南京大学学报（自然科学版）,2016,52(2):289-299. 被引量：16
4李亚超,熊德意,张民,江静,马宁,殷建民.藏汉神经网络机器翻译研究[J].中文信息学报,2017,31(6):103-109. 被引量：17
5高定国.藏文信息处理研究进展[J].广西科学院学报,2018,34(1):1-11. 被引量：9
6夏吾吉,华却才让.基于有限状态自动机阿拉伯数字与藏文数词自动翻译[J].计算机工程与科学,2018,40(3):550-554. 被引量：5
7夏吾吉,色差甲,扎西吉,贡保才让,华却才让.基于卷积神经网络的藏文手写数字识别[J].现代电子技术,2019,42(5):79-82. 被引量：5

二级引证文献79

1张有礼.在西医病房会诊的体会[J].中医杂志,2000,41(4):212-213.
2夏天赐,孙媛.基于联合模型的藏文实体关系抽取方法研究[J].中文信息学报,2018,32(12):76-83. 被引量：12
3李娜.基于条件随机场的方志古籍别名自动抽取模型构建[J].中文信息学报,2018,32(11):41-48. 被引量：30
4张海军.维吾尔语短语自动抽取研究进展[J].计算机科学与探索,2015,9(12):1420-1429. 被引量：3
5珠杰,李天瑞,刘胜久.基于条件随机场的藏文人名识别技术研究[J].南京大学学报（自然科学版）,2016,52(2):289-299. 被引量：16
6加羊吉,李亚超,于洪志.CRF与规则相结合的藏文人名识别方法[J].西北民族大学学报（自然科学版）,2016,37(3):41-45. 被引量：2
7阿依古丽·哈力克,艾山·吾买尔,吐尔根·伊布拉音,卡哈尔江·阿比的热西提,买合木提·买买提.汉维时间数字和量词的识别与翻译研究[J].中文信息学报,2016,30(6):190-200. 被引量：8
8夏吾吉,华却才让,色差甲,贡保才让,扎西吉.融合藏族人名音节特征的性别自动识别[J].西北民族大学学报（自然科学版）,2017,38(3):1-5. 被引量：3
9珠杰,李天瑞.深度学习模型的藏文人名识别方法[J].高原科学研究,2017,1(1):112-124. 被引量：11
10高定国.藏文信息处理研究进展[J].广西科学院学报,2018,34(1):1-11. 被引量：9

1完么扎西,尼玛扎西.藏语自动分词中的数词识别方法研究[J].西藏大学学报（社会科学版）,2015,30(5):96-104. 被引量：1
2徐涛,冷淑霞,刘正东.Internet实时浏览翻译系统中数字和数词的识别技术[J].山东理工大学学报（自然科学版）,2003,17(4):54-57. 被引量：1
3刘培培,章勇,邵振.基于Pi演算的构件模型研究[J].计算机与网络,2012,38(21):48-50.
4郭宏蕾,姚天顺.数词的语义结构及通用翻译算法[J].中文信息学报,1996,10(4):60-65. 被引量：3
5乌丹牧其尔,王斯日古楞.蒙汉机器翻译中的数词自动翻译研究[J].内蒙古师范大学学报（自然科学汉文版）,2015,44(3):368-371. 被引量：2
6邹炜,孙家骕,孙艳春.青鸟网上构件库系统的访问控制机制[J].软件学报,2002,13(1):92-98. 被引量：5
7约尔尼萨.吾不力卡司木,玉素甫.艾白都拉.基于最小编辑距离和词汇库的维吾尔语文本校对系统的设计与算法实现[J].信息与电脑（理论版）,2013(6):43-44. 被引量：1
8王磊,黄河笑,吴兵,郑任儿.基于主题与三支决策的文本情感分析[J].计算机科学,2015,42(6):93-96. 被引量：11
9陈少达,夏士雄,王志晓.基于改进谱聚类的提升机故障诊断算法[J].计算机工程与设计,2015,36(12):3241-3245. 被引量：3
10何嫣.西班牙语创造新词的方法[J].清远职业技术学院学报,2013,6(6):114-116. 被引量：1

北京大学学报（自然科学版）

2013年第1期

浏览历史

内容加载中请稍等...

藏文数词识别与翻译被引量：7

参考文献8

二级参考文献62

共引文献131

同被引文献117

引证文献7

二级引证文献79

相关作者

相关机构

相关主题

浏览历史

藏文数词识别与翻译 被引量：7

参考文献8

二级参考文献62

共引文献131

同被引文献117

引证文献7

二级引证文献79

相关作者

相关机构

相关主题

浏览历史

藏文数词识别与翻译被引量：7