面向复杂形态语言机器翻译的多模型融合词性标注研究被引量：1

Research on Multi-Models Combined Part-Of-Speech Tagging for Machine Translation Between Languages with Complex Morphology

下载PDF

导出

摘要针对维汉机器翻译中所存在的效率低下以及数据稀疏等问题,本文提出一种多模型融合的词性标注方法。该方法在维吾尔语浅层形态分析的基础上,结合渐进标注模型(Progressive POS,PPOS)对噪音数据的过滤能力及泛化标注模型(Generalize POS,GPOS)的泛化表示能力,对维吾尔语进行词性标注。实验证明,使用该方法进行维吾尔语词性标注,其标注效果已接近实用。 For the Inefficient and data sparse in Uyghur Part-Of-Speech（ POS） tagging,this paper presents a tagging method that merged multi-models. The tagging method based on the shallow morphological analysis of Uyghur,and combined the noise data filtering capability of the Progressive Part-Of-Speech model and generalization capability of the Generalize POS model. Experiments show that with the tagging method mentioned above,the quality of Uyghur Part-Of-Speech tagging is closing to the practical.

作者李晓蒋同海周喜王磊杨雅婷

机构地区中国科学院新疆理化技术研究所

出处《网络新媒体技术》 2014年第1期60-64,共5页 Network New Media Technology

基金中国科学院战略性先导科技专项课题"新疆少数民族信息处理"(课题编号:XDA06030400)

关键词维汉机器翻译维吾尔语词性标注感知器算法泛化复杂形态语言 Uyghur-Chinese machine translation Part-Of-Speech tagging of Uyghur perceptron algorithm generalization lan-guage with complex morphology

分类号 TP391.2 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1玉素甫.艾白都拉.维语句法分析器中的词义排歧问题的研究[J].计算机应用与软件,2002,19(4):59-62. 被引量：11
2早克热.卡德尔,艾山.吾买尔,吐尔根.依布拉音,帕里旦.吐尔逊,吴小川.混合策略的维吾尔语名词词干提取系统[J].计算机工程与应用,2013,49(1):171-175. 被引量：11
3古丽拉.阿东别克,米吉提.阿布力米提.维吾尔语词切分方法初探[J].中文信息学报,2004,18(6):61-65. 被引量：39

二级参考文献7

1力提甫.托乎提.电脑处理维吾尔语语音和谐律的可能性[J].中央民族大学学报（哲学社会科学版）,2004,31(5):108-113. 被引量：15
2易斌.现代维吾尔语元音格局分析[J].新疆大学学报（哲学社会科学版）,2006,34(1):141-144. 被引量：9
3阿依克孜.卡德尔,开沙尔.卡德尔,吐尔根.依布拉音.面向自然语言信息处理的维吾尔语名词形态分析研究[J].中文信息学报,2006,20(3):43-48. 被引量：24
4Gulila·Adongbieke. The Research of Proofreading for the Uighur Character [A],The 2001 IEEE International Conference on System, Man and Cybernetics (SMC2001)[C], 2001.10.7 - . 10.10, Tucson, Arizona ,U.S.A,P874- 876.
5玉素甫.艾白都拉,吾守尔.斯拉木,赛依提.阿不都拉.维语词法分析器研究成功[J].中文信息,1997,14(4):31-35. 被引量：5
6米热古丽.艾力,米吉提.阿不力米提,艾斯卡尔.艾木都拉.基于词法分析的维吾尔语元音弱化算法研究[J].中文信息学报,2008,22(4):43-47. 被引量：17
7玉素甫.艾白都拉,吾守尔.斯拉木.维语中心语驱动文法句法分析器中的上下文相关处理[J].计算机应用与软件,1999,16(6):22-25. 被引量：12

共引文献51

1玉素甫.艾白都拉,阿布都热依木.沙力.现代维语语料库的词类标注研究[J].民族语文,2005(4):63-66. 被引量：7
2许日俊,刘昌平.印刷体朝鲜文字符中字母的分割与识别研究[J].中文信息学报,2006,20(2):66-71. 被引量：2
3阿依克孜.卡德尔,开沙尔.卡德尔,吐尔根.依布拉音.面向自然语言信息处理的维吾尔语名词形态分析研究[J].中文信息学报,2006,20(3):43-48. 被引量：24
4赛麦提.麦麦提明.现代维吾尔语同形词词性自动标注探析[J].语言与翻译,2006(3):35-38. 被引量：1
5卢有飞,张伟,张岩,缪成,李春.维文版Office设计中关键技术的研究与实现[J].中文信息学报,2007,21(2):112-116. 被引量：7
6赵永进,郭大庆,卢有飞,李英凡.维文软件中排版关键技术的研究与实现[J].计算机工程与应用,2007,43(22):106-108. 被引量：8
7张伟,任大明,许晓辉,赵凡,张岩.维、哈、柯文显示及排版技术研究[J].计算机应用研究,2008,25(3):836-838. 被引量：4
8阿孜古丽.夏力甫.维吾尔语动词附加语素的复杂特征研究[J].中文信息学报,2008,22(3):105-109. 被引量：8
9玛依热.依布拉音,米吉提.阿不里米提,艾斯卡尔.艾木都拉.基于最小编辑距离的维语词语检错与纠错研究[J].中文信息学报,2008,22(3):110-114. 被引量：11
10米热古丽.艾力,米吉提.阿不力米提,艾斯卡尔.艾木都拉.基于词法分析的维吾尔语元音弱化算法研究[J].中文信息学报,2008,22(4):43-47. 被引量：17

同被引文献2

1李晓,蒋同海,周喜,王磊,杨雅婷.维汉机器翻译关键技术研究概述[J].网络新媒体技术,2016,5(1):19-25. 被引量：2
2张丽林,李茂西,肖文艳,万剑怡,王明文.机器翻译自动评价中领域知识复述抽取研究[J].北京大学学报（自然科学版）,2017,53(2):230-238. 被引量：9

引证文献1

1王亚娟,李晓,杨雅婷,米成刚.基于释义信息的维汉机器翻译系统融合研究[J].计算机工程,2019,45(4):288-295. 被引量：7

二级引证文献7

1霍小静.人工智能理论的机器自动翻译系统[J].微型电脑应用,2020,36(11):77-79. 被引量：3
2祁伟,牛欢,肖蕾.基于大数据分析的网络多语言及时翻译系统设计[J].现代电子技术,2021,44(22):154-158. 被引量：8
3李静.基于人工智能技术的计算机辅助翻译软件设计[J].信息技术与信息化,2022(3):70-73. 被引量：8
4赵崇俊.基于CNN的英语机器翻译微小误差检测系统设计[J].自动化与仪器仪表,2022(4):210-213. 被引量：5
5陈瑞.基于人机交互增强算法的英语机器翻译系统设计[J].自动化与仪器仪表,2022(4):223-226. 被引量：6
6段仁翀,段湘煜.基于适应性训练与丢弃机制的神经机器翻译[J].计算机工程,2023,49(10):120-126. 被引量：2
7汪斐,马发民.基于云计算架构的在线外语翻译系统[J].信息技术,2023,47(12):57-61. 被引量：2

1李萍,杨勇,赛买提.艾力,任鸽.基于HMM的维吾尔语词性标注研究[J].现代计算机,2017,23(5):11-14. 被引量：1
2帕提古力.依马木,买合木提.买买提,吐尔根.依布拉音,卡哈尔江.阿比的热西提.基于感知器算法的维吾尔语词性标注研究[J].中文信息学报,2014,28(5):187-191. 被引量：4
3Carol Levin,伍颖文.驯服文本猛虎[J].个人电脑,1995,0(9):8-8.
4尼加提·纳吉米,买合木提·买买提,吐尔根·依布拉音.基于N元模型的维吾尔语词性标注实验研究[J].计算机工程与应用,2012,48(25):137-140. 被引量：2
5王海波,祖漪清,力提甫.托乎提.基于功能词缀串的维吾尔语词性标注方法[J].中文信息学报,2013,27(5):179-183. 被引量：8
6帕力旦.吐尔逊,房鼎益.融合形态特征的最大熵维吾尔语词性标注[J].西北大学学报（自然科学版）,2015,45(5):721-726. 被引量：1
7郑雅心.汉字对有声语言二次创作中情感色彩的影响[J].西部广播电视,2013,34(08X):28-29.
8刘婷,郭志刚.基于WEB的网络管理方案[J].通讯世界,2001,7(1):53-54. 被引量：3
9陈鹏,古丽拉.阿东别克.隐马尔可夫模型在维吾尔语词性标注中的应用[J].电脑知识与技术,2006,1(4):127-128. 被引量：1
10李闽.二进制文件在数据库中的保存[J].电脑知识与技术,2012,8(6X):4410-4411.

网络新媒体技术

2014年第1期

浏览历史

内容加载中请稍等...

面向复杂形态语言机器翻译的多模型融合词性标注研究被引量：1

参考文献3

二级参考文献7

共引文献51

同被引文献2

引证文献1

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

面向复杂形态语言机器翻译的多模型融合词性标注研究 被引量：1

参考文献3

二级参考文献7

共引文献51

同被引文献2

引证文献1

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

面向复杂形态语言机器翻译的多模型融合词性标注研究被引量：1