最大熵和条件随机场模型相融合的藏文人名识别被引量：22

A Hybrid Approach to Tibetan Person Name Identification by Maximum Entropy Model and Conditional Random Fields

下载PDF

导出

摘要藏文人名识别是藏文信息处理领域研究的难点之一,其识别效果直接影响到藏文自动分词的精度和相关应用系统的性能,包括藏汉翻译、藏文信息检索、文本分类等。该文在分析藏文人名构成规律和特点的基础上,提出了一种最大熵和条件随机场相融合的藏文人名识别方法。实验表明,该方法可以获取较好的识别效果,在我们的测试集上F-测度值到达了93.08%。 Tibetan person name recognition is one of the most difficult tasks in the area of Tibetan information pro- cessing, with a direct impact on the precision of Tibetan word segmentation. Based on the analysis of wording rules and features of Tibetan names, this paper proposes a method combining maximum entropy and conditional random fields to identify Tibetan person names. The experiment shows that this approach works significant well reaching 93. 08% in Fl-measure.

作者加羊吉李亚超宗成庆于洪志

机构地区西北民族大学中国民族语言文字信息技术重点实验室中国科学院自动化研究所模式识别国家重点实验室

出处《中文信息学报》 CSCD 北大核心 2014年第1期107-112,共6页 Journal of Chinese Information Processing

基金国家自然基金重点项目(61032008) 西北民族大学中央高校基本科研业务费专项资金资助项目(ycx12003) 模式识别国家重点实验室开放课题(201001051)

关键词藏文人名识别最大熵条件随机场 Tibetan name identification maximum entropy conditional random fields

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1罗智勇,宋柔.现代汉语自动分词中专名的一体化、快速识别方法[C]//Ji Dong-Hong.国际中文电脑学术会议,新加坡,2001:323-328.
2郑家恒,李鑫,谭红叶.基于语料库的中文姓名识别方法研究[J].中文信息学报,2000,14(1):7-12. 被引量：43
3李中国,刘颖.边界模板和局部统计相结合的中国人名识别[J].中文信息学报,2006,20(5):44-50. 被引量：13
4张华平,刘群.基于角色标注的中国人名自动识别研究[J].计算机学报,2004,27(1):85-91. 被引量：104
5张素香,高国洋,戚银城.基于条件随机场的中国人名识别方法[J].郑州大学学报（理学版）,2009,41(2):40-43. 被引量：7
6毛婷婷,李丽双,黄德根.基于混合模型的中国人名自动识别[J].中文信息学报,2007,21(2):22-28. 被引量：10
7钱晶,张杰,张涛.基于最大熵的汉语人名地名识别方法研究[J].小型微型计算机系统,2006,27(9):1761-1765. 被引量：27
8贾宁,张全.基于最大熵模型和规则的中文姓名识别[J].计算机工程与应用,2007,43(35):1-4. 被引量：6
9尕藏卓玛.浅谈藏族人名的文化含义及其翻译原则[J].西北民族大学学报（哲学社会科学版）,2008(5):113-116. 被引量：4
10罗镭贾,宋柔,朱小杰.藏族人名汉译名识别研究[J].情报学报,2009,28(3):475-480. 被引量：3

二级参考文献47

1孙茂松,邹嘉彦.汉语自动分词研究中的苦干理论问题[J].语言文字应用,1995(4):40-46. 被引量：45
2郑家恒,刘开瑛.汉语姓名自动辨识初探[J].语言文字应用,1994(2):65-68. 被引量：4
3噶玛降村.藏族人名的佛教文化内涵[J].中国西藏,1998,0(3):42-43. 被引量：5
4季姮,罗振声.基于统计和规则的中文姓名自动辨识[J].语言文字应用,2001(1):14-18. 被引量：13
5孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：102
6王振华,孔祥龙,陆汝占,刘绍明.结合决策树方法的中文姓名识别[J].中文信息学报,2004,18(6):10-15. 被引量：16
7李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量：98
8罗智勇 ,宋柔 .一种基于可信度的人名识别方法[J].中文信息学报,2005,19(3):67-72. 被引量：20
9孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：88
10李中国,刘颖.边界模板和局部统计相结合的中国人名识别[J].中文信息学报,2006,20(5):44-50. 被引量：13

共引文献178

1成于思,施云涛.融合词典特征的Bi-LSTM-WCRF中文人名识别[J].中文信息学报,2020(4):69-76. 被引量：7
2宋凯丽,李云岭,姚露露.基于条件随机场的分词标注一体化地址解析方法[J].测绘地理信息,2021,46(S01):185-187. 被引量：5
3钱爱兵,江岚.基于改进TF-IDF的中文网页关键词抽取——以新闻网页为例[J].情报理论与实践,2008,31(6):945-950. 被引量：31
4张素香,高国洋,戚银城.基于条件随机场的中国人名识别方法[J].郑州大学学报（理学版）,2009,41(2):40-43. 被引量：7
5杨霞,黄陈英.基于HMM的中文姓名识别方法研究[J].硅谷,2009,2(3).
6罗安,王勇,张福浩,刘纪平.基于角色标注的中文POI名称语义分类方法[J].测绘通报,2012(S1):521-524. 被引量：4
7刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：202
8郑泽之,张普,杨建国.基于语料库的字母词语自动提取研究[J].中文信息学报,2005,19(2):78-85. 被引量：10
9罗智勇 ,宋柔 .一种基于可信度的人名识别方法[J].中文信息学报,2005,19(3):67-72. 被引量：20
10李成城,赵述芳,刘建毅,钟义信.基于动态规划算法的专有名词切分[J].计算机应用研究,2005,22(7):78-80. 被引量：2

同被引文献162

1李永宏,孔江平,于洪志.藏语文-音自动规则转换及其实现[J].清华大学学报（自然科学版）,2008,48(S1):621-626. 被引量：20
2尼玛扎西,李志蜀,群诺,普顿,拥措,陈安龙.一种在移动电话上实现藏文处理的方法[J].四川大学学报（工程科学版）,2009,41(1):162-167. 被引量：9
3张素香,高国洋,戚银城.基于条件随机场的中国人名识别方法[J].郑州大学学报（理学版）,2009,41(2):40-43. 被引量：7
4索南尖措.藏语动词的黏着性及屈折性变化研究[J].西藏大学学报（社会科学版）,2013,28(4):70-75. 被引量：3
5德吉梅朵.面向藏语语料库建设的数量词的分类研究[J].剑南文学（经典教苑）（下）,2013(1):228-229. 被引量：1
6王维兰,陈万军.藏文字丁、音节频度及其信息熵[J].术语标准化与信息技术,2004(2):27-31. 被引量：17
7罗圣仪,江虹.藏文轻印刷系统[J].计算机世界月刊,1993(7):73-73. 被引量：2
8高定国,龚育昌.现代藏字全集的属性统计研究[J].中文信息学报,2005,19(1):71-75. 被引量：35
9扎西次仁.藏文的排序规则及其计算机自动排序的实现[J].中国藏学,1999(4):128-135. 被引量：16
10车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：122

引证文献22

1江涛,江静,戴玉刚,李艾林.藏文舆情云分析系统平台研究[J].信息网络安全,2014(9):92-94. 被引量：1
2邹后孝.基于词语级的藏语显示情感句的情感分析与研究[J].网友世界,2014,0(17):317-317.
3马宁,李亚超,于槐,加羊吉.面向互联网的藏文实体关系模板获取技术研究[J].中央民族大学学报（自然科学版）,2015,24(1):35-39. 被引量：1
4朱臻,孙媛.基于SVM和泛化模板协作的藏语人物属性抽取[J].中文信息学报,2015,29(6):220-227. 被引量：8
5珠杰,李天瑞,刘胜久.基于条件随机场的藏文人名识别技术研究[J].南京大学学报（自然科学版）,2016,52(2):289-299. 被引量：16
6张义,李治江.基于高斯词长特征的中文分词方法[J].中文信息学报,2016,30(5):89-93. 被引量：3
7加羊吉,李亚超,于洪志.CRF与规则相结合的藏文人名识别方法[J].西北民族大学学报（自然科学版）,2016,37(3):41-45. 被引量：2
8珠杰,李天瑞.深度学习模型的藏文人名识别方法[J].高原科学研究,2017,1(1):112-124. 被引量：11
9高定国.藏文信息处理研究进展[J].广西科学院学报,2018,34(1):1-11. 被引量：10
10兰义湧,龙从军,赵小兵.基于条件随机场的藏文人名识别研究[J].中央民族大学学报（自然科学版）,2018,27(1):34-40. 被引量：2

二级引证文献99

1马进,杨一帆,陈文亮.基于远程监督的人物属性抽取研究[J].中文信息学报,2020(6):64-72. 被引量：13
2张有礼.在西医病房会诊的体会[J].中医杂志,2000,41(4):212-213.
3夏天赐,孙媛.基于联合模型的藏文实体关系抽取方法研究[J].中文信息学报,2018,32(12):76-83. 被引量：13
4李娜.基于条件随机场的方志古籍别名自动抽取模型构建[J].中文信息学报,2018,32(11):41-48. 被引量：30
5胡刚,王嘉梅,李炳泽,林睿,林碧彤.汉英-泰互译有声语料的数据库研究[J].计算机系统应用,2016,25(9):223-229. 被引量：1
6高定国.藏文信息处理研究进展[J].广西科学院学报,2018,34(1):1-11. 被引量：10
7瞿珊珊,周晓光.面向流域水资源自由文本的属性抽取方法[J].情报探索,2018(5):63-67.
8唐慧慧,王昊,张紫玄,王雪颖.基于汉字标注的中文历史事件名抽取研究[J].数据分析与知识发现,2018,2(7):89-100. 被引量：8
9官却多杰,关白.计算机识别藏文音节构件的方法研究[J].现代电子技术,2017,40(10):24-27.
10张瑞.藏文在线评论情感分析研究综述[J].智库时代,2018(35):206-208. 被引量：2

1加羊吉,李亚超,于洪志.CRF与规则相结合的藏文人名识别方法[J].西北民族大学学报（自然科学版）,2016,37(3):41-45. 被引量：2
2娘本先,安见才让.藏文人名自动识别研究[J].电子技术与软件工程,2015(19):115-116. 被引量：2
3珠杰,李天瑞,刘胜久.基于条件随机场的藏文人名识别技术研究[J].南京大学学报（自然科学版）,2016,52(2):289-299. 被引量：16
4康才畯,龙从军,江荻.基于条件随机场的藏文人名识别研究[J].计算机工程与应用,2015,51(3):109-111. 被引量：10
5窦嵘,加羊吉,黄伟.统计与规则相结合的藏文人名自动识别研究[J].长春工程学院学报（自然科学版）,2010,11(2):113-115. 被引量：10
6普措才仁,蔡光波.基于Android+SQLite藏汉电子词典应用软件的设计与实现[J].西北民族大学学报（自然科学版）,2016,37(2):17-24. 被引量：4
7加日拉·买买提热衣木,吐尔根·依布拉音,艾山·吾买尔.基于统计和规则混合策略的维吾尔人名识别研究[J].新疆大学学报（自然科学版）,2014,31(3):319-324. 被引量：10
8和雪娟,陈玉华,高丽金,夏幼明.基于统计和规则混合策略的中国人名识别研究[J].云南民族大学学报（自然科学版）,2009,18(1):70-72. 被引量：2

中文信息学报

2014年第1期

浏览历史

内容加载中请稍等...

最大熵和条件随机场模型相融合的藏文人名识别被引量：22

参考文献10

二级参考文献47

共引文献178

同被引文献162

引证文献22

二级引证文献99

相关作者

相关机构

相关主题

浏览历史

最大熵和条件随机场模型相融合的藏文人名识别 被引量：22

参考文献10

二级参考文献47

共引文献178

同被引文献162

引证文献22

二级引证文献99

相关作者

相关机构

相关主题

浏览历史

最大熵和条件随机场模型相融合的藏文人名识别被引量：22