利用地名用字分析的中文地名识别处理被引量：7

Chinese place name identification with Chinese characters features

下载PDF

导出

摘要对中文地名未登录词识别而言,首先充分挖掘地名用字本身的特征,及其上下文用字的特征,其次通过最大熵模型把这些来源不同的知识整合。在特征选择和知识获取时,通过对中文地名这个特定群体进行针对性分析,得到了更多的信息,如中文地名更常用哪些字以及这些字如何搭配更常见等。最终使得系统在真实语料的封闭测试和开放测试中分别达到了F值87%和83%的较好效果。 This paper extracts the features from the Chinese place names and their context firstly,and then aggregates differernt features from different sources.Before setting feature functions,more information has been received by analyzing the Chinese characters features.This paper focuses on characters which are used frequently and how these characters matching with each other.Finally,it achieves an acceptable result by open test on real corpus.

作者李诺张全

机构地区中国科学院研究生院中国科学院声学研究所

出处《计算机工程与应用》 CSCD 北大核心 2009年第28期230-232,共3页 Computer Engineering and Applications

基金国家重点基础研究发展规划(973)No2004CB318104 中科院声学所知识创新工程项目(No0654091431) 中国科学院声学研究所"所长择优基金"(NoGS13SJJ04) 中国科学院青年人才领域前沿项目(NoO754021432)~~

关键词中文地名识别地名用字分析最大熵 placename recognition analysis of placename maximum entropy

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1钱晶,张杰,张涛.基于最大熵的汉语人名地名识别方法研究[J].小型微型计算机系统,2006,27(9):1761-1765. 被引量：27
2欧嘉致,陈凯江,李宗葛.基于NN/HMM混合模型的汉语地名识别系统[J].计算机工程与应用,2002,38(23):220-222. 被引量：4
3黄德根,岳广玲,杨元生.基于统计的中文地名识别[J].中文信息学报,2003,17(2):36-41. 被引量：49
4李丽双,黄德根,陈春荣,杨元生.SVM与规则相结合的中文地名自动识别[J].中文信息学报,2006,20(5):51-57. 被引量：32
5高红,黄德根,杨元生.汉语自动分词中中文地名识别[J].大连理工大学学报,2006,46(4):576-581. 被引量：10

二级参考文献28

1王振华,孔祥龙,陆汝占,刘绍明.结合决策树方法的中文姓名识别[J].中文信息学报,2004,18(6):10-15. 被引量：16
2李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量：98
3孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：88
4沈达阳孙茂松黄昌宁.中文地名的自动识别[A]..计算语言学进展与应用[C].北京:清华大学出版社,1995..
5沈达阳孙茂松黄昌宁.中文地名的自动辨识[A]..计算语言学进展与应用[M].北京:清华大学出版社,1995..
6国家测绘局地名研究所.中国地名录[M].北京:中国地图出版社,1997.1-318.
7国家测绘局地名研究所.中国地名录[M].北京.中国地图出版社,1997,1～318.
8俞士汶段慧明朱学锋等.北大语料库加工规范：切分·词性标注·注音[J].汉语语言与计算学报,2003,13(2):121-158.
9EPPSTEIN D. Finding the k shortest paths [J].SIAM J on Comput, 1998, 28(2):652-673
10谭红叶，郑家恒，刘开瑛．中国地名的自动识别方法研究[C]∥黄昌宁，董振东．计算语言学文集．北京：清华大学出版社，1999：174—179

共引文献93

1王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报（自然科学版）,2005,45(S1):1908-1914. 被引量：10
2李丽双,黄德根,陈春荣,杨元生.用支持向量机进行中文地名识别的研究[J].小型微型计算机系统,2005,26(8):1416-1419. 被引量：11
3蔡华利,刘鲁,李红.基于规则推理的突发事件发生地点识别研究[J].情报学报,2011,30(2):219-224. 被引量：9
4王桂平,林鹏.基于双侧语料评价模型的专业词汇识别算法[J].计算机与现代化,2005(9):13-15.
5黄德根,孙迎红.中文地名的自动识别[J].计算机工程,2006,32(3):220-222. 被引量：10
6冯丽萍.基于统计的中文组织机构名识别[J].福建电脑,2006,22(1):147-147.
7高红,黄德根,杨元生.汉语自动分词中中文地名识别[J].大连理工大学学报,2006,46(4):576-581. 被引量：10
8钱晶,张杰,张涛.基于最大熵的汉语人名地名识别方法研究[J].小型微型计算机系统,2006,27(9):1761-1765. 被引量：27
9李丽双,黄德根,陈春荣,杨元生.SVM与规则相结合的中文地名自动识别[J].中文信息学报,2006,20(5):51-57. 被引量：32
10顾美红.利用NAT实现多校区图书馆内部网络的互访[J].福建电脑,2006,22(10):196-196.

同被引文献70

1张瑞霞,肖汉.基于知网的词图构造[J].华北水利水电学院学报,2008(3):53-56. 被引量：6
2HE Li,LI ZhengLin,PENG ZhaoHui.Ambient noise near the sea-route[J].Science China(Physics,Mechanics & Astronomy),2009,52(1):40-45. 被引量：5
3来新夏.中国地方志的史料价值及其利用[J].国家图书馆学刊,2005,14(1):5-8. 被引量：40
4李丽双,黄德根,陈春荣,杨元生.用支持向量机进行中文地名识别的研究[J].小型微型计算机系统,2005,26(8):1416-1419. 被引量：11
5蔡华利,刘鲁,李红.基于规则推理的突发事件发生地点识别研究[J].情报学报,2011,30(2):219-224. 被引量：9
6俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：168
7顾晓明,翟玉庆.一种基于本体的军用文书理解系统设计[J].现代计算机,2006,12(3):69-72. 被引量：2
8周波,杨国纬.基于贝叶斯算法的中国人名识别[J].计算机应用,2006,26(4):998-1000. 被引量：12
9钱晶,张杰,张涛.基于最大熵的汉语人名地名识别方法研究[J].小型微型计算机系统,2006,27(9):1761-1765. 被引量：27
10李丽双,黄德根,陈春荣,杨元生.SVM与规则相结合的中文地名自动识别[J].中文信息学报,2006,20(5):51-57. 被引量：32

引证文献7

1朱锁玲,包平.方志类古籍地名识别及系统构建[J].中国图书馆学报,2011,37(3):118-124. 被引量：36
2尹驰东,黄生叶,鄂智丰.寻路算法在中文金融机构名匹配中的应用[J].计算技术与自动化,2011,30(2):83-88.
3朱锁玲,包平.方志类古籍地名识别及分析研究——以《方志物产》(广东分卷)为例[J].图书馆论坛,2012,32(4):171-176. 被引量：7
4张瑞霞,杨国增,闫新庆.基于知网的汉语普通未登录词语义分析模型[J].计算机应用与软件,2012,29(8):126-130. 被引量：4
5李颖,王青海,池毓焕.句类分析准则在作战文书地名识别中的应用[J].计算机工程与设计,2013,34(8):2903-2907. 被引量：3
6孙赫,李淑琴,吕学强,刘克会.微博城市投诉文本中地理位置实体的完整性研究[J].现代图书情报技术,2016(3):58-66. 被引量：1
7沈思,朱丹浩.基于深度学习的中文地名识别研究[J].北京理工大学学报,2017,37(11):1150-1155. 被引量：18

二级引证文献62

1赵薇.数字时代人文学研究的变革与超越——数字人文在中国[J].探索与争鸣,2021(6):191-206. 被引量：41
2高巍,万廷彬.甜菜碱对商品产蛋鸡生产性能的影响[J].中国禽业导刊,2000,17(6):16-17. 被引量：1
3朱锁玲,包平.方志类古籍地名识别及分析研究——以《方志物产》(广东分卷)为例[J].图书馆论坛,2012,32(4):171-176. 被引量：7
4唐惠燕,包平.基于GIS的农业史研究前景初探[J].中国农史,2013,32(2):132-137. 被引量：5
5朱锁玲,王明峰.GIS在方志类古籍开发利用中的应用初探[J].大学图书馆学报,2013,31(5):118-121. 被引量：17
6李娜.基于条件随机场的方志古籍别名自动抽取模型构建[J].中文信息学报,2018,32(11):41-48. 被引量：30
7魏晓峰.基于知识图谱的国内古籍整理与保护研究进展计量分析[J].图书馆理论与实践,2014(10):46-50. 被引量：5
8朱成林,袁曦临.中国古籍的数字化导读研究[J].图书馆建设,2014(11):50-55. 被引量：16
9黄水清,王东波,何琳.基于先秦语料库的古汉语地名自动识别模型构建研究[J].图书情报工作,2015,59(12):135-140. 被引量：49
10尚芬芬,顾彦慧,戴茹冰,李斌,周俊生,曲维光.基于《现代汉语语义词典》的未登录词语义预测研究[J].北京大学学报（自然科学版）,2016,52(1):10-16. 被引量：5

1高红,黄德根,杨元生.汉语自动分词中中文地名识别[J].大连理工大学学报,2006,46(4):576-581. 被引量：10
2高国洋,戚银城,潘德锋.基于条件随机场与规则相结合的中文地名识别[J].电脑开发与应用,2009,22(8):26-28. 被引量：2
3李丽双,黄德根,陈春荣,杨元生.用支持向量机进行中文地名识别的研究[J].小型微型计算机系统,2005,26(8):1416-1419. 被引量：11
4林雄鹰,黄宇光.基于规则和混合统计模型的中文地名识别研究[J].高性能计算技术,2012,0(1):31-35.
5孙虹,陈俊杰.双层CRF与规则相结合的中文地名识别方法研究[J].计算机应用与软件,2014,31(11):175-177. 被引量：9
6李丽双,党延忠,廖文平,黄德根,张颖.CRF与规则相结合的中文地名识别[J].大连理工大学学报,2012,52(2):285-289. 被引量：17
7王凡秀.基于条件随机场的中文地名识别[J].中国西部科技,2008,7(28):8-8.
8毕行,徐炜民.基于特定群体兴趣的混合个性化推荐算法[J].上海大学学报（自然科学版）,2010,16(3):318-322. 被引量：2
9邱莎,阿圆,王付艳,丁海燕.基于统计的中文地名自动识别研究[J].计算机技术与发展,2011,21(11):35-38. 被引量：13
10黄德根,岳广玲,杨元生.基于统计的中文地名识别[J].中文信息学报,2003,17(2):36-41. 被引量：49

计算机工程与应用

2009年第28期

浏览历史

内容加载中请稍等...

利用地名用字分析的中文地名识别处理被引量：7

参考文献5

二级参考文献28

共引文献93

同被引文献70

引证文献7

二级引证文献62

相关作者

相关机构

相关主题

浏览历史

利用地名用字分析的中文地名识别处理 被引量：7

参考文献5

二级参考文献28

共引文献93

同被引文献70

引证文献7

二级引证文献62

相关作者

相关机构

相关主题

浏览历史

利用地名用字分析的中文地名识别处理被引量：7