地理信息系统中自然语言查询的分词处理与应用被引量：6

Word Expanding Method for Chinese Word Segmentation Applied in GIS

下载PDF

导出

摘要随着地理信息系统应用的不断发展,本文提出了在地理信息系统中对基于受限自然语言的查询语句进行分词处理的方法——首字扩词分词法。该分词方法在汲取正向最大匹配分词方法的核心思想--长词优先原则。为了缩小匹配范围,提高匹配效率,该方法首先根据查询自然语言的首字对词汇库的记录进行筛选,得到以该首字开头的词汇库子集;然后再按照长词优先原则把原查询语句与词汇库子集进行匹配,切分查询语句。通过比较,该方法比正向最大匹配方法具有较小的时间复杂度。同时,采用DELPHI编程语言在计算机上得到了实现。 In this paper, we present the method called Word Expanding Method for analyzing and handling the Chinese natural language queries which are derived from the user interface of GIS. The realization of this method will help the nonprofessionals to use the GIS more conveniently and efficiently. Here, we adopt the idea of Maximum Matching Method known as longer word preferred. The process of Word Expanding Method includes two steps： filtrating and matching. The filtrating step filtrates the whole Limited Chinese Words Library by using the first character of the querying sentence, so as to reduce the scope which the matching step should match to. The Word Expanding Method is approved to be a rather efficient method for Chinese word segmentation. And finally, we applied this method in GIS by programming.

作者吴静蔡砥王铮

机构地区华东师范大学地理信息科学教育部重点实验室中国科学院科技政策与管理科学研究所

出处《地球信息科学》 CSCD 2005年第3期67-71,共5页 Geo-information Science

基金国家863计划资助(2002AA134020)

关键词地理信息系统自然语言分词首字扩词长词优先 GIS Chinese word segmentation word expanding method longer word preferred

分类号 P208 [天文地球—地图制图学与地理信息工程]

引文网络
相关文献

参考文献6

1李满春,李延满,陈刚.地理信息查询语言发展趋势[J].计算机工程与应用,2002,38(6):70-73. 被引量：2
2黄昌宁.中文信息处理中的分词问题[J].语言文字应用,1997(1):74-80. 被引量：85
3骆正清,陈增武,王泽兵,胡上序.汉语自动分词研究综述[J].浙江大学学报（自然科学版）,1997,31(3):306-312. 被引量：16
4梁南元,郑延斌.书面汉语自动分词方法和分词模型[J].微型计算机,1991,11(3):18-23. 被引量：1
5郭辉,苏中义,王文,崔骏.一种改进的MM分词算法[J].微型电脑应用,2002,18(1):13-15. 被引量：39
6董振东.汉语分词研究漫谈[J].语言文字应用,1997(1):109-114. 被引量：11

二级参考文献21

1黄昌宁.中文信息处理中的分词问题[J].语言文字应用,1997(1):74-80. 被引量：85
2骆正清,陈增武,胡上序.一种改进的MM分词方法的算法设计[J].中文信息学报,1996,10(3):30-36. 被引量：28
3张国煊，计算机研究与发展，1993年，1期，61页
4冯志伟，中文信息处理与汉语研究，1992年，12页
5贺银云，计算机杂志，1991年，1/3期，144页
6何克抗，中文信息学报，1991年，2期，1页
7韩世欣，中文信息学报，1990年，4期，48页
8揭春雨，中文信息学报，1990年，1期，1页
9揭春雨，中文信息学报，1990年，4期，27页
10梁南元，中文信息学报，1990年，4期，29页

共引文献144

1孙宝刚,肖灵.计算机与数据库技术在舰船建造过程的节本与工时分析应用[J].舰船科学技术,2019,0(20):217-219. 被引量：2
2梁晓弘,杨文安.分词技术在信息处理中的研究综述[J].电脑知识与技术（过刊）,2007(22):1100-1102. 被引量：1
3刘春辉,金顺福,刘国华,李颖.基于优化最大匹配与统计结合的汉语分词方法[J].燕山大学学报,2009,33(2):124-129. 被引量：9
4谢新吾.黄跃佳:北大失业生的三次跳跃[J].职业圈,2005(11):30-31.
5王军辉.汉语自动分词研究进展[J].魅力中国,2009(30):333-333.
6王建新.我国在语料库语言学研究方面的部分进展(概述)[J].外语与外语教学,1999(3):18-20. 被引量：10
7洪虹,李波.汉语自动分词研究进展[J].魅力中国,2009,0(22):114-114.
8陈淑珍.Web文本挖掘中的特征表示与特征提取技术[J].三明高等专科学校学报,2004,21(2):53-57. 被引量：2
9文庭孝,邱均平,侯经川.汉语自动分词研究展望[J].现代图书情报技术,2004(7):6-10. 被引量：20
10金瑜,陆启明,高峰.基于上下文相关的最大概率汉语自动分词算法[J].计算机工程,2004,30(16):146-148. 被引量：8

同被引文献63

1许珺,张晶,司望利,孙红玖.线状物体空间关系的自然语言理解的双语比较[J].遥感学报,2008,12(2):362-369. 被引量：3
2文庭孝,邱均平,侯经川.汉语自动分词研究展望[J].现代图书情报技术,2004(7):6-10. 被引量：20
3余正涛,樊孝忠,耿增民.受限领域自然语言数据库查询接口研究[J].昆明理工大学学报（理工版）,2004,29(4):133-138. 被引量：5
4信息处理用现代汉语词类标记集规范[J].语言文字应用,2001(3):16-20. 被引量：12
5Peng Bi - xian Chen Li - Juan Wang Ying Shi Jing - jing Guo Yu - long Zheng TongLaboratory of Gelatin - Silver Halide Emulsion,Technical Institute of Chemistry and Physics, Chinese Academy of Sciences, 100101 .Beijing.A Novel Pilot-Scale Production of Gelatin Was Discovered and Established[J].明胶科学与技术,2002,22(4):207-208. 被引量：1
6岳玮宁,董士海,王悦,汪国平,王衡,陈文广.普适计算的人机交互框架研究[J].计算机学报,2004,27(12):1657-1664. 被引量：45
7张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
8马晓娜,杨承磊.基于面向对象的受限自然语言查询系统的设计与实现[J].计算机工程与应用,2005,41(10):165-168. 被引量：5
9胡斌,汤伟,刘晓明.基于自然语言理解的文本标图系统设计与实现[J].解放军理工大学学报（自然科学版）,2005,6(2):132-136. 被引量：9
10王丹力,华庆一,戴国忠.以用户为中心的场景设计方法研究[J].计算机学报,2005,28(6):1043-1047. 被引量：30

引证文献6

1丰江帆,张宏,闾国年,乔延春.面向用户群的WebGIS场景设计框架初探[J].地球信息科学,2007,9(4):51-56. 被引量：1
2明小娜,龙毅,钱程扬,张翎.基于受限自然语言的GIS命令解析方法[J].地球信息科学,2009,11(2):183-188. 被引量：3
3陆锋,刘焕焕,陈传彬.一种中文自然语言表达交通信息的跨阶分词算法[J].武汉大学学报（信息科学版）,2009,34(8):943-947. 被引量：3
4XU Aiping,LIN Guang,HUANG Yuan.GIS Chinese Query System Based on CBR[J].Wuhan University Journal of Natural Sciences,2009,14(5):399-403.
5杜冲,司望利,许珺.基于地理语义的空间关系查询和推理[J].地球信息科学,2010,12(1):48-55. 被引量：14
6吴建华,余梦娟,刘强,舒志刚.基于ArcGIS与Speech SDK的中文语音交互式GIS实现方法[J].地理与地理信息科学,2016,32(5):76-80. 被引量：5

二级引证文献25

1白雪,肖宝弟,刘皓玮.基于场景设计的列车调度系统需求建模方法[J].中国铁道科学,2009,30(3):115-118. 被引量：3
2戴芹,刘建波,刘士彬.综合多特征遥感图像智能检索方法的概念设计[J].地球信息科学学报,2011,13(3):401-408. 被引量：6
3郑玥,龙毅,明小娜,严瑞.多种空间关系组合的地理位置自然语言描述方法[J].地球信息科学学报,2011,13(4):465-471. 被引量：16
4张雪英,张春菊,杜超利.空间关系词汇与地理实体要素类型的语义约束关系构建方法[J].武汉大学学报（信息科学版）,2012,37(11):1266-1270. 被引量：14
5余明朗,明小娜,龙毅,张雪英.GIS环境下中文命令的规则匹配与语义解析[J].地理与地理信息科学,2012,28(6):7-12. 被引量：3
6张恒才,陆锋,陈洁.微博客蕴含交通信息的提取[J].中国图象图形学报,2013,18(1):123-129. 被引量：12
7李澎林,张献力,李伟.基于双字Hash机制的交通信息分词算法研究[J].浙江工业大学学报,2014,42(6):596-600. 被引量：4
8杨林,余丽,叶亚琴,万波.一种中文门楼址的自适应表达及成分解析方法[J].测绘科学,2014,39(12):109-115.
9王艳军,李朝奎,路立娟.地理空间信息技术在智慧城市中的应用思考[J].湖南科技大学学报（自然科学版）,2014,29(4):69-73. 被引量：15
10贾奋励,张威巍,游雄.虚拟地理环境的认知研究框架初探[J].遥感学报,2015,19(2):179-187. 被引量：12

1李艳红,庞小平,李海亭.地名分词搜索的词典设计与匹配方法研究[J].测绘信息与工程,2011,36(2):52-54. 被引量：7
2张连蓬,刘国林,江涛,李云岭,季民.受限自然语言查询在GIS中的应用[J].测绘学院学报,2002,19(4):283-286. 被引量：8
3李滨,张海波,刘嘉,林闯,潘丰,李鹏.自然空间查询语言解译机制研究[J].测绘科学技术学报,2010,27(2):139-142. 被引量：1
4秦松年,高彩.光纤星象切分器[J].云南天文台台刊,1992(2):53-56. 被引量：1
5王克永,刘纪平,罗安,王勇.前后缀与特征词相结合的地名地址提取[J].测绘通报,2016(2):64-68. 被引量：17
6郭黎,李宏伟,张泽建,张斌.道路网信息投影匹配方法研究[J].武汉大学学报（信息科学版）,2013,38(9):1113-1117. 被引量：11
7杜冲,司望利,许珺.基于地理语义的空间关系查询和推理[J].地球信息科学,2010,12(1):48-55. 被引量：14
8张恒才,陆锋,陈洁.微博客蕴含交通信息的提取[J].中国图象图形学报,2013,18(1):123-129. 被引量：12
9赵云鹏,刘新贵,宋华标,吴铮,马绍龙.一种俄语地名专名快速音译方法[J].测绘与空间地理信息,2016,39(6):47-49. 被引量：7
10吴桂桔,申重阳,谈红波,杨光亮.2015阿拉善左旗Ms5.8地震区布格重力异常及归一化总梯度的构造意义[J].大地测量与地球动力学,2015,35(6):936-940. 被引量：4

地球信息科学

2005年第3期

浏览历史

内容加载中请稍等...

地理信息系统中自然语言查询的分词处理与应用被引量：6

参考文献6

二级参考文献21

共引文献144

同被引文献63

引证文献6

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

地理信息系统中自然语言查询的分词处理与应用 被引量：6

参考文献6

二级参考文献21

共引文献144

同被引文献63

引证文献6

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

地理信息系统中自然语言查询的分词处理与应用被引量：6