期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
专业搜索引擎中文分词算法的实现与研究
被引量:
3
在线阅读
下载PDF
职称材料
导出
摘要
为实现专业信息查询的中文搜索引擎,首要的问题就是中文分词。本文首先介绍了分词用词典数据结构的组织以及使用二分查找的查询算法,然后提出了一种基于最短路径的改进分词算法。实验证明,利用该算法,可以消除大量歧义,取得较好的分词效果。
作者
王坚
赵恒永
机构地区
北京化工大学信息科学与技术学院
出处
《福建电脑》
2005年第7期55-55,57,共2页
Journal of Fujian Computer
关键词
专业搜索引擎
中文分词算法
词典数据结构
查询算法
最短路径法
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
引文网络
相关文献
节点文献
二级参考文献
32
参考文献
8
共引文献
210
同被引文献
24
引证文献
3
二级引证文献
2
参考文献
8
1
冯书晓,徐新,杨春梅.
国内中文分词技术研究新进展[J]
.情报杂志,2002,21(11):29-30.
被引量:25
2
欧振猛,余顺争.
中文分词算法在搜索引擎应用中的研究[J]
.计算机工程与应用,2000,36(8):80-82.
被引量:20
3
邹海山,吴勇,吴月珠,陈阵.
中文搜索引擎中的中文信息处理技术[J]
.计算机应用研究,2000,17(12):21-24.
被引量:35
4
The Unicode Consortium.The Unicode Standard Version 3.0.
5
Herbert Schildt;周志彬;吕建宁;章晓莉.Java2参考大全,2003.
6
刘汝佳;黄亮.算法艺术与信息学竞赛,2004.
7
张华平,刘群.
基于N-最短路径方法的中文词语粗分模型[J]
.中文信息学报,2002,16(5):1-7.
被引量:99
8
陈桂林,王永成,韩客松,王刚.
一种改进的快速分词算法[J]
.计算机研究与发展,2000,37(4):418-424.
被引量:56
二级参考文献
32
1
徐秉铮,詹剑,贺前华.
基于神经网络的分词方法[J]
.中文信息学报,1993,7(2):36-44.
被引量:16
2
周强.
规则和统计相结合的汉语词类标注方法[J]
.中文信息学报,1995,9(3):1-10.
被引量:43
3
骆正清,陈增武,胡上序.
一种改进的MM分词方法的算法设计[J]
.中文信息学报,1996,10(3):30-36.
被引量:28
4
吴胜远.
一种汉语分词方法[J]
.计算机研究与发展,1996,33(4):306-311.
被引量:49
5
孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳.
利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J]
.计算机研究与发展,1997,34(5):332-339.
被引量:66
6
冯志伟.
自然语言的计算机处理[J]
.中文信息,1997,14(4):26-27.
被引量:18
7
张树武,黄泰翼.
汉语统计语言模型的N值分析[J]
.中文信息学报,1998,12(1):35-41.
被引量:8
8
黄祥喜.
书面汉语自动分词的“生成——测试”方法[J]
.中文信息学报,1989,3(4):42-49.
被引量:11
9
揭春雨,刘源,梁南元.
论汉语自动分词方法[J]
.中文信息学报,1989,3(1):1-9.
被引量:55
10
孙建军,陈肇雄,薛选民,郭喜林,侯敏.
基于多功能逻辑运算分析技术的汉语分词[J]
.计算机研究与发展,1998,35(5):385-388.
被引量:2
共引文献
210
1
冯裕静,赵一美子.
基于词频分析的国家级创新创业项目研究方向及趋势研究[J]
.产业科技创新,2020(6):26-27.
被引量:1
2
战疆,冯月利,王珊.
PostgreSQL中文全文索引技术研究与实现[J]
.华中科技大学学报(自然科学版),2005,33(z1):213-216.
被引量:3
3
隋丽萍,徐承韬,李瑞芳.
一个中文全文检索系统的设计与实现[J]
.科技资讯,2007,5(18):244-245.
被引量:1
4
戴文军,朱立谷,孙志伟,任勇,曾赛峰,郝玮.
一种基于搜索引擎的对象存储系统的扩展技术[J]
.计算机研究与发展,2007,44(z1):126-129.
5
任成义.
基于网页的知识元挖掘[J]
.图书情报工作,2010,54(S1):278-281.
6
陈淑珍.
Web文本挖掘中的特征表示与特征提取技术[J]
.三明高等专科学校学报,2004,21(2):53-57.
被引量:2
7
邵晓良,刘红.
Web信息采集中军事主题信息的识别[J]
.情报杂志,2004,23(7):14-16.
被引量:2
8
文庭孝,邱均平,侯经川.
汉语自动分词研究展望[J]
.现代图书情报技术,2004(7):6-10.
被引量:20
9
张素娟,郑庆华,胡云华,孙霞.
一种面向网络答疑的汉语切分歧义消除算法[J]
.计算机工程与应用,2004,40(25):55-58.
被引量:4
10
王朝静,郑庆华.
面向答疑文本的词类标注方法的研究与实现[J]
.计算机工程与应用,2004,40(16):57-60.
被引量:2
同被引文献
24
1
陈细谦,迟忠先,金妮.
城市地理编码系统应用与研究[J]
.计算机工程,2004,30(23):50-52.
被引量:30
2
王坚,赵恒永.
专业搜索引擎的实现与研究——中文分词算法[J]
.电子科学技术评论,2005(3):77-79.
被引量:4
3
山岚,徐耀.
基于Agent的智能化专业信息采集系统[J]
.计算机工程与设计,2005,26(11):3028-3030.
被引量:4
4
周军,迟呈英.
基于校园网的中文搜索引擎系统[J]
.沈阳师范大学学报(自然科学版),2006,24(1):55-57.
被引量:5
5
WEN Kun-mei LU Zheng-ding LI Yu-hua SUN Xiao-lin.
A Cooperative Schema between Web Sever and Search Engine for Improving Freshness of Web Repository[J]
.Wuhan University Journal of Natural Sciences,2006,11(1):11-14.
被引量:1
6
瞿锋,陈纪元.
汉语自动分词算法综述[J]
.福建电脑,2006,22(4):23-25.
被引量:8
7
沈贺丹,潘亚楠,邵良杉.
关于搜索引擎的研究综述[J]
.计算机技术与发展,2006,16(4):147-149.
被引量:17
8
王小林,刘宏申.
搜索引擎的设计研究[J]
.计算机技术与发展,2007,17(2):5-7.
被引量:7
9
刘滨,石峰.
基于消息传递机制的动态负载平衡算法研究[J]
.计算机工程,2007,33(10):58-60.
被引量:5
10
Chau M. Teaching Key Topics in Computer Science and Information Systems Through a Web Search Engine Project [J]. ACM Journal of Educational Resources in Computing, 2003,3 (3) : 1-14.
引证文献
3
1
赵恒永,沈坚,山岚.
基于专业信息深度挖掘的搜索引擎Spider的设计与实现[J]
.计算机工程与科学,2009,31(6):18-20.
被引量:2
2
夏兰芳.
地理编码技术在“数字城市”建设中的应用研究[J]
.上海城市发展,2011(B11):239-244.
3
黄宇达,魏霞,王迤冉.
一种轻量级中文搜索引擎模型的设计与实现[J]
.计算机技术与发展,2012,22(9):201-204.
二级引证文献
2
1
李晓丽,杜振龙.
基于Lucence的个性化搜索引擎研究[J]
.计算机工程,2010,36(19):258-260.
被引量:4
2
周凤丽,林晓丽.
基于Lucene的Web搜索引擎的研究和实现[J]
.计算机技术与发展,2012,22(1):140-142.
被引量:7
1
王坚,赵恒永.
专业搜索引擎的实现与研究——中文分词算法[J]
.电子科学技术评论,2005(3):77-79.
被引量:4
2
韦绥线,黄胜华.
一种快速规避拥塞的路由算法[J]
.计算机仿真,2007,24(4):136-138.
被引量:3
3
佟晓筠,宋国龙,刘强,张俐,姜伟.
中文分词及词性标注一体化模型研究[J]
.计算机科学,2007,34(9):174-175.
被引量:10
4
吴云志,乐毅,王超,张友华.
蚁群算法在物流路径优化中的应用及仿真[J]
.合肥工业大学学报(自然科学版),2009,32(2):211-214.
被引量:17
5
王华风.
论大型英汉双语词典数据的结构模型[J]
.情报学报,1999,18(S1):63-67.
被引量:1
6
海通.
Internet的路由传送与ATM的虚电路传输在方式上有哪些不同?[J]
.电脑爱好者,2000(19):114-114.
7
蒋斌,杨超,赵欢.
基于二字词位图表的汉语自动分词词典机制[J]
.湖南大学学报(自然科学版),2006,33(1):121-123.
被引量:3
8
张天祥,凡金伟.
最短距离改进问题算法在物流选址中的应用[J]
.光盘技术,2008(11):40-40.
9
杨育,杨洁,王小磊,梁宗雁,梁学栋.
基于发明问题解决理论的客户协同产品创新设计方法[J]
.计算机集成制造系统,2010,16(1):8-16.
被引量:10
10
种衍文,江柳,沈未名.
基于变化检测的视频对象提取及后继帧的对象跟踪[J]
.武汉大学学报(信息科学版),2006,31(8):748-751.
被引量:2
福建电脑
2005年 第7期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部