基于模拟退火遗传算法的主题爬虫搜索策略研究
摘要
以何种策略访问网络,提高搜索效率,是近年来主题搜索引擎研究的主要问题之一。本文对主题爬虫常用搜索策略进行了简单分析,提出了实用性较强的基于SAGA的主题爬虫搜索策略。
出处
《科技风》
2012年第16期7-7,13,共1页
参考文献5
-
1Sut on R S,Barto A G. Reinforcement Learning:an introduction[M].MA:MIT Pres,1998.
-
2Diligenti M,Coetzee F M,Lawrence S. Focused crawling using context graphs[A].2000.
-
3王海鹰,魏颖.基于蚁群算法的多目标网页综合评价策略[J].计算机工程与应用,2011,47(4):223-225. 被引量:3
-
4贺晟,程家兴,蔡欣宝.基于模拟退火算法的主题爬虫[J].计算机技术与发展,2009,19(12):55-58. 被引量:8
-
5邓岳贵.启发式搜索在网络爬虫中应用的分析[J].教育技术导刊,2008(2):80-82. 被引量:7
二级参考文献19
-
1李春旺.Web信息主题采集技术研究[J].图书情报工作,2005,49(4):77-80. 被引量:18
-
2王知人,章胤,李新乔.一种改进的模拟退火算法[J].高等学校计算数学学报,2006,28(1):15-19. 被引量:13
-
3唐利,蓝强.对网络搜索引擎的比较研究[J].重庆文理学院学报(自然科学版),2006,5(4):98-102. 被引量:5
-
4林海霞,原福永,陈金森,刘俊峰.一种改进的主题网络蜘蛛搜索算法[J].计算机工程与应用,2007,43(10):174-176. 被引量:18
-
5Ester M, Gross M, Kriegel H P. Focused Web crawling: a generic framework for specifying the user Interest and for adaptive crawling strategies[ C]//In: Proceedings of 27th International Conference on Very Large Database (VLDB'01). Roma: Springer- Verlag, 2001:527 - 534.
-
6Cho J, Garcia - Molina H, Page L. Efficient crawling through URL ordering[J]. Computers Networks and ISDN Systems, 1998, 30: 161- 172.
-
7DeBra P, Post P. Information retrieval in the World - Wide web: making client- based searching feasible [ J ]. Computer Networks and ISDN Systems, 1995,27(2) : 183 - 192.
-
8李晓明,闫宏飞,王维民.搜索引擎原理[M].北京:科学出版社,2005:123-124.
-
9EngelbrechtAP.计算群体智能基础[M].谭营,译.北京:清华大学出版社,2009.
-
10胡贵强.多目标优化的遗传算法及其实现[J].重庆文理学院学报(自然科学版),2008,27(5):12-15. 被引量:26
共引文献14
-
1贺晟,程家兴,蔡欣宝.基于模拟退火算法的主题爬虫[J].计算机技术与发展,2009,19(12):55-58. 被引量:8
-
2赵思佳,尹婷.基于规则引擎的个性化主题网页爬虫的研究[J].计算机技术与发展,2011,21(3):56-59. 被引量:3
-
3林子皓.主题爬虫的设计与实现[J].计算机技术与发展,2014,24(8):99-102. 被引量:7
-
4于娟,刘强.主题网络爬虫研究综述[J].计算机工程与科学,2015,37(2):231-237. 被引量:105
-
5李慧,胡辉,庄冬梅.农产品供需对接系统中主题网络爬虫的设计与实现[J].现代计算机,2015,21(3):62-65.
-
6肖江,季节.基于Heritrix的主题爬虫在互联网舆情系统中应用[J].电子设计工程,2015,23(6):30-32. 被引量:5
-
7仝召娟,许鑫.百度百科网页质量的自动化评价[J].信息资源管理学报,2015,5(2):63-69. 被引量:3
-
8朱婧.搜索引擎系统中的蚁群算法分析[J].西安文理学院学报(自然科学版),2016,19(4):44-47. 被引量:1
-
9荆文鹏,王育坚,董伟伟.自适应遗传算法在主题爬虫搜索策略中的应用研究[J].计算机科学,2016,43(8):254-257. 被引量:7
-
10马雷雷,李宏伟,连世伟,梁汝鹏,陈虎.一种基于本体语义的灾害主题爬虫策略[J].计算机工程,2016,42(11):50-56. 被引量:4
-
1刘红梅.垂直搜索引擎主题爬虫搜索策略研究[J].科技信息,2013(24):252-253. 被引量:1
-
2杨仁广,孟祥增.网络多媒体主题搜索策略研究[J].中国科技资源导刊,2009,41(2):37-41.
-
3刘国靖,康丽,罗长寿.基于遗传算法的主题爬虫策略[J].计算机应用,2007,27(B12):172-174. 被引量:14
-
4钱晨,张晓静.网络Flash爬虫搜索方法比较研究[J].中国教育技术装备,2014(14):32-34. 被引量:1
-
5关慧芬,师军,马继红.基于遗传算法的主题爬行技术研究[J].计算机与数字工程,2008,36(10):50-53. 被引量:4
-
6张福泉.人工智能在主题搜索策略中的应用[J].重庆科技学院学报(自然科学版),2009,11(4):148-151. 被引量:1
-
7陈财森,王韬,郑伟,陈建泗.基于搜索引擎调用的主题搜索设计与实现[J].计算机工程与设计,2008,29(21):5627-5629. 被引量:1
-
8高红梅,仁青诺布,普次仁.领域本体的藏文主题爬虫搜索策略研究[J].计算机应用与软件,2015,32(9):68-71. 被引量:1
-
9黄旭,朱艳琴,罗喜召.基于内容评价的爬虫搜索策略研究[J].微电子学与计算机,2008,25(11):25-28. 被引量:4
-
10余旸,Zhangxi LIN,夏国平.基于链接结构分析的主题搜索[J].北京工业大学学报,2011,37(4):614-618. 被引量:2