期刊文献+

larbin网络爬虫的体系结构 被引量:3

System Architecture of Larbin Web Crawler
在线阅读 下载PDF
导出
摘要 本文通过对larbin网络爬虫的研究后总结出了larbin网络爬虫的体系结构,然后结合该爬虫详细介绍了整个体系结构的工作过程,最后介绍了larbin网络爬虫的特点。 Based on the study of larbin Web Crawler, the paper sums up system architecture of larbin,and then combined with larbin crawler, the paper describes in detail the operation of the whole architecture, finally introduces the features of larbin crawler.
作者 孟时 王彦
出处 《电脑学习》 2010年第4期80-81,共2页 Computer Study
关键词 larbin 网络爬虫 体系结构 HASH larbin Web Crawler Architecture hash
  • 相关文献

参考文献3

二级参考文献17

  • 1印鉴,陈忆群,张钢.搜索引擎技术研究与发展[J].计算机工程,2005,31(14):54-56. 被引量:53
  • 2陈刚,卢炎生.BBS搜索引擎设计与实现[J].微计算机信息,2006,22(06X):34-36. 被引量:4
  • 3中国互联网络信息中心.第十六次中国互联网络发展状况统计报告[EB/OL].http://www.cnnic.net.cn/index/OE/00/11/index.htm.2005—07—01.
  • 4Border A Z, Glassman S C, Manasse M S, etal. Syntactic clustering of the Web[C]//Proceedings of the 6th ACM International Conference on World Wide Web.USA: ACM Press, 1997:1157-1166.
  • 5Cho J H, Shivakumar N, Gareia-Molina H. Finding replicated web collections[C]//Proeeedings of the ACM International Conference on Management of the Data.USA: ACM Press, 2000, 29(2): 355-366.
  • 6Shivakumar N, Garcia-Molilna H. Finding near-replicas of documents on the Web [C]//Proceedings of Workshop on Web Databases. Spain: Springer Press,1998:204-212.
  • 7Cho J H, Garcia-Molina H. Parallel crawlers[C]//Proceedings of the 11th ACM International Conference on World Wide Web. Hawaii: ACM Press, 2002:124-135.
  • 8Bharat K, Broder A Z. Mirror, mirror, on the Web:A study of host pairs with replicated content[J]. Computer Networks, 1999. 31(11-16): 1579-1590.
  • 9Nam G W, Park J H, Kim T Y. Dynamic management of URL based on object-oriented paradigm[C]//Proceedings of the International Conference on Parallel and Distributed Systems. Taiwan, China: IEEE Computer Society Press, 1998:226-230.
  • 10Winter.中文搜索引擎技术揭密:网络蜘蛛[EB/OL].http://article.bwtech.net/artshow_33.htm.

共引文献53

同被引文献19

引证文献3

二级引证文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部