期刊文献+

网络存储信息采集方式研究 被引量:14

Study on web harvest methods in web archive
原文传递
导出
摘要 对网络存储(Web Archive)信息采集方式进行梳理和分析,根据采集对象、采集目的和实施者的不同把网络存储中的信息采集归纳为:面向长期保存的一次采集、基于web仓储的二次采集、面向采集服务的订阅型采集、需求触发的被动采集和事件驱动的网络交易采集,期望为国内网络信息采集和保存提供参考。 In this article, authors clear up and analyze web harvest methods in web archive. According to the target, the harvestman and the purpose of the acquisition, web harvest methods are divid- ed into five methods : web crawling for long - term preservation, lazy preservation for rebuilding website, service- oriented subscription harvest, demand -driven web harvest and event -driven transactional archive. Wishes to provide some references for domestic web archive.
作者 刘兰 吴振新
出处 《图书馆杂志》 CSSCI 北大核心 2009年第8期28-31,共4页 Library Journal
基金 国家社会科学基金项目"网络信息资源保存的理论与方法研究"课题的资助 课题编号为06BTQ025
关键词 网络存储 信息采集 采集方式 Web Archive, Web harvest, Harvest method
  • 相关文献

参考文献9

  • 1Paul Koerbin, The PANDORA Digital Archiving System (PANDAS): Managing Web Archiving in Australia: A Case Study. [2008 -04 -06] http://www, tda. gov. au/ irla/staffpaper/2004/koerbin2, html.
  • 2The Web Curator Tool. [ 2008 - 04 - 06 ] http ://webcura- tor. sourceforge, net/.
  • 3Netarchive. [ 2008 - 04 - 06 ] http ://netarchive. dE/suite/ Overview.
  • 4lazy preservation. [ 2008 - 04 - 06 ] http ://www. cs. odu. edu/- fmccown/research/lazy/.
  • 5Frank McCown, Joan A. Smith, Michael L. Nelson 等. Lazy Preservation: Reconstructing Websites by Crawling the Crawlers. WIDM06, November 10, 2006, Arlington, Virginia, USA.
  • 6Archive - it. [2008 -04 -06] www. Archive - It. org.
  • 7Hanzo Archives. [ 2008 - 04 - 06 ] http ://www. hanzoweb. com/.
  • 8WebCite. [ 2008 - 04 - 06 ] http ://www. webcitation, org/.
  • 9PageVault. [ 2008 - 04 - 06 ] http ://www. projectcomputing. com/products/pageVault/.

同被引文献281

引证文献14

二级引证文献80

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部