摘要
对网络存储(Web Archive)信息采集方式进行梳理和分析,根据采集对象、采集目的和实施者的不同把网络存储中的信息采集归纳为:面向长期保存的一次采集、基于web仓储的二次采集、面向采集服务的订阅型采集、需求触发的被动采集和事件驱动的网络交易采集,期望为国内网络信息采集和保存提供参考。
In this article, authors clear up and analyze web harvest methods in web archive. According to the target, the harvestman and the purpose of the acquisition, web harvest methods are divid- ed into five methods : web crawling for long - term preservation, lazy preservation for rebuilding website, service- oriented subscription harvest, demand -driven web harvest and event -driven transactional archive. Wishes to provide some references for domestic web archive.
出处
《图书馆杂志》
CSSCI
北大核心
2009年第8期28-31,共4页
Library Journal
基金
国家社会科学基金项目"网络信息资源保存的理论与方法研究"课题的资助
课题编号为06BTQ025