期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于Linux的网络爬虫系统 被引量:8
1
作者 王锋 王伟 +1 位作者 张璟 罗作民 《计算机工程》 CAS CSCD 北大核心 2010年第1期280-282,共3页
针对目前影响爬虫程序效率的诸多关键因素,在研究爬虫程序内部运行机理的基础上,进行架构优化,改进爬虫程序中的相关算法。在Linux网络环境下,通过对实现的爬虫程序运行进行检测,反馈出该解决方案和改进之处具有可行性,提高了页面抓取... 针对目前影响爬虫程序效率的诸多关键因素,在研究爬虫程序内部运行机理的基础上,进行架构优化,改进爬虫程序中的相关算法。在Linux网络环境下,通过对实现的爬虫程序运行进行检测,反馈出该解决方案和改进之处具有可行性,提高了页面抓取的效率和爬虫程序的整体性能。 展开更多
关键词 网络爬虫 url调度 DNS解析 哈希算法
在线阅读 下载PDF
基于信息资源地址的Web集群分配策略 被引量:2
2
作者 李兰英 蒋维成 +1 位作者 何勇 李晓芳 《科学技术与工程》 北大核心 2016年第20期228-232,共5页
Web任务的分配影响Web服务器集群系统的整体性能。常用的分配方法是对用户的信息资源地址(URL)请求,根据服务器数量进行轮询分配。这种策略影响缓存的命中率和服务器性能的发挥。在分析了Web站点中文件的组织方式及用户对Web请求特征的... Web任务的分配影响Web服务器集群系统的整体性能。常用的分配方法是对用户的信息资源地址(URL)请求,根据服务器数量进行轮询分配。这种策略影响缓存的命中率和服务器性能的发挥。在分析了Web站点中文件的组织方式及用户对Web请求特征的基础上,提出了基于URL分配树的LT分配策略。根据URL地址构建URL分配树,对用户的请求进行响应;同时考虑任务的处理代价,各服务节点服务能力和当前负载状况,对服务节点进行负载均衡的任务分配。从缓存队列剩余、请求任务溢出情况和轮询分配策略进行了比较,实验表明分配策略能根据服务节点的服务能力、负载状况进行合理地分配,实现了负载的真正均衡,提高了系统整体吞吐量。 展开更多
关键词 信息资源地址(uniform RESOURCE locator url) 分配树 WEB服务 请求分配 处理费用
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部