期刊文献+
共找到208篇文章
< 1 2 11 >
每页显示 20 50 100
节点对等Web Spider设计与实现
1
作者 张林才 张燕 王红霞 《计算机技术与发展》 2010年第3期195-198,202,共5页
由于互联网具有海量信息并且快速增长,提高搜索引擎的信息采集器Web Spider的数据采集和更新速度有重要意义。受计算资源限制,单机多线程Web Spider的采集速率不高。带中心节点的分布式并行Web Spider又容易产生中心节点瓶颈问题。利用P... 由于互联网具有海量信息并且快速增长,提高搜索引擎的信息采集器Web Spider的数据采集和更新速度有重要意义。受计算资源限制,单机多线程Web Spider的采集速率不高。带中心节点的分布式并行Web Spider又容易产生中心节点瓶颈问题。利用ProActive网格网络并行分布计算中间件提供的主动对象技术、网络并行计算技术、自动部署机制等设计和实现了一个名为P-Spider2.0的节点对等的分布式并行Web Spider,并设计了一个基于Raibin算法的URL去重算法。实验表明该Web Spider方便管理和部署,并且比单机多线程Web Spider具有更高的采集速率。 展开更多
关键词 网络爬虫 PROACTIVE 并行 分布式 节点对等
在线阅读 下载PDF
Web Page Forensics:A Web Spider Based Approach
2
作者 Ya-Dong Li Dong-Hui Hu +1 位作者 Yu-Qi Fan Xin-Dong Wu 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2014年第6期46-50,共5页
Cyber-crimes are growing rapidly,so it is important to obtain the digital evidence on the web page.Usually,people can examine the browser history on the client side and data files on the server side,but both of them h... Cyber-crimes are growing rapidly,so it is important to obtain the digital evidence on the web page.Usually,people can examine the browser history on the client side and data files on the server side,but both of them have shortcomings in real criminal investigation.To overcome the weakness,this paper designs a web page forensic scheme to snapshot the pages from web servers with the help of web spider.Also,it designs several steps to improve the trustworthiness of these pages.All the pages will be dumped in local database which can be presented as reliable evidence on the court. 展开更多
关键词 web page digital forensics web spider
在线阅读 下载PDF
基于ProActive的分布式并行WebSpider设计
3
作者 张林才 梁正友 《计算机工程》 CAS CSCD 北大核心 2008年第19期47-48,52,共3页
单机Web Spider的数据采集速度较慢,采用MPI技术或直接用Java开发分布式Web Spider代价较高。该文利用ProActive中间件提供的主动对象技术、网络并行计算技术、自动部署机制设计实现了P-Spider分布式并行Web Spider。实验结果表明,该P-S... 单机Web Spider的数据采集速度较慢,采用MPI技术或直接用Java开发分布式Web Spider代价较高。该文利用ProActive中间件提供的主动对象技术、网络并行计算技术、自动部署机制设计实现了P-Spider分布式并行Web Spider。实验结果表明,该P-Spider采集速率是单机多线程Web Spider的2.2倍。 展开更多
关键词 web spider程序 ProActive中间件 并行 分布式
在线阅读 下载PDF
Economic analysis of spider web airline networks
4
作者 Wen-dong Yang, Jin-fu Zhu, Qiang Gao,Wen-fang Wang College of Civil Aviation, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China. 《Journal of Pharmaceutical Analysis》 SCIE CAS 2009年第1期49-53,共5页
The distinct network organization, management, service and operating characteristics of US Southwest Airlines are key elements of its success compared with other airlines. As a network organization type, the spider we... The distinct network organization, management, service and operating characteristics of US Southwest Airlines are key elements of its success compared with other airlines. As a network organization type, the spider web airline network has received more attention. In this paper, we analyzed the relation between the spider web airline network and spider web, and the structure of spider web airline network, built the assignment model of the spider web airline network,and investigated the economics concerned. 展开更多
关键词 spider web spider web airline network economic analysis
在线阅读 下载PDF
面向Web论坛的网络信息获取技术及系统实现 被引量:7
5
作者 彭冬 蔡皖东 《计算机工程与科学》 CSCD 北大核心 2011年第1期157-160,共4页
网络爬虫技术是网络信息获取的重要手段,面向Web论坛的信息获取则是网络爬虫技术所面临的新课题。在分析和研究面向Web论坛信息获取技术的基础上,本文设计和实现了一种用于Web论坛信息获取的主题网络爬虫系统,根据Web论坛信息组织结构,... 网络爬虫技术是网络信息获取的重要手段,面向Web论坛的信息获取则是网络爬虫技术所面临的新课题。在分析和研究面向Web论坛信息获取技术的基础上,本文设计和实现了一种用于Web论坛信息获取的主题网络爬虫系统,根据Web论坛信息组织结构,提出了基于遍历策略的信息搜索技术;根据正文信息分布及论坛自身特点,提出了基于DOM与分块算法相结合的正文提取技术。实验结果表明,遍历策略比传统的网络爬虫遍历策略具有更高的效率,能够采集到更多主题相关度高的网页;经过噪声清洗处理后,有效提取网页正文,提高了信息采集精度。 展开更多
关键词 网络爬虫 web论坛 正文提取 主题相关度
在线阅读 下载PDF
基于Lucene的Web搜索引擎的研究和实现 被引量:7
6
作者 周凤丽 林晓丽 《计算机技术与发展》 2012年第1期140-142,160,共4页
互联网的快速发展也使搜索引擎不断的发展着,而搜索引擎逐渐转向商业化运行,使得搜索引擎的技术细节越来越隐蔽。文章研究和分析了搜索引擎工具Lucene的原理、模型和索引器,设计了一个搜索引擎系统。该系统采用了非递归的方式负责Web站... 互联网的快速发展也使搜索引擎不断的发展着,而搜索引擎逐渐转向商业化运行,使得搜索引擎的技术细节越来越隐蔽。文章研究和分析了搜索引擎工具Lucene的原理、模型和索引器,设计了一个搜索引擎系统。该系统采用了非递归的方式负责Web站点的网页爬取以及爬取过程中URL链接的存储、处理等,并通过多线程技术管理多个抓取线程,实现了并发抓取网页,提高了系统的运行效率。最后采用JSP技术设计了一个简易的新闻搜索引擎客户端,系统可以稳定运行,基本符合搜索引擎原理的探索,具有一定的现实意义。 展开更多
关键词 网络爬虫 应用系统 搜索引擎 多线程
在线阅读 下载PDF
RL_Spider:一种自主垂直搜索引擎网络爬虫 被引量:2
7
作者 黄蔚 刘忠 刘全 《计算机应用与软件》 CSCD 2011年第12期183-187,共5页
在分析相关spider技术的基础上,提出了将强化学习技术应用到垂直搜索引擎的可控网络爬虫方法。该方法通过强化学习技术得到一些控制"经验信息",根据这些信息来预测较远的回报,按照某一主题进行搜索,以使累积返回的回报值最大... 在分析相关spider技术的基础上,提出了将强化学习技术应用到垂直搜索引擎的可控网络爬虫方法。该方法通过强化学习技术得到一些控制"经验信息",根据这些信息来预测较远的回报,按照某一主题进行搜索,以使累积返回的回报值最大。将得到的网页存储、索引,用户通过搜索引擎的搜索接口,就可以得到最佳的搜索结果。对多个网站进行主题爬虫搜索,实验结果表明,该方法对于网络的查全率和查准率都具有较大的提高。 展开更多
关键词 可控强化学习 垂直搜索引擎 网络爬虫
在线阅读 下载PDF
复材蛛网蜂窝弹性常数的虚拟材料-灵敏度辨识方法
8
作者 陆鹏旭 周晋 +5 位作者 赵文 曹济川 李晖 王珺 薛杰 张迪 《火箭推进》 北大核心 2025年第4期92-99,共8页
提出了一种基于虚拟材料-灵敏度法的复材蛛网型蜂窝夹芯等效弹性常数辨识方法。首先,建立该夹芯的有限元模型,构造试验与有限元计算获得的固有频率相对误差函数,在进行迭代计算并获取相对误差函数最小值的基础上,详细阐述辨识复材蛛网... 提出了一种基于虚拟材料-灵敏度法的复材蛛网型蜂窝夹芯等效弹性常数辨识方法。首先,建立该夹芯的有限元模型,构造试验与有限元计算获得的固有频率相对误差函数,在进行迭代计算并获取相对误差函数最小值的基础上,详细阐述辨识复材蛛网型蜂窝夹芯结构等效弹性常数的理论原理和流程。其次,成功制备了具有不同尺寸的该类型夹芯试件,进一步对所提出辨识方法以及辨识获得的面内外等效杨氏模量、面内外等效剪切模量、泊松比等弹性常数的正确性开展了验证研究。研究发现将上述等效弹性常数输入有限元模型后,可以准确预测夹芯的固有频率及模态振型,且有限元计算获得的固有频率与测试结果的偏差可控制在5%之内,同时前3阶模态振型与试验振型相吻合,从而可证明辨识方法的有效性和可靠性。该方法亦可为其它复杂构型蜂窝夹芯结构的参数辨识提供一种新方法和思路。 展开更多
关键词 蛛网型蜂窝夹芯 虚拟材料法 灵敏度分析 材料参数辨识 等效弹性常数
在线阅读 下载PDF
受蛛网启发的海绵纤维基柔性电阻式压力传感阵列 被引量:1
9
作者 黄梁松 张雨 +5 位作者 张鹏 张坤 杜明超 步晓飞 王硕 赵忠凯 《传感技术学报》 北大核心 2025年第2期214-221,共8页
柔性压力传感阵列作为能够对一定范围内的压力进行检测的工具而被广泛应用。但在面对诸如非平整表面、高应力作用等复杂工作环境时,一些传感器阵列往往表现不理想,易出现撕裂,不透气,不透湿等问题。针对上述问题,采用炭黑(CB)、热塑性... 柔性压力传感阵列作为能够对一定范围内的压力进行检测的工具而被广泛应用。但在面对诸如非平整表面、高应力作用等复杂工作环境时,一些传感器阵列往往表现不理想,易出现撕裂,不透气,不透湿等问题。针对上述问题,采用炭黑(CB)、热塑性聚氨酯(TPU)和食盐(NaCl)为基础材料,利用湿法纺丝和牺牲模板法制备了具有海绵状多孔结构的柔性纤维压力传感器。该传感器具有良好的灵敏度(-0.03487 kPa^(-1),<6 kPa),且保持了良好的重复性。同时受蛛网结构的启发,以该传感器为基础制作了仿生蛛网结构的传感阵列,该结构为传感阵列带来的更好的抗应力能力和气体环境下的透气透湿性,有利于传感器阵列在不平整表面、对透气透湿性有要求等复杂环境下的应用。测试结果表明,该传感阵列能够在人体行为检测应用中发挥出理想的性能。 展开更多
关键词 电阻式柔性压力传感阵列 仿生蛛网结构 湿法纺丝 多孔结构 牺牲模板法
在线阅读 下载PDF
基于ProActive的P-Spider1.0改进
10
作者 张林才 梁正友 王红霞 《计算机工程》 CAS CSCD 北大核心 2010年第17期288-290,共3页
针对带中心节点结构的分布式并行Web Spider的中心节点负担过重、通信负载不均衡、可扩展性差的问题,提出基于Rabin指纹算法的URL去重改进算法和节点对等结构的改进方案,利用ProActive中间件设计开发改进的分布式并行Web Spider。对比... 针对带中心节点结构的分布式并行Web Spider的中心节点负担过重、通信负载不均衡、可扩展性差的问题,提出基于Rabin指纹算法的URL去重改进算法和节点对等结构的改进方案,利用ProActive中间件设计开发改进的分布式并行Web Spider。对比实验表明,改进后的Web Spider采集效率更高,通信负载均衡,无节点瓶颈问题,具有良好的可扩展性。 展开更多
关键词 网络蜘蛛 ProActive中间件 节点对等 分布式 中心节点
在线阅读 下载PDF
Web搜索引擎技术综述 被引量:5
11
作者 宋春阳 金可音 《现代计算机》 2008年第5期82-85,共4页
在现代网络飞速发展的带动下,搜索引擎技术引起了广泛的研究。从Web搜索引擎的背景、定义、分类、工作原理、网页信息采集技术,以及发展趋势方面来做一个简要的综述,来介绍国内外主要的搜索引擎。
关键词 web 搜索引擎 网络蜘蛛
在线阅读 下载PDF
基于WebLech的内容搜索引擎设计
12
作者 戴明星 杜彦辉 《计算机工程》 CAS CSCD 北大核心 2008年第9期278-280,共3页
网络蜘蛛WebLech是一种优秀的Web站点下载开源工具。该文分析WebLech的特点和工作流程,完善WebLech的起始地址设置,并丰富其链接和所获取的网页类型。使用改进后的WebLech设计了一款能在用户设置的IP范围内进行搜索的基于内容的搜索引擎。
关键词 webLech开源软件 网络蜘蛛 搜索引擎
在线阅读 下载PDF
中文WEB文档自动分类系统的设计与实现
13
作者 张小刚 杨凯 冉天保 《微计算机信息》 北大核心 2008年第30期244-246,共3页
中文WEB文档自动分类是中文自动信息检索的核心技术之一。中文WEB文档的分类涉及到文档的自动抓取、信息加工和提取、自动分类等,本文实现一个开放式的中文WEB文档自动分类系统,并在系统模块中应用了几个改进算法,主要解决目前信息检索... 中文WEB文档自动分类是中文自动信息检索的核心技术之一。中文WEB文档的分类涉及到文档的自动抓取、信息加工和提取、自动分类等,本文实现一个开放式的中文WEB文档自动分类系统,并在系统模块中应用了几个改进算法,主要解决目前信息检索中涉及中文分词搜索时所遇到的一些问题。 展开更多
关键词 网络蜘蛛 中文分词 文档频度 NAIVE 贝叶斯分类器
在线阅读 下载PDF
基于Web的专用爬虫的研究
14
作者 夏道勋 谢晓尧 《贵州师范大学学报(自然科学版)》 CAS 2009年第3期92-95,共4页
网络爬虫是全文搜索引擎系统的核心模块,它实现对站内信息的检索和特定Web信息的搜索。然而,万维网规模越来越巨大,产生了专业爬虫。主要研究了怎样建立一个有效的专用爬虫,它可以自动发现和下载用户感兴趣的页面。包括的内容:超文本分... 网络爬虫是全文搜索引擎系统的核心模块,它实现对站内信息的检索和特定Web信息的搜索。然而,万维网规模越来越巨大,产生了专业爬虫。主要研究了怎样建立一个有效的专用爬虫,它可以自动发现和下载用户感兴趣的页面。包括的内容:超文本分类器、提取器、爬虫的基本功能、数据存储及核心算法。 展开更多
关键词 专用爬虫 web内容挖掘 超文本分类器 提取器
在线阅读 下载PDF
遗传算法在主题Web信息采集中的应用研究 被引量:5
15
作者 唐志 王成良 《计算机科学》 CSCD 北大核心 2006年第7期71-74,共4页
传统的基于本地搜索算法的信息采集系统存在诸如主题漂移和采集结果局部最优等问题。在深入研究Web拓扑结构基础上,利用网络蜘蛛的在线状态,提出了基于全局信息的、动态综合了链接的立即回报价值和未来回报价值的遗传算法。通过此算法,... 传统的基于本地搜索算法的信息采集系统存在诸如主题漂移和采集结果局部最优等问题。在深入研究Web拓扑结构基础上,利用网络蜘蛛的在线状态,提出了基于全局信息的、动态综合了链接的立即回报价值和未来回报价值的遗传算法。通过此算法,利用元搜索技术可进一步提高网络蜘蛛的性能,具有更高的查全率和查准率,能够较好地解决现存问题。 展开更多
关键词 网络蜘蛛 遗传算法 web社区 信息采集
在线阅读 下载PDF
沪渝两地房产税改革效果分析及国外经验借鉴
16
作者 位雪 《山西师范大学学报(自然科学版)》 2025年第4期98-106,共9页
房产税是世界各国普遍征收的一种财产税.目前,我国实行的房产税暂行条例规定个人所有非营业用的房产免征房产税.对个人住房征税需要在制度设计和管理机制等方面进行充分研究论证并在实践中逐步探索,积累经验以后逐步在全国推进房产税改... 房产税是世界各国普遍征收的一种财产税.目前,我国实行的房产税暂行条例规定个人所有非营业用的房产免征房产税.对个人住房征税需要在制度设计和管理机制等方面进行充分研究论证并在实践中逐步探索,积累经验以后逐步在全国推进房产税改革.本文从现阶段沪渝两地开征个人房产税试点的效果入手,分析房产税改革试点的意义,并从多角度探讨房产税改革试点中的深层次问题,借鉴发达国家房产税的有益经验,以期为我国房产税改革的深入推进提供几点建议. 展开更多
关键词 房产税 改革试点 税负转嫁 蛛网模型
在线阅读 下载PDF
多意象驱动下的方向盘造型设计研究
17
作者 邓昭 孙贵川 《设计》 2025年第2期124-128,共5页
为了满足年轻群体对汽车方向盘多个意象的情感需求,文章结合感性工学、蛛网灰靶图决策模型和BP神经网络,提出了一种系统化的多意象设计方法。首先,通过感性工学构建各样本与目标意象的判断矩阵,得出目标群体对各样本的目标意象得分;其次... 为了满足年轻群体对汽车方向盘多个意象的情感需求,文章结合感性工学、蛛网灰靶图决策模型和BP神经网络,提出了一种系统化的多意象设计方法。首先,通过感性工学构建各样本与目标意象的判断矩阵,得出目标群体对各样本的目标意象得分;其次,运用AHP方法确定各个目标意象在实际需求中的权重,接着结合目标意象得分和意象权重计算蛛网灰靶决策系数,以此代表多意象综合评分;再者,通过形态分析法构建设计元素空间,接着构建各样本设计元素组合与决策系数的关系矩阵,为得到最优设计元素组合提供输入数据;最后,利用BP神经网络预测所有组合的决策系数并排序,得到最优元素组合。最终,通过最优元素组合设计了一款针对年轻群体的汽车方向盘,通过验证说明了该方法的有效性和可实施性。 展开更多
关键词 多意象设计方法 感性工学 汽车方向盘 蛛网灰靶决策 BP神经网络
在线阅读 下载PDF
一种改进的T-Spider分布式爬虫 被引量:3
18
作者 金凡 顾进广 《微电子学与计算机》 CSCD 北大核心 2011年第8期102-104,共3页
为了提高互联网网页的抓取速度,提出了一个改进的T-Spider分布式爬虫模型.该爬虫在解析URL阶段将页面进行切割以并行解析,在页面调度阶段使用改进的链接优先权计算方法,提高爬虫的抓取速度和稳定性.通过实验结果分析,验证了该方法的有效性.
关键词 网络爬虫 T-spider 页面切割 链接优先权计算
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部