期刊文献+
共找到2,952篇文章
< 1 2 148 >
每页显示 20 50 100
Teaching Reform and Practice of the“Data Collection and Web Crawler”Course Based on the Blended Teaching Mode
1
作者 Simin Wu 《Journal of Contemporary Educational Research》 2025年第7期116-122,共7页
The data collection and web crawling course has a lot of theoretical knowledge and strong practicality.Traditional teaching methods are no longer sufficient to meet teaching needs.Based on the characteristics of the c... The data collection and web crawling course has a lot of theoretical knowledge and strong practicality.Traditional teaching methods are no longer sufficient to meet teaching needs.Based on the characteristics of the course,this article constructs a mixed teaching environment based on“Learning Pass+Hongya Platform+Offline Course,”integrates teaching resource libraries and ideological and political cases,and develops a suitable evaluation system to cultivate students’innovative and critical thinking abilities,stimulate their learning initiative,improve their teamwork ability,and enhance their professional level and data literacy. 展开更多
关键词 Blended learning mode crawler Course teaching reform
在线阅读 下载PDF
人才型住房政策与数字创新创业活跃度 被引量:1
2
作者 李言 毛丰付 《经济与管理》 北大核心 2026年第1期19-28,共10页
伴随数字经济快速发展,如何提高数字创新创业活跃度成为相关研究关注的重点,但现有研究尚未从人才供给角度思考该问题。从数字人才集聚水平渠道切入,构建人才型住房政策影响数字创新创业活跃度的作用机制,基于中国2011—2019年城市层面... 伴随数字经济快速发展,如何提高数字创新创业活跃度成为相关研究关注的重点,但现有研究尚未从人才供给角度思考该问题。从数字人才集聚水平渠道切入,构建人才型住房政策影响数字创新创业活跃度的作用机制,基于中国2011—2019年城市层面数据,利用网络爬虫法构建人才型住房政策数据库,并根据政策文本内容构建人才型住房政策强度指标,采用面板双向固定效应模型识别人才型住房政策对数字创新创业活跃度的影响效应和作用机制。研究发现:人才型住房政策强度增加能够显著提高数字创新创业活跃度,上述结论通过了稳健性检验。异质性分析结果表明,在沿海地区、南方地区、数字创新创业活跃度较低的城市,人才型住房政策对数字创新创业活跃度的推动作用更好。机制分析结果表明,人才型住房政策主要通过提升数字人才集聚水平提高数字创新创业活跃度。进一步分析发现,周边城市人才型住房政策强度增加会对本地数字创新创业活跃度产生不利影响。 展开更多
关键词 人才型住房政策 数字创新创业活跃度 数字人才集聚水平 网络爬虫法
在线阅读 下载PDF
分布式Web Crawler的研究:结构、算法和策略 被引量:23
3
作者 叶允明 于水 +2 位作者 马范援 宋晖 张岭 《电子学报》 EI CAS CSCD 北大核心 2002年第12A期2008-2011,共4页
本文介绍了一个大型分布式Web Crawler系统——Igloo 1.2版。它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageR... 本文介绍了一个大型分布式Web Crawler系统——Igloo 1.2版。它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageRank值作为网页质量评价的标准,从而提高了爬行质量.加快爬行速度的关键是如何解除Crawler系统中的性能瓶颈,本文对此也作了详细的讨论,并提出了一种基于“滞后合并”策略的UBL数据库存取方法.实验表明,Igloo在保持高性能的同时能快速爬行到高质量的网页. 展开更多
关键词 WEB爬虫 爬行策略 分布式系统 计算机网络 网页
在线阅读 下载PDF
基于神经网络的增量式crawler重访频率研究 被引量:1
4
作者 周英飚 王军 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第12期32-33,45,共3页
crawler是搜索引擎必备的核心组件 ,以何种频率对变化的Web页面进行重访是增量式crawler要解决的主要问题 .结合人工神经网络建立页面变化模型 ,由模型确定增量式crawler重访时间 ,同时分析模型在实践中的应用 ,提出一种应用方案 ,具有... crawler是搜索引擎必备的核心组件 ,以何种频率对变化的Web页面进行重访是增量式crawler要解决的主要问题 .结合人工神经网络建立页面变化模型 ,由模型确定增量式crawler重访时间 ,同时分析模型在实践中的应用 ,提出一种应用方案 ,具有较好的自适应性 . 展开更多
关键词 搜索引擎 crawler 增量式crawler 神经网络
在线阅读 下载PDF
一种并行Crawler系统中的URL分配算法设计 被引量:1
5
作者 万源 万方 王大震 《计算机工程与应用》 CSCD 北大核心 2006年第A01期117-119,共3页
研究了分布式体系结构下的并行Crawler采集模型,分析了各组件的功能及各Cmwler在并行搜索时,为保证系统的负载均衡而应遵循的基本规则,并提出了一种基于散列(hash)的URL的调度算法。
关键词 分布式crawler 散列算法 URL分配
在线阅读 下载PDF
面向动态网页爬行的Crawler架构 被引量:7
6
作者 严亚兰 《图书情报知识》 CSSCI 北大核心 2003年第4期51-53,共3页
 本文分析了Crawler动态网页爬行功能,提出了面向动态网页爬行的Crawler架构,并对相应模块进行了探讨。
关键词 crawler架构 爬行 动态网页
在线阅读 下载PDF
一个P2P IPTV多协议爬行器——TVCrawler 被引量:5
7
作者 姜志宏 王晖 +1 位作者 樊鹏翼 袁雪美 《计算机应用》 CSCD 北大核心 2010年第3期715-718,728,共5页
P2PIPTV网络测量是研究P2PIPTV行为和特征的重要手段,不仅有利于设计出更符合真实网络环境的系统或协议,也是实现P2PIPTV监测、引导和控制等方面的重要依据和基础。爬行器是P2PIPTV网络的一种主动测量技术,也是目前P2PIPTV测量的主要方... P2PIPTV网络测量是研究P2PIPTV行为和特征的重要手段,不仅有利于设计出更符合真实网络环境的系统或协议,也是实现P2PIPTV监测、引导和控制等方面的重要依据和基础。爬行器是P2PIPTV网络的一种主动测量技术,也是目前P2PIPTV测量的主要方式之一。提出了一个P2PIPTV多协议爬行器——TVCrawler,能够对PPLive、PPStream和UUSee三个系统的直播频道进行测量。TVCrawler主要具有三个特点:1)采用基于反馈的引导节点集构造机制;2)采用主从结构,并行爬行获取拓扑数据;3)采用基于拓扑增长系数的自适应爬行时长控制。实验表明,TVCrawler的爬行测量速度达到20~100节点/秒和130~500边/秒。 展开更多
关键词 网络测量 对等网络 网络电视 爬行器 覆盖网络
在线阅读 下载PDF
智能专题化信息搜集Crawler 被引量:4
8
作者 钱榕 徐新华 +1 位作者 郑莹 杨炳儒 《计算机工程》 CAS CSCD 北大核心 2006年第3期57-59,共3页
介绍了基于Web内容和结构挖掘的专题化智能Web爬行Crawler系统,并重点介绍其中CA(C&S)算法,该算法充分利用神经网络可以方便地模拟网络的拓扑结构和并行计算的特点,采用加强学习判断网页与主题的相关度,在进行相关度计算时,不考虑... 介绍了基于Web内容和结构挖掘的专题化智能Web爬行Crawler系统,并重点介绍其中CA(C&S)算法,该算法充分利用神经网络可以方便地模拟网络的拓扑结构和并行计算的特点,采用加强学习判断网页与主题的相关度,在进行相关度计算时,不考虑网页的全部内容,而通过提取网页的HTML描述中的重要标记,对Web网页进行内容和结构分析,从而判断爬行到的网页与主题的相关性,以提高信息搜集的效率和精确性。 展开更多
关键词 专题化爬行 WEB挖掘 神经网络 加强学习
在线阅读 下载PDF
基于网络评论的酱香型白酒消费体验描述词研究
9
作者 杨玉波 牛俊桀 +12 位作者 汪厚银 曹念 钟葵 熊小淋 杨帆 云振宇 徐阳 涂华彬 赵镭 张瑶 秦臻 向平 史波林 《中国酿造》 北大核心 2026年第1期328-333,共6页
酱香型白酒具有丰富的风味属性、极高的感官体验和品鉴价值,其感官描述形成于全国五届评酒会,主要为专业品酒师所用,而专业品酒师的感知水平与品评技能通常高于消费者,且品酒方式与消费者日常饮酒存在较大差异,从分析型角度描述白酒呈... 酱香型白酒具有丰富的风味属性、极高的感官体验和品鉴价值,其感官描述形成于全国五届评酒会,主要为专业品酒师所用,而专业品酒师的感知水平与品评技能通常高于消费者,且品酒方式与消费者日常饮酒存在较大差异,从分析型角度描述白酒呈现出的感知特征与消费型角度传递饮酒的体验与感受亦存在较大差别。该文通过Python爬虫程序,从网络平台抓取酱香型白酒的评论,通过文本预处理与文本挖掘手段,将网络评论中感官描述词进行划分。结果表明,共抓取了6 435条关于酱香型白酒的评论,将其划分为感受类描述词和感知类描述词。感受类描述词表现出“视整体、较宽泛、喜对比、重体验”的特点,感知类描述词在数量与范畴上的减少表明消费者与品酒师对酱香型白酒感官品质的关注、感知与表述存在差异。该结果验证了构建酱香型白酒消费体验描述词的合理性与基于网络评论分析消费者感知侧重的可行性。 展开更多
关键词 网络评论 酱香型白酒 消费体验描述词 Python爬虫 感官描述
在线阅读 下载PDF
增量更新Crawler进行Web收集方法研究 被引量:2
10
作者 程菲 汪建海 罗键 《计算机工程与科学》 CSCD 2006年第12期28-30,98,共4页
本文针对目前Web信息挖掘中存在的各种问题,对网络爬虫系统进行研究,提出了一种基于HTTP协议原理、旨在减少网络爬虫系统运行时网络流量的Web页面收集方法———增量更新Crawler方法。该方法通过Web预取技术对现有的Web链接数据库进行... 本文针对目前Web信息挖掘中存在的各种问题,对网络爬虫系统进行研究,提出了一种基于HTTP协议原理、旨在减少网络爬虫系统运行时网络流量的Web页面收集方法———增量更新Crawler方法。该方法通过Web预取技术对现有的Web链接数据库进行演化更新,可以在减少网络流量的同时获得接近现有网络爬虫系统的效果。 展开更多
关键词 信息检索 网络爬虫 增量更新
在线阅读 下载PDF
面向主题Crawler的设计与实现 被引量:1
11
作者 苗长芬 冯伟华 《平原大学学报》 2005年第3期110-112,共3页
针对目前通用搜索引擎所搜索到的结果过多,与主题相关性不强的情况,提出了面向主题的搜索引擎,文章以主题相关度为核心研究和设计了主题crawler,为进行主题搜索引擎的研究奠定了良好的基础.
关键词 crawler 主题搜索引擎 相关度
在线阅读 下载PDF
一种面向快速Web漏洞扫描的网页爬取方法
12
作者 王金翔 朱亚运 +3 位作者 刘万大山 姜琳 刘林彬 李俊娥 《计算机应用与软件》 北大核心 2026年第1期370-376,共7页
随着Web应用规模的不断扩大,对网站进行漏洞扫描的时间成本也不断增加。为此,提出一种面向快速Web漏洞扫描的网页爬取方法。该方法在传统的面向Web漏洞扫描的爬虫的基础上,利用增量闭频繁项集挖掘算法对网站页面进行阶段性聚类,并基于... 随着Web应用规模的不断扩大,对网站进行漏洞扫描的时间成本也不断增加。为此,提出一种面向快速Web漏洞扫描的网页爬取方法。该方法在传统的面向Web漏洞扫描的爬虫的基础上,利用增量闭频繁项集挖掘算法对网站页面进行阶段性聚类,并基于页面聚簇和爬虫日志构建页面分类模型,以过滤由同一个服务处理程序生成的冗余页面。实验表明,该方法能有效减少漏洞扫描系统在网站目录遍历和页面聚类上消耗的时间,从而提升Web漏洞扫描的效率。 展开更多
关键词 爬虫 Web漏洞扫描 页面聚类 频繁模式挖掘
在线阅读 下载PDF
基于Crawler技术的超链接测试系统
13
作者 吉向东 《信息技术》 2009年第9期106-108,共3页
设计和实现了一个基于搜索引擎Crawler技术的超链接测试系统。通过将Crawler的爬行范围限制在一个网站之内,系统可以自动对待测网站进行扫描,有效地找出烂链和孤页。测试表明,相对于其它超链接测试产品而言,系统的测试自动化程度较高,... 设计和实现了一个基于搜索引擎Crawler技术的超链接测试系统。通过将Crawler的爬行范围限制在一个网站之内,系统可以自动对待测网站进行扫描,有效地找出烂链和孤页。测试表明,相对于其它超链接测试产品而言,系统的测试自动化程度较高,为测试人员提供了较为丰富的控制手段。 展开更多
关键词 crawler 超链接 测试 烂链 孤页
在线阅读 下载PDF
Defending against Topological Information Probing for Online Decentralized Web Services
14
作者 Xinli Hao Qingyuan Gong Yang Chen 《Computers, Materials & Continua》 2026年第3期330-350,共21页
Topological information is very important for understanding different types of online web services,in particular,for online social networks(OSNs).People leverage such information for various applications,such as socia... Topological information is very important for understanding different types of online web services,in particular,for online social networks(OSNs).People leverage such information for various applications,such as social relationship modeling,community detection,user profiling,and user behavior prediction.However,the leak of such information will also pose severe challenges for user privacy preserving due to its usefulness in characterizing users.Large-scale web crawling-based information probing is a representative way for obtaining topological information of online web services.In this paper,we explore how to defend against topological information probing for online web services,with a particular focus on online decentralized web services such as Mastodon.Different from traditional centralized web services,the federated nature of decentralized web services makes the identification of distributed crawlers even more difficult.We analyze the behavioral differences between legitimate users and crawlers in decentralized web services and highlight two key behavioral attributes that distinguish crawlers from legitimate users:instance interaction preferences and hop count in profile viewing patterns.Based on these insights:we propose a supervised machine learning-based framework for crawler detection,which is able to learn the federation-aware feature representations for users.To validate the framework’s effectiveness,we construct a labeled dataset that integrates real users with real-trace driven simulated crawlers in Mastodon.We use this dataset to train various supervised classifiers for crawler detection.Experimental results demonstrate that our framework can achieve an excellent classification performance.Moreover,it is observed that federation-aware features are effective in improving detection performance. 展开更多
关键词 Anti-mapping crawler detection machine learning decentralized online social networks
在线阅读 下载PDF
分布式Crawler系统研究与设计
15
作者 万方 王大震 《软件导刊》 2007年第5期45-46,共2页
分布式Crawler系统是在传统集中式信息采集系统基础上,结合分布式并行技术的产物,是搜索引擎的一个重要组成部分。研究了分布式Crawler系统中并行调度和URL处理的主要实现技术,并设计了一个分布式Crawler系统,对其中的任务划分机制和UR... 分布式Crawler系统是在传统集中式信息采集系统基础上,结合分布式并行技术的产物,是搜索引擎的一个重要组成部分。研究了分布式Crawler系统中并行调度和URL处理的主要实现技术,并设计了一个分布式Crawler系统,对其中的任务划分机制和URL检索算法作了详细描述。 展开更多
关键词 分布式crawler 并行调度 URL检索
在线阅读 下载PDF
可变履带式莲藕采收机底盘的设计与分析
16
作者 刘岸卓 杨晨升 +1 位作者 梁海斌 杜历琪 《智能化农业装备学报(中英文)》 2026年第1期190-196,共7页
我国莲藕产业在国际市场占据主导地位,但莲藕采收机械化率较低。传统农机刚性底盘难以满足稳定性、通过性与适应性要求。针对这一问题,研究设计了一种可变式三角履带底盘,以提升采收机在复杂藕田环境中的作业性能。通过分析藕田工况及... 我国莲藕产业在国际市场占据主导地位,但莲藕采收机械化率较低。传统农机刚性底盘难以满足稳定性、通过性与适应性要求。针对这一问题,研究设计了一种可变式三角履带底盘,以提升采收机在复杂藕田环境中的作业性能。通过分析藕田工况及底盘受力特性,确定了履带接地比压、牵引力、功率等关键参数,采用模块化设计结合ZL303铝合金材料优化整机结构,实现减重与成本控制。利用SolidWorks建立三维模型,基于ANSYS Workbench对驱动轮、可变装置及承重部件进行有限元分析,涵盖应力分布、疲劳安全裕度及模态特性等关键指标。仿真结果表明:当整机满载总质量1.1 t、最高速度15 km/h时,驱动轮最大应力为44.05 MPa,关键部件疲劳安全系数均高于2.4,最低固有频率为323.3Hz,可有效避免与附加设备振动频率(50~300 Hz)产生共振。通过液压系统动态调节履带张紧力(400~2000 N)和可变轨距机构,底盘具备300 mm垂直越障能力及0.4 m水深适应性。整机采用冗余设计与模块化维修体系,有效解决了现有技术系统集成度不足、能量效率偏低、制造成本较高等问题。该底盘满载时有效载荷比达54.5%,重心高度控制在420 mm以下,倾覆力矩安全系数满足GB/T19930-2005标准要求,且预留3组动力输出接口与4个标准化安装基座,支持多功能农业作业装置快速换装,为智能农机装备开发提供了可靠平台。 展开更多
关键词 莲藕采收 可变式底盘 三角履带底盘 模态分析 履带底盘 经济水生植物产业
在线阅读 下载PDF
连续油管井下机器人发展概况与展望
17
作者 刘清友 赵建国 +1 位作者 管彬 梁鹏辉 《钻采工艺》 北大核心 2026年第1期66-73,I0001,共9页
系统梳理了连续油管井下机器人结构与控制特征,重点对比分析了其支撑机构和控制系统。基于连续油管井下机器人结构特征,首次将支撑机构划分为斜面式、连杆式和复合式3大类共9种,分析了各类支撑机构工况适应性和优缺点;根据其控制原理,... 系统梳理了连续油管井下机器人结构与控制特征,重点对比分析了其支撑机构和控制系统。基于连续油管井下机器人结构特征,首次将支撑机构划分为斜面式、连杆式和复合式3大类共9种,分析了各类支撑机构工况适应性和优缺点;根据其控制原理,将控制系统分为液驱液控和液驱电控2大类,对比分析了各类控制系统特征,并总结了两类系统在连续油管井下机器人中的应用现状和发展趋势。同时,提出了连续油管井下机器人钻井、下套管等新工艺、新方法,设计了井下机器人智能钻完井实验系统方案,为连续油管井下机器人的研发、设计与工程应用提供了重要参考和技术借鉴。 展开更多
关键词 井下机器人 井下牵引器 井下爬行器 连续油管 超长水平井
在线阅读 下载PDF
履带起重机支重轮设计及排布分析
18
作者 董文侯 《建筑机械》 2026年第1期250-251,259,共3页
为减少履带起重机行走装置各轮系和履带板的磨损,优化履带架及整机受力状态,延长“四轮一带”使用寿命,降低制造成本及后期使用维修维护等运营成本,文章论述了履带起重机支重轮的设计和材料选用及排布间距的方法,为履带起重机及履带行... 为减少履带起重机行走装置各轮系和履带板的磨损,优化履带架及整机受力状态,延长“四轮一带”使用寿命,降低制造成本及后期使用维修维护等运营成本,文章论述了履带起重机支重轮的设计和材料选用及排布间距的方法,为履带起重机及履带行走类产品的行走装置设计提供参考。 展开更多
关键词 履带起重机 支重轮设计 支重轮排布 履带行走装置
在线阅读 下载PDF
“国家规定”更新视角下非法数据爬取的刑法规制
19
作者 王小源 郭旨龙 《法治现代化研究》 2026年第1期116-134,共19页
刑法应整体秉持谦抑立场对非法数据爬取行为予以规制。在可能涉及的罪名中,非法获取计算机信息系统数据罪因行为方式与数据爬取的技术性特征重合、行为对象具有最广泛的涵摄能力,因而处于牵一发而动全身的地位,值得深入研究。立足“违... 刑法应整体秉持谦抑立场对非法数据爬取行为予以规制。在可能涉及的罪名中,非法获取计算机信息系统数据罪因行为方式与数据爬取的技术性特征重合、行为对象具有最广泛的涵摄能力,因而处于牵一发而动全身的地位,值得深入研究。立足“违反国家规定”的空白罪状,宜以最新修订的《反不正当竞争法》等在内的前置法更新,作为限缩解释非法获取计算机信息系统数据罪的构成要件、合理确定本罪成立范围的切入口。形式不法层面,基于本罪以数据安全为保护法益以及数据爬取“访问+获取”的双环节技术构造,可遵循从数据对象“公开—不公开”的一阶判断,到行为方式“侵入—非侵入”的二阶判断的阶梯审查范式,后者宜结合前端爬虫与后端爬虫的技术性区分进行典型不法样态的厘清。在实质不法层面,“情节严重”的罪量要件为基于法益侵害性程度限缩本罪适用提供了指引。爬取方单纯造成被爬取方竞争利益损失,或在调用接口等技术侵入行为前已充分进行数据及系统安全影响评估的情形,应被排除于刑事归责范围之外。 展开更多
关键词 非法获取计算机信息系统数据罪 数据法益 反不正当竞争法 网络爬虫 后端爬取
在线阅读 下载PDF
OBE理念在数据采集与网络爬虫课程中的应用
20
作者 周丽明 李文华 张兆虔 《数字通信世界》 2026年第1期106-108,共3页
在教育领域,成果导向教育(OBE)理念正重塑课程教学范式。本文聚焦其在数据采集与网络爬虫课程的应用,剖析从实践策略、教育路径到品德素养融合的教育逻辑,展现其驱动课程实现知识、能力、素养的统一,为信息技术类课程创新提供参考。
关键词 OBE理念 数据采集 网络爬虫 课程应用
在线阅读 下载PDF
上一页 1 2 148 下一页 到第
使用帮助 返回顶部