期刊文献+
共找到2,959篇文章
< 1 2 148 >
每页显示 20 50 100
人才型住房政策与数字创新创业活跃度 被引量:1
1
作者 李言 毛丰付 《经济与管理》 北大核心 2026年第1期19-28,共10页
伴随数字经济快速发展,如何提高数字创新创业活跃度成为相关研究关注的重点,但现有研究尚未从人才供给角度思考该问题。从数字人才集聚水平渠道切入,构建人才型住房政策影响数字创新创业活跃度的作用机制,基于中国2011—2019年城市层面... 伴随数字经济快速发展,如何提高数字创新创业活跃度成为相关研究关注的重点,但现有研究尚未从人才供给角度思考该问题。从数字人才集聚水平渠道切入,构建人才型住房政策影响数字创新创业活跃度的作用机制,基于中国2011—2019年城市层面数据,利用网络爬虫法构建人才型住房政策数据库,并根据政策文本内容构建人才型住房政策强度指标,采用面板双向固定效应模型识别人才型住房政策对数字创新创业活跃度的影响效应和作用机制。研究发现:人才型住房政策强度增加能够显著提高数字创新创业活跃度,上述结论通过了稳健性检验。异质性分析结果表明,在沿海地区、南方地区、数字创新创业活跃度较低的城市,人才型住房政策对数字创新创业活跃度的推动作用更好。机制分析结果表明,人才型住房政策主要通过提升数字人才集聚水平提高数字创新创业活跃度。进一步分析发现,周边城市人才型住房政策强度增加会对本地数字创新创业活跃度产生不利影响。 展开更多
关键词 人才型住房政策 数字创新创业活跃度 数字人才集聚水平 网络爬虫法
在线阅读 下载PDF
Teaching Reform and Practice of the“Data Collection and Web Crawler”Course Based on the Blended Teaching Mode
2
作者 Simin Wu 《Journal of Contemporary Educational Research》 2025年第7期116-122,共7页
The data collection and web crawling course has a lot of theoretical knowledge and strong practicality.Traditional teaching methods are no longer sufficient to meet teaching needs.Based on the characteristics of the c... The data collection and web crawling course has a lot of theoretical knowledge and strong practicality.Traditional teaching methods are no longer sufficient to meet teaching needs.Based on the characteristics of the course,this article constructs a mixed teaching environment based on“Learning Pass+Hongya Platform+Offline Course,”integrates teaching resource libraries and ideological and political cases,and develops a suitable evaluation system to cultivate students’innovative and critical thinking abilities,stimulate their learning initiative,improve their teamwork ability,and enhance their professional level and data literacy. 展开更多
关键词 Blended learning mode crawler Course teaching reform
在线阅读 下载PDF
分布式Web Crawler的研究:结构、算法和策略 被引量:23
3
作者 叶允明 于水 +2 位作者 马范援 宋晖 张岭 《电子学报》 EI CAS CSCD 北大核心 2002年第12A期2008-2011,共4页
本文介绍了一个大型分布式Web Crawler系统——Igloo 1.2版。它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageR... 本文介绍了一个大型分布式Web Crawler系统——Igloo 1.2版。它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageRank值作为网页质量评价的标准,从而提高了爬行质量.加快爬行速度的关键是如何解除Crawler系统中的性能瓶颈,本文对此也作了详细的讨论,并提出了一种基于“滞后合并”策略的UBL数据库存取方法.实验表明,Igloo在保持高性能的同时能快速爬行到高质量的网页. 展开更多
关键词 WEB爬虫 爬行策略 分布式系统 计算机网络 网页
在线阅读 下载PDF
智能专题化信息搜集Crawler 被引量:4
4
作者 钱榕 徐新华 +1 位作者 郑莹 杨炳儒 《计算机工程》 CAS CSCD 北大核心 2006年第3期57-59,共3页
介绍了基于Web内容和结构挖掘的专题化智能Web爬行Crawler系统,并重点介绍其中CA(C&S)算法,该算法充分利用神经网络可以方便地模拟网络的拓扑结构和并行计算的特点,采用加强学习判断网页与主题的相关度,在进行相关度计算时,不考虑... 介绍了基于Web内容和结构挖掘的专题化智能Web爬行Crawler系统,并重点介绍其中CA(C&S)算法,该算法充分利用神经网络可以方便地模拟网络的拓扑结构和并行计算的特点,采用加强学习判断网页与主题的相关度,在进行相关度计算时,不考虑网页的全部内容,而通过提取网页的HTML描述中的重要标记,对Web网页进行内容和结构分析,从而判断爬行到的网页与主题的相关性,以提高信息搜集的效率和精确性。 展开更多
关键词 专题化爬行 WEB挖掘 神经网络 加强学习
在线阅读 下载PDF
增量更新Crawler进行Web收集方法研究 被引量:2
5
作者 程菲 汪建海 罗键 《计算机工程与科学》 CSCD 2006年第12期28-30,98,共4页
本文针对目前Web信息挖掘中存在的各种问题,对网络爬虫系统进行研究,提出了一种基于HTTP协议原理、旨在减少网络爬虫系统运行时网络流量的Web页面收集方法———增量更新Crawler方法。该方法通过Web预取技术对现有的Web链接数据库进行... 本文针对目前Web信息挖掘中存在的各种问题,对网络爬虫系统进行研究,提出了一种基于HTTP协议原理、旨在减少网络爬虫系统运行时网络流量的Web页面收集方法———增量更新Crawler方法。该方法通过Web预取技术对现有的Web链接数据库进行演化更新,可以在减少网络流量的同时获得接近现有网络爬虫系统的效果。 展开更多
关键词 信息检索 网络爬虫 增量更新
在线阅读 下载PDF
一种面向快速Web漏洞扫描的网页爬取方法
6
作者 王金翔 朱亚运 +3 位作者 刘万大山 姜琳 刘林彬 李俊娥 《计算机应用与软件》 北大核心 2026年第1期370-376,共7页
随着Web应用规模的不断扩大,对网站进行漏洞扫描的时间成本也不断增加。为此,提出一种面向快速Web漏洞扫描的网页爬取方法。该方法在传统的面向Web漏洞扫描的爬虫的基础上,利用增量闭频繁项集挖掘算法对网站页面进行阶段性聚类,并基于... 随着Web应用规模的不断扩大,对网站进行漏洞扫描的时间成本也不断增加。为此,提出一种面向快速Web漏洞扫描的网页爬取方法。该方法在传统的面向Web漏洞扫描的爬虫的基础上,利用增量闭频繁项集挖掘算法对网站页面进行阶段性聚类,并基于页面聚簇和爬虫日志构建页面分类模型,以过滤由同一个服务处理程序生成的冗余页面。实验表明,该方法能有效减少漏洞扫描系统在网站目录遍历和页面聚类上消耗的时间,从而提升Web漏洞扫描的效率。 展开更多
关键词 爬虫 Web漏洞扫描 页面聚类 频繁模式挖掘
在线阅读 下载PDF
基于神经网络的增量式crawler重访频率研究 被引量:1
7
作者 周英飚 王军 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第12期32-33,45,共3页
crawler是搜索引擎必备的核心组件 ,以何种频率对变化的Web页面进行重访是增量式crawler要解决的主要问题 .结合人工神经网络建立页面变化模型 ,由模型确定增量式crawler重访时间 ,同时分析模型在实践中的应用 ,提出一种应用方案 ,具有... crawler是搜索引擎必备的核心组件 ,以何种频率对变化的Web页面进行重访是增量式crawler要解决的主要问题 .结合人工神经网络建立页面变化模型 ,由模型确定增量式crawler重访时间 ,同时分析模型在实践中的应用 ,提出一种应用方案 ,具有较好的自适应性 . 展开更多
关键词 搜索引擎 crawler 增量式crawler 神经网络
在线阅读 下载PDF
一种并行Crawler系统中的URL分配算法设计 被引量:1
8
作者 万源 万方 王大震 《计算机工程与应用》 CSCD 北大核心 2006年第A01期117-119,共3页
研究了分布式体系结构下的并行Crawler采集模型,分析了各组件的功能及各Cmwler在并行搜索时,为保证系统的负载均衡而应遵循的基本规则,并提出了一种基于散列(hash)的URL的调度算法。
关键词 分布式crawler 散列算法 URL分配
在线阅读 下载PDF
面向动态网页爬行的Crawler架构 被引量:7
9
作者 严亚兰 《图书情报知识》 CSSCI 北大核心 2003年第4期51-53,共3页
 本文分析了Crawler动态网页爬行功能,提出了面向动态网页爬行的Crawler架构,并对相应模块进行了探讨。
关键词 crawler架构 爬行 动态网页
在线阅读 下载PDF
“国家规定”更新视角下非法数据爬取的刑法规制
10
作者 王小源 郭旨龙 《法治现代化研究》 2026年第1期116-134,共19页
刑法应整体秉持谦抑立场对非法数据爬取行为予以规制。在可能涉及的罪名中,非法获取计算机信息系统数据罪因行为方式与数据爬取的技术性特征重合、行为对象具有最广泛的涵摄能力,因而处于牵一发而动全身的地位,值得深入研究。立足“违... 刑法应整体秉持谦抑立场对非法数据爬取行为予以规制。在可能涉及的罪名中,非法获取计算机信息系统数据罪因行为方式与数据爬取的技术性特征重合、行为对象具有最广泛的涵摄能力,因而处于牵一发而动全身的地位,值得深入研究。立足“违反国家规定”的空白罪状,宜以最新修订的《反不正当竞争法》等在内的前置法更新,作为限缩解释非法获取计算机信息系统数据罪的构成要件、合理确定本罪成立范围的切入口。形式不法层面,基于本罪以数据安全为保护法益以及数据爬取“访问+获取”的双环节技术构造,可遵循从数据对象“公开—不公开”的一阶判断,到行为方式“侵入—非侵入”的二阶判断的阶梯审查范式,后者宜结合前端爬虫与后端爬虫的技术性区分进行典型不法样态的厘清。在实质不法层面,“情节严重”的罪量要件为基于法益侵害性程度限缩本罪适用提供了指引。爬取方单纯造成被爬取方竞争利益损失,或在调用接口等技术侵入行为前已充分进行数据及系统安全影响评估的情形,应被排除于刑事归责范围之外。 展开更多
关键词 非法获取计算机信息系统数据罪 数据法益 反不正当竞争法 网络爬虫 后端爬取
在线阅读 下载PDF
一个P2P IPTV多协议爬行器——TVCrawler 被引量:5
11
作者 姜志宏 王晖 +1 位作者 樊鹏翼 袁雪美 《计算机应用》 CSCD 北大核心 2010年第3期715-718,728,共5页
P2PIPTV网络测量是研究P2PIPTV行为和特征的重要手段,不仅有利于设计出更符合真实网络环境的系统或协议,也是实现P2PIPTV监测、引导和控制等方面的重要依据和基础。爬行器是P2PIPTV网络的一种主动测量技术,也是目前P2PIPTV测量的主要方... P2PIPTV网络测量是研究P2PIPTV行为和特征的重要手段,不仅有利于设计出更符合真实网络环境的系统或协议,也是实现P2PIPTV监测、引导和控制等方面的重要依据和基础。爬行器是P2PIPTV网络的一种主动测量技术,也是目前P2PIPTV测量的主要方式之一。提出了一个P2PIPTV多协议爬行器——TVCrawler,能够对PPLive、PPStream和UUSee三个系统的直播频道进行测量。TVCrawler主要具有三个特点:1)采用基于反馈的引导节点集构造机制;2)采用主从结构,并行爬行获取拓扑数据;3)采用基于拓扑增长系数的自适应爬行时长控制。实验表明,TVCrawler的爬行测量速度达到20~100节点/秒和130~500边/秒。 展开更多
关键词 网络测量 对等网络 网络电视 爬行器 覆盖网络
在线阅读 下载PDF
基于Web-3D的网络虚拟社区的交互设计 被引量:3
12
作者 陈实 《包装工程》 CAS CSCD 北大核心 2008年第4期84-86,101,共4页
以基于W eb-3D的网络虚拟现实为例,探讨了在其中如何通过用户建模得到相应得用户角色,来指导网络虚拟现实系统中相应模型的开发。一方面针对系统可行性,通过用户定性研究建立网络系统的表现模型;另一方面为了提升系统的期望性进行用户建... 以基于W eb-3D的网络虚拟现实为例,探讨了在其中如何通过用户建模得到相应得用户角色,来指导网络虚拟现实系统中相应模型的开发。一方面针对系统可行性,通过用户定性研究建立网络系统的表现模型;另一方面为了提升系统的期望性进行用户建模,以帮助用户更好地进行人物角色设定和参与虚拟社区生活。 展开更多
关键词 web-3D 虚拟现实 网络交互设计 用户建模
在线阅读 下载PDF
基于网络评论的酱香型白酒消费体验描述词研究
13
作者 杨玉波 牛俊桀 +12 位作者 汪厚银 曹念 钟葵 熊小淋 杨帆 云振宇 徐阳 涂华彬 赵镭 张瑶 秦臻 向平 史波林 《中国酿造》 北大核心 2026年第1期328-333,共6页
酱香型白酒具有丰富的风味属性、极高的感官体验和品鉴价值,其感官描述形成于全国五届评酒会,主要为专业品酒师所用,而专业品酒师的感知水平与品评技能通常高于消费者,且品酒方式与消费者日常饮酒存在较大差异,从分析型角度描述白酒呈... 酱香型白酒具有丰富的风味属性、极高的感官体验和品鉴价值,其感官描述形成于全国五届评酒会,主要为专业品酒师所用,而专业品酒师的感知水平与品评技能通常高于消费者,且品酒方式与消费者日常饮酒存在较大差异,从分析型角度描述白酒呈现出的感知特征与消费型角度传递饮酒的体验与感受亦存在较大差别。该文通过Python爬虫程序,从网络平台抓取酱香型白酒的评论,通过文本预处理与文本挖掘手段,将网络评论中感官描述词进行划分。结果表明,共抓取了6 435条关于酱香型白酒的评论,将其划分为感受类描述词和感知类描述词。感受类描述词表现出“视整体、较宽泛、喜对比、重体验”的特点,感知类描述词在数量与范畴上的减少表明消费者与品酒师对酱香型白酒感官品质的关注、感知与表述存在差异。该结果验证了构建酱香型白酒消费体验描述词的合理性与基于网络评论分析消费者感知侧重的可行性。 展开更多
关键词 网络评论 酱香型白酒 消费体验描述词 Python爬虫 感官描述
在线阅读 下载PDF
面向主题Crawler的设计与实现 被引量:1
14
作者 苗长芬 冯伟华 《平原大学学报》 2005年第3期110-112,共3页
针对目前通用搜索引擎所搜索到的结果过多,与主题相关性不强的情况,提出了面向主题的搜索引擎,文章以主题相关度为核心研究和设计了主题crawler,为进行主题搜索引擎的研究奠定了良好的基础.
关键词 crawler 主题搜索引擎 相关度
在线阅读 下载PDF
OBE理念在数据采集与网络爬虫课程中的应用
15
作者 周丽明 李文华 张兆虔 《数字通信世界》 2026年第1期106-108,共3页
在教育领域,成果导向教育(OBE)理念正重塑课程教学范式。本文聚焦其在数据采集与网络爬虫课程的应用,剖析从实践策略、教育路径到品德素养融合的教育逻辑,展现其驱动课程实现知识、能力、素养的统一,为信息技术类课程创新提供参考。
关键词 OBE理念 数据采集 网络爬虫 课程应用
在线阅读 下载PDF
变电站运行状态智能化检修方法设计
16
作者 代显忠 董俊贤 +2 位作者 沈燚 张弄韬 李起荣 《自动化仪表》 2026年第2期70-75,共6页
以降低变电站设备故障概率、提升设备状态智能化检修效果为目的,提出了变电站运行状态智能化检修方法。首先,将变电站设备历史数据库、生产管理系统以及数据采集与监视控制(SCADA)系统中的变电站设备数据作为基础数据来源,通过适配器、... 以降低变电站设备故障概率、提升设备状态智能化检修效果为目的,提出了变电站运行状态智能化检修方法。首先,将变电站设备历史数据库、生产管理系统以及数据采集与监视控制(SCADA)系统中的变电站设备数据作为基础数据来源,通过适配器、数据加工组件、数据访问服务组件等硬件,将数据提供给变电站运行状态智能化检修部分。然后,建立最小综合风险、最大可用输电容量的变电站运行状态智能化检修目标函数。最后,通过粒子群优化算法求解构建的目标函数,以获取最小综合风险与最大可用输电容量;制定对应的变电站运行状态智能化检修策略,完成变电站运行状态智能化检修。试验结果证明,该方法可有效采集变电站设备运行相关数据、检修变电站运行状态、降低设备故障概率与综合风险、提升变电站设备可用输电容量。该方法的应用有助于进一步提高变电站运行的可靠性、保障设备稳定运行。 展开更多
关键词 变电站 大数据架构 设备状态 检修方法 网络爬虫 粒子群优化算法
在线阅读 下载PDF
基于Web-3D的动漫品牌虚拟专卖店展示设计与实现 被引量:1
17
作者 田甜 《数字技术与应用》 2012年第8期128-129,共2页
动漫品牌虚拟专卖店是基于互联网的专门经营某一动漫品牌商品的非实体性零售商店。目前其展示形式以2D为主,存在诸多问题。为解决问题本文提出研究基于Web-3D的动漫品牌虚拟专卖店展示设计与实现。本课题通过调研和实证,探讨了构建虚拟... 动漫品牌虚拟专卖店是基于互联网的专门经营某一动漫品牌商品的非实体性零售商店。目前其展示形式以2D为主,存在诸多问题。为解决问题本文提出研究基于Web-3D的动漫品牌虚拟专卖店展示设计与实现。本课题通过调研和实证,探讨了构建虚拟专卖店的设计理论与程序,并结合软硬件技术论述了实现设计的制作流程。研究的理论成果将进一步拓宽科学技术与艺术整合领域并对国内外动漫品牌在虚拟专卖店中设计与制作3D展示具有一定指导意义。 展开更多
关键词 信息传播 web-3D 虚拟展示 设计与制作 动漫品牌
在线阅读 下载PDF
基于Crawler技术的超链接测试系统
18
作者 吉向东 《信息技术》 2009年第9期106-108,共3页
设计和实现了一个基于搜索引擎Crawler技术的超链接测试系统。通过将Crawler的爬行范围限制在一个网站之内,系统可以自动对待测网站进行扫描,有效地找出烂链和孤页。测试表明,相对于其它超链接测试产品而言,系统的测试自动化程度较高,... 设计和实现了一个基于搜索引擎Crawler技术的超链接测试系统。通过将Crawler的爬行范围限制在一个网站之内,系统可以自动对待测网站进行扫描,有效地找出烂链和孤页。测试表明,相对于其它超链接测试产品而言,系统的测试自动化程度较高,为测试人员提供了较为丰富的控制手段。 展开更多
关键词 crawler 超链接 测试 烂链 孤页
在线阅读 下载PDF
Defending against Topological Information Probing for Online Decentralized Web Services
19
作者 Xinli Hao Qingyuan Gong Yang Chen 《Computers, Materials & Continua》 2026年第3期330-350,共21页
Topological information is very important for understanding different types of online web services,in particular,for online social networks(OSNs).People leverage such information for various applications,such as socia... Topological information is very important for understanding different types of online web services,in particular,for online social networks(OSNs).People leverage such information for various applications,such as social relationship modeling,community detection,user profiling,and user behavior prediction.However,the leak of such information will also pose severe challenges for user privacy preserving due to its usefulness in characterizing users.Large-scale web crawling-based information probing is a representative way for obtaining topological information of online web services.In this paper,we explore how to defend against topological information probing for online web services,with a particular focus on online decentralized web services such as Mastodon.Different from traditional centralized web services,the federated nature of decentralized web services makes the identification of distributed crawlers even more difficult.We analyze the behavioral differences between legitimate users and crawlers in decentralized web services and highlight two key behavioral attributes that distinguish crawlers from legitimate users:instance interaction preferences and hop count in profile viewing patterns.Based on these insights:we propose a supervised machine learning-based framework for crawler detection,which is able to learn the federation-aware feature representations for users.To validate the framework’s effectiveness,we construct a labeled dataset that integrates real users with real-trace driven simulated crawlers in Mastodon.We use this dataset to train various supervised classifiers for crawler detection.Experimental results demonstrate that our framework can achieve an excellent classification performance.Moreover,it is observed that federation-aware features are effective in improving detection performance. 展开更多
关键词 Anti-mapping crawler detection machine learning decentralized online social networks
在线阅读 下载PDF
分布式Crawler系统研究与设计
20
作者 万方 王大震 《软件导刊》 2007年第5期45-46,共2页
分布式Crawler系统是在传统集中式信息采集系统基础上,结合分布式并行技术的产物,是搜索引擎的一个重要组成部分。研究了分布式Crawler系统中并行调度和URL处理的主要实现技术,并设计了一个分布式Crawler系统,对其中的任务划分机制和UR... 分布式Crawler系统是在传统集中式信息采集系统基础上,结合分布式并行技术的产物,是搜索引擎的一个重要组成部分。研究了分布式Crawler系统中并行调度和URL处理的主要实现技术,并设计了一个分布式Crawler系统,对其中的任务划分机制和URL检索算法作了详细描述。 展开更多
关键词 分布式crawler 并行调度 URL检索
在线阅读 下载PDF
上一页 1 2 148 下一页 到第
使用帮助 返回顶部