期刊文献+
共找到2,966篇文章
< 1 2 149 >
每页显示 20 50 100
Teaching Reform and Practice of the“Data Collection and Web Crawler”Course Based on the Blended Teaching Mode
1
作者 Simin Wu 《Journal of Contemporary Educational Research》 2025年第7期116-122,共7页
The data collection and web crawling course has a lot of theoretical knowledge and strong practicality.Traditional teaching methods are no longer sufficient to meet teaching needs.Based on the characteristics of the c... The data collection and web crawling course has a lot of theoretical knowledge and strong practicality.Traditional teaching methods are no longer sufficient to meet teaching needs.Based on the characteristics of the course,this article constructs a mixed teaching environment based on“Learning Pass+Hongya Platform+Offline Course,”integrates teaching resource libraries and ideological and political cases,and develops a suitable evaluation system to cultivate students’innovative and critical thinking abilities,stimulate their learning initiative,improve their teamwork ability,and enhance their professional level and data literacy. 展开更多
关键词 Blended learning mode crawler Course teaching reform
在线阅读 下载PDF
人才型住房政策与数字创新创业活跃度 被引量:1
2
作者 李言 毛丰付 《经济与管理》 北大核心 2026年第1期19-28,共10页
伴随数字经济快速发展,如何提高数字创新创业活跃度成为相关研究关注的重点,但现有研究尚未从人才供给角度思考该问题。从数字人才集聚水平渠道切入,构建人才型住房政策影响数字创新创业活跃度的作用机制,基于中国2011—2019年城市层面... 伴随数字经济快速发展,如何提高数字创新创业活跃度成为相关研究关注的重点,但现有研究尚未从人才供给角度思考该问题。从数字人才集聚水平渠道切入,构建人才型住房政策影响数字创新创业活跃度的作用机制,基于中国2011—2019年城市层面数据,利用网络爬虫法构建人才型住房政策数据库,并根据政策文本内容构建人才型住房政策强度指标,采用面板双向固定效应模型识别人才型住房政策对数字创新创业活跃度的影响效应和作用机制。研究发现:人才型住房政策强度增加能够显著提高数字创新创业活跃度,上述结论通过了稳健性检验。异质性分析结果表明,在沿海地区、南方地区、数字创新创业活跃度较低的城市,人才型住房政策对数字创新创业活跃度的推动作用更好。机制分析结果表明,人才型住房政策主要通过提升数字人才集聚水平提高数字创新创业活跃度。进一步分析发现,周边城市人才型住房政策强度增加会对本地数字创新创业活跃度产生不利影响。 展开更多
关键词 人才型住房政策 数字创新创业活跃度 数字人才集聚水平 网络爬虫法
在线阅读 下载PDF
履带作业机全向调平系统结构参数优化设计与试验
3
作者 汪若尘 汤佳佳 +3 位作者 丁仁凯 苏兆睿 蒋俞 孙泽宇 《中国农机化学报》 北大核心 2026年第3期168-176,共9页
针对丘陵山区农业机械作业时机身翻倾角变化大和安全性差的问题,设计一种履带式作业机全向调平系统。提出一种基于“双层支架”履带式作业机全向调平结构方案,建立履带式作业机翻倾数学模型,解析履带式作业机纵横向的静态/动态的极限翻... 针对丘陵山区农业机械作业时机身翻倾角变化大和安全性差的问题,设计一种履带式作业机全向调平系统。提出一种基于“双层支架”履带式作业机全向调平结构方案,建立履带式作业机翻倾数学模型,解析履带式作业机纵横向的静态/动态的极限翻倾角,保证其工作稳定性。通过建立调平结构运动学数学模型,分析其结构参数对调平系统性能的影响,运用GA—PSO算法,优化调平系统的结构参数,确定履带式作业机全向调平系统结构尺寸。构建Adams-MATLAB/Simulink联合仿真模型,进行仿真与试验研究。结果表明,相比于遗传算法,GA—PSO参数优化后的调平角速度分别提高0.24 rad/s和0.2 rad/s,横、纵向调平精度分别提高1.94°和1.05°,横、纵向调平稳定时间分别提前1.27 s和1.05 s,验证所设计的全向调平系统工作性能优良。 展开更多
关键词 履带式作业机 全向调平系统 优化设计 稳定性 GA—PSO算法
在线阅读 下载PDF
基于DrissionPage的文献数据抓取与分析——以CALIS与全国报刊索引数据库为例
4
作者 潘京华 《计算机应用文摘》 2026年第7期110-113,共4页
网络爬虫能够高效实现大规模数据采集,将其应用于文献数据的收集与整理具有重要价值。基于Python语言,使用DrissionPage框架编写爬虫程序,从CALIS和全国报刊索引数据库两个信息源抓取文献数据,并结合词频统计和主题分类方法,对采集的数... 网络爬虫能够高效实现大规模数据采集,将其应用于文献数据的收集与整理具有重要价值。基于Python语言,使用DrissionPage框架编写爬虫程序,从CALIS和全国报刊索引数据库两个信息源抓取文献数据,并结合词频统计和主题分类方法,对采集的数据进行可视化分析,为“互联网+”背景下高校文献资源建设提供新的思路。 展开更多
关键词 PYTHON 网络爬虫 DrissionPage 特藏建设 内容分析
在线阅读 下载PDF
分布式Web Crawler的研究:结构、算法和策略 被引量:23
5
作者 叶允明 于水 +2 位作者 马范援 宋晖 张岭 《电子学报》 EI CAS CSCD 北大核心 2002年第12A期2008-2011,共4页
本文介绍了一个大型分布式Web Crawler系统——Igloo 1.2版。它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageR... 本文介绍了一个大型分布式Web Crawler系统——Igloo 1.2版。它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageRank值作为网页质量评价的标准,从而提高了爬行质量.加快爬行速度的关键是如何解除Crawler系统中的性能瓶颈,本文对此也作了详细的讨论,并提出了一种基于“滞后合并”策略的UBL数据库存取方法.实验表明,Igloo在保持高性能的同时能快速爬行到高质量的网页. 展开更多
关键词 WEB爬虫 爬行策略 分布式系统 计算机网络 网页
在线阅读 下载PDF
基于神经网络的增量式crawler重访频率研究 被引量:1
6
作者 周英飚 王军 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第12期32-33,45,共3页
crawler是搜索引擎必备的核心组件 ,以何种频率对变化的Web页面进行重访是增量式crawler要解决的主要问题 .结合人工神经网络建立页面变化模型 ,由模型确定增量式crawler重访时间 ,同时分析模型在实践中的应用 ,提出一种应用方案 ,具有... crawler是搜索引擎必备的核心组件 ,以何种频率对变化的Web页面进行重访是增量式crawler要解决的主要问题 .结合人工神经网络建立页面变化模型 ,由模型确定增量式crawler重访时间 ,同时分析模型在实践中的应用 ,提出一种应用方案 ,具有较好的自适应性 . 展开更多
关键词 搜索引擎 crawler 增量式crawler 神经网络
在线阅读 下载PDF
一种并行Crawler系统中的URL分配算法设计 被引量:1
7
作者 万源 万方 王大震 《计算机工程与应用》 CSCD 北大核心 2006年第A01期117-119,共3页
研究了分布式体系结构下的并行Crawler采集模型,分析了各组件的功能及各Cmwler在并行搜索时,为保证系统的负载均衡而应遵循的基本规则,并提出了一种基于散列(hash)的URL的调度算法。
关键词 分布式crawler 散列算法 URL分配
在线阅读 下载PDF
面向动态网页爬行的Crawler架构 被引量:7
8
作者 严亚兰 《图书情报知识》 CSSCI 北大核心 2003年第4期51-53,共3页
 本文分析了Crawler动态网页爬行功能,提出了面向动态网页爬行的Crawler架构,并对相应模块进行了探讨。
关键词 crawler架构 爬行 动态网页
在线阅读 下载PDF
一个P2P IPTV多协议爬行器——TVCrawler 被引量:5
9
作者 姜志宏 王晖 +1 位作者 樊鹏翼 袁雪美 《计算机应用》 CSCD 北大核心 2010年第3期715-718,728,共5页
P2PIPTV网络测量是研究P2PIPTV行为和特征的重要手段,不仅有利于设计出更符合真实网络环境的系统或协议,也是实现P2PIPTV监测、引导和控制等方面的重要依据和基础。爬行器是P2PIPTV网络的一种主动测量技术,也是目前P2PIPTV测量的主要方... P2PIPTV网络测量是研究P2PIPTV行为和特征的重要手段,不仅有利于设计出更符合真实网络环境的系统或协议,也是实现P2PIPTV监测、引导和控制等方面的重要依据和基础。爬行器是P2PIPTV网络的一种主动测量技术,也是目前P2PIPTV测量的主要方式之一。提出了一个P2PIPTV多协议爬行器——TVCrawler,能够对PPLive、PPStream和UUSee三个系统的直播频道进行测量。TVCrawler主要具有三个特点:1)采用基于反馈的引导节点集构造机制;2)采用主从结构,并行爬行获取拓扑数据;3)采用基于拓扑增长系数的自适应爬行时长控制。实验表明,TVCrawler的爬行测量速度达到20~100节点/秒和130~500边/秒。 展开更多
关键词 网络测量 对等网络 网络电视 爬行器 覆盖网络
在线阅读 下载PDF
智能专题化信息搜集Crawler 被引量:4
10
作者 钱榕 徐新华 +1 位作者 郑莹 杨炳儒 《计算机工程》 CAS CSCD 北大核心 2006年第3期57-59,共3页
介绍了基于Web内容和结构挖掘的专题化智能Web爬行Crawler系统,并重点介绍其中CA(C&S)算法,该算法充分利用神经网络可以方便地模拟网络的拓扑结构和并行计算的特点,采用加强学习判断网页与主题的相关度,在进行相关度计算时,不考虑... 介绍了基于Web内容和结构挖掘的专题化智能Web爬行Crawler系统,并重点介绍其中CA(C&S)算法,该算法充分利用神经网络可以方便地模拟网络的拓扑结构和并行计算的特点,采用加强学习判断网页与主题的相关度,在进行相关度计算时,不考虑网页的全部内容,而通过提取网页的HTML描述中的重要标记,对Web网页进行内容和结构分析,从而判断爬行到的网页与主题的相关性,以提高信息搜集的效率和精确性。 展开更多
关键词 专题化爬行 WEB挖掘 神经网络 加强学习
在线阅读 下载PDF
基于网络评论的酱香型白酒消费体验描述词研究
11
作者 杨玉波 牛俊桀 +12 位作者 汪厚银 曹念 钟葵 熊小淋 杨帆 云振宇 徐阳 涂华彬 赵镭 张瑶 秦臻 向平 史波林 《中国酿造》 北大核心 2026年第1期328-333,共6页
酱香型白酒具有丰富的风味属性、极高的感官体验和品鉴价值,其感官描述形成于全国五届评酒会,主要为专业品酒师所用,而专业品酒师的感知水平与品评技能通常高于消费者,且品酒方式与消费者日常饮酒存在较大差异,从分析型角度描述白酒呈... 酱香型白酒具有丰富的风味属性、极高的感官体验和品鉴价值,其感官描述形成于全国五届评酒会,主要为专业品酒师所用,而专业品酒师的感知水平与品评技能通常高于消费者,且品酒方式与消费者日常饮酒存在较大差异,从分析型角度描述白酒呈现出的感知特征与消费型角度传递饮酒的体验与感受亦存在较大差别。该文通过Python爬虫程序,从网络平台抓取酱香型白酒的评论,通过文本预处理与文本挖掘手段,将网络评论中感官描述词进行划分。结果表明,共抓取了6 435条关于酱香型白酒的评论,将其划分为感受类描述词和感知类描述词。感受类描述词表现出“视整体、较宽泛、喜对比、重体验”的特点,感知类描述词在数量与范畴上的减少表明消费者与品酒师对酱香型白酒感官品质的关注、感知与表述存在差异。该结果验证了构建酱香型白酒消费体验描述词的合理性与基于网络评论分析消费者感知侧重的可行性。 展开更多
关键词 网络评论 酱香型白酒 消费体验描述词 Python爬虫 感官描述
在线阅读 下载PDF
增量更新Crawler进行Web收集方法研究 被引量:2
12
作者 程菲 汪建海 罗键 《计算机工程与科学》 CSCD 2006年第12期28-30,98,共4页
本文针对目前Web信息挖掘中存在的各种问题,对网络爬虫系统进行研究,提出了一种基于HTTP协议原理、旨在减少网络爬虫系统运行时网络流量的Web页面收集方法———增量更新Crawler方法。该方法通过Web预取技术对现有的Web链接数据库进行... 本文针对目前Web信息挖掘中存在的各种问题,对网络爬虫系统进行研究,提出了一种基于HTTP协议原理、旨在减少网络爬虫系统运行时网络流量的Web页面收集方法———增量更新Crawler方法。该方法通过Web预取技术对现有的Web链接数据库进行演化更新,可以在减少网络流量的同时获得接近现有网络爬虫系统的效果。 展开更多
关键词 信息检索 网络爬虫 增量更新
在线阅读 下载PDF
面向主题Crawler的设计与实现 被引量:1
13
作者 苗长芬 冯伟华 《平原大学学报》 2005年第3期110-112,共3页
针对目前通用搜索引擎所搜索到的结果过多,与主题相关性不强的情况,提出了面向主题的搜索引擎,文章以主题相关度为核心研究和设计了主题crawler,为进行主题搜索引擎的研究奠定了良好的基础.
关键词 crawler 主题搜索引擎 相关度
在线阅读 下载PDF
一种面向快速Web漏洞扫描的网页爬取方法
14
作者 王金翔 朱亚运 +3 位作者 刘万大山 姜琳 刘林彬 李俊娥 《计算机应用与软件》 北大核心 2026年第1期370-376,共7页
随着Web应用规模的不断扩大,对网站进行漏洞扫描的时间成本也不断增加。为此,提出一种面向快速Web漏洞扫描的网页爬取方法。该方法在传统的面向Web漏洞扫描的爬虫的基础上,利用增量闭频繁项集挖掘算法对网站页面进行阶段性聚类,并基于... 随着Web应用规模的不断扩大,对网站进行漏洞扫描的时间成本也不断增加。为此,提出一种面向快速Web漏洞扫描的网页爬取方法。该方法在传统的面向Web漏洞扫描的爬虫的基础上,利用增量闭频繁项集挖掘算法对网站页面进行阶段性聚类,并基于页面聚簇和爬虫日志构建页面分类模型,以过滤由同一个服务处理程序生成的冗余页面。实验表明,该方法能有效减少漏洞扫描系统在网站目录遍历和页面聚类上消耗的时间,从而提升Web漏洞扫描的效率。 展开更多
关键词 爬虫 Web漏洞扫描 页面聚类 频繁模式挖掘
在线阅读 下载PDF
基于改进A^(*)算法与B样条曲线的果园履带机路径规划
15
作者 陈天嘉 吴春笃 陈立邦 《农机化研究》 北大核心 2026年第8期129-136,共8页
针对传统A^(*)算法在果园履带机路径规划中存在的路径急转弯多、曲率不连续、路径紧贴障碍物等问题,提出了一种改进A^(*)算法与B样条曲线拟合算法相结合的路径规划方法。通过引入动态权重调控策略、方向性约束和曲率代价项,优化传统A^(*... 针对传统A^(*)算法在果园履带机路径规划中存在的路径急转弯多、曲率不连续、路径紧贴障碍物等问题,提出了一种改进A^(*)算法与B样条曲线拟合算法相结合的路径规划方法。通过引入动态权重调控策略、方向性约束和曲率代价项,优化传统A^(*)算法的路径搜索效率和路径质量。同时,采用B样条曲线拟合算法对初始路径进行平滑优化,生成满足履带机运动学约束的连续路径。仿真试验分别在无膨胀层与有膨胀层果园环境下进行,结果表明:与传统A^(*)算法相比,改进算法在无膨胀条件下,路径搜索时间缩短46.35%,迭代次数减少25%,评估节点数减少39.70%;在有膨胀条件下,路径最大曲率降低33.82%,平均曲率降低64.15%,路径更加平滑且避障效果显著。本文方法有效提升了果园履带机的路径规划效率和质量,满足果园复杂环境下的作业需求。 展开更多
关键词 果园履带机 路径规划 改进A^(*)算法 B样条曲线 曲率约束
在线阅读 下载PDF
挪威贝特斯塔德大桥超长超重变截面钢-混组合梁施工技术
16
作者 卢伟 杜传鹏 《世界桥梁》 北大核心 2026年第2期1-8,共8页
挪威贝特斯塔德大桥为(75+102+112+112+104+73)m连续钢-混组合梁桥,主梁采用开口式单箱单(双)室变截面钢箱梁+纤维防裂混凝土桥面板。受运输与加工条件限制,钢箱梁在中国加工成小节段,运输至挪威码头总拼成大节段后现场整体安装。利用驳... 挪威贝特斯塔德大桥为(75+102+112+112+104+73)m连续钢-混组合梁桥,主梁采用开口式单箱单(双)室变截面钢箱梁+纤维防裂混凝土桥面板。受运输与加工条件限制,钢箱梁在中国加工成小节段,运输至挪威码头总拼成大节段后现场整体安装。利用驳船+履带吊组合设备,设计不同类型的吊具,对驳船运输及履带吊吊装进行安全稳定分析,确保大节段在航道通航净空限制区域内的运输与高精度现场定位及吊装。小节段总拼成大节段后,通过平整度检测与线形测量,确保节段结构尺寸满足要求。钢箱梁现场吊装采用精准对位,履带吊分级落梁,并结合箱梁纵移措施进行合龙施工。钢箱梁桥面板施工采用悬臂支架+内模支架现场浇筑,混凝土冬季低温养护采用养护剂锁水+薄膜保湿+橡塑海绵保温+篷布防水+热气养护5重措施,保证冬季混凝土浇筑质量及耐久性。 展开更多
关键词 组合梁 驳船+履带吊组合设备 吊具 平整度 线形 混凝土养护措施 施工技术
在线阅读 下载PDF
基于Crawler技术的超链接测试系统
17
作者 吉向东 《信息技术》 2009年第9期106-108,共3页
设计和实现了一个基于搜索引擎Crawler技术的超链接测试系统。通过将Crawler的爬行范围限制在一个网站之内,系统可以自动对待测网站进行扫描,有效地找出烂链和孤页。测试表明,相对于其它超链接测试产品而言,系统的测试自动化程度较高,... 设计和实现了一个基于搜索引擎Crawler技术的超链接测试系统。通过将Crawler的爬行范围限制在一个网站之内,系统可以自动对待测网站进行扫描,有效地找出烂链和孤页。测试表明,相对于其它超链接测试产品而言,系统的测试自动化程度较高,为测试人员提供了较为丰富的控制手段。 展开更多
关键词 crawler 超链接 测试 烂链 孤页
在线阅读 下载PDF
掘进机履带行走机构力学特性分析
18
作者 赵米玉 詹利华 +1 位作者 唐艳 杜尚宇 《中国工程机械学报》 北大核心 2026年第1期90-94,共5页
针对掘进机履带行走机构易产生振动、疲劳等问题,对履带行走机构进行力学特性分析。采用有限元分析对履带行走机构的单边履带进行模态分析,研究其振型及材料可靠性;再利用动力学仿真软件对履带行走机构的3种工况(平路、上坡、下坡)进行... 针对掘进机履带行走机构易产生振动、疲劳等问题,对履带行走机构进行力学特性分析。采用有限元分析对履带行走机构的单边履带进行模态分析,研究其振型及材料可靠性;再利用动力学仿真软件对履带行走机构的3种工况(平路、上坡、下坡)进行分析,研究其动态特性。结果表明:履带行走机构的振型主要为沿Y轴的上、下摆动;施加重力加速度谱分析表明,履带行走机构材料强度有99.73%的概率不超过462.24 MPa。对其进行动态特性分析时,分析3种工况下履带行走机构的加速度、速度、滑转率、驱动转矩的变化情况,该研究为进一步研究履带行走机构运行稳定性提供了理论基础。 展开更多
关键词 履带行走机构 振型 模态 动力学
在线阅读 下载PDF
Defending against Topological Information Probing for Online Decentralized Web Services
19
作者 Xinli Hao Qingyuan Gong Yang Chen 《Computers, Materials & Continua》 2026年第3期330-350,共21页
Topological information is very important for understanding different types of online web services,in particular,for online social networks(OSNs).People leverage such information for various applications,such as socia... Topological information is very important for understanding different types of online web services,in particular,for online social networks(OSNs).People leverage such information for various applications,such as social relationship modeling,community detection,user profiling,and user behavior prediction.However,the leak of such information will also pose severe challenges for user privacy preserving due to its usefulness in characterizing users.Large-scale web crawling-based information probing is a representative way for obtaining topological information of online web services.In this paper,we explore how to defend against topological information probing for online web services,with a particular focus on online decentralized web services such as Mastodon.Different from traditional centralized web services,the federated nature of decentralized web services makes the identification of distributed crawlers even more difficult.We analyze the behavioral differences between legitimate users and crawlers in decentralized web services and highlight two key behavioral attributes that distinguish crawlers from legitimate users:instance interaction preferences and hop count in profile viewing patterns.Based on these insights:we propose a supervised machine learning-based framework for crawler detection,which is able to learn the federation-aware feature representations for users.To validate the framework’s effectiveness,we construct a labeled dataset that integrates real users with real-trace driven simulated crawlers in Mastodon.We use this dataset to train various supervised classifiers for crawler detection.Experimental results demonstrate that our framework can achieve an excellent classification performance.Moreover,it is observed that federation-aware features are effective in improving detection performance. 展开更多
关键词 Anti-mapping crawler detection machine learning decentralized online social networks
在线阅读 下载PDF
分布式Crawler系统研究与设计
20
作者 万方 王大震 《软件导刊》 2007年第5期45-46,共2页
分布式Crawler系统是在传统集中式信息采集系统基础上,结合分布式并行技术的产物,是搜索引擎的一个重要组成部分。研究了分布式Crawler系统中并行调度和URL处理的主要实现技术,并设计了一个分布式Crawler系统,对其中的任务划分机制和UR... 分布式Crawler系统是在传统集中式信息采集系统基础上,结合分布式并行技术的产物,是搜索引擎的一个重要组成部分。研究了分布式Crawler系统中并行调度和URL处理的主要实现技术,并设计了一个分布式Crawler系统,对其中的任务划分机制和URL检索算法作了详细描述。 展开更多
关键词 分布式crawler 并行调度 URL检索
在线阅读 下载PDF
上一页 1 2 149 下一页 到第
使用帮助 返回顶部