期刊文献+
共找到969篇文章
< 1 2 49 >
每页显示 20 50 100
To Whom Do Data Belong?——Data Ownership and Protection in the Context of Web-Crawlers
1
作者 Ding Xiaodong Ryan(翻译) 《Contemporary Social Sciences》 2020年第6期134-155,共22页
Platform data has already become an important asset for web-based companies,but this sort of data frequently includes large amounts of personal information.Platform data can be seen as belonging to an individual,belon... Platform data has already become an important asset for web-based companies,but this sort of data frequently includes large amounts of personal information.Platform data can be seen as belonging to an individual,belonging to a platform,belonging to some combinations of the two,or can be seen as a form of Internet-based public data.Analysis of legal clauses and doctrines as well as analysis based in legitimacy and consequentialism both fail to completely delineate data ownership.One potential reason for this is that there are many types of platform data,and that each type is highly dependent on circumstances.The determination of rights in regard to platform data should be done in a way which revolves around a contextual regulatory framework,one in which the rules of reason is applied on a case-by-case basis and in which gradual changes are done in a bottom-up manner,and not one which seeks to establish a universal set of data regulations.In actual judgments,factors such as the nature of the platform and the nature of the data crawling behavior should be comprehensively considered while ensuring a balance of data circulation and data protection. 展开更多
关键词 data ownership data protection web-crawling unfair competition
在线阅读 下载PDF
人才型住房政策与数字创新创业活跃度 被引量:1
2
作者 李言 毛丰付 《经济与管理》 北大核心 2026年第1期19-28,共10页
伴随数字经济快速发展,如何提高数字创新创业活跃度成为相关研究关注的重点,但现有研究尚未从人才供给角度思考该问题。从数字人才集聚水平渠道切入,构建人才型住房政策影响数字创新创业活跃度的作用机制,基于中国2011—2019年城市层面... 伴随数字经济快速发展,如何提高数字创新创业活跃度成为相关研究关注的重点,但现有研究尚未从人才供给角度思考该问题。从数字人才集聚水平渠道切入,构建人才型住房政策影响数字创新创业活跃度的作用机制,基于中国2011—2019年城市层面数据,利用网络爬虫法构建人才型住房政策数据库,并根据政策文本内容构建人才型住房政策强度指标,采用面板双向固定效应模型识别人才型住房政策对数字创新创业活跃度的影响效应和作用机制。研究发现:人才型住房政策强度增加能够显著提高数字创新创业活跃度,上述结论通过了稳健性检验。异质性分析结果表明,在沿海地区、南方地区、数字创新创业活跃度较低的城市,人才型住房政策对数字创新创业活跃度的推动作用更好。机制分析结果表明,人才型住房政策主要通过提升数字人才集聚水平提高数字创新创业活跃度。进一步分析发现,周边城市人才型住房政策强度增加会对本地数字创新创业活跃度产生不利影响。 展开更多
关键词 人才型住房政策 数字创新创业活跃度 数字人才集聚水平 网络爬虫法
在线阅读 下载PDF
一种面向快速Web漏洞扫描的网页爬取方法
3
作者 王金翔 朱亚运 +3 位作者 刘万大山 姜琳 刘林彬 李俊娥 《计算机应用与软件》 北大核心 2026年第1期370-376,共7页
随着Web应用规模的不断扩大,对网站进行漏洞扫描的时间成本也不断增加。为此,提出一种面向快速Web漏洞扫描的网页爬取方法。该方法在传统的面向Web漏洞扫描的爬虫的基础上,利用增量闭频繁项集挖掘算法对网站页面进行阶段性聚类,并基于... 随着Web应用规模的不断扩大,对网站进行漏洞扫描的时间成本也不断增加。为此,提出一种面向快速Web漏洞扫描的网页爬取方法。该方法在传统的面向Web漏洞扫描的爬虫的基础上,利用增量闭频繁项集挖掘算法对网站页面进行阶段性聚类,并基于页面聚簇和爬虫日志构建页面分类模型,以过滤由同一个服务处理程序生成的冗余页面。实验表明,该方法能有效减少漏洞扫描系统在网站目录遍历和页面聚类上消耗的时间,从而提升Web漏洞扫描的效率。 展开更多
关键词 爬虫 Web漏洞扫描 页面聚类 频繁模式挖掘
在线阅读 下载PDF
“国家规定”更新视角下非法数据爬取的刑法规制
4
作者 王小源 郭旨龙 《法治现代化研究》 2026年第1期116-134,共19页
刑法应整体秉持谦抑立场对非法数据爬取行为予以规制。在可能涉及的罪名中,非法获取计算机信息系统数据罪因行为方式与数据爬取的技术性特征重合、行为对象具有最广泛的涵摄能力,因而处于牵一发而动全身的地位,值得深入研究。立足“违... 刑法应整体秉持谦抑立场对非法数据爬取行为予以规制。在可能涉及的罪名中,非法获取计算机信息系统数据罪因行为方式与数据爬取的技术性特征重合、行为对象具有最广泛的涵摄能力,因而处于牵一发而动全身的地位,值得深入研究。立足“违反国家规定”的空白罪状,宜以最新修订的《反不正当竞争法》等在内的前置法更新,作为限缩解释非法获取计算机信息系统数据罪的构成要件、合理确定本罪成立范围的切入口。形式不法层面,基于本罪以数据安全为保护法益以及数据爬取“访问+获取”的双环节技术构造,可遵循从数据对象“公开—不公开”的一阶判断,到行为方式“侵入—非侵入”的二阶判断的阶梯审查范式,后者宜结合前端爬虫与后端爬虫的技术性区分进行典型不法样态的厘清。在实质不法层面,“情节严重”的罪量要件为基于法益侵害性程度限缩本罪适用提供了指引。爬取方单纯造成被爬取方竞争利益损失,或在调用接口等技术侵入行为前已充分进行数据及系统安全影响评估的情形,应被排除于刑事归责范围之外。 展开更多
关键词 非法获取计算机信息系统数据罪 数据法益 反不正当竞争法 网络爬虫 后端爬取
在线阅读 下载PDF
OBE理念在数据采集与网络爬虫课程中的应用
5
作者 周丽明 李文华 张兆虔 《数字通信世界》 2026年第1期106-108,共3页
在教育领域,成果导向教育(OBE)理念正重塑课程教学范式。本文聚焦其在数据采集与网络爬虫课程的应用,剖析从实践策略、教育路径到品德素养融合的教育逻辑,展现其驱动课程实现知识、能力、素养的统一,为信息技术类课程创新提供参考。
关键词 OBE理念 数据采集 网络爬虫 课程应用
在线阅读 下载PDF
变电站运行状态智能化检修方法设计
6
作者 代显忠 董俊贤 +2 位作者 沈燚 张弄韬 李起荣 《自动化仪表》 2026年第2期70-75,共6页
以降低变电站设备故障概率、提升设备状态智能化检修效果为目的,提出了变电站运行状态智能化检修方法。首先,将变电站设备历史数据库、生产管理系统以及数据采集与监视控制(SCADA)系统中的变电站设备数据作为基础数据来源,通过适配器、... 以降低变电站设备故障概率、提升设备状态智能化检修效果为目的,提出了变电站运行状态智能化检修方法。首先,将变电站设备历史数据库、生产管理系统以及数据采集与监视控制(SCADA)系统中的变电站设备数据作为基础数据来源,通过适配器、数据加工组件、数据访问服务组件等硬件,将数据提供给变电站运行状态智能化检修部分。然后,建立最小综合风险、最大可用输电容量的变电站运行状态智能化检修目标函数。最后,通过粒子群优化算法求解构建的目标函数,以获取最小综合风险与最大可用输电容量;制定对应的变电站运行状态智能化检修策略,完成变电站运行状态智能化检修。试验结果证明,该方法可有效采集变电站设备运行相关数据、检修变电站运行状态、降低设备故障概率与综合风险、提升变电站设备可用输电容量。该方法的应用有助于进一步提高变电站运行的可靠性、保障设备稳定运行。 展开更多
关键词 变电站 大数据架构 设备状态 检修方法 网络爬虫 粒子群优化算法
在线阅读 下载PDF
广西非遗文化知识图谱构建与数据处理研究 被引量:1
7
作者 张涛 周卫 《智能计算机与应用》 2025年第3期72-78,共7页
非物质文化遗产代表着地区文化历史的沉淀,是中华优秀传统文化的重要组成部分,也是人类文明的宝贵财富,具有无可替代的历史文化价值。对于维护文化多样性来说,保护和传承非物质文化遗产至关重要。然而,在当前网络环境下,广西的非物质文... 非物质文化遗产代表着地区文化历史的沉淀,是中华优秀传统文化的重要组成部分,也是人类文明的宝贵财富,具有无可替代的历史文化价值。对于维护文化多样性来说,保护和传承非物质文化遗产至关重要。然而,在当前网络环境下,广西的非物质文化遗产信息存在着杂乱无章、结构不清晰的问题。针对此问题,通过采用Python爬虫技术,对广西非物质文化遗产信息进行了系统采集,通过应用自然语言处理模型、特别是命名实体识别和关系抽取技术,能够将其中的非结构化信息转化为结构化数据,随后对这些数据进行了全面整理和清洗。最终,运用知识图谱技术的强大信息整合和表示能力,成功构建出一个结构清晰的广西非物质文化遗产知识图谱。 展开更多
关键词 知识图谱 Python爬虫 命名实体识别 关系抽取 Neo4j图数据库 RoBERTa
在线阅读 下载PDF
基于大数据的装配式建筑密封胶应用性能与可靠性分析
8
作者 李元元 《粘接》 2025年第2期5-8,共4页
为了提高建筑的整体防水性能和耐久性,分析基于大数据的装配式建筑密封胶应用性能可靠性。使用基于Python的网络爬虫技术构建装配式建筑密封胶相关专利功能语料库,以此为基础制备装配式建筑用硅烷改性密封胶。测试硅烷偶联剂用量为0.4%~... 为了提高建筑的整体防水性能和耐久性,分析基于大数据的装配式建筑密封胶应用性能可靠性。使用基于Python的网络爬虫技术构建装配式建筑密封胶相关专利功能语料库,以此为基础制备装配式建筑用硅烷改性密封胶。测试硅烷偶联剂用量为0.4%~3.2%时对密封胶表干时间、固化时间、粘接强度以及稀释剂用量对密封胶拉伸强度影响,最后测试光照老化和浸水老化对密封胶耐老化性能影响。试验结果表明,硅烷偶联剂用量为1.6%时表干时间较短,固化时间较优且粘接强度较高,稀释剂用量为11%时密封胶拉伸强度最优。该密封胶经过长时间光照老化、浸水老化和加热老化后具有较强耐老化性能。 展开更多
关键词 装配式建筑 密封胶 表干时间 网络爬虫 硅烷偶联剂
在线阅读 下载PDF
基于R语言的上市公司企业社会责任数据采集系统设计
9
作者 张益明 《山西电子技术》 2025年第1期70-72,共3页
数字经济时代下,高效的数据采集非常关键。不同于大部分基于Python的自动数据采集的是,着重介绍R语言环境下上市公司企业社会责任数据采集系统的设计,并测试了多线程技术下的采集效率。所介绍设计方案可以为其他财经数据的抓取提供有效... 数字经济时代下,高效的数据采集非常关键。不同于大部分基于Python的自动数据采集的是,着重介绍R语言环境下上市公司企业社会责任数据采集系统的设计,并测试了多线程技术下的采集效率。所介绍设计方案可以为其他财经数据的抓取提供有效的技术支持。 展开更多
关键词 数据采集 R 网页解析 爬虫 数据挖掘
在线阅读 下载PDF
基于网络爬虫及双词主题模型的4个主流在线平台帕金森病患者健康信息需求分析 被引量:2
10
作者 朱傲雪 毛惠娜 +2 位作者 谢惠玲 王梅 邓绮兰 《护理学报》 2025年第11期20-27,共8页
目的探索主流在线平台帕金森病患者的健康信息需求,为护理人员开展针对性健康信息服务提供依据。方法抓取4个主流在线平台的帕金森病交流文本,应用Python软件和双词主题模型(Biterm Topic Model,BTM),挖掘帕金森病患者健康信息需求并进... 目的探索主流在线平台帕金森病患者的健康信息需求,为护理人员开展针对性健康信息服务提供依据。方法抓取4个主流在线平台的帕金森病交流文本,应用Python软件和双词主题模型(Biterm Topic Model,BTM),挖掘帕金森病患者健康信息需求并进行主题划分,使用Gephi软件绘制各主题的关键词共现图。结果各主流在线平台的主题分析显示:知乎、贴吧、小红书、好大夫平台分别析出3、4、5、5个主题;对上述4个平台汇总的32852条文本进行分析,析出6类帕金森病健康信息需求:症状管理(“睡眠-疼痛-乏力”症状群加重疾病负担)、药物治疗(存在错误用药认知及不规范调药行为)、居家管理(饮食与运动管理缺乏可操作性指导)、家属照护(替代搜寻存在信息简化与报告失真风险)、手术治疗(术前适应证评估与术后药物-程控协同不明确)、疾病诊断(基层难以确诊患者在线求助专家)。结论帕金森病患者的健康信息需求以内容多维性和“患者-家属”双主体为特征,为护士实施多方联动、精准全面的健康信息服务提供新的证据支持。 展开更多
关键词 帕金森病 健康信息需求 网络爬虫 双词主题模型 主流在线平台
暂未订购
社会资本视角下高校教师团队科研产出研究——基于网络爬虫数据的分析 被引量:2
11
作者 李艳 刘荣三 +1 位作者 马琳 张婷 《科学学研究》 北大核心 2025年第10期2212-2220,2240,共10页
高校是国家战略科技力量的重要组成部分,高校科研能力是推动国家科技创新的重要引擎。围绕高校教师的科研产出,学界进行了大量探讨。然而,多数研究仍集中在教师个体或学校层面的视角,对于如何强化高校教师团队建设、促进教师团队科研产... 高校是国家战略科技力量的重要组成部分,高校科研能力是推动国家科技创新的重要引擎。围绕高校教师的科研产出,学界进行了大量探讨。然而,多数研究仍集中在教师个体或学校层面的视角,对于如何强化高校教师团队建设、促进教师团队科研产出的提升回答有限。本文基于社会资本理论,使用网络爬虫软件从Web of Science和中国知网上获取教师团队科研产出信息,数据爬取起始时间为2019年1月1日,截止时间为2023年12月31日,共计爬取年限为5年。从4265篇中文论文和2726篇英文论文中整理出北京某985高校7个院系58个专业团队588名教师的科研产出情况,同时从教师所在院系官网上获取了人口统计学和研究方向信息。通过多元回归分析方法检验了学历背景多样性、学术活动举办频率和研究方向一致性对高校教师科研团队产出的影响作用。结果发现,学历背景多样性与高校教师团队科研产出无显著关系,学术活动举办频率与科研产出负相关,研究方向一致性显著正向影响高校教师团队科研产出。在此基础上,本研究提出切实可行的管理建议,为高校进一步建设有组织科研、提高教师团队科研产出提供实践指导。 展开更多
关键词 高校教师团队 科研产出 社会资本理论 网络爬虫
原文传递
网页向量化表示:一种优化网络爬虫质量的方法 被引量:1
12
作者 武强 官却多杰 周庆国 《计算机应用与软件》 北大核心 2025年第6期350-355,共6页
搜索引擎的性能一定程度上依赖网络爬虫(网络内容获取)的能力。受到深度学习向量化表示和卷积神经网络技术启发,关注计算机对于信息(自然语言和图片)理解与信息的关联性,提出网页向量表示(Page2Vec)算法,并基于Page2Vec算法构建爬虫-过... 搜索引擎的性能一定程度上依赖网络爬虫(网络内容获取)的能力。受到深度学习向量化表示和卷积神经网络技术启发,关注计算机对于信息(自然语言和图片)理解与信息的关联性,提出网页向量表示(Page2Vec)算法,并基于Page2Vec算法构建爬虫-过滤(Crawler-Filter)算法。实验表明:Crawler-Filter算法在网络爬虫过程中,能够在覆盖合理的内容的同时绕过低质量或无关内容。 展开更多
关键词 搜索引擎 网络爬虫 网页向量表示算法 爬虫过滤算法
在线阅读 下载PDF
基于Python的全球7级大震趋势研判系统设计与实现
13
作者 马亚伟 孟令媛 +5 位作者 臧阳 韩颜颜 姜祥华 王月 解孟雨 杨志高 《地震研究》 北大核心 2025年第3期450-459,共10页
为提高全球7级以上地震的震后应急效率,设计并实现了一套基于Python的全球7级大震趋势研判系统。针对不同机构对同一地震测定的地震信息存在差异的问题,如震级标度不一致、定位存在差异等,通过统计历史地震提出了利用“时间差小于10 s... 为提高全球7级以上地震的震后应急效率,设计并实现了一套基于Python的全球7级大震趋势研判系统。针对不同机构对同一地震测定的地震信息存在差异的问题,如震级标度不一致、定位存在差异等,通过统计历史地震提出了利用“时间差小于10 s且定位误差小于2°即可确定为同一地震”的规则对相同地震进行匹配的规则;在上述规则下,利用Python爬虫技术获取地震目录及震源机制解等数据;利用PyGMT实现了地震分布等各类图件的自动绘制;最后实现了震后趋势研判PPT文档的自动产出。实际应用表明,该系统可以快速产出全球7级以上地震分布、历史地震、地质构造、震源机制解及其与大陆强震的统计关系等震后趋势研判资料,平均运行时间在1分钟内,显著提高全球7级以上大震的震后应急效率。 展开更多
关键词 网络爬虫 7级以上大震 地震应急 震后趋势研判
在线阅读 下载PDF
数据可供性的再隐蔽:平台社会视角下平台未授权数据开放特征与权力边界 被引量:4
14
作者 方园 孙铭菲 《新闻界》 北大核心 2025年第2期72-83,96,共13页
平台授权单向性与第三方行动者日益增长的数据需求之间的矛盾,推动了未授权的数据采集方式兴起。作为更隐蔽的数据流动方式,未授权的数据采集与平台数据开放权力之间的运作关系尚未得到足够的关注。从平台社会中的数据基础设施和可供性... 平台授权单向性与第三方行动者日益增长的数据需求之间的矛盾,推动了未授权的数据采集方式兴起。作为更隐蔽的数据流动方式,未授权的数据采集与平台数据开放权力之间的运作关系尚未得到足够的关注。从平台社会中的数据基础设施和可供性理论脉络出发,本研究旨在考察未授权情境下行动者与平台方的技术互动,揭示其背后所隐含的平台数据开放特征,并由此审视平台权力边界。通过走查法与半结构化访谈发现,未授权的数据采集对平台与用户“双重隐蔽”。行动者挑战平台既定框架并进行技术实践的再创造,这种未授权数据的可获取性成为数据可供性“再隐蔽”的表现形式。平台对技术手段的权衡与使用促成了“分层可供”的数据开放特征,形成技术性的权力边界,并将其与行动者在技术层面上的对抗关系转化为社会性的合作关系,以巩固自身权力。 展开更多
关键词 平台社会 数据开放 可供性理论 平台权力 网络爬虫
原文传递
基于网络爬虫与TF-IDF算法的非遗产品创新 被引量:1
15
作者 王菁 杨晓翔 《佳木斯大学学报(自然科学版)》 2025年第8期52-54,74,共4页
非遗产品创新无法满足当前流行趋势,提出基于网络爬虫与TF-IDF算法的非遗产品创新方法。以百度百科、天猫商城为对象基于网络爬虫技术爬取非遗产品创新热点的网络词条,构造一个语料库粗糙集;利用TF-IDF算法对语料库进行精确搜索,在传统T... 非遗产品创新无法满足当前流行趋势,提出基于网络爬虫与TF-IDF算法的非遗产品创新方法。以百度百科、天猫商城为对象基于网络爬虫技术爬取非遗产品创新热点的网络词条,构造一个语料库粗糙集;利用TF-IDF算法对语料库进行精确搜索,在传统TF-IDF算法中引入词跨度,选取权重最高的前n个作为非遗产品创新设计的关键词,获得符合非遗产品创新设计需求的结果。测试结果显示:该方法抽取的非遗创新关键词与人工抽取结果更契合,准确度均在90%以上,基于网络爬虫与TF-IDF算法的非遗产品创新具有良好的推广应用前景。 展开更多
关键词 网络爬虫 TF-IDF算法 语料库 词频率 非遗创新 产品
在线阅读 下载PDF
大数据背景下企业财务管理的机遇与挑战 被引量:4
16
作者 刘晓慧 《山西财经大学学报》 北大核心 2025年第S1期175-177,共3页
在大数据技术的支持下,企业利用大数据技术能够深入挖掘财务数据,掌握企业的经营状况,促进企业整体发展沿着正确的轨迹前进。基于对企业利用大数据技术的机遇与挑战的分析,提出利用网络爬虫技术进行财务信息分析、合理利用关键词匹配算... 在大数据技术的支持下,企业利用大数据技术能够深入挖掘财务数据,掌握企业的经营状况,促进企业整体发展沿着正确的轨迹前进。基于对企业利用大数据技术的机遇与挑战的分析,提出利用网络爬虫技术进行财务信息分析、合理利用关键词匹配算法、运用实质性程序中的大数据技术、优化企业信息数据存储等大数据技术在企业财务管理工作中的应用策略。 展开更多
关键词 企业财务管理 网络爬虫技术 数据存储
原文传递
基于Python语言的网络舆情大数据传播特征挖掘研究
17
作者 胡贵恒 张震 陈翠红 《陇东学院学报》 2025年第2期21-26,共6页
为解决网络舆情大数据传播特征挖掘存在读入延迟等问题,提出基于Python语言的网络舆情大数据传播特征挖掘研究。通过Python语言设计基于scrapy开源结构的改进爬虫算法,爬取网络中的舆情大数据;构建舆情大数据文本空间向量模型,提取数据... 为解决网络舆情大数据传播特征挖掘存在读入延迟等问题,提出基于Python语言的网络舆情大数据传播特征挖掘研究。通过Python语言设计基于scrapy开源结构的改进爬虫算法,爬取网络中的舆情大数据;构建舆情大数据文本空间向量模型,提取数据内的文本特征;采用时间序列模型消除文本特征延时性,通过基于特征词向量的短文本聚类算法,计算短文本之间语义关联性,依据该关联性并通过层次聚类算法挖掘网络舆情大数据传播特征。经实验验证,该方法具有较低的读入延迟,能够挖掘得到舆情大数据的网络关注度、发帖数量以及转发时间频率等传播特征。 展开更多
关键词 PYTHON语言 网络舆情 大数据 传播特征挖掘 scrapy开源结构 网络爬虫
在线阅读 下载PDF
数字化转型对中部地区制造业企业创新的影响 被引量:3
18
作者 李诗琪 袁梓怀 谢咏谕 《南昌工程学院学报》 2025年第2期103-108,共6页
在数字经济时代,数字化转型已成为推动制造业创新发展的坚实力量,对提升企业核心竞争力具有重要意义。本文采用文本挖掘和网络爬虫技术,结合熵权法,搜集并整理了2018—2022年中部地区A股制造业上市公司年度报告,对样本企业数字化转型程... 在数字经济时代,数字化转型已成为推动制造业创新发展的坚实力量,对提升企业核心竞争力具有重要意义。本文采用文本挖掘和网络爬虫技术,结合熵权法,搜集并整理了2018—2022年中部地区A股制造业上市公司年度报告,对样本企业数字化转型程度及其创新效率进行了量化,考察了企业数字化转型与其创新效率之间的关系。结果表明,数字化转型能够在一定程度上提升样本企业的创新效率,对企业发展具有积极作用。 展开更多
关键词 数字化转型 创新效率 文本挖掘 网络爬虫 熵权法
在线阅读 下载PDF
Python环境下的JavaScript逆向技术分析
19
作者 魏霞 《微型电脑应用》 2025年第9期267-269,277,共4页
在数据下载和网络爬虫领域,经常会遇到各种问题,如难以理解网页代码、无法破解数据加密方式等。为了解决这些问题,运用JavaScript逆向技术,结合某售房网站的实例,使用排错法和断点调试技术对数据加密问题进行深入分析,得到可用数据。结... 在数据下载和网络爬虫领域,经常会遇到各种问题,如难以理解网页代码、无法破解数据加密方式等。为了解决这些问题,运用JavaScript逆向技术,结合某售房网站的实例,使用排错法和断点调试技术对数据加密问题进行深入分析,得到可用数据。结果表明,运用JavaScript逆向技术后爬虫效果(获取数据)得到明显提升,模拟参数解密方式也取得了成功。 展开更多
关键词 网络爬虫 JavaScript逆向技术 PYTHON 数据加密
在线阅读 下载PDF
基于AI技术和DNS数据的威胁网站分析方案
20
作者 戚大强 郑涛 +2 位作者 由志远 宋洪飞 刘果 《邮电设计技术》 2025年第9期47-51,共5页
针对网络安全领域的现状,提出一种基于分布式爬虫与混合检测引擎的恶意网站识别系统,该系统通过多层架构实现从DNS原始日志分析、域名检测、恶意域名管理的全流程管控。系统构建分布式爬虫集群,创新性地设计权重关键词规则库与AI分析相... 针对网络安全领域的现状,提出一种基于分布式爬虫与混合检测引擎的恶意网站识别系统,该系统通过多层架构实现从DNS原始日志分析、域名检测、恶意域名管理的全流程管控。系统构建分布式爬虫集群,创新性地设计权重关键词规则库与AI分析相结合的检测机制,快速、高效、准确地分析恶意网站,为主动式网络安全防护提供新思路。 展开更多
关键词 DNS日志 恶意网站检测 网络爬虫 关键词匹配 AI 图片识别
在线阅读 下载PDF
上一页 1 2 49 下一页 到第
使用帮助 返回顶部