期刊文献+
共找到213篇文章
< 1 2 11 >
每页显示 20 50 100
基于Python的青海西宁房价分析与可视化
1
作者 李生霞 冯桂莲 《科技创新与生产力》 2025年第5期38-42,共5页
文章通过爬虫技术收集了近3年青海省西宁市的房价数据,并进行了可视化分析,这不仅让数据更直观,便于分析,还提升了决策的效率和准确性,促进了信息的共享和交流。通过这种方式,复杂数据被转化为易于理解的图表,大大节省了分析时间,并使... 文章通过爬虫技术收集了近3年青海省西宁市的房价数据,并进行了可视化分析,这不仅让数据更直观,便于分析,还提升了决策的效率和准确性,促进了信息的共享和交流。通过这种方式,复杂数据被转化为易于理解的图表,大大节省了分析时间,并使关键信息的识别更加迅速。此外,可视化分析还帮助工作人员及时发现数据中的异常或趋势变化,从而及时应对,具有很大的实际应用价值。 展开更多
关键词 python 爬虫技术 数据分析 数据可视化
在线阅读 下载PDF
Python环境下的JavaScript逆向技术分析
2
作者 魏霞 《微型电脑应用》 2025年第9期267-269,277,共4页
在数据下载和网络爬虫领域,经常会遇到各种问题,如难以理解网页代码、无法破解数据加密方式等。为了解决这些问题,运用JavaScript逆向技术,结合某售房网站的实例,使用排错法和断点调试技术对数据加密问题进行深入分析,得到可用数据。结... 在数据下载和网络爬虫领域,经常会遇到各种问题,如难以理解网页代码、无法破解数据加密方式等。为了解决这些问题,运用JavaScript逆向技术,结合某售房网站的实例,使用排错法和断点调试技术对数据加密问题进行深入分析,得到可用数据。结果表明,运用JavaScript逆向技术后爬虫效果(获取数据)得到明显提升,模拟参数解密方式也取得了成功。 展开更多
关键词 网络爬虫 JavaScript逆向技术 python 数据加密
在线阅读 下载PDF
基于Python爬虫技术的智能法拍计算工具
3
作者 吴晓涵 王雪静 刘扬 《信息与电脑》 2025年第6期30-32,共3页
随着法拍涉税业务的增长,税务机关的监管工作面临挑战,且现有处理方式存在诸多问题。为此,文章提出了一款基于Python爬虫技术的智能法拍计算工具。该工具可自动从互联网公共数据中采集法拍事项,自动进行税额计算,展示计算步骤及相关税... 随着法拍涉税业务的增长,税务机关的监管工作面临挑战,且现有处理方式存在诸多问题。为此,文章提出了一款基于Python爬虫技术的智能法拍计算工具。该工具可自动从互联网公共数据中采集法拍事项,自动进行税额计算,展示计算步骤及相关税收政策,并通过多税种结果展示和自动生成Excel表格实现自动归档。此工具实现了法拍信息互联网采集、计税自动化和数据可视化等功能,解决了法拍事项采集途径单一、分析依赖人工、机外流转以及碎片化管理等问题。 展开更多
关键词 python爬虫技术 法拍事项 智能计算工具
在线阅读 下载PDF
基于Python的图书信息爬取与可视化应用研究
4
作者 梁玉清 《无线互联科技》 2025年第11期46-50,共5页
随着信息技术的发展,图书信息的快速获取与分析成为图书管理与推荐系统的重要需求。为实现高效、低成本的数据收集与整理,文章以国内知名图书平台为实证对象,设计并实现了一种基于Python的图书信息爬取与可视化方法。通过编写爬虫脚本,... 随着信息技术的发展,图书信息的快速获取与分析成为图书管理与推荐系统的重要需求。为实现高效、低成本的数据收集与整理,文章以国内知名图书平台为实证对象,设计并实现了一种基于Python的图书信息爬取与可视化方法。通过编写爬虫脚本,自动获取并存储大量图书信息至本地Excel表格,利用可视化技术从微观和宏观2个角度分析数据:微观层面揭示单一变量的分布规律,宏观层面提取整体统计特征。研究结果表明,该方法能够为特定类型或具体图书信息的定量分析和整理提供支持,具有较高的实用性与可行性。因此,基于Python技术的图书信息爬取与可视化方法是一种有效的数据获取与分析手段,为图书资源管理与决策提供了科学依据。 展开更多
关键词 python 爬虫 图书信息 可视化研究
在线阅读 下载PDF
基于Python爬虫的招聘信息可视化分析
5
作者 张乐 王自一 谢毅 《电脑与信息技术》 2025年第3期84-88,共5页
随着网络招聘的发展,广大毕业生面对众多的招聘网站,出现了招聘信息数量繁杂、无法快速筛选所需信息和选择正确信息等问题。针对这些问题,基于Python爬虫技术获取招聘相关数据,经数据处理后对招聘信息数据进行可视化分析,使用Matplotlib... 随着网络招聘的发展,广大毕业生面对众多的招聘网站,出现了招聘信息数量繁杂、无法快速筛选所需信息和选择正确信息等问题。针对这些问题,基于Python爬虫技术获取招聘相关数据,经数据处理后对招聘信息数据进行可视化分析,使用Matplotlib和Wordcloud等库绘制岗位数量对比直方图、岗位来源饼图、平均薪资直方图和岗位能力要求词云图,并做以分析。结果表明,计算机、工商管理、土木工程可作为就业首选,民营和国营企业对人才需求量大,计算机专业平均薪资最高且岗位对专业能力要求高等。该研究有助于毕业生求职者快速筛选出自己心仪的职位,从而为广大毕业生提供参考。 展开更多
关键词 python 网络爬虫 数据可视化
在线阅读 下载PDF
Python网络爬虫技术在信息安全监测中的应用与防范策略
6
作者 胡红玲 《信息与电脑》 2025年第12期152-154,共3页
为探讨Python网络爬虫技术在信息安全监测时的应用与防范手段,文章采取技术特点分析和典型应用场景分析相配合的途径,探讨了其在网络舆情把控、威胁情报汇聚和异常行为监测中的实际效能,剖析滥用造成的安全漏洞及防范办法。Python网络... 为探讨Python网络爬虫技术在信息安全监测时的应用与防范手段,文章采取技术特点分析和典型应用场景分析相配合的途径,探讨了其在网络舆情把控、威胁情报汇聚和异常行为监测中的实际效能,剖析滥用造成的安全漏洞及防范办法。Python网络爬虫借助技术优势,提升了信息安全监测效率,但需利用反爬虫机制、数据加密与法律规范等多维度策略,有效避开潜在风险。 展开更多
关键词 python网络爬虫 信息安全 安全监测 防范策略
在线阅读 下载PDF
基于Python的新浪微博数据爬虫 被引量:62
7
作者 周中华 张惠然 谢江 《计算机应用》 CSCD 北大核心 2014年第11期3131-3134,共4页
目前很多的社交网络研究都是采用国外的平台数据,而国内的新浪微博没有很好的接口方便研究人员采集数据进行分析。为了快速地获取到微博中的数据,开发了一款支持并行的微博数据抓取工具。该工具可以实时抓取微博中指定用户的粉丝信息、... 目前很多的社交网络研究都是采用国外的平台数据,而国内的新浪微博没有很好的接口方便研究人员采集数据进行分析。为了快速地获取到微博中的数据,开发了一款支持并行的微博数据抓取工具。该工具可以实时抓取微博中指定用户的粉丝信息、微博正文等内容;该工具利用关键字匹配技术,匹配符合规定条件的微博,并抓取相关内容;该工具支持并行抓取,可以同时抓取多个用户的信息。最后将串行微博爬虫工具和其并行版本进行对比,并使用该工具对部分微博数据作了一个关于流感问题的分析。实验结果显示:并行爬虫拥有较好的加速比,可以快速地获取数据,并且这些数据具有实时性和准确性。 展开更多
关键词 新浪微博 爬虫 python 并行 大数据
在线阅读 下载PDF
python爬虫获取天气数据与儿童肺部疾病门诊就诊率相关性分析 被引量:3
8
作者 尹小妹 田国祥 +4 位作者 王天一 耿辉 贺海蓉 张勇 吕军 《中国循证心血管医学杂志》 2019年第9期1047-1049,1061,共4页
目的利用爬虫获取AQI(Air Quality Index空气质量指数)数据,尝试分析空气质量数据与儿童肺部疾病发病率的关系。方法用爬虫获取中国空气质量在线监测分析平台2018年3月至2019年3月空气质量数据,将西安市2018年3月至2019年3月交通大学第... 目的利用爬虫获取AQI(Air Quality Index空气质量指数)数据,尝试分析空气质量数据与儿童肺部疾病发病率的关系。方法用爬虫获取中国空气质量在线监测分析平台2018年3月至2019年3月空气质量数据,将西安市2018年3月至2019年3月交通大学第一附属医院儿科门诊月平均肺部疾病就诊率进行统计分析。结果呼吸系统性疾病与西安AQI等空气数据正相关,与O3负相关,上呼吸道感染、支气管炎、肺炎与AQI正相关。结论严重雾霾天气使儿童肺部疾病就诊率大幅增加,应加大空气污染防治力度,减少儿童在严重雾霾天气外出次数并在外出时佩戴防雾霾口罩。 展开更多
关键词 爬虫 空气质量指数 雾霾 肺部疾病 儿童
暂未订购
基于Python爬虫技术的商品信息采集与分析 被引量:15
9
作者 孟宪颖 毛应爽 《软件》 2021年第11期128-130,共3页
大数据背景下,怎样快速有效地获取所需的数据信息成为互联网企业和网络用户热切关注的内容。网络爬虫在网络数据采集与分析上发挥了重要的作用。本文以京东作为目标网站,采用Python的爬虫技术,设计了一种商品采集与分析的方法。使用Requ... 大数据背景下,怎样快速有效地获取所需的数据信息成为互联网企业和网络用户热切关注的内容。网络爬虫在网络数据采集与分析上发挥了重要的作用。本文以京东作为目标网站,采用Python的爬虫技术,设计了一种商品采集与分析的方法。使用Requests库对按关键字搜索的结果商品信息进行下载,使用正则表达式和Beautiful Soup对数据进行初步清洗,最后将数据存储到MongoDB数据库中,实现了预想的目标。 展开更多
关键词 电商平台 python 网络爬虫 数据采集
在线阅读 下载PDF
Python网络爬虫在医学影像领域的发展现状与趋势研究 被引量:6
10
作者 白金川 王豪 +3 位作者 焦宝园 娄元仓 陈秋冰 李中伟 《生物医学工程学进展》 CAS 2023年第3期260-266,共7页
爬虫是一类收集信息的自动化程序,当前越来越多的领域都在使用爬虫收集目标信息。由于Python具有可快速迭代的特性,在主要内容为图像处理与人工智能的医学影像中得到了广泛的应用。为了在保证程序运行效率的同时,减轻训练模型所需数据... 爬虫是一类收集信息的自动化程序,当前越来越多的领域都在使用爬虫收集目标信息。由于Python具有可快速迭代的特性,在主要内容为图像处理与人工智能的医学影像中得到了广泛的应用。为了在保证程序运行效率的同时,减轻训练模型所需数据为计算机存储带来的压力,采用了能够大幅提高程序运行效率的异步式程序,并使用暂态文件保存数据。结果表明,异步式程序、暂态存储程序的运行效率分别是单线程的4.722倍、1.433倍,在医学影像模型训练中使用爬虫可以降低对计算机存储性能的要求。 展开更多
关键词 python 网络爬虫 医学影像 人工智能 发展趋势
在线阅读 下载PDF
基于Python的多线程聚焦网络爬虫设计与实现 被引量:3
11
作者 王美芝 支学超 刘财辉 《赣南师范大学学报》 2019年第6期35-38,共4页
在大数据时代下,人们要想从大量数据中找到自己需要的信息变得越来越困难,因此使用网络爬虫处理网络中大量的信息成为了必不可少的方法.本文利用Python语言设计并实现了一种多线程聚焦网络爬虫.首先,通过聚焦爬虫,获取目标网站数据,然... 在大数据时代下,人们要想从大量数据中找到自己需要的信息变得越来越困难,因此使用网络爬虫处理网络中大量的信息成为了必不可少的方法.本文利用Python语言设计并实现了一种多线程聚焦网络爬虫.首先,通过聚焦爬虫,获取目标网站数据,然后建立相应索引数据库.在爬取数据库的基础上,用户可以通过输入关键字,从多个网络地址URL中获取大量用户所需要的数据. 展开更多
关键词 python 网络爬虫 网络地址URL 多线程
在线阅读 下载PDF
Python在标准查新中的应用 被引量:6
12
作者 李骏 张鸽 +1 位作者 纪海婷 于翔 《科技创新与应用》 2020年第12期184-186,共3页
检验检测机构传统手工标准查新的方法,工作量大,效率低,且查新周期长,为提高工作效率,文章提出了一种基于Python的标准查新方法,并以实例描述其工作过程,实现了一种高效的标准查新方式。
关键词 标准查新 大数据 python 网络爬虫
在线阅读 下载PDF
基于Python的招聘数据爬虫设计与实现 被引量:15
13
作者 常逢佳 李宗花 +1 位作者 文静 常逢锦 《软件导刊》 2019年第12期130-133,共4页
随着就业压力日渐增加,准确全面地获取数据可以帮助高校学生规避就业风险、正确认识自身价值,具有相当重要的研究价值。基于Python的网络动态招聘数据抓取方案利用requests库抓取Ajax异步请求多页数据源,抓取的内容更为全面;对抓取到的... 随着就业压力日渐增加,准确全面地获取数据可以帮助高校学生规避就业风险、正确认识自身价值,具有相当重要的研究价值。基于Python的网络动态招聘数据抓取方案利用requests库抓取Ajax异步请求多页数据源,抓取的内容更为全面;对抓取到的招聘数据进行统计分析,对多线程效率进行对比分析,显示爬虫具有良好的适应性。该方案抓取的网络资讯在科研、求职等方面具有一定实用价值。 展开更多
关键词 网络爬虫 招聘 python 数据分析
在线阅读 下载PDF
基于Python网上招聘信息的爬取和分析 被引量:13
14
作者 殷丽凤 张浩然 《电子设计工程》 2019年第20期22-26,共5页
针对Python语言的大数据爬取和分析,采用以纯python语言编写爬虫脚本的方式,通过爬取51job上招聘信息为“python”和“数据分析”两个词条的数据信息和简要分析,得出python爬虫编写中各类问题的解决方法,最后对规范数据做了进一步分析,... 针对Python语言的大数据爬取和分析,采用以纯python语言编写爬虫脚本的方式,通过爬取51job上招聘信息为“python”和“数据分析”两个词条的数据信息和简要分析,得出python爬虫编写中各类问题的解决方法,最后对规范数据做了进一步分析,分析结果为应聘人才做决策提供了有价值的信息。 展开更多
关键词 python语言 网络爬虫 数据预处理 规范数据 数据分析
在线阅读 下载PDF
基于Python的聚焦网络爬虫的设计与实现 被引量:4
15
作者 唐文军 隆承志 《计算机与数字工程》 2023年第4期845-849,共5页
针对如何快速、精准地检索门户网站信息的问题,设计和实现基于Python语言的聚焦网络爬虫。首先分析聚焦网络爬虫的爬取数据流程,明确爬虫的基本原理;在爬取数据流程的基础上,设计聚焦网络爬虫的通用结构模型;最后,利用Python语言库实现... 针对如何快速、精准地检索门户网站信息的问题,设计和实现基于Python语言的聚焦网络爬虫。首先分析聚焦网络爬虫的爬取数据流程,明确爬虫的基本原理;在爬取数据流程的基础上,设计聚焦网络爬虫的通用结构模型;最后,利用Python语言库实现聚焦网络爬虫,并以广东省政府采购网的招标信息的爬取为实例验证该聚焦网络爬虫的可用性。 展开更多
关键词 聚焦网络爬虫 python语言 门户 广度爬行策略
在线阅读 下载PDF
基于Python的新浪微博爬虫程序设计与实现 被引量:9
16
作者 孙握瑜 《科技资讯》 2022年第12期34-37,共4页
在互联网时代,各类新媒体平台出现使得信息数据得到广泛传播。为加强对新浪微博内容的监管和分析,应对舆情分析的需求,该文主要研究采用Python语言设计新浪微博爬虫程序,在对网络爬虫基本概念和原理研究的基础上,设计了具有配置、爬取... 在互联网时代,各类新媒体平台出现使得信息数据得到广泛传播。为加强对新浪微博内容的监管和分析,应对舆情分析的需求,该文主要研究采用Python语言设计新浪微博爬虫程序,在对网络爬虫基本概念和原理研究的基础上,设计了具有配置、爬取、存储、分析这4个功能模块的应用程序,为媒体内容监管和数据分析提供了技术支持。 展开更多
关键词 python 新浪微博 网络爬虫 舆情分析
在线阅读 下载PDF
基于Python的招聘信息爬虫系统设计 被引量:3
17
作者 孙亚红 《软件》 2020年第10期213-214,235,共3页
本文详细阐述了运用Python爬取51job上相关招聘信息的过程,并对所抓取的信息进行处理和分析,按照不同地区,不同薪资把招聘信息以图表的形式进行展示,以期帮助高校毕业生在择业时能够快速获取特定的需求信息,并通过快速数据分析得到自身... 本文详细阐述了运用Python爬取51job上相关招聘信息的过程,并对所抓取的信息进行处理和分析,按照不同地区,不同薪资把招聘信息以图表的形式进行展示,以期帮助高校毕业生在择业时能够快速获取特定的需求信息,并通过快速数据分析得到自身择业的准确定位,从而做出更好的选择。 展开更多
关键词 爬虫 python 招聘
在线阅读 下载PDF
基于Python的招聘网站信息爬取与数据分析 被引量:14
18
作者 刘晓知 《电子测试》 2020年第12期75-76,110,共3页
文章通过对Python爬虫的具体设计与数据分析具体流程进行了简述,并对涉及到的相关技术进行了诠释,并给出具体分析结果,通过应用Python爬虫定向抓取网站当中的相关招聘信息数据,之后对所爬取的招聘信息数据进行处理,并及时存入到数据库当... 文章通过对Python爬虫的具体设计与数据分析具体流程进行了简述,并对涉及到的相关技术进行了诠释,并给出具体分析结果,通过应用Python爬虫定向抓取网站当中的相关招聘信息数据,之后对所爬取的招聘信息数据进行处理,并及时存入到数据库当中,并对招聘数据信息进行综合处理与分析,结合不同的区域、职业要求、学历要求等相关基础条件,合理分析某一具体职业的具体薪资状况,并将所得的分析数据结果进行展示。 展开更多
关键词 python 爬虫 可视化 招聘网站 信息爬取 数据分析
在线阅读 下载PDF
基于Python的城市天气数据爬虫程序分析 被引量:11
19
作者 于学斗 柏晓钰 《办公自动化》 2022年第7期10-13,9,共5页
目前,我国正在加大环境保护的力度。如何充分利用互联网上的已有的海量数据为低碳环保事业做出贡献,是我们不可推缺的责任。为快速爬取网络上的信息,网络爬虫应运而生。通过使用网络爬虫技术,能在短时内提取有价值的信息数据。得到有价... 目前,我国正在加大环境保护的力度。如何充分利用互联网上的已有的海量数据为低碳环保事业做出贡献,是我们不可推缺的责任。为快速爬取网络上的信息,网络爬虫应运而生。通过使用网络爬虫技术,能在短时内提取有价值的信息数据。得到有价值的数据后,根据数据的形式进行整理,运用HTML、CSS、JavaScript、Flask框架、Echarts、WordCloud等技术对数据进行可视化展现。将数据进行完整地分析,有利于更好地利用数据解决实际问题。本文将对基于Python的聚焦式网络爬虫设计与实现以及分析天气数据并可视化地展现作出简介。 展开更多
关键词 python爬虫 网页设计 Flask框架 信息可视化
在线阅读 下载PDF
基于Python爬虫技术的虚假数据溯源与途中过滤分析 被引量:2
20
作者 王景 《河南科技》 2021年第22期27-30,共4页
面对不同网络系统场景下存在虚假数据溯源精度低、过滤执行范围小等问题,提出利用Python爬虫技术的虚假数据处理方案,将虚假数据覆盖的网络空间划分为多个网格,在网格系统中布置多个节点,利用爬虫管理器、采集器等软件,对网页、应用程... 面对不同网络系统场景下存在虚假数据溯源精度低、过滤执行范围小等问题,提出利用Python爬虫技术的虚假数据处理方案,将虚假数据覆盖的网络空间划分为多个网格,在网格系统中布置多个节点,利用爬虫管理器、采集器等软件,对网页、应用程序界面的数据进行Python爬虫抓取,标记抓取到的数据包,再使用共享密钥对sink网关节点获得的数据包做出其消息认证码(Message Authentication Code,MAC)地址是否合法的判断,若不合法则启动虚假数溯源,过滤掉无用的密钥节点。 展开更多
关键词 python爬虫技术 虚假数据 溯源 途中过滤分析
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部