期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于python的网络爬虫技术研究被引量：24

下载PDF

导出

摘要随着互联网信息技术的快速发展,越来越多用户借助于网络搜索、在线浏览等平台,进行所需要数据信息的获取,而最常用的信息获取方式为网络爬虫。网络爬虫又被称为网络机器人,其主要利用Python程序设计语言,对浏览器网页中的HTTP超文本协议、URL地址等进行访问与爬取,不需要人为的干预或操作,就能够完成网站中数据信息的自动爬取。本文主要探讨python网络爬虫技术的主要内容,及其对网页数据爬取、永久保存的实现流程。

作者李玉香王孟玉涂宇晰 LI Yu-xiang;WANG Meng-yu;TU Yu-xi

机构地区河北科技师范学院中国石油化工股份有限公司河北秦皇岛石油分公司

出处《信息技术与信息化》 2019年第12期143-145,共3页 Information Technology and Informatization

基金 2018年教育部产学合作协同育人项目“Python全栈开发人才培养实践”(201802057003) “基于Python的数据分析与智能开发人才培养实践”(201801037002)

关键词 PYTHON 网络爬虫技术数据提取与处理研究

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献4

1钱程,阳小兰,朱福喜.基于Python的网络爬虫技术[J].黑龙江科技信息,2016(36):273-273. 被引量：27
2李琳.基于Python的网络爬虫系统的设计与实现[J].信息通信,2017,30(9):26-27. 被引量：33
3苻玲美.正则表达式在python爬虫中的应用[J].电脑知识与技术,2019,15(9):253-254. 被引量：10
4李军红.基于Python的辅助教学系统[J].电子技术与软件工程,2019(17):51-52. 被引量：3

二级参考文献8

1于娟,刘强.主题网络爬虫研究综述[J].计算机工程与科学,2015,37(2):231-237. 被引量：105
2刘娜.Python正则表达式高级特性研究[J].电脑编程技巧与维护,2015(22):12-13. 被引量：3
3熊畅.基于Python爬虫技术的网页数据抓取与分析研究[J].数字技术与应用,2017,35(9):35-36. 被引量：49
4魏冬梅,何忠秀,唐建梅.基于Python的Web信息获取方法研究[J].软件导刊,2018,17(1):41-43. 被引量：25
5隋晓冰,程璐璐.作文自动批改系统辅助大学英语写作慕课的交互式教学模式研究[J].现代教育技术,2019,29(2):66-71. 被引量：12
6王梦雪,李俊,贾清源,费腾.基于动态参考书目推荐的英语创意写作辅助教学系统的设计与实现[J].计算机应用与软件,2019,36(2):98-102. 被引量：4
7陈新河,刘艳丽,邵瑞,汪世义.电力电子技术课程辅助教学系统的设计与实现[J].安庆师范大学学报（自然科学版）,2019,25(1):108-112. 被引量：3
8万磊,严道波,杨勇,何镇庭,邱丹,吴迪.基于文本挖掘的95598投诉工单关键信息提取分析[J].电力与能源,2019,40(1):70-72. 被引量：7

共引文献65

1章蓬伟,贾钰峰,邵小青.基于案例的Python语言程序设计教学[J].学园,2020,13(7):44-45. 被引量：2
2杨玉永,娄世平,徐秀杰,刘瑞峰.利用正则表达式实现数据在线采集标准化[J].科技经济导刊,2020,0(1):30-30.
3魏东霞.在高中开设Python语言程序设计课程的实践研究[J].高考,2020,0(15):80-80. 被引量：2
4刘慧,李凤银,禹继国,崔璨,葛睿.基于影评挖掘的电影推荐系统设计与实现[J].电子技术（上海）,2018,47(12):83-86. 被引量：1
5王碧瑶.基于Python的网络爬虫技术研究[J].数字技术与应用,2017,35(5):76-76. 被引量：17
6涂辉,王锋,商庆伟.Python3编程实现网络图片爬虫[J].电脑编程技巧与维护,2017(23):21-22. 被引量：10
7潘巧智,张磊.浅谈大数据环境下基于python的网络爬虫技术[J].网络安全技术与应用,2018(5):41-42. 被引量：13
8刘杰,葛晓玢,闻顺杰.基于Python的网络爬虫系统的设计与实现[J].信息与电脑,2018,30(12):92-93. 被引量：4
9冯传新,杨保华.基于scrapy框架的京东数据分析系统设计与实现[J].价值工程,2018,37(28):255-258. 被引量：3
10张怡华.基于Python的图书馆业务报表自动生成研究[J].智库时代,2018,0(8):260-261.

同被引文献155

1赵春珍.“新冠肺炎”疫情期间大学生心理状况调查及教育对策研究[J].心理月刊,2020,0(8):1-3. 被引量：93
2潘虹,唐莉.质性数据分析工具在中国社会科学研究的应用——以Nvivo为例[J].数据分析与知识发现,2020,4(1):51-62. 被引量：65
3骆高远.国外乡村旅游发展的类型[J].乡村振兴,2021(1):92-95. 被引量：6
4李子韵.新闻可视化在公共卫生事件报道中的运用研究——以新冠疫情期间媒体的可视化报道为例[J].传媒论坛,2021,4(23):66-67. 被引量：2
5郑冬冬,赵朋朋,崔志明.Deep Web爬虫研究与设计[J].清华大学学报（自然科学版）,2005,45(S1):1896-1902. 被引量：28
6王建国,蔡凯臻.数字技术方法在现代城市设计中的应用[J].南方建筑,2008(2):28-32. 被引量：15
7王美萍,张文新.青少年期亲子冲突与亲子亲合的发展特征[J].心理科学,2007,30(5):1196-1198. 被引量：78
8周明洁,张建新.心理学研究方法中“质”与“量”的整合[J].心理科学进展,2008(1):163-168. 被引量：37
9曾伟辉,李淼.深层网络爬虫研究综述[J].计算机系统应用,2008,17(5):122-126. 被引量：40
10孙嘉卿,金盛华,曹慎慎.灾难后谣言传播心理的定性分析——以“5·12汶川地震”谣言为例[J].心理科学进展,2009,17(3):602-609. 被引量：57

引证文献24

1姚文杰,艾旭升,栾咏红,李良.POS机系统的数据爬虫技术[J].福建电脑,2020,36(4):91-93. 被引量：1
2王江北,丁蕊,李晓会.基于Python的数据分析指导高校课程设置[J].哈尔滨职业技术学院学报,2020(3):30-33.
3徐志,金伟.Python爬虫技术的网页数据抓取与分析[J].数字技术与应用,2020,38(10):30-32. 被引量：11
4熊波.网络违法信息传播次数作为入罪标准的困境与出路——基于186份刑事裁判文书和相关司法解释的思考[J].新闻与传播研究,2020,27(10):77-94. 被引量：18
5宋钰.基于Python爬虫技术的网络目录更新程序设计[J].现代信息科技,2020,4(18):20-22. 被引量：1
6陈倩倩,彭甜典,张琦.大数据背景下Python技术在审计工作中的应用[J].中国集体经济,2021(4):155-156. 被引量：6
7李传科.基于Python的网页数据爬虫设计分析[J].信息与电脑,2020,32(24):130-132. 被引量：6
8胡雅丽.基于Python爬取视频的设计与实现[J].通信电源技术,2021,38(3):191-193.
9袁望.对土地流转信息进行网络爬虫的实现与优化[J].科技创新与应用,2021,11(15):122-125. 被引量：1
10张荑阳,毛红霞.基于python的豆瓣电影数据采集与分析可视化[J].电子制作,2021,29(16):47-49. 被引量：5

二级引证文献79

1宋冰心,胡可,吴芳,李嫣婷.“留守二代”儿童疏离感的调查研究[J].心理月刊,2024(18):203-205.
2任芳,王鹏,郑贵省,郭强.网络数据获取与可视化教学项目设计实施[J].军事交通学报,2022(7):64-67.
3孙跃.数字经济时代算法司法治理的挑战及其应对——基于算法正义的裁判方法与多元共治[J].法治论坛,2023(2):50-65. 被引量：1
4饶传平.论数据抓取法律风险的流程化管理[J].东方法学,2023(6):28-42. 被引量：16
5熊波.数据状态安全法益的证立与刑法调适[J].当代法学,2023,37(1):70-82. 被引量：37
6王文娟,马方.“深度伪造”违法信息算法传播入罪的困境与破解[J].新闻界,2021(1):64-74. 被引量：9
7曾光辉,何波.RANSAC算法在网页关键信息智能筛选中的应用研究[J].科学技术创新,2021(12):114-115. 被引量：1
8李俊华.基于Python的数据可视化[J].新型工业化,2021,11(3):69-70. 被引量：2
9雷琼.基于Python的大数据审计方法探讨[J].商业文化,2021(16):126-127.
10单艳,张帆.基于Python的网页信息爬取技术研究[J].电子技术与软件工程,2021(14):238-239. 被引量：6

1《口腔颌面外科杂志》官方微信开通[J].口腔颌面外科杂志,2019,29(6):330-330.
2Henry Canaday,樊世宏(译).现代化后勤保障的关键——数字化工具[J].航空维修与工程,2019,0(8):20-21.
3张弛,张玮玮,梁吉春,刘谦.国内中文高影响力医学期刊报告利益冲突的现状及分析[J].科技与出版,2019,0(11):139-144. 被引量：11
4饶子龙,廖安庭,宋南昌.推拿治疗急性腰扭伤的系统评价[J].中医正骨,2019,31(12):29-33. 被引量：9
5胡珊珊,王晓晔,李争,陶秀彬.我国重症监护室护士职业倦怠发生率及影响因素的系统评价[J].齐齐哈尔医学院学报,2019,40(20):2615-2619. 被引量：8
6黄榕,陈宝梅,李青原,徐丽,刘思德.超声内镜引导下胰腺假性囊肿穿刺安全性和有效性的Meta分析[J].临床超声医学杂志,2019,21(12):917-921. 被引量：6
7吴冬梅,翟羽佳,周芳,王雨晴,张宇,罗漪涟,王洁琼,翟云忠.实验室管理软件在农产品检测中心的运用探究[J].南方农业,2019,13(27):191-193. 被引量：1
8本刊讯.购买用户数据优势和劣势的最新研究[J].数据分析与知识发现,2019,3(11):88-88.
9杨蔚茁.六西格玛在医院人力资源管理中的应用[J].产业创新研究,2019(12):143-143. 被引量：5
10曹杰.P2P技术在云平台内容分发中的应用[J].信息与电脑,2019,31(22):15-16. 被引量：1

信息技术与信息化

2019年第12期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部