摘要
随着互联网信息技术的快速发展,越来越多用户借助于网络搜索、在线浏览等平台,进行所需要数据信息的获取,而最常用的信息获取方式为网络爬虫。网络爬虫又被称为网络机器人,其主要利用Python程序设计语言,对浏览器网页中的HTTP超文本协议、URL地址等进行访问与爬取,不需要人为的干预或操作,就能够完成网站中数据信息的自动爬取。本文主要探讨python网络爬虫技术的主要内容,及其对网页数据爬取、永久保存的实现流程。
作者
李玉香
王孟玉
涂宇晰
LI Yu-xiang;WANG Meng-yu;TU Yu-xi
出处
《信息技术与信息化》
2019年第12期143-145,共3页
Information Technology and Informatization
基金
2018年教育部产学合作协同育人项目“Python全栈开发人才培养实践”(201802057003)
“基于Python的数据分析与智能开发人才培养实践”(201801037002)