摘要
随着互联网的发展,网络上每时每刻都在产生着大量的信息,这些信息具有很高的研究价值。笔者以淘宝为例,基于Python中的Selenium库,实现了对商品评论、追评、商品信息、评论时间、用户名等信息的快速爬取,并将爬取的数据存入Excel表格中。
With the development of the Internet,a lot of information is produced on the network every moment,which has high research value.Taking Taobao as an example,based on selenium Library in Python,the author realizes the quick crawling of product comments,follow-up reviews,commodity information,comment time,user name and other information,and stores the crawled data into excel tables.
作者
李晓宇
徐勇
汪倩
武雅利
马琴琴
Li Xiaoyu;Xu Yong;Wang Qian;Wu Yali;Ma Qinqin(School of Management Science and Engineering,Anhui University of Finance and Economics,Bengbu Anhui 233030,China)
出处
《信息与电脑》
2020年第12期62-64,共3页
Information & Computer
基金
2015年度国家社科基金规划项目(项目编号:15BTQ043)
2018年度安徽省自然科学基金(项目编号:1808085MF194)
2019年度安徽省高校科学研究项目(项目编号:KJ2019A0663)
2018年度安徽财经大学研究生科研创新基金(项目编号:ACYC2018226)
2019年度安徽财经大学研究生科研创新基金(项目编号:ACYC2019218)。