期刊文献+
共找到961篇文章
< 1 2 49 >
每页显示 20 50 100
To Whom Do Data Belong?——Data Ownership and Protection in the Context of Web-Crawlers
1
作者 Ding Xiaodong Ryan(翻译) 《Contemporary Social Sciences》 2020年第6期134-155,共22页
Platform data has already become an important asset for web-based companies,but this sort of data frequently includes large amounts of personal information.Platform data can be seen as belonging to an individual,belon... Platform data has already become an important asset for web-based companies,but this sort of data frequently includes large amounts of personal information.Platform data can be seen as belonging to an individual,belonging to a platform,belonging to some combinations of the two,or can be seen as a form of Internet-based public data.Analysis of legal clauses and doctrines as well as analysis based in legitimacy and consequentialism both fail to completely delineate data ownership.One potential reason for this is that there are many types of platform data,and that each type is highly dependent on circumstances.The determination of rights in regard to platform data should be done in a way which revolves around a contextual regulatory framework,one in which the rules of reason is applied on a case-by-case basis and in which gradual changes are done in a bottom-up manner,and not one which seeks to establish a universal set of data regulations.In actual judgments,factors such as the nature of the platform and the nature of the data crawling behavior should be comprehensively considered while ensuring a balance of data circulation and data protection. 展开更多
关键词 data ownership data protection web-crawling unfair competition
在线阅读 下载PDF
广西非遗文化知识图谱构建与数据处理研究 被引量:1
2
作者 张涛 周卫 《智能计算机与应用》 2025年第3期72-78,共7页
非物质文化遗产代表着地区文化历史的沉淀,是中华优秀传统文化的重要组成部分,也是人类文明的宝贵财富,具有无可替代的历史文化价值。对于维护文化多样性来说,保护和传承非物质文化遗产至关重要。然而,在当前网络环境下,广西的非物质文... 非物质文化遗产代表着地区文化历史的沉淀,是中华优秀传统文化的重要组成部分,也是人类文明的宝贵财富,具有无可替代的历史文化价值。对于维护文化多样性来说,保护和传承非物质文化遗产至关重要。然而,在当前网络环境下,广西的非物质文化遗产信息存在着杂乱无章、结构不清晰的问题。针对此问题,通过采用Python爬虫技术,对广西非物质文化遗产信息进行了系统采集,通过应用自然语言处理模型、特别是命名实体识别和关系抽取技术,能够将其中的非结构化信息转化为结构化数据,随后对这些数据进行了全面整理和清洗。最终,运用知识图谱技术的强大信息整合和表示能力,成功构建出一个结构清晰的广西非物质文化遗产知识图谱。 展开更多
关键词 知识图谱 Python爬虫 命名实体识别 关系抽取 Neo4j图数据库 RoBERTa
在线阅读 下载PDF
基于大数据的装配式建筑密封胶应用性能与可靠性分析
3
作者 李元元 《粘接》 2025年第2期5-8,共4页
为了提高建筑的整体防水性能和耐久性,分析基于大数据的装配式建筑密封胶应用性能可靠性。使用基于Python的网络爬虫技术构建装配式建筑密封胶相关专利功能语料库,以此为基础制备装配式建筑用硅烷改性密封胶。测试硅烷偶联剂用量为0.4%~... 为了提高建筑的整体防水性能和耐久性,分析基于大数据的装配式建筑密封胶应用性能可靠性。使用基于Python的网络爬虫技术构建装配式建筑密封胶相关专利功能语料库,以此为基础制备装配式建筑用硅烷改性密封胶。测试硅烷偶联剂用量为0.4%~3.2%时对密封胶表干时间、固化时间、粘接强度以及稀释剂用量对密封胶拉伸强度影响,最后测试光照老化和浸水老化对密封胶耐老化性能影响。试验结果表明,硅烷偶联剂用量为1.6%时表干时间较短,固化时间较优且粘接强度较高,稀释剂用量为11%时密封胶拉伸强度最优。该密封胶经过长时间光照老化、浸水老化和加热老化后具有较强耐老化性能。 展开更多
关键词 装配式建筑 密封胶 表干时间 网络爬虫 硅烷偶联剂
在线阅读 下载PDF
基于R语言的上市公司企业社会责任数据采集系统设计
4
作者 张益明 《山西电子技术》 2025年第1期70-72,共3页
数字经济时代下,高效的数据采集非常关键。不同于大部分基于Python的自动数据采集的是,着重介绍R语言环境下上市公司企业社会责任数据采集系统的设计,并测试了多线程技术下的采集效率。所介绍设计方案可以为其他财经数据的抓取提供有效... 数字经济时代下,高效的数据采集非常关键。不同于大部分基于Python的自动数据采集的是,着重介绍R语言环境下上市公司企业社会责任数据采集系统的设计,并测试了多线程技术下的采集效率。所介绍设计方案可以为其他财经数据的抓取提供有效的技术支持。 展开更多
关键词 数据采集 R 网页解析 爬虫 数据挖掘
在线阅读 下载PDF
基于网络爬虫及双词主题模型的4个主流在线平台帕金森病患者健康信息需求分析 被引量:1
5
作者 朱傲雪 毛惠娜 +2 位作者 谢惠玲 王梅 邓绮兰 《护理学报》 2025年第11期20-27,共8页
目的探索主流在线平台帕金森病患者的健康信息需求,为护理人员开展针对性健康信息服务提供依据。方法抓取4个主流在线平台的帕金森病交流文本,应用Python软件和双词主题模型(Biterm Topic Model,BTM),挖掘帕金森病患者健康信息需求并进... 目的探索主流在线平台帕金森病患者的健康信息需求,为护理人员开展针对性健康信息服务提供依据。方法抓取4个主流在线平台的帕金森病交流文本,应用Python软件和双词主题模型(Biterm Topic Model,BTM),挖掘帕金森病患者健康信息需求并进行主题划分,使用Gephi软件绘制各主题的关键词共现图。结果各主流在线平台的主题分析显示:知乎、贴吧、小红书、好大夫平台分别析出3、4、5、5个主题;对上述4个平台汇总的32852条文本进行分析,析出6类帕金森病健康信息需求:症状管理(“睡眠-疼痛-乏力”症状群加重疾病负担)、药物治疗(存在错误用药认知及不规范调药行为)、居家管理(饮食与运动管理缺乏可操作性指导)、家属照护(替代搜寻存在信息简化与报告失真风险)、手术治疗(术前适应证评估与术后药物-程控协同不明确)、疾病诊断(基层难以确诊患者在线求助专家)。结论帕金森病患者的健康信息需求以内容多维性和“患者-家属”双主体为特征,为护士实施多方联动、精准全面的健康信息服务提供新的证据支持。 展开更多
关键词 帕金森病 健康信息需求 网络爬虫 双词主题模型 主流在线平台
暂未订购
基于Python的全球7级大震趋势研判系统设计与实现
6
作者 马亚伟 孟令媛 +5 位作者 臧阳 韩颜颜 姜祥华 王月 解孟雨 杨志高 《地震研究》 北大核心 2025年第3期450-459,共10页
为提高全球7级以上地震的震后应急效率,设计并实现了一套基于Python的全球7级大震趋势研判系统。针对不同机构对同一地震测定的地震信息存在差异的问题,如震级标度不一致、定位存在差异等,通过统计历史地震提出了利用“时间差小于10 s... 为提高全球7级以上地震的震后应急效率,设计并实现了一套基于Python的全球7级大震趋势研判系统。针对不同机构对同一地震测定的地震信息存在差异的问题,如震级标度不一致、定位存在差异等,通过统计历史地震提出了利用“时间差小于10 s且定位误差小于2°即可确定为同一地震”的规则对相同地震进行匹配的规则;在上述规则下,利用Python爬虫技术获取地震目录及震源机制解等数据;利用PyGMT实现了地震分布等各类图件的自动绘制;最后实现了震后趋势研判PPT文档的自动产出。实际应用表明,该系统可以快速产出全球7级以上地震分布、历史地震、地质构造、震源机制解及其与大陆强震的统计关系等震后趋势研判资料,平均运行时间在1分钟内,显著提高全球7级以上大震的震后应急效率。 展开更多
关键词 网络爬虫 7级以上大震 地震应急 震后趋势研判
在线阅读 下载PDF
数据可供性的再隐蔽:平台社会视角下平台未授权数据开放特征与权力边界 被引量:2
7
作者 方园 孙铭菲 《新闻界》 北大核心 2025年第2期72-83,96,共13页
平台授权单向性与第三方行动者日益增长的数据需求之间的矛盾,推动了未授权的数据采集方式兴起。作为更隐蔽的数据流动方式,未授权的数据采集与平台数据开放权力之间的运作关系尚未得到足够的关注。从平台社会中的数据基础设施和可供性... 平台授权单向性与第三方行动者日益增长的数据需求之间的矛盾,推动了未授权的数据采集方式兴起。作为更隐蔽的数据流动方式,未授权的数据采集与平台数据开放权力之间的运作关系尚未得到足够的关注。从平台社会中的数据基础设施和可供性理论脉络出发,本研究旨在考察未授权情境下行动者与平台方的技术互动,揭示其背后所隐含的平台数据开放特征,并由此审视平台权力边界。通过走查法与半结构化访谈发现,未授权的数据采集对平台与用户“双重隐蔽”。行动者挑战平台既定框架并进行技术实践的再创造,这种未授权数据的可获取性成为数据可供性“再隐蔽”的表现形式。平台对技术手段的权衡与使用促成了“分层可供”的数据开放特征,形成技术性的权力边界,并将其与行动者在技术层面上的对抗关系转化为社会性的合作关系,以巩固自身权力。 展开更多
关键词 平台社会 数据开放 可供性理论 平台权力 网络爬虫
原文传递
大数据背景下企业财务管理的机遇与挑战 被引量:2
8
作者 刘晓慧 《山西财经大学学报》 北大核心 2025年第S1期175-177,共3页
在大数据技术的支持下,企业利用大数据技术能够深入挖掘财务数据,掌握企业的经营状况,促进企业整体发展沿着正确的轨迹前进。基于对企业利用大数据技术的机遇与挑战的分析,提出利用网络爬虫技术进行财务信息分析、合理利用关键词匹配算... 在大数据技术的支持下,企业利用大数据技术能够深入挖掘财务数据,掌握企业的经营状况,促进企业整体发展沿着正确的轨迹前进。基于对企业利用大数据技术的机遇与挑战的分析,提出利用网络爬虫技术进行财务信息分析、合理利用关键词匹配算法、运用实质性程序中的大数据技术、优化企业信息数据存储等大数据技术在企业财务管理工作中的应用策略。 展开更多
关键词 企业财务管理 网络爬虫技术 数据存储
原文传递
网页向量化表示:一种优化网络爬虫质量的方法
9
作者 武强 官却多杰 周庆国 《计算机应用与软件》 北大核心 2025年第6期350-355,共6页
搜索引擎的性能一定程度上依赖网络爬虫(网络内容获取)的能力。受到深度学习向量化表示和卷积神经网络技术启发,关注计算机对于信息(自然语言和图片)理解与信息的关联性,提出网页向量表示(Page2Vec)算法,并基于Page2Vec算法构建爬虫-过... 搜索引擎的性能一定程度上依赖网络爬虫(网络内容获取)的能力。受到深度学习向量化表示和卷积神经网络技术启发,关注计算机对于信息(自然语言和图片)理解与信息的关联性,提出网页向量表示(Page2Vec)算法,并基于Page2Vec算法构建爬虫-过滤(Crawler-Filter)算法。实验表明:Crawler-Filter算法在网络爬虫过程中,能够在覆盖合理的内容的同时绕过低质量或无关内容。 展开更多
关键词 搜索引擎 网络爬虫 网页向量表示算法 爬虫过滤算法
在线阅读 下载PDF
社会资本视角下高校教师团队科研产出研究——基于网络爬虫数据的分析
10
作者 李艳 刘荣三 +1 位作者 马琳 张婷 《科学学研究》 北大核心 2025年第10期2212-2220,2240,共10页
高校是国家战略科技力量的重要组成部分,高校科研能力是推动国家科技创新的重要引擎。围绕高校教师的科研产出,学界进行了大量探讨。然而,多数研究仍集中在教师个体或学校层面的视角,对于如何强化高校教师团队建设、促进教师团队科研产... 高校是国家战略科技力量的重要组成部分,高校科研能力是推动国家科技创新的重要引擎。围绕高校教师的科研产出,学界进行了大量探讨。然而,多数研究仍集中在教师个体或学校层面的视角,对于如何强化高校教师团队建设、促进教师团队科研产出的提升回答有限。本文基于社会资本理论,使用网络爬虫软件从Web of Science和中国知网上获取教师团队科研产出信息,数据爬取起始时间为2019年1月1日,截止时间为2023年12月31日,共计爬取年限为5年。从4265篇中文论文和2726篇英文论文中整理出北京某985高校7个院系58个专业团队588名教师的科研产出情况,同时从教师所在院系官网上获取了人口统计学和研究方向信息。通过多元回归分析方法检验了学历背景多样性、学术活动举办频率和研究方向一致性对高校教师科研团队产出的影响作用。结果发现,学历背景多样性与高校教师团队科研产出无显著关系,学术活动举办频率与科研产出负相关,研究方向一致性显著正向影响高校教师团队科研产出。在此基础上,本研究提出切实可行的管理建议,为高校进一步建设有组织科研、提高教师团队科研产出提供实践指导。 展开更多
关键词 高校教师团队 科研产出 社会资本理论 网络爬虫
原文传递
基于Python语言的网络舆情大数据传播特征挖掘研究
11
作者 胡贵恒 张震 陈翠红 《陇东学院学报》 2025年第2期21-26,共6页
为解决网络舆情大数据传播特征挖掘存在读入延迟等问题,提出基于Python语言的网络舆情大数据传播特征挖掘研究。通过Python语言设计基于scrapy开源结构的改进爬虫算法,爬取网络中的舆情大数据;构建舆情大数据文本空间向量模型,提取数据... 为解决网络舆情大数据传播特征挖掘存在读入延迟等问题,提出基于Python语言的网络舆情大数据传播特征挖掘研究。通过Python语言设计基于scrapy开源结构的改进爬虫算法,爬取网络中的舆情大数据;构建舆情大数据文本空间向量模型,提取数据内的文本特征;采用时间序列模型消除文本特征延时性,通过基于特征词向量的短文本聚类算法,计算短文本之间语义关联性,依据该关联性并通过层次聚类算法挖掘网络舆情大数据传播特征。经实验验证,该方法具有较低的读入延迟,能够挖掘得到舆情大数据的网络关注度、发帖数量以及转发时间频率等传播特征。 展开更多
关键词 PYTHON语言 网络舆情 大数据 传播特征挖掘 scrapy开源结构 网络爬虫
在线阅读 下载PDF
数字化转型对中部地区制造业企业创新的影响 被引量:2
12
作者 李诗琪 袁梓怀 谢咏谕 《南昌工程学院学报》 2025年第2期103-108,共6页
在数字经济时代,数字化转型已成为推动制造业创新发展的坚实力量,对提升企业核心竞争力具有重要意义。本文采用文本挖掘和网络爬虫技术,结合熵权法,搜集并整理了2018—2022年中部地区A股制造业上市公司年度报告,对样本企业数字化转型程... 在数字经济时代,数字化转型已成为推动制造业创新发展的坚实力量,对提升企业核心竞争力具有重要意义。本文采用文本挖掘和网络爬虫技术,结合熵权法,搜集并整理了2018—2022年中部地区A股制造业上市公司年度报告,对样本企业数字化转型程度及其创新效率进行了量化,考察了企业数字化转型与其创新效率之间的关系。结果表明,数字化转型能够在一定程度上提升样本企业的创新效率,对企业发展具有积极作用。 展开更多
关键词 数字化转型 创新效率 文本挖掘 网络爬虫 熵权法
在线阅读 下载PDF
基于网络爬虫与TF-IDF算法的非遗产品创新
13
作者 王菁 杨晓翔 《佳木斯大学学报(自然科学版)》 2025年第8期52-54,74,共4页
非遗产品创新无法满足当前流行趋势,提出基于网络爬虫与TF-IDF算法的非遗产品创新方法。以百度百科、天猫商城为对象基于网络爬虫技术爬取非遗产品创新热点的网络词条,构造一个语料库粗糙集;利用TF-IDF算法对语料库进行精确搜索,在传统T... 非遗产品创新无法满足当前流行趋势,提出基于网络爬虫与TF-IDF算法的非遗产品创新方法。以百度百科、天猫商城为对象基于网络爬虫技术爬取非遗产品创新热点的网络词条,构造一个语料库粗糙集;利用TF-IDF算法对语料库进行精确搜索,在传统TF-IDF算法中引入词跨度,选取权重最高的前n个作为非遗产品创新设计的关键词,获得符合非遗产品创新设计需求的结果。测试结果显示:该方法抽取的非遗创新关键词与人工抽取结果更契合,准确度均在90%以上,基于网络爬虫与TF-IDF算法的非遗产品创新具有良好的推广应用前景。 展开更多
关键词 网络爬虫 TF-IDF算法 语料库 词频率 非遗创新 产品
在线阅读 下载PDF
Python环境下的JavaScript逆向技术分析
14
作者 魏霞 《微型电脑应用》 2025年第9期267-269,277,共4页
在数据下载和网络爬虫领域,经常会遇到各种问题,如难以理解网页代码、无法破解数据加密方式等。为了解决这些问题,运用JavaScript逆向技术,结合某售房网站的实例,使用排错法和断点调试技术对数据加密问题进行深入分析,得到可用数据。结... 在数据下载和网络爬虫领域,经常会遇到各种问题,如难以理解网页代码、无法破解数据加密方式等。为了解决这些问题,运用JavaScript逆向技术,结合某售房网站的实例,使用排错法和断点调试技术对数据加密问题进行深入分析,得到可用数据。结果表明,运用JavaScript逆向技术后爬虫效果(获取数据)得到明显提升,模拟参数解密方式也取得了成功。 展开更多
关键词 网络爬虫 JavaScript逆向技术 PYTHON 数据加密
在线阅读 下载PDF
基于AI技术和DNS数据的威胁网站分析方案
15
作者 戚大强 郑涛 +2 位作者 由志远 宋洪飞 刘果 《邮电设计技术》 2025年第9期47-51,共5页
针对网络安全领域的现状,提出一种基于分布式爬虫与混合检测引擎的恶意网站识别系统,该系统通过多层架构实现从DNS原始日志分析、域名检测、恶意域名管理的全流程管控。系统构建分布式爬虫集群,创新性地设计权重关键词规则库与AI分析相... 针对网络安全领域的现状,提出一种基于分布式爬虫与混合检测引擎的恶意网站识别系统,该系统通过多层架构实现从DNS原始日志分析、域名检测、恶意域名管理的全流程管控。系统构建分布式爬虫集群,创新性地设计权重关键词规则库与AI分析相结合的检测机制,快速、高效、准确地分析恶意网站,为主动式网络安全防护提供新思路。 展开更多
关键词 DNS日志 恶意网站检测 网络爬虫 关键词匹配 AI 图片识别
在线阅读 下载PDF
基于ChatGPT与金融数据接口的智能选股及回测系统研究
16
作者 刘逸凯 汪煌俊 吴瑰 《现代信息科技》 2025年第17期62-67,72,共7页
文章深入探讨了融合ChatGPT自然语言处理能力与金融数据接口的智能选股及回测系统。通过将ChatGPT的对话交互功能与Tushare、东方财富等金融数据接口相结合,实现了从用户自然语言需求到量化指标的自动转换,并高效筛选出符合条件的股票... 文章深入探讨了融合ChatGPT自然语言处理能力与金融数据接口的智能选股及回测系统。通过将ChatGPT的对话交互功能与Tushare、东方财富等金融数据接口相结合,实现了从用户自然语言需求到量化指标的自动转换,并高效筛选出符合条件的股票集合。同时,进一步拓展开发了智能回测功能,利用backtest回测接口完成对选股策略的精准计算与验证。系统采用Flask框架构建后端,支持多轮对话,确保交互连贯性。经测试,该系统在功能、性能及准确性上表现优异,为投资者提供了智能化、高效化的选股与回测解决方案,未来可期待在更多金融领域拓展应用。 展开更多
关键词 ChatGPT 智能选股 网络爬虫 智能回测 多轮对话
在线阅读 下载PDF
地震灾害事件驱动的输电杆塔震害自动评估系统研究
17
作者 陈刚 李茂峰 +6 位作者 陈强 刘波 岑关 甘朝阳 李克华 申文豪 李强 《中国地震》 北大核心 2025年第2期374-384,共11页
输电杆塔是电网系统重要的组成部分。地震是一种在极短时间内释放巨大能量的自然灾害,对输电杆塔的安全造成巨大破坏。震后第一时间开展输电杆塔震害应急评估,可为输电杆塔巡查修复提供决策支撑。针对输电杆塔震害应急评估响应效率低、... 输电杆塔是电网系统重要的组成部分。地震是一种在极短时间内释放巨大能量的自然灾害,对输电杆塔的安全造成巨大破坏。震后第一时间开展输电杆塔震害应急评估,可为输电杆塔巡查修复提供决策支撑。针对输电杆塔震害应急评估响应效率低、巡检目标不明确等问题,构建了基于地震灾害事件驱动的输电杆塔震害自动评估系统。本系统底层基于GIS(Geographic Information System)技术,采用B/S(Browser/Server)架构形式,利用网络爬虫技术自动获取地震发震信息;以地形和场地校正后的峰值加速度(Peak Ground Acceleration,PGA)为输入,结合输电杆塔地震易损性曲线,快速自动化地实现输电杆塔震害程度评估并实时发布。本系统满足了输电杆塔震害应急评估需求,为“是否巡查”提供决策参考,可有效提高电网应急决策的精准化程度和反应效率,优化输电线路杆塔震害应急处置机制和应急处置策略。 展开更多
关键词 地震 输电杆塔易损性 网络爬虫 地震应急 损失评估
在线阅读 下载PDF
物联网海量不均衡数据组内方差SNM清洗算法
18
作者 伍阳 陈科基 《现代电子技术》 北大核心 2025年第3期124-128,共5页
由于物联网数据通常是不均衡的,导致采集的数据集中各个类别的样本数量差异很大,无法准确反映其内部的方差情况,使得数据文本相似度较高,为此,提出物联网海量不均衡数据组内方差SNM清洗算法。使用网络爬虫技术爬取海量不均衡数据,对不... 由于物联网数据通常是不均衡的,导致采集的数据集中各个类别的样本数量差异很大,无法准确反映其内部的方差情况,使得数据文本相似度较高,为此,提出物联网海量不均衡数据组内方差SNM清洗算法。使用网络爬虫技术爬取海量不均衡数据,对不平衡数据字段过滤处理,设计可伸缩滑动窗口方式改进SNM算法,计算不均衡数据组内方差,将其作为清洗不均衡数据的约束,通过对比物联网海量不均衡数据组内方差阈值,实现物联网海量不均衡数据清洗。实验结果表明:该方法具备较强的物联网海量不均衡数据清洗能力,且清洗后的物联网海量不平衡数据的文本相似度较低,应用性较强。 展开更多
关键词 物联网 不均衡数据 组内方差 SNM清洗算法 滑动窗口 网络爬虫 数据字段 约束条件
在线阅读 下载PDF
基于大众点评数据的北京市餐饮业发展研究
19
作者 陈澜 许荣华 《食品安全导刊》 2025年第27期163-167,共5页
本文基于2024年12月中旬在大众点评网利用爬虫技术获取的北京市740家餐饮门店共20160条餐饮门店的评论数据,深入分析北京市餐饮业态分布、价格区间、评分及评价数据,探究影响北京市餐饮业高质量发展的核心因素。研究发现,北京市餐饮业... 本文基于2024年12月中旬在大众点评网利用爬虫技术获取的北京市740家餐饮门店共20160条餐饮门店的评论数据,深入分析北京市餐饮业态分布、价格区间、评分及评价数据,探究影响北京市餐饮业高质量发展的核心因素。研究发现,北京市餐饮业态呈现多样化特征,人均消费集中于51~150元,中端市场占比超半数;菜品口味、食材新鲜度是顾客好评的主要驱动力,而服务品质与环境也备受重视。北京市餐饮企业需通过菜品创新、提升服务细节及环境体验实现差异化竞争。 展开更多
关键词 大众点评网 餐饮门店 爬虫技术 北京市
在线阅读 下载PDF
基于Python的图书信息爬取与可视化应用研究
20
作者 梁玉清 《无线互联科技》 2025年第11期46-50,共5页
随着信息技术的发展,图书信息的快速获取与分析成为图书管理与推荐系统的重要需求。为实现高效、低成本的数据收集与整理,文章以国内知名图书平台为实证对象,设计并实现了一种基于Python的图书信息爬取与可视化方法。通过编写爬虫脚本,... 随着信息技术的发展,图书信息的快速获取与分析成为图书管理与推荐系统的重要需求。为实现高效、低成本的数据收集与整理,文章以国内知名图书平台为实证对象,设计并实现了一种基于Python的图书信息爬取与可视化方法。通过编写爬虫脚本,自动获取并存储大量图书信息至本地Excel表格,利用可视化技术从微观和宏观2个角度分析数据:微观层面揭示单一变量的分布规律,宏观层面提取整体统计特征。研究结果表明,该方法能够为特定类型或具体图书信息的定量分析和整理提供支持,具有较高的实用性与可行性。因此,基于Python技术的图书信息爬取与可视化方法是一种有效的数据获取与分析手段,为图书资源管理与决策提供了科学依据。 展开更多
关键词 PYTHON 爬虫 图书信息 可视化研究
在线阅读 下载PDF
上一页 1 2 49 下一页 到第
使用帮助 返回顶部