-
题名基于WebMagic爬虫框架的网页信息系统设计
- 1
-
-
作者
朱延刚
-
机构
南京信息工程大学
-
出处
《无线互联科技》
2023年第11期73-76,98,共5页
-
文摘
随着互联网技术的迅速发展,人们获取信息的渠道和方式,都得到了极大的丰富和拓展。面对海量的网络信息,如何高效便捷地利用网络信息资源,提高对有效信息的获取能力,成了一个重要的课题。文章基于Java的WebMagic爬虫框架设计了一个具有高适用性和可扩展性的信息采集系统,以便于针对不同的业务场景和需求,快速搭建自己的爬虫数据采集系统。
-
关键词
java爬虫
WebMagic框架
数据持久化
-
Keywords
java crawler
WebMagic framework
data persistence
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名地理环境对闽南民歌的影响
- 2
-
-
作者
吴银鸿
方旭红
-
机构
华侨大学旅游学院
-
出处
《黎明职业大学学报》
2018年第2期56-60,共5页
-
基金
华侨大学研究生科研创新能力培育计划资助项目(1611308012)
-
文摘
为探究地理环境对闽南民歌产生的影响,选取文本挖掘的新视角,通过Java爬虫抓取闽南民歌及内容文本,借助ROST Content Mining 6软件对闽南民歌文本进行抓取高频词汇和可视化分析。高频词汇可分为表示闽南地方虔诚信仰的词汇,表示月份的时间名词,表示亲人朋友等人物名词,表示地方农作物的名词,表示自然环境与地方其他特色的名词。根据闽南民歌社会网络和语义网络表可以看出,"父母""日头""小妹""心肝"等词汇处于闽南民歌的核心地位,与这些核心要素联系较为紧密的词语中充分体现了与地理环境相关的要素。地理环境对闽南民歌体裁多样性、题材丰富性、歌唱风格地方性等方面产生了深刻的影响。
-
关键词
闽南民歌
地理环境
闽南文化
java爬虫技术
文本数据
高频词汇
-
Keywords
Minnan folk songs
geographical environment
Minnan culture
the java crawler
text data
high-frequency vocabulary
-
分类号
J642
[艺术—音乐]
-
-
题名基于深度学习的微博舆情监测模型研究与实现
被引量:3
- 3
-
-
作者
成哲丞
-
机构
浙江理工大学信息科学与工程学院
-
出处
《计算机时代》
2023年第11期124-126,130,共4页
-
文摘
为了实时监测和分析新浪微博上的舆论情况,建立一种基于深度学习的微博舆情监测模型。提出了基于Java的分布式数据爬取框架和基于Elasticsearch的分布式搜索存储方法,有效地提升了舆情监测模型的性能。提出了融合改进注意力机制的Bi-LSTM情感分析方法和基于情感分析的舆情预警等级计算方法,很好地实现了对微博热搜话题的实时舆情监测。
-
关键词
java分布式爬虫
Elasticsearch
注意力机制
Bi-LSTM
舆情预警
-
Keywords
java distributed crawler
Elasticsearch
attention mechanism
Bi-LSTM
public opinion warning
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-