-
题名基于改进的OLDA模型话题检测及演化分析
被引量:8
- 1
-
-
作者
余本功
张卫春
王龙飞
-
机构
合肥工业大学管理学院
过程优化与智能决策教育部重点实验室
-
出处
《情报杂志》
CSSCI
北大核心
2017年第2期102-107,共6页
-
基金
教育部人文社会科学研究项目"云计算环境下企业知识组织与知识门户系统研究"(编号:2012JYRW0710)
国家自然科学基金项目"基于制造大数据的产品研发知识集成与服务机制研究"(编号:71671057)
-
文摘
[目的/意义]话题检测和演化分析是网络舆情监控中的热点问题,对热点话题的检测和演化分析有助于挖掘热点话题和深入理解话题的演化趋势,并给以舆情监控者提供完整的话题演化路径和更为合理的决策意见。[方法/过程]OLDA(Online Latent Dirichlet Allocation)模型是用于挖掘热点话题和分析话题演化的工具,由于其存在新旧主题混合、冗余词较多的缺点,采用双通道模式对主题、词分布的遗传度进行改进,并给出了新的词分布计算方法。[结果/结论]提出的改进OLDA模型解决了新旧主题混合问题,降低冗余词的概率,更为明确地解释话题的含义。实验表明,改进的OLDA模型更为有效地对话题进行检测及演化分析。
-
关键词
网络舆情
olda
模型
话题演化
话题检测
Gibbs
采样
特征字
-
Keywords
network public opinion olda model topic evolution topic detection Gibbs sampling feature word
-
分类号
C931.6
[经济管理—管理学]
-
-
题名基于OLDA的可变在线主题演化模型
被引量:7
- 2
-
-
作者
裴可锋
陈永洲
马静
-
机构
南京航空航天大学经济与管理学院
-
出处
《情报科学》
CSSCI
北大核心
2017年第5期63-68,共6页
-
基金
国家自然科学基金项目(71373123)
江苏高校哲学社会科学研究重点项目(2015ZDIXM007)
-
文摘
【目的/意义】随着网络社交媒体的发展,舆情文本中隐含的主题越来越能体现出人们的关注点所在及变化情况,因此对其进行检测及演化分析具有重要意义。【方法/过程】为了解决OLDA模型存在的主题混合及权重定义问题,本文提出了一种可变在线LDA模型(variable online LDA,VOLDA),通过构建主题相似度矩阵,明确主题变化关系,在主题内容演化矩阵中剔除含有旧主题的时间片,从而构建变长的演化矩阵,并在此基础上设计动态权重计算方法及先验参数优化方法。【结果/结论】基于论坛文本数据的实验结果表明,VOLDA模型能够有效减少新主题出现后的主题混合问题,并且提高主题在演化过程中的表示能力。
-
关键词
主题相似度
olda
在线主题演化
模型优化
-
Keywords
topic similarity
olda
online topic evolution
model optimizatio
-
分类号
G206.3
[文化科学—传播学]
-
-
题名一种话题演化建模与分析方法
被引量:26
- 3
-
-
作者
胡艳丽
白亮
张维明
-
机构
国防科学技术大学信息系统工程重点实验室
-
出处
《自动化学报》
EI
CSCD
北大核心
2012年第10期1690-1697,共8页
-
基金
国家自然科学基金(60902094
60903225
+1 种基金
41001260)
高等学校博士学科点专项科研基金(20114307110008)资助~~
-
文摘
根据时序关系将文本流划分为连续时间片中的文本集,在线抽取各时间片中隐含的子话题,采用模型选择方法动态确定各时间片包含的子话题数,以历史时间片的子话题信息作为当前子话题发现的先验知识,基于OLDA(Online latent Dirichlet allocation)模型抽取各时间片包含的子话题,通过Gibbs抽样对话题模型参数进行估计;对子话题进行关联分析,定义子话题产生、消亡、继承、分裂和合并五种演化类型,提出基于相对熵的子话题关联分析方法,根据子话题语义相似度和时序关系建立子话题间的关联,由具有时序关系和内容关联的子话题组成话题,通过子话题内容和强度的变化描述话题演化.基于真实网络新闻的话题演化分析实验表明,本文提出的话题演化分析方法能够有效检测网络新闻话题内容和强度的演化.
-
关键词
话题演化
olda
模型
模型选择
Gibbs
抽样
相对熵
关联分析
-
Keywords
Topic evolution, online latent Dirichlet allocation (olda), model selection, Gibbs sampling, relative entropy,correlation analysis
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于OTSCM模型的主题情感在线追踪
被引量:3
- 4
-
-
作者
刘玉文
刘月华
杨枢
张钰
-
机构
蚌埠医学院卫生管理系
中国科学技术大学综合国力信息监测中心
-
出处
《现代情报》
CSSCI
北大核心
2017年第12期35-41,共7页
-
基金
国家自然科学基金项目"面向路径隐私保护的移动群智感知数据收集研究"(项目编号:61672038)
安徽省高校人文科学重点项目"基于对比挖掘的医疗卫生网络舆情的发现
+1 种基金
跟踪及倾向性分析"(项目编号:sk2015A405)
安徽省高校自然科学重点项目"基于统计模型检验和风险分析的婴儿培养箱安全性评价关键技术研究"(项目编号:KJ2017A223)
-
文摘
网络舆论主题情感在线分析对舆情研判与管理起着十分重要的作用,当前的主题情感模型存在着主题与情感建模关系不紧密,情感挖掘偏斜等问题,容易造成舆情误判。文本在OLDA(On-Line Latent Dirichlet Allocation,OLDA)模型的基础上引入情感参数,并提出情感遗传思想,建立基于情感遗传的在线主题情感混合模型OTSCM(On-Line Topic and Sentiment Combining Model)。该模型把t-1时间片内的主题情感分布作为t时间片内主题情感分布的先验,通过构造主题情感演化矩阵,生成t时间片内文档—主题、主题—特征词以及主题—情感词3个分布,最后使用交叉熵方法计算t时间片内主题分布与t-1之前主题分布的相似度,得出t时间片内主题情感演化结果。本文在5个数据集上对OTSCM进行了验证,并与其它流行算法进行了对比,实验表明,文本方法在主题情感在线识别方面达到了良好的效果。
-
关键词
olda模型
主题情感
情感遗传
OTSCM模型
情感计算
情感演化
-
Keywords
olda model
topic sentiment
sentiment genetic
OTSCM model
sentiment computing
sentiment evolution
-
分类号
G206.2
[文化科学—传播学]
-
-
题名基于OTUCM模型的网络社团在线识别
被引量:1
- 5
-
-
作者
翟菊叶
张浩
-
机构
蚌埠医学院卫生管理系
复旦大学计算机科学与技术学院
-
出处
《情报理论与实践》
CSSCI
北大核心
2018年第7期129-135,共7页
-
基金
安徽省高校人文社会科学重点项目"基于对比挖掘的医疗卫生网络舆情的发现
跟踪及倾向性分析"(项目编号:sk2015A405)
+1 种基金
安徽省高校人文社会科学重点项目"基于统计分析及多维关联规则挖掘的安徽省大学生手机依赖与身心健康关联性研究"(项目编号:sk2017A182)
2018年度安徽高校人文社会科学研究项目"医院负面口碑补救行为对患者满意度影响与多维度关联分析"(项目编号:SK2018A1072)的成果
-
文摘
[目的/意义]通过挖掘网络社团及其演化过程,有助于掌握网络用户结构及行为方式,对网络舆情分析具有十分重要的意义,当前的网络社团演化挖掘模型存在着局部最优及抗噪能力差等问题。[方法/过程]通过建立网络社团与主题的对应关系,把社团的识别转化成主题的识别。在OLDA模型的基础上引入用户参数,提出一种主题社团混合模型(OTUCM),该模型把t-1时刻社团后验作为t时刻社团先验,通过建模用户、消息、主题、词汇四者之间的概率依赖关系,生成t时刻消息—主题、主题—词汇、主题—用户三个分布矩阵。通过交叉熵计算t与t-1时刻的主题相似度,得出主题及主题下用户的演化过程。[结果/结论]在实验数据集上验证了OTUCM模型,并与当前流行算法进行对比,实验结果表明OTUCM模型在网络社团演化挖掘方面达到了良好的效果。
-
关键词
网络用户
网络社团
olda模型
网络舆情
主题社团混合模型
演化过程
-
Keywords
Internet user
network community
olda model
network public opinion
OTUCM
evolution process
-
分类号
G206
[文化科学—传播学]
G353.1
[文化科学—情报学]
-