期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于速度增长的微博热点话题发现
被引量:
17
1
作者
薛素芝
鲁燃
任圆圆
《计算机应用研究》
CSCD
北大核心
2013年第9期2598-2601,共4页
在微博热点话题发现中,由于微博文本短、词量少、用词不规范等特征,使得传统的热点话题检测方法力不从心。针对这一问题,提出了基于速度增长的微博热点话题发现方法。首先把经过预处理的微博按等数量窗口划分,统计每个窗口内各词语的词...
在微博热点话题发现中,由于微博文本短、词量少、用词不规范等特征,使得传统的热点话题检测方法力不从心。针对这一问题,提出了基于速度增长的微博热点话题发现方法。首先把经过预处理的微博按等数量窗口划分,统计每个窗口内各词语的词频,并表示成时间二元组序列;然后通过计算每相邻两个窗口的个词语的增长斜率来发现增长速度快的词语;再通过计算与该词语有关的用户的增长速度和微博条数的增长速度来确定该词语是否是热点主题词;最后通过热点主题词聚类产生热点话题。通过实验验证了该方法的可行性。实验结果表明,该方法在一定程度上提高了检测效率,降低了漏检率和误检率,可以有效地及时发现微博热点话题。
展开更多
关键词
增长斜率
增长速度
时间二元组序列
热点发现
在线阅读
下载PDF
职称材料
题名
基于速度增长的微博热点话题发现
被引量:
17
1
作者
薛素芝
鲁燃
任圆圆
机构
山东师范大学信息科学与工程学院
山东省分布式计算机软件新技术重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2013年第9期2598-2601,共4页
基金
国家自然科学基金资助项目(60873247)
山东省自然科学基金资助项目(ZR2009GZ007
+2 种基金
ZR2011FM030)
国家社科基金资助项目(12BXW040)
公安部科技创新计划资助项目(2011YYCXSDST057)
文摘
在微博热点话题发现中,由于微博文本短、词量少、用词不规范等特征,使得传统的热点话题检测方法力不从心。针对这一问题,提出了基于速度增长的微博热点话题发现方法。首先把经过预处理的微博按等数量窗口划分,统计每个窗口内各词语的词频,并表示成时间二元组序列;然后通过计算每相邻两个窗口的个词语的增长斜率来发现增长速度快的词语;再通过计算与该词语有关的用户的增长速度和微博条数的增长速度来确定该词语是否是热点主题词;最后通过热点主题词聚类产生热点话题。通过实验验证了该方法的可行性。实验结果表明,该方法在一定程度上提高了检测效率,降低了漏检率和误检率,可以有效地及时发现微博热点话题。
关键词
增长斜率
增长速度
时间二元组序列
热点发现
Keywords
growth slope
growth speed
feature trajectory of binary group sequence
hot topics found
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于速度增长的微博热点话题发现
薛素芝
鲁燃
任圆圆
《计算机应用研究》
CSCD
北大核心
2013
17
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部