期刊文献+

基于K-Means改进算法在微博话题发现中的应用研究 被引量:4

Application of Improved Algorithm Based on K-Means in Microblog Topic Discovery
在线阅读 下载PDF
导出
摘要 在传统的K-means算法中,聚类结果很大程度依赖于随机选择的初始聚类中心点以及人工指定的k值.为了提高聚类精度,本文提出了利用最小距离与平均聚集度来对初始聚类中心点进行选取,将层次聚类CURE算法得到的聚簇数作为k值,从而使聚类精度得到提高.最后,将改进后的K-means算法应用到微博话题发现中,通过对实验结果分析,证明该算法提高了聚类结果精度. In the traditional K-means algorithm, the clustering results greatly depend on the random selection of initial cluster centers and the artificial K values. In order to improve the clustering accuracy, this paper proposes to select the initial cluster centers by using the minimum distance and the average clustering degree. The number of clusters is obtained by the hierarchical clustering CURE algorithm as K value, so that the clustering accuracy can be improved. Finally, the improved K-means algorithm is applied to the micro-blog topic discovery. Through the analysis of the experimental results, it is proved that the algorithm can improve the accuracy of clustering results.
出处 《计算机系统应用》 2016年第10期308-311,共4页 Computer Systems & Applications
基金 国家自然科学基金(61502298)
关键词 K-MEANS 微博 话题 聚类 K-means microblog topic clustering
  • 相关文献

参考文献4

二级参考文献38

共引文献1283

同被引文献38

引证文献4

二级引证文献17

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部