期刊文献+

一种改进的K-means数字资源聚类算法 被引量:1

An Improved K-means Clustering Algorithm for Digital Resources
在线阅读 下载PDF
导出
摘要 K-means聚类算法在数据挖掘聚类分析方法中是一个基本的、使用最广泛的划分算法。为了对数字图书馆中大量的数字资源进行更加有效、快速的聚类,文中针对传统的K-means算法存在的问题,结合数字图书馆数字资源的特征,提出了一种改进的基于关键词特征向量的初始聚类中心选择算法,并在此基础上对传统的K-means聚类算法进行了改进,用于对数字资源进行聚类,并进行了算法的实验验证。通过对实验结果的分析证明,文中提出的算法降低了数字资源聚类的代价,提高了聚类的效率,从而验证了算法的可行性。 K-means clustering algorithm is a basic analysis method in data mining closeting analysis,which is also the most widely used partitioning algorithm.In this paper,in order to get more fast and effective clustering result from large number of digital resources in digital library,aiming at the problems of the traditional K-means algorithm,combining with the features of the digital resources,an improved selection algorithm based on the keyword feature vector for initial clustering center is proposed.On this basis,the traditional K-means clustering algorithm is improved for digital resources clustering and experiment verification.The analysis results show that the algorithm proposed reduces the digital resources clustering cost,improves the clustering efficiency,verifying the feasibility of the algorithm.
作者 杨永涛 李静
出处 《计算机技术与发展》 2014年第6期107-109,113,共4页 Computer Technology and Development
基金 河北省自然科学基金面上项目(F2013203324)
关键词 K-MEANS算法 数字资源 相似度 初始聚类中心 K-means clustering algorithm digital resource similarity initial clustering center
  • 相关文献

参考文献13

  • 1MacQueen J. Some methods for classification and analysis of multi-variate observations [ C ]//Proc of the 5th Berkeley symposium on mathematical statistics and probability. Berke- ley, USA : Univ of Calif Press, 1967:281-297.
  • 2周爱武,于亚飞.K-Means聚类算法的研究[J].计算机技术与发展,2011,21(2):62-65. 被引量:137
  • 3张靖,段富.优化初始聚类中心的改进k-means算法[J].计算机工程与设计,2013,34(5):1691-1694. 被引量:59
  • 4Asgharbeygi N, Maleki A. Geodesic K-means clustering [ C ] //Proc of 19th international conference on pattern recogni- tion. Tampa, FL: IEEE,2008 : 1-4.
  • 5Lanthier M, Maheshwari A, Sack J R. Approximating weighted shortest paths on polyhedral surfaces [ C ]//Proc of symposium on computational geometry. [ s. 1. ] : [ s. n. ], 1999:274-283.
  • 6Mitchell J S B, Mount D M, Papadimitriou C H. The discrete geodeic problem [ J ]. SIAM Journal on Computing, 1987,16 (4) :647-668.
  • 7黄韬,刘胜辉,谭艳娜.基于k-means聚类算法的研究[J].计算机技术与发展,2011,21(7):54-57. 被引量:88
  • 8殷君伟,陈建明,薛百里,张健.一种基于排序划分的聚类初始化方法[J].微电子学与计算机,2013,30(6):80-83. 被引量:3
  • 9Salton G, Wong A, Yang C S. A vector space model for auto- matic indexing[J]. Communications of ACM, 1975,18 ( 11 ) : 613-620.
  • 10林春实,方燕,全吉成.汉语文献自动分词与标引技术发展浅析[J].情报学报,1997,16(S1):37-40. 被引量:8

二级参考文献56

共引文献370

同被引文献3

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部