期刊文献+

一种基于改进K-means聚类的文本特征选择模型 被引量:2

A Model of Text Feature Selection Based on an Improved K-mean
在线阅读 下载PDF
导出
摘要 介绍了文本聚类中基于划分的方法,针对该算法对孤立点的过于敏感问题,提出了一种用于特征选择的算法改进模型,通过对特征集里孤立点的剔除改善了特征聚类效果.随后的文本分类试验表明,提出的改进的算法具有较好的特征选择效果,文本分类的效率较高. This paper first introduces the partitioning-based k-means algorithm for documents clustering. In allusion to the problem that it is sensitive to outliers, we put forward an improved k-means model for the feature selection. By deleting the outliers in the feature set, we have improved the effect of feature clustering. Lastly, we have a test about text categorization and the result shows that this method has a better feature clustering effect and more, the efficiency of text classification is better.
出处 《微电子学与计算机》 CSCD 北大核心 2009年第6期29-31,35,共4页 Microelectronics & Computer
基金 国家自然科学基金项目(70571087)
关键词 特征选择 特征降维 特征聚类 文本分类 feature selection feature reduction feature clustering text classification
  • 相关文献

参考文献8

二级参考文献28

  • 1贺贤明,戴坚峰.一种新型文本自动分类系统的研究与实现[J].微电子学与计算机,2004,21(10):23-26. 被引量:6
  • 2陈伏兵,张生亮,高秀梅,杨静宇.小样本情况下Fisher线性鉴别分析的理论及其验证[J].中国图象图形学报,2005,10(8):984-991. 被引量:17
  • 3宋枫溪,杨静宇,刘树海,张大鹏.基于多类最大散度差的人脸表示方法[J].自动化学报,2006,32(3):378-385. 被引量:17
  • 4牛强,王志晓,陈岱,夏士雄.基于支持向量机的Web文本分类方法[J].微电子学与计算机,2006,23(9):102-104. 被引量:19
  • 5Salton, G. Automatic Text Processing. Addison-Wesley Publishing Company, 1988.
  • 6Hartigan, J.A. Clustering Algorithms, Yale University, John Wiley&Sons, New York, London, 1975.
  • 7Kleinberg, J. Authoritative sources in a hyperlinked environment, In: Proceedings of the ACM-SIAM Symposium on Discrete Algorithms. 1998. http://www.cs.cornell.edu/home/kleinber/.
  • 8Dumais, S.T. LSI meets TREC: a status report. In: Harman, D., ed. Proceedings of the 1st Text Retrieval Conference (TREC1). National Institute of Standards and Technology, 1993. 137~152.
  • 9Dumais, S.T. Latent semantic indexing (LSI) and TREC-2. In: Harman, D., ed. Proceedings of the 2nd Text Retrieval Conference (TREC2). National Institute of Standards and Technology, 1994. 105~116.
  • 10Jin Z, Yang J Y, Tang Z M, et al. A theorem on uneorrelated optimal discriminant vectors [J ]. Pattern Recognition, 2001,34(10) : 2041 - 2047.

共引文献98

同被引文献14

引证文献2

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部