期刊文献+

分层聚类算法在文本挖掘中的应用

the Hierarchical Clustering Algorithm in Text Mining Application
原文传递
导出
摘要 随着Internet技术的高速发展,如何从海量的Web信息中快速而有效地获得所需信息也就成为一项重要课题,而数据挖掘技术是解决这一难题的有效办法。其中数据挖掘中的聚类方法是用来发现数据分布的一项重要方法。本文首先阐述了Web挖掘的有关理论,然后针对Web挖掘中的分层聚类法进行了较为详细的论述,最后使用该算法并结合改进的特征权值计算方法和文本相似度的计算方法,建立了训练文本库。 With the development of Internet technique,How to acquire the useful information quickly and effectively from information-sea has become a very important problem,but data mining is effective method to solve this problem.Therein,Clustering is an important technology in Data Mining for the discovery of data distribution.This paper described the theory of Web mining and web mining for and hierarchical clustering method,a more detailed discussion,the final use of the algorithm is combined with the improved feature weight calculation method and text similarity calculation method established a training text database.
作者 刘卓 徐斌
出处 《网络安全技术与应用》 2010年第7期61-62,共2页 Network Security Technology & Application
关键词 数据挖掘 WEB文本挖掘 分层聚类算法 web text mining data mining Hierarchical Clustering Algorithm
  • 相关文献

参考文献8

二级参考文献42

  • 1何建章.汉语科技文献自动抽词的探讨与试验[J].情报科学,1987,8(4):35-45. 被引量:3
  • 2金博,史彦军,滕弘飞,艾景波.自动文摘技术及应用[J].计算机应用研究,2004,21(12):13-15. 被引量:4
  • 3许建潮,胡明.中文Web文本的特征获取与分类[J].计算机工程,2005,31(8):24-25. 被引量:24
  • 4Geofrey Z.Liu.语义矢量空间模式(SVSM)及其试验评价——自然语言处理与文献自动标引[J].情报学报,1996,15(6):402-413. 被引量:4
  • 5李中.汉语文献自动标引的技术途径及展望[J].情报科学技术,1990,(4):34-37.
  • 6[1]ZHANG T, RAMAKRISHNAN R, LIVNY M. BIRCH: An Efficient Data Clustering Method for very Large Database [ A ] . In: Proc of the ACM SIGMOD Int's Conf on Management of Data[ C]. Montreal Canada:ACM Press, 1996.83-94.
  • 7[2]SANDER F,ESTER M,KRIEGEL HP,XUX.The Algorithm GDBSCAN and its Applications. Data Mining and Knowledge Discovery[J]. KLUWER Academic Publishers, 1998,2: 178-192.
  • 8[3]Ng RT,CALBERSON J.Etficient and Effective Clustering Methods for Spatial Data Mining[A] .In:Porc of the VLDB Conference[C]. Santiago, Chile, 1994. 144-155.
  • 9[5]GEHRKE J, AGRAWAL R, GUNOPULOS D. Automatic Subspace Clustering of High Dimensional Data for Data Mining Applicaitons[J]. ACM SIMOD, 1998,72(2) :94-105.
  • 10[6]CHRISTOPHER J,PHILIP K.Chan,Systems for Knowledge Discovery in Databases IEEE Ttans[J] .On Knowledge and Data Engineering, 1993,5(6) :903-913.

共引文献407

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部