摘要
数据挖掘在各行业发挥着越来越重要的作用,随着数据挖掘中数据量的高速增长以及大规模计算在数据挖掘中的应用,挖掘算法处理海量数据的能力问题日益突出.通过对常见的数据挖掘分类并行算法进行研究探讨,分析了C4.5算法,SLIQ算法,SPRINT算法的优缺点,最后指出研究并行算法是解决处理海量数据能力的有效途径.
Data Mining plays an important role in industry and business. The ability of data mining algorithms to deal with mass-data becomes more important with the increase in data. Parallel technology is an effective way to resolve this problem. This paper studies some common parallel algorithms for classification in data mining.
出处
《河南科技学院学报》
2009年第3期63-65,共3页
Journal of Henan Institute of Science and Technology(Natural Science Edition)
关键词
数据挖掘
分类
并行
Data mining
classification
parallelism