期刊文献+

一种Apriori的改进算法 被引量:40

An Improved Algorithm of Apriori
在线阅读 下载PDF
导出
摘要 提出了一种Apriori算法的改进算法 ,讨论了通过使用概率的方法估算任意数据项集同时出现的概率来求候选频繁项集的方法 ,并给出了相关算法。将本算法与Apriori算法产生的候选项集大小和扫描数据库次数进行了比较 ,该算法将关联规则挖掘的运行速度提高了一个数量级 ,非常适合挖掘数据库、长模式的关联规则。 Based on Apriori algorithm,an improved algorithm of Apriori is presented in this paper.The main ideas of the algorithm are: 1) Count the probability of each item( I 1,I 2,...,I m ) by scanning the DB for the first time; 2) Item I k and I m appear in one record is P km . min( P k,P m)≤P km ≤P k*P m , 3) Count the support count of the frequence itemsets by scanning the DB another time; 4) Output the association rule from the frequence itemsets. The detailed algorithm and its sample are described in this paper.Lastly we compare it with Apriori algorithm.The best quality of the new algorithm is that it reduce the times of scanning DB.
出处 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2003年第1期94-99,共6页 Geomatics and Information Science of Wuhan University
基金 湖北省自然科学基金资助项目 (99J171)
关键词 APRIORI算法 改进算法 概率 数据库 关联规则 支持度 信息存储 association rule Apriori algorithm frequence itemset support_count
  • 相关文献

参考文献6

二级参考文献31

  • 1朱湖根,汪家权.平原地下水水质评价方法探讨[J].水文地质工程地质,1993,20(6):46-49. 被引量:11
  • 2王珊 等.数据仓库技术与联机分析处理[M].北京:科学出版社,1999.1-76.
  • 3李德毅,1st Pacific-Asia Conf on KDD&DM,1997年
  • 4Han J,ACM-SIGMOD’96 Conf,1996年
  • 5邸凯昌,中国GIS协会第二届年会,1996年
  • 6李德仁,测绘学报,1995年,24卷,1期
  • 7李德毅,小型微型计算机系统,1994年,15卷,11期
  • 8李德毅,第十届全国数据库学术会议,1992年
  • 9吕锋,系统工程理论与实验,1997年,6期,49页
  • 10朱湖根,合肥工业大学学报,1991年,14卷,4期,27页

共引文献424

同被引文献242

引证文献40

二级引证文献169

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部