摘要
拟采用一种基于滑动窗模式的单遍挖掘算法,专注于处理近期数据;为了减少处理时间和占用的内存,设计了一种新的事务表示方法。通过处理这个事务的表达式,频繁项集可以被高效输出,并解决了使用基于Apriori理论的算法时,由候选频繁1-项集生成频繁2-项集时数据项顺序判断不准确问题。该算法称为MRFI-SW算法。
This paper proposed a one-pass data stream mining algorithm to mine the recent frequent itemsets in data streams with a sliding window based on transactions.To reduce the cost of time and memory needed to slide the windows,denoted each items a bit-sequence representations. Basing on dealing with the representations,can find frequent patterns in data streams efficiently,and the sequent of frequent 2-items is correct.This paper named the method MRFI-SW(mining recent frequent itemsets by sliding window)algorithm.
出处
《计算机应用研究》
CSCD
北大核心
2010年第5期1711-1713,共3页
Application Research of Computers
基金
国家"863"计划资助项目(2009AA01Z433)
河北省自然科学基金资助项目(F2008000888)
关键词
在线数据流
频繁项集
滑动窗
online data stream
frequent items
sliding window