-
题名一种自适应的数据流近期加权频繁项集挖掘
- 1
-
-
作者
贺慧爱
荀亚玲
王林青
杨海峰
-
机构
太原科技大学计算机科学与技术学院
-
出处
《太原科技大学学报》
2025年第2期152-159,共8页
-
基金
国家自然科学基金(U1931209,62272336)
山西省研究生教育创新项目(2022Y699)。
-
文摘
针对传统频繁项集挖掘仅考虑项目频率导致的信息损失,以及流式数据所包含知识将随时间推移发生变化的问题,提出一种高效的近期加权频繁项集挖掘算法RWFIM-Neg.RWFIM-Neg引入时间衰减因子,通过设置相似性阈值自适应地调整不同时域数据流的衰减程度;在挖掘过程中,通过引入一种更高效的数据结构NegNodeset避免了复杂的建树过程和繁琐的支持度计算,其采用前缀树中的节点集Nodesets,利用位运算来迅速得到没有父子节点关系的负节点集NegNodesets,提高了连接效率,使得其支持度计算的复杂度降低到O(n);同时采用超集等价和父子等价修剪策略,有效地减少了最近加权频繁模式的搜索空间。实验结果表明,其性能优于最新的RWFIM-M算法和传统的WFI挖掘算法。
-
关键词
相似度
时间衰减因子
近期加权频繁项集
位图树
数据流
-
Keywords
similarity
time decayfactor
recency weighted frequent itemset
bitmap tree
data stream
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-