期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于动态网格的非平衡大数据密度聚类方法
1
作者 郭清 李睿 +3 位作者 李宇 章荣燕 刘伟 雷宇 《电子设计工程》 2025年第3期162-167,共6页
针对非平衡大数据当中进行聚类较为繁琐且聚类结果准确度不高的问题,提出一种以动态网格为基础的密度聚类方式。通过动态网格的划分,并设置相应网格密度的阈值,进行网格的自适应生成,实现相应的密度聚类效果。算法通过样本训练与测试对... 针对非平衡大数据当中进行聚类较为繁琐且聚类结果准确度不高的问题,提出一种以动态网格为基础的密度聚类方式。通过动态网格的划分,并设置相应网格密度的阈值,进行网格的自适应生成,实现相应的密度聚类效果。算法通过样本训练与测试对用户的异常轨迹进行监测,提出类相似的概念对不同的格簇进行划分,同时将噪声当成异常数据进行检测,保证数据检测的全面性。经过实际实验验证,改进算法对于非平衡大数据等问题的处理效果更优,精确度更高。 展开更多
关键词 动态网格 非平衡大数据 数据流 类相似 异常轨迹
在线阅读 下载PDF
基于统计推理的多类不平衡数据流集成仿真
2
作者 梁晓波 王一惠 张露 《计算机仿真》 2025年第8期496-500,共5页
多类不平衡数据流是动态变化的,这种动态性使得类别分布可能随时间发生变化,使得多类不平衡数据流集成难度增加。在处理不平衡数据流时,贝叶斯统计推理网络中的贝叶斯分类器可以通过自适应地调整不同类别的权重来平衡分类决策,以此为后... 多类不平衡数据流是动态变化的,这种动态性使得类别分布可能随时间发生变化,使得多类不平衡数据流集成难度增加。在处理不平衡数据流时,贝叶斯统计推理网络中的贝叶斯分类器可以通过自适应地调整不同类别的权重来平衡分类决策,以此为后续的数据流集成奠定重要基础,为此提出了基于统计推理的多类不平衡数据流集成仿真方法。通过过采样方法获取多类不平衡数据流,将多类不平衡数据流输入至贝叶斯统计推理网络中,网络通过调整分类器集成权重、分类器剔除、集成目标函数构建等输出多类不平衡数据流集成结果。通过仿真可知,所提方法的F-value和G-mean值较高,多类不平衡数据流集成效果好。 展开更多
关键词 统计推理 多类不平衡数据流 数据流集成 过采样方法 贝叶斯统计推理网络
在线阅读 下载PDF
类别严重不均衡应用的在线数据流学习算法 被引量:3
3
作者 赵强利 蒋艳凰 《计算机科学》 CSCD 北大核心 2017年第6期255-259,共5页
集成式数据流挖掘是对存在概念漂移的数据流进行学习的重要方法。对于类别分布严重不均衡的应用,集成式数据流挖掘中数据块的学习方式导致样本数多的类别的分类精度高,样本数少的类别的分类精度低的问题,现有算法无法满足此类应用的需... 集成式数据流挖掘是对存在概念漂移的数据流进行学习的重要方法。对于类别分布严重不均衡的应用,集成式数据流挖掘中数据块的学习方式导致样本数多的类别的分类精度高,样本数少的类别的分类精度低的问题,现有算法无法满足此类应用的需求。针对上述问题,对基于回忆机制的集成式数据流学习算法MAE(Memorizing based Adaptive Ensemble)进行改进,提出面向类别严重不均衡应用的在线数据流学习算法UMAE(Unbalanced data Learning based on MAE)。UMAE算法为每个类别设置了一个样本滑动窗口,对于新到达的数据块,其样本依据自身的类别分别进入相应的滑动窗口,最后利用各类别滑动窗口内的样本构建用于在线学习的数据块。与5种典型的数据流挖掘算法的比较结果表明,UMAE算法在满足实时性的同时,不仅整体分类精度高,而且对于样本数很少的小类别的分类精度有大幅度提高;对于异常检测等类别分布严重不均衡的应用,UMAE算法的实用性明显优于其他算法。 展开更多
关键词 在线学习 数据流挖掘 回忆与遗忘机制 不均衡数据学习
在线阅读 下载PDF
一种改进的不平衡数据流集成分类算法
4
作者 刘剑桥 《阜阳师范学院学报(自然科学版)》 2018年第2期27-31,共5页
本文提出了一种针对类分布不平衡数据流的分类算法。首先,针对数据流的类分布不平衡,采用改进的重采样方法,建立平衡的训练子集;然后,采用支持向量机在平衡的训练子集上建立基分类器;最后,采用WE集成模型组合基分类器,构建不平衡数据流... 本文提出了一种针对类分布不平衡数据流的分类算法。首先,针对数据流的类分布不平衡,采用改进的重采样方法,建立平衡的训练子集;然后,采用支持向量机在平衡的训练子集上建立基分类器;最后,采用WE集成模型组合基分类器,构建不平衡数据流的集成分类器。该算法通过设定相邻数据块的F-value的差值大于等于某一阈值作为更新分类器的标准,同时在更新分类器时引入错分正类实例重新训练基分类器。实验结果表明该算法不仅对正类有较好的分类性能,对整体也有较好的分类性能。 展开更多
关键词 数据流 分类 不平衡 重采样 集成模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部