期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
子空间流式分类方法在校园网IPv6流量上的应用研究 被引量:3
1
作者 王若愚 张凌 刘珍 《通信学报》 EI CSCD 北大核心 2018年第A01期44-52,共9页
随着IPv4地址的耗尽,IPv6将被广泛部署使用。在互联网流量分类领域,目前大多研究对象为IPv4流量。采集校园网IPv6流量数据,开展数据预处理工作,为解决流量数据面临的概念漂移问题,改进流式机器学习算法(VFDT)。为每个类别搜索与之相关... 随着IPv4地址的耗尽,IPv6将被广泛部署使用。在互联网流量分类领域,目前大多研究对象为IPv4流量。采集校园网IPv6流量数据,开展数据预处理工作,为解决流量数据面临的概念漂移问题,改进流式机器学习算法(VFDT)。为每个类别搜索与之相关的特征集合,利用各特征集合建立子空间,在每个子空间利用流式机器学习算法建立分类模型,在分类过程中,不断学习新标记流量数据,改善分类模型。未知流量数据的类别预测为多个分类模型的投票结果。实验结果表明,改进的算法能改善流式学习方法在IPv6网络流量数据上的分类性能。 展开更多
关键词 IPv6流量分类 vfdt算法 特征选择 流式学习
在线阅读 下载PDF
大数据环境下的不确定数据流在线分类算法 被引量:9
2
作者 吕艳霞 王翠荣 +1 位作者 王聪 于长永 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第9期1245-1249,共5页
在大数据环境下,由于隐私保护、数据丢失等原因,数据普遍存在不确定性;数据流系统中数据不断地到达系统,只扫描一遍且不能一次性全部获得;所以要构建一个增量分类模型来处理不确定数据流分类.本文基于VFDT算法提出了WBVFDTu算法,该算法... 在大数据环境下,由于隐私保护、数据丢失等原因,数据普遍存在不确定性;数据流系统中数据不断地到达系统,只扫描一遍且不能一次性全部获得;所以要构建一个增量分类模型来处理不确定数据流分类.本文基于VFDT算法提出了WBVFDTu算法,该算法在学习和分类阶段都可快速而有效地分析不确定信息.在学习期间,采用Hoeffding分解定理构造决策树模型;在分类期间,在决策树的叶子节点利用加权贝叶斯分类算法提高模型的分类准确率和算法的执行效率.最终证明该算法能够非常快速地学习不确定数据流,提高分类的准确率. 展开更多
关键词 不确定数据流 加权贝叶斯 vfdt 分类算法 大数据
在线阅读 下载PDF
基于大数据分析的配电网辅助决策系统的研究 被引量:18
3
作者 谢潇睿 李学 +1 位作者 彭春华 杨春艳 《电子设计工程》 2020年第5期121-124,129,共5页
为高效、快速地处理配电网呈指数增长的数据,提高数据分析、决策能力,文中提出了1种基于大数据分析的配电网辅助决策系统设计。文中根据配电网业务需求特点,分别就流处理与批处理两种数据处理方式进行了分析。利用分布式计算通用框架Map... 为高效、快速地处理配电网呈指数增长的数据,提高数据分析、决策能力,文中提出了1种基于大数据分析的配电网辅助决策系统设计。文中根据配电网业务需求特点,分别就流处理与批处理两种数据处理方式进行了分析。利用分布式计算通用框架MapReduce分别进行基于Strom的VFDT算法的构建,实现了流处理。同时利用Spark进行了随机森林算法的构建,实现了批处理。测试结果表明,基于Strom的VFDT算法可有效将数据进行分类,具有更好的分类准确率。此外,基于Spark的随机森林算法具有良好的可扩展性。 展开更多
关键词 大数据分析 vfdt算法 SPARK 随机森林算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部