-
题名基于贝叶斯与数据湖的网络数据分类存储方法
- 1
-
-
作者
施凯健
曹锋
韩吉双
葛友铖
张岩
-
机构
南方电网调峰调频发电有限公司工程建设管理分公司
-
出处
《电子设计工程》
2025年第18期134-137,146,共5页
-
基金
南方电网储能股份有限公司项目(0295002023030301XM00001)。
-
文摘
针对网络数据的复杂性,为优化数据存储效果,提出基于贝叶斯与数据湖的网络数据分类存储方法。构建基于数据湖的分类存储框架,集成JDBC元数据服务引擎与Grafana数据监控程序,选用Hadoop Distributed File System(HDFS)分布式存储体系,引入Kubernetes容器编排实现多维数据并行存储负载均衡,并通过存算分离方案形成更高效稳定的存储模式。通过贝叶斯网络对海量数据进行分类与池化处理,引入模糊误差评估提高数据的分类准确率,进一步优化分类存储的质量与效率。实验结果表明,该方法在并行存储2900 kB数据量时的存储延迟时间为18 ms,且存储数据分类准确性能EMA指标最高为0.852,具有良好的运行与存储效果。
-
关键词
贝叶斯网络
数据湖
分类存储
贝叶斯分类
-
Keywords
Bayesian network
data lake
classification storage
Bayesian classification
-
分类号
TP367.5
[自动化与计算机技术—计算机系统结构]
-