期刊文献+
共找到502篇文章
< 1 2 26 >
每页显示 20 50 100
Energy-balanced clustering protocol for data gathering in wireless sensor networks with unbalanced traffic load 被引量:1
1
作者 奎晓燕 王建新 张士庚 《Journal of Central South University》 SCIE EI CAS 2012年第11期3180-3187,共8页
Energy-efficient data gathering in multi-hop wireless sensor networks was studied,considering that different node produces different amounts of data in realistic environments.A novel dominating set based clustering pr... Energy-efficient data gathering in multi-hop wireless sensor networks was studied,considering that different node produces different amounts of data in realistic environments.A novel dominating set based clustering protocol (DSCP) was proposed to solve the data gathering problem in this scenario.In DSCP,a node evaluates the potential lifetime of the network (from its local point of view) assuming that it acts as the cluster head,and claims to be a tentative cluster head if it maximizes the potential lifetime.When evaluating the potential lifetime of the network,a node considers not only its remaining energy,but also other factors including its traffic load,the number of its neighbors,and the traffic loads of its neighbors.A tentative cluster head becomes a final cluster head with a probability inversely proportional to the number of tentative cluster heads that cover its neighbors.The protocol can terminate in O(n/lg n) steps,and its total message complexity is O(n2/lg n).Simulation results show that DSCP can effectively prolong the lifetime of the network in multi-hop networks with unbalanced traffic load.Compared with EECT,the network lifetime is prolonged by 56.6% in average. 展开更多
关键词 ENERGY-BALANCE CLUSTERING data gathering wireless sensor networks unbalanced traffic load
在线阅读 下载PDF
Adaptive Optimization Swarm Algorithm Ensemble Model Applied to the Classification of Unbalanced Data 被引量:1
2
作者 Qingqing He Chao Qin 《Intelligent Information Management》 2021年第5期251-267,共17页
In order to solve the problem that, the <span style="white-space:normal;">hyper-parameters</span> of the existing random forest-based classification prediction model depend on empirical settings,... In order to solve the problem that, the <span style="white-space:normal;">hyper-parameters</span> of the existing random forest-based classification prediction model depend on empirical settings, which leads to unsatisfactory model performance. We propose a based on adaptive particle swarm optimization algorithm random forest model to optimize data classification and an adaptive particle swarm algorithm for optimizing hyper-parameters in the random forest to ensure that the model can better predict unbalanced data. Aiming at the premature convergence problem in the particle swarm optimization algorithm, the population is adaptively divided according to the fitness of the population, and an adaptive update strategy is introduced to enhance the ability of particles to jump out of the local optimum. The main steps of the model are as follows: Normalize the data set, initialize the model on the training set, and then use the particle swarm optimization algorithm to optimize the modeling process to establish a classification model. Experimental results show that our proposed algorithm is better than traditional algorithms, especially in terms of F1-Measure and ACC evaluation standards. The results of the six-keel imbalanced data set demonstrate the advantages of our proposed algorithm. 展开更多
关键词 Random Forest APSO unbalanced data Parameter Optimization
在线阅读 下载PDF
Optimized Modeling Method for Unbalanced Data in High-Level Visual Semantic Concept Classification
3
作者 谭励 曹元大 +1 位作者 杨明华 贺巧艳 《Journal of Beijing Institute of Technology》 EI CAS 2009年第2期186-191,共6页
To solve the unbalanced data problems of learning models for semantic concepts, an optimized modeling method based on the posterior probability support vector machine (PPSVM) is presented. A neighborbased posterior ... To solve the unbalanced data problems of learning models for semantic concepts, an optimized modeling method based on the posterior probability support vector machine (PPSVM) is presented. A neighborbased posterior probability estimator for visual concepts is provided. The proposed method has been applied in a high-level visual semantic concept classification system and the experiment results show that it results in enhanced performance over the baseline SVM models, as well as in improved robustness with respect to high-level visual semantic concept classification. 展开更多
关键词 visual concept modeling posterior probability support vector machine unbalanced data
在线阅读 下载PDF
Switched-mode AGC circuits with internally created reset module for burst-mode unbalanced data optical receiver
4
作者 Wang Rong Wang Zhigong +2 位作者 Wang Weibai Xu Jian Guan Zhiqiang 《High Technology Letters》 EI CAS 2011年第3期317-324,共8页
This paper presents an innovative switched-mode auto gain control (AGC) circuit with internally created reset module for DC-10Mb/s burst-mode unbalanced (BMU) optical data transmission. Conventional AGC circuit is... This paper presents an innovative switched-mode auto gain control (AGC) circuit with internally created reset module for DC-10Mb/s burst-mode unbalanced (BMU) optical data transmission. Conventional AGC circuit is inappropriate for BMU data transmission because it is based on average level detection and requires considerable time to settle on a predefined gain. Therefore, we adopt a fast switched-mode AGC based on peak level detection. After the gain is adjusted, the peak level detectors need to re-detect the peak level of the input signal. Thus, we develop an internally created reset module. This AGC with reset module exhibits a fast operation and achieves an adjusted stable gain within one-bit, avoiding any bit loss up to 10Mb/s data rate. During power-up, the peak level detectors possibly hold an uncertain level resulting in the bit-errors. We propose a power-up reset circuit to solve this problem. Designed in a 0.5μm CMOS technology, the circuit achieves an optical sensitivity of better than -30dBm and a wide dynamic range of over 30dB with a power dissipation of only 30 mW from a 5V supply. 展开更多
关键词 burst-mode unbalanced (BMU) data optical receiver auto gain control (AGC) internally created reset module bit loss
在线阅读 下载PDF
Unbalanced classification method using least squares support vector machine with sparse strategy for steel surface defects with label noise 被引量:1
5
作者 Li-ming Liu Mao-xiang Chu +1 位作者 Rong-fen Gong Xin-yu Qi 《Journal of Iron and Steel Research International》 SCIE EI CAS CSCD 2020年第12期1407-1419,共13页
Least squares support vector machine (LS-SVM) plays an important role in steel surface defects classification because of its high speed. However, the defect samples obtained from the real production line may be noise.... Least squares support vector machine (LS-SVM) plays an important role in steel surface defects classification because of its high speed. However, the defect samples obtained from the real production line may be noise. LS-SVM suffers from the poor classification performance in the classification stage when there are noise samples. Thus, in the classification stage, it is necessary to design an effective algorithm to process the defects dataset obtained from the real production line. To this end, an adaptive weight function was employed to reduce the adverse effect of noise samples. Moreover, although LSSVM offers fast speed, it still suffers from a high computational complexity if the number of training samples is large. The time for steel surface defects classification should be as short as possible. Therefore, a sparse strategy was adopted to prune the training samples. Finally, since the steel surface defects classification belongs to unbalanced data classification, LSSVM algorithm is not applicable. Hence, the unbalanced data information was introduced to improve the classification performance. Comprehensively considering above-mentioned factors, an improved LS-SVM classification model was proposed, termed as ILS-SVM. Experimental results show that the new algorithm has the advantages of high speed and great anti-noise ability. 展开更多
关键词 Steel surface defect Least squares support vector machine ANTI-NOISE SPARSENESS unbalanced data
原文传递
Analysis of Variance in an Unbalanced Two-Way Mixed Effect Interactive Model 被引量:1
6
作者 F. C. Eze E. U. Nwankwo 《Open Journal of Statistics》 2016年第2期310-319,共10页
The expected mean squares for unbalanced mixed effect interactive model were derived using Brute Force Method. From the expected mean squares, there are no obvious denominators for testing for the main effects when th... The expected mean squares for unbalanced mixed effect interactive model were derived using Brute Force Method. From the expected mean squares, there are no obvious denominators for testing for the main effects when the factors are mixed. An expression for F-test for testing for the main effects was derived which was proved to be unbiased. 展开更多
关键词 Mixed Model Expected Mean Squares unbalanced data
暂未订购
基于边界信息的自适应过采样算法
7
作者 杜睿山 靳明洋 +1 位作者 孟令东 宋健辉 《郑州大学学报(理学版)》 CAS 北大核心 2025年第1期23-30,共8页
针对人工少数类过采样(synthetic minority over-sampling technique,SMOTE)算法存在样本合成区域狭小,容易将少数类泛化到多数类及引入噪声的问题,提出一种基于噪声过滤、边界点自适应采样的过采样算法。首先,该算法使用K近邻算法进行... 针对人工少数类过采样(synthetic minority over-sampling technique,SMOTE)算法存在样本合成区域狭小,容易将少数类泛化到多数类及引入噪声的问题,提出一种基于噪声过滤、边界点自适应采样的过采样算法。首先,该算法使用K近邻算法进行噪声过滤,接着确定边界点并在边界点中寻找合适的点作为根样本点,并以其K近邻点中与其同类且欧氏距离最远的点作为候选样本点。然后,根据根样本点所携带的边界信息确定该点所合成的样本数量,并根据根样本点和候选样本点生成一个N维球体作为样本的合成区间。最后,对合成样本进行判断以确定其是否满足条件。通过实验证明,该算法生成的样本质量要优于SMOTE及其常见变种算法。 展开更多
关键词 SMOTE KNN 过采样算法 数据不均衡 ISMOTE
在线阅读 下载PDF
基于最大安全近邻与局部密度的自适应过采样方法 被引量:1
8
作者 赵小强 何嘉琦 《电子与信息学报》 北大核心 2025年第4期1140-1149,共10页
针对不平衡数据过采样的过程中如何合成有效新样本的问题,该文提出一种基于最大安全近邻与局部密度的自适应过采样方法。该方法利用最大安全近邻和局部密度将少数类样本划分为安全样本、边界样本和离群点;在此基础上,通过组合加权设置... 针对不平衡数据过采样的过程中如何合成有效新样本的问题,该文提出一种基于最大安全近邻与局部密度的自适应过采样方法。该方法利用最大安全近邻和局部密度将少数类样本划分为安全样本、边界样本和离群点;在此基础上,通过组合加权设置样本的采样概率,使得靠近边界的“次边界样本”更容易被选择为根样本,并且自适应地调整K近邻的参数K,选择最优合成区域;针对离群点,采用超球面内的随机过采样策略,进一步增加少数类样本的多样性。最后,将所提方法与合成少数类过采样技术(SMOTE)、自适应合成采样方法(ADASYN)等6种过采样方法在13个公开数据集上进行实验分析,结果表明,所提方法相对于对比方法在F1分数(F1-score)指标上分别平均提高了6.9%,8.8%,8.2%,5.8%,7.2%和12.5%,在几何平均值(G-mean)指标上分别平均提高了3.0%,2.5%,3.0%,3.2%,5.3%和8.6%,证明所提方法可以有效解决不平衡数据分类问题。 展开更多
关键词 不平衡数据 过采样技术 最大安全近邻 次边界样本
在线阅读 下载PDF
基于多尺度解纠缠扩散模型的轴承故障数据生成方法
9
作者 火久元 王芸芸 +1 位作者 常琛 汤世宝 《振动与冲击》 北大核心 2025年第21期302-315,共14页
轴承作为支撑旋转机械转体的关键部件,其可靠性直接关联着各类机械设备的稳定运行。针对轴承故障诊断方法存在因样本不平衡导致诊断精度低的问题,提出了基于多尺度解纠缠扩散(de-entangling multi-scale diffusion,DMSDiffusion)模型的... 轴承作为支撑旋转机械转体的关键部件,其可靠性直接关联着各类机械设备的稳定运行。针对轴承故障诊断方法存在因样本不平衡导致诊断精度低的问题,提出了基于多尺度解纠缠扩散(de-entangling multi-scale diffusion,DMSDiffusion)模型的轴承故障数据生成方法。首先,设计了多分辨率嵌入结构,将加噪振动序列划分为不同长短的时间分辨率片段,结合多头自注意力机制和交叉注意力机制捕捉振动序列的全局相关性和局部细节;此外,提出了解纠缠结构作为内置块引入深度去噪网络,对复杂振动数据进行渐近分解,以还原初始数据分布;最后,为验证所提DMSDiffusion的有效性和优势,分别进行了样本扩充和故障诊断试验。试验结果表明,相较于现有的主流生成模型,所提模型能够生成丰富的高质量轴承故障样本,并且生成的样本数据可以更有效地辅助训练生成模型,从而提升轴承故障的诊断准确率。 展开更多
关键词 多尺度 解纠缠 扩散模型 不平衡数据集 数据生成
在线阅读 下载PDF
融合知识图谱和LLM的不平衡样本电力数据整合
10
作者 李平 马吉科 +3 位作者 杜先波 尹飞 帅率 江洲 《电子设计工程》 2025年第16期120-123,共4页
电力信号分布不均是导致电力网络中出现样本不平衡分布的主要原因,对于主机元件而言,整合不平衡样本并实施针对性处理是改善电力信号分布不均问题的有效方法。为此,提出融合知识图谱和LLM的不平衡样本电力数据整合方法。在电网知识图谱... 电力信号分布不均是导致电力网络中出现样本不平衡分布的主要原因,对于主机元件而言,整合不平衡样本并实施针对性处理是改善电力信号分布不均问题的有效方法。为此,提出融合知识图谱和LLM的不平衡样本电力数据整合方法。在电网知识图谱中,构建LLM模型,并在此基础上推导电力信号建模条件,构建基于知识图谱和LLM的电网模型。定义电力数据不平衡样本集合,根据数据样本缺失度条件,确定整合参数的取值范围,完成不平衡样本电力数据整合方法的设计。实验结果表明,所提方法应用后可保证电力信号分布均匀度最大值达到75%,能够有效解决电力网络中的样本不平衡分布问题。 展开更多
关键词 知识图谱 LLM模型 不平衡样本 电力数据 样本缺失度
在线阅读 下载PDF
基于CNN和BiLSTM并行的智能合约漏洞检测
11
作者 张光华 高业萍 +1 位作者 张思怡 武少广 《微电子学与计算机》 2025年第8期67-77,共11页
针对数据集不平衡导致智能合约漏洞检测率低以及漏洞检测单一问题,本文提出一种基于卷积神经网络和双向长短期记忆网络并行的智能合约漏洞检测方案SVCB。首先,通过循环遍历并提取原数据集中的每列标签形成新的标签列表,使用合成少数类... 针对数据集不平衡导致智能合约漏洞检测率低以及漏洞检测单一问题,本文提出一种基于卷积神经网络和双向长短期记忆网络并行的智能合约漏洞检测方案SVCB。首先,通过循环遍历并提取原数据集中的每列标签形成新的标签列表,使用合成少数类过采样技术对新的标签列表进行独立的过采样来解决数据集不平衡问题。其次,利用卷积神经网络和双向长短期记忆网络分别对词向量进行特征提取,卷积神经网络用于捕捉局部特征,双向长短期记忆网络用于捕捉全局特征,并将提取的特征进行特征融合。再次,将特征融合后的序列输入注意力机制中,为输入序列中不同的特征分配不同的权重,突出与漏洞相关的关键特征。最后,通过全连接层和输出层实现智能合约的漏洞检测。本文使用在以太坊上收集的智能合约对模型的性能进行评估,实验结果表明,该方法能够准确检测出4种漏洞,可以有效解决数据不平衡问题,与传统检测方法和目前深度学习模型相比,准确率、召回率、F1值、精确率均有一定提升,其中准确率可达91.70%。 展开更多
关键词 智能合约 深度学习 不平衡数据 注意力
在线阅读 下载PDF
基于CTGAN的自动驾驶车辆交通事故关键诱因识别
12
作者 张志清 于晓正 +2 位作者 朱雷鹏 孙玉凤 李祎昕 《华南理工大学学报(自然科学版)》 北大核心 2025年第10期14-28,共15页
明晰自动驾驶车辆交通事故机理是有效防控安全风险的重要前提。自动驾驶车辆交通事故诱因分析通常基于小样本和不平衡数据进行建模,但这类模型对于少数类预测精度低。基于数据增强的分析框架可以提高模型对于少数类的预测精度。通过条... 明晰自动驾驶车辆交通事故机理是有效防控安全风险的重要前提。自动驾驶车辆交通事故诱因分析通常基于小样本和不平衡数据进行建模,但这类模型对于少数类预测精度低。基于数据增强的分析框架可以提高模型对于少数类的预测精度。通过条件表格生成对抗网络(CTGAN)、联合生成对抗网络(CopulaGAN)以及合成少数过采样(SMOTE)、自适应过采样(ADASYN)技术增加样本量,平衡数据集,对比不同方法的合成数据质量;基于合成数据,对逻辑回归(LR)、决策树(DT)、随机森林(RF)、极端梯度提升(XGB)、支持向量机(SVM)5种分类算法进行评估,采用召回率、特异性、加权F_1分数及曲线下面积(AUC)等指标确定最优组合;最后结合沙普利可加解释(SHAP)框架量化事故关键诱因重要度。结果表明:CTGAN生成数据的边际分布得分(0.96)和相关性得分(0.92)最高,合成数据的平均质量为0.94,显著优于其他方法;CTGAN与随机森林算法结合时,模型在召回率(0.82)、特异性(0.84)、AUC(0.86)等指标上均表现优异,在包含10%标签噪声的测试集中仍保持鲁棒性(召回率提升至0.88),进一步验证了其在复杂场景中的适用性。关键诱因分析表明,路面状况(潮湿状态显著增加受伤风险)、夜间行车(低光照导致传感器性能下降)、交叉口及街道化程度(复杂场景增加检测延迟)是导致事故的核心因素。该研究为自动驾驶测试场景搭建及道路基础设施改造提供了关键依据。 展开更多
关键词 自动驾驶车辆 小样本量 数据不平衡 条件表格生成对抗网络 事故预测
在线阅读 下载PDF
数字孪生辅助的直升机尾传动系统轴承与传动轴故障诊断 被引量:1
13
作者 李恒 唐倩 +1 位作者 陈国旺 王浩宇 《航空动力学报》 北大核心 2025年第6期489-500,共12页
针对直升机尾传动系统故障数据不平衡问题,提出一种基于数字孪生和迁移学习的直升机尾传动系统故障诊断方法。建立直升机尾传动系统刚柔耦合动力学仿真模型获取真实反映直升机尾传动系统工作状态的高保真故障仿真数据。通过引入坐标可... 针对直升机尾传动系统故障数据不平衡问题,提出一种基于数字孪生和迁移学习的直升机尾传动系统故障诊断方法。建立直升机尾传动系统刚柔耦合动力学仿真模型获取真实反映直升机尾传动系统工作状态的高保真故障仿真数据。通过引入坐标可分离卷积和注意力机制的残差网络进行故障特征提取和分类。采用基于高斯核函数的领域自适应方法缩小仿真数据和实验数据在特征空间的分布差异。为提高决策边界的鲁棒性,增强类别之间的区分度,引入边界正则化的交叉熵损失。经实验验证,基于数字孪生和迁移学习的故障诊断方法,可以解决数据不平衡导致的深度学习故障诊断模型训练效果变差的问题,使模型损失显著降低、准确率至少提高了2.17%,达到基于正常数据驱动的深度学习故障诊断模型的性能水平。 展开更多
关键词 不平衡数据 故障诊断 数字孪生 迁移学习 直升机尾传动系统
原文传递
改进生成对抗网络的不平衡数据下轴承故障诊断 被引量:2
14
作者 周建民 夏晓枫 李家辉 《控制工程》 北大核心 2025年第6期1039-1048,共10页
针对滚动轴承实际运行中的故障数据远少于正常数据,从而影响故障诊断模型诊断率的问题,提出了一种数据不平衡情况下的基于改进生成对抗网络(generative adversarial networks,GAN)的滚动轴承故障诊断方法——基于梯度惩罚的Wasserstein... 针对滚动轴承实际运行中的故障数据远少于正常数据,从而影响故障诊断模型诊断率的问题,提出了一种数据不平衡情况下的基于改进生成对抗网络(generative adversarial networks,GAN)的滚动轴承故障诊断方法——基于梯度惩罚的Wasserstein生成对抗网络(Wassserstein generative adversarial networks based on gradient penalty,WGAN-GP)。首先,采用连续小波变换(continuewavelettransform,CWT)将振动信号集转化为二维图像数据集。然后,用Wasserstein距离替代GAN的Jensen-Shannon(JS)散度,再使用梯度惩罚策略在WGAN权值裁剪过程中优化模型,使生成器损失函数的权值在区间中取得均衡,实现故障数据的自动生成,扩充故障数据集。最后,设置了不平衡数据集和数据增强对比实验,结果表明,WGAN-GP在所设置的不同不平衡比例实验下的模型诊断率分别提高了2.29%、1%、2.85%,在数据增强对比实验中的诊断率也高于几何变换增强后的数据和原始数据。 展开更多
关键词 生成对抗网络 深度残差网络 迁移学习 不平衡数据 故障诊断
原文传递
基于非平衡最优传输理论的拉索式幕墙面板尺寸检测方法 被引量:1
15
作者 谭立云 刘界鹏 +4 位作者 李汉涛 曾焱 廖岳 吴小峰 崔娜 《图学学报》 北大核心 2025年第5期1134-1143,共10页
玻璃幕墙因独特的美感和强大的塑型能力被广泛应用于大型场馆和地标建筑,其施工流程为先施工龙骨支撑系统再进行玻璃面板的安装与调试,但在具体操作时,建成龙骨的轴线通常与设计轴线有所偏差,导致后续玻璃面板施工困难。本文开展基于非... 玻璃幕墙因独特的美感和强大的塑型能力被广泛应用于大型场馆和地标建筑,其施工流程为先施工龙骨支撑系统再进行玻璃面板的安装与调试,但在具体操作时,建成龙骨的轴线通常与设计轴线有所偏差,导致后续玻璃面板施工困难。本文开展基于非平衡最优传输理论的幕墙点云轴线提取研究。该方法充分利用点云数据信息,结合非平衡最优传输理论,包括输入点云数据、点云数据预处理、随机采样获得初始轴线点集、提取杆件粗轴线和提取杆件精轴线等步骤,以此获得目标点云的轴线特征,后续再根据提取到的轴线获取幕墙尺寸。实验结果表明,该方法能有效提取幕墙龙骨的轴线,且具有良好的中心性与鲁棒性。通过与其他算法进行比较,证明了其有效性。计算得到的幕墙尺寸与实际测得的结果相比,误差在±2 mm内,在允许误差范围内。 展开更多
关键词 点云数据 轴线提取 非平衡最优传输 玻璃幕墙 智能建造
在线阅读 下载PDF
基于SMOTE-ENN和深度森林的弥漫大B细胞淋巴瘤复发风险预测
16
作者 乔宇 张岩波 +9 位作者 余红梅 曹红艳 周洁 王俊霞 张高源 于凯 王雪嫚 郭玉娇 赵志强 罗艳虹 《中国卫生统计》 北大核心 2025年第1期67-72,共6页
目的对山西省某肿瘤医院血液科2011—2020年被确诊为弥漫性大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)并经过治疗达到完全缓解(complete response,CR)的498例患者构建2年内的复发风险预测模型,为患者的临床治疗提供参考。方... 目的对山西省某肿瘤医院血液科2011—2020年被确诊为弥漫性大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)并经过治疗达到完全缓解(complete response,CR)的498例患者构建2年内的复发风险预测模型,为患者的临床治疗提供参考。方法第一步使用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)特征选择算法并结合临床医师意见筛选出对DLBCL达到CR的患者两年复发率影响较大的21个变量因素,第二步用SMOTE(synthetic minority oversampling technique)与SMOTE-ENN(synthetic minority oversampling technique and edited nearest neighbor)两种不平衡方法处理数据,将原始未处理数据和两种不平衡方法处理后的数据分别使用7种分类器进行模型预测。第三步用深度森林(deep forest,DF)做复发风险预测模型。第四步使用准确率(accuracy)、查准率(precision)、灵敏度/召回率(sensitivity/recall)、特异度(specificity)、F1值(F1-score)和G均值(G-means)比较模型分类性能,采用Brier分数(Brier score,BS)评价模型校准度。结果SMOTE-ENN不平衡方法下的深度森林算法表现最好(accuracy=0.932,precision=0.949,recall=0.944,specificity=0.910,F1-score=0.946,G-means=0.926,Brier score=0.068)。结论本文使用SMOTE-ENN不平衡方法与深度森林分类器结合的方法,对完全缓解的DLBCL患者两年复发进行预测,模型达到预期效果。 展开更多
关键词 弥漫性大B细胞淋巴瘤 不平衡数据 复发预测 深度森林
暂未订购
面向不平衡数据的联邦类别增量学习
17
作者 方子希 付晓东 +3 位作者 丁家满 刘骊 彭玮 代飞 《小型微型计算机系统》 北大核心 2025年第9期2121-2129,共9页
联邦增量学习作为一种新兴学习范式,在保护用户隐私的同时利用数据孤岛的知识,有效缓解了由于存储空间有限而导致的灾难性遗忘问题.但现有的联邦增量学习研究忽略了用户数据不平衡对造成全局模型灾难性遗忘及精度降低的影响.针对此问题... 联邦增量学习作为一种新兴学习范式,在保护用户隐私的同时利用数据孤岛的知识,有效缓解了由于存储空间有限而导致的灾难性遗忘问题.但现有的联邦增量学习研究忽略了用户数据不平衡对造成全局模型灾难性遗忘及精度降低的影响.针对此问题,该文提出了一种基于条件生成对抗网络的无数据存储重放再训练方法(ARR).具体来说,用户模型训练分为两个阶段:第1阶段结合条件生成对抗网络生成模拟的历史任务数据和当前任务数据共同训练本地模型;第2阶段则冻结特征提取层,采用平衡采样技术对其他层进行再训练.服务器通过利用条件生成对抗网络生成的所有用户任务数据来优化全局模型.实验结果显示,ARR在不平衡程度逐渐加剧的情况下,全局模型准确率相较于现有的相关方法提高了8.64%~31.03%,有效缓解了灾难性遗忘问题,显著提高了全局模型的最终精度. 展开更多
关键词 联邦增量学习 不平衡数据 条件生成对抗网络 灾难性遗忘 二次训练
在线阅读 下载PDF
基于GA-KNN的炼化设备腐蚀状态预测研究
18
作者 陶金福 陈良超 +1 位作者 陆新元 杨剑锋 《北京化工大学学报(自然科学版)》 北大核心 2025年第3期96-104,共9页
腐蚀问题极易引发炼化装置的安全隐患,甚至是严重的安全事故,因此开展针对炼化设备的快速、精准的腐蚀状态预测技术研究具有重要意义。针对多数研究基于理想实验数据以及虚拟生成数据进行腐蚀预测而忽略实际情况的问题,通过收集621组酸... 腐蚀问题极易引发炼化装置的安全隐患,甚至是严重的安全事故,因此开展针对炼化设备的快速、精准的腐蚀状态预测技术研究具有重要意义。针对多数研究基于理想实验数据以及虚拟生成数据进行腐蚀预测而忽略实际情况的问题,通过收集621组酸性水汽提装置设备腐蚀检测数据,采用一种结合合成少数类过采样与基于最近邻规则欠采样(synthetic minority over-sampling technique with edited nearest neighbors, SMOTEENN)的算法解决原始数据不平衡问题,基于遗传算法优化后的K-最近邻(genetic algorithm-based K-nearest neighbors, GA-KNN)算法建立设备腐蚀状态(包含腐蚀类型及腐蚀程度)预测模型。结果表明,在数据集平衡方面,SMOTEENN算法能够有效平衡数据集并提高模型对设备腐蚀状态的识别能力;在设备腐蚀状态预测方面,经遗传算法优化后的KNN(K-nearest neighbors)模型具有较好的预测效果,对设备腐蚀类型及腐蚀程度的预测准确率分别达到0.993 3和0.981 2。结果证明了所提模型可实现设备腐蚀综合诊断,为酸性水汽提装置腐蚀监测及检修维护提供理论指导。 展开更多
关键词 非平衡数据处理 腐蚀状态预测 K-最近邻(KNN) 酸性水汽提装置
在线阅读 下载PDF
基于密度峰值快速聚类算法的合成过采样方法 被引量:1
19
作者 冷强奎 李梓涵 《计算机科学与探索》 北大核心 2025年第10期2697-2711,共15页
类不平衡问题,作为分类任务中的一大挑战,源于训练数据集中多数类与少数类样本数量的显著失衡。这种不平衡性不仅影响分类器的泛化能力,还可能导致对少数类样本的识别精度大幅下降。过采样技术,尤其是合成过采样技术(SMOTE)及其变种方法... 类不平衡问题,作为分类任务中的一大挑战,源于训练数据集中多数类与少数类样本数量的显著失衡。这种不平衡性不仅影响分类器的泛化能力,还可能导致对少数类样本的识别精度大幅下降。过采样技术,尤其是合成过采样技术(SMOTE)及其变种方法,作为缓解此类问题的有效手段,通过生成额外的少数类样本来平衡数据集。然而,这些方法存在生成样本可能引入噪声、样本多样性不足以及未能充分关注边界区域等局限性。鉴于边界样本在分类决策中的关键作用及其易受分类器误判的特性,提出了一种创新的过采样策略,旨在精准识别边界样本,并在其周围生成高质量的新样本。该方法采用密度峰值快速聚类算法CFSFDP,凭借其识别局部密度峰值的能力,计算出每个少数类样本的局部密度,进而筛选出位于分类边界样本。通过计算这些边界样本与其最近多数类样本之间的欧式距离,为每个边界样本定义一个合适的球形区域,该区域既涵盖了边界样本的潜在分布范围,又避免了与多数类样本的过度重叠。在确定了边界样本及其对应的球形区域后,该方法在该区域内随机生成新的合成样本。这一步骤不仅增加了少数类样本的多样性,还使得生成的样本更加贴近真实的边界分布,从而有助于分类器更好地学习少数类的复杂特征。为验证该方法的有效性,将其与现有的9种过采样方法在32个真实世界的不平衡数据集上进行了全面比较。实验结果表明,提出的方法在多个评价指标上均表现出色。 展开更多
关键词 不平衡数据 CFSFDP聚类算法 合成过采样 边界样本
在线阅读 下载PDF
基于Focal Loss^(IM)-Transformer的电网虚假数据注入攻击检测
20
作者 席磊 和昀 +3 位作者 李子豪 曹利锋 李宗泽 石雨凡 《南方电网技术》 北大核心 2025年第6期26-38,共13页
虚假数据注入攻击对电力信息物理系统造成严重安全威胁。由于受到攻击样本与正常样本之间存在类别不平衡特性,导致机器学习检测方法偏向于多数类的预测,影响其对攻击的检测精度。为此,提出了基于Focal Loss^(IM)-Transformer的虚假数据... 虚假数据注入攻击对电力信息物理系统造成严重安全威胁。由于受到攻击样本与正常样本之间存在类别不平衡特性,导致机器学习检测方法偏向于多数类的预测,影响其对攻击的检测精度。为此,提出了基于Focal Loss^(IM)-Transformer的虚假数据注入攻击检测。Transformer利用其自注意力机制能够捕捉数据中的长期依赖性,进而识别不平衡的虚假数据注入攻击数据。Focal Loss^(IM)通过引入调制因子来更好地匹配虚假数据注入攻击样本的分布和特性,来增强检测方法对不平衡数据的识别能力,以提高检测方法对攻击的检测精度。通过在IEEE 14节点系统、IEEE 30节点系统和IEEE 57节点系统进行仿真,验证了所提方法的有效性。且相较于传统损失函数和其他检测方法,所提方法显示出更好的泛化能力和对少数类的识别能力,且辨识精度高、误报率低。 展开更多
关键词 电力信息物理系统 虚假数据注入攻击 不平衡数据 TRANSFORMER focal loss
在线阅读 下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部