期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
一种面向个人信用评分数据的改进型SMOTE算法
1
作者 杨涛 《现代信息科技》 2025年第23期83-88,96,共7页
在个人信用评分模型的训练中,常面临样本数量不平衡问题,因此提出了数据层面的各种采样算法。其中,SMOTE作为一种典型的少数类样本扩充算法而受到广泛应用。为提升SMOTE在处理高维复杂数据集时的性能,提高合成样本的多样性,文章设计了... 在个人信用评分模型的训练中,常面临样本数量不平衡问题,因此提出了数据层面的各种采样算法。其中,SMOTE作为一种典型的少数类样本扩充算法而受到广泛应用。为提升SMOTE在处理高维复杂数据集时的性能,提高合成样本的多样性,文章设计了一种融合最小二乘法与高斯噪声的改进型SMOTE算法。首先,使用最小二乘算法拟合少数类样本的特征空间;然后,在特征空间中合成新样本;最终,给新样本添加高斯噪声以增强样本多样性,从而提升合成样本的质量与分布合理性。在4个真实数据集和5个评分模型上的实验结果表明,该算法能够有效提升评分模型的性能。 展开更多
关键词 个人信用评分 不平衡数据 smote 最小二乘 数据处理
在线阅读 下载PDF
基于SMOTETomek过采样方法与领域自适应迁移学习的风电机组故障诊断 被引量:3
2
作者 张伊杰 刘宝良 +2 位作者 王承民 杨镜非 谢宁 《太阳能学报》 EI CAS CSCD 北大核心 2024年第10期635-644,共10页
为在不平衡数据上得到准确分类的故障诊断模型,提出将SMOTETomek过采样方法与领域自适应迁移学习相结合的故障诊断算法框架。首先利用滑动窗口采样技术将数据采样成二维时空窗口数据,然后执行SMOTETomek过采样操作,可保留并丰富完整的... 为在不平衡数据上得到准确分类的故障诊断模型,提出将SMOTETomek过采样方法与领域自适应迁移学习相结合的故障诊断算法框架。首先利用滑动窗口采样技术将数据采样成二维时空窗口数据,然后执行SMOTETomek过采样操作,可保留并丰富完整的时序故障特征。针对过采样算法引入噪声信息的问题,引入领域自适应迁移学习算法在原始数据与过采样后的数据之间提取不变特征,使得过采样算法的引入的噪声信息可被过滤掉。在中国某实际风电场的实验结果显示,所提方法可在高度不平衡的数据上完成模型训练,准确识别各类型故障并精确辨识故障过程对应的时间窗口,诊断性能显著优于基于先前用于应对数据不平衡所普遍使用的过采样方法得到的模型。 展开更多
关键词 风电机组 故障诊断 监督控制和数据采集系统 深度学习 smote过采样方法 领域自适应
原文传递
基于缺值填补和随机森林的窃电数据检测
3
作者 汤熠 李鹏 +2 位作者 李伟华 周宇 冯艳丽 《微型电脑应用》 2026年第1期163-166,共4页
为了实现窃电数据的准确检测,解决用户用电量数据集存在的数据缺失、样本不平衡等问题,提出一种基于缺值填补和随机森林的窃电数据检测方法。采用均值插补法对用户用电量数据集中的缺值进行填补,依据拉依达准则对异常值进行修正;使用合... 为了实现窃电数据的准确检测,解决用户用电量数据集存在的数据缺失、样本不平衡等问题,提出一种基于缺值填补和随机森林的窃电数据检测方法。采用均值插补法对用户用电量数据集中的缺值进行填补,依据拉依达准则对异常值进行修正;使用合成少数类过采样技术(SMOTE)对数据集中的窃电用户样本进行过采样,使样本数量达到平衡;采用随机森林对样本数量平衡的数据集进行窃电检测。实验结果表明,所提出的方法对用户用电量数据集进行窃电检测的准确率达到95.33%,高于比较方法,所提出的方法可有效检测窃电数据。 展开更多
关键词 窃电检测 均值插补法 拉依达准则 smote 随机森林
在线阅读 下载PDF
面向不平衡数据基于高斯混合聚类的SMOTE改进算法 被引量:4
4
作者 陶叶辉 赵寿为 《软件导刊》 2022年第5期110-114,共5页
SMOTE算法对于不平衡数据集有较好的分类,但对于类内不平衡情况分类效果欠佳,针对此问题提出一种基于高斯混合模型聚类的SMOTE过采样算法。先利用GMM算法对少数类样本集进行聚类,再删除与聚类中心点重叠的冗余样本,最后根据不同聚簇进行... SMOTE算法对于不平衡数据集有较好的分类,但对于类内不平衡情况分类效果欠佳,针对此问题提出一种基于高斯混合模型聚类的SMOTE过采样算法。先利用GMM算法对少数类样本集进行聚类,再删除与聚类中心点重叠的冗余样本,最后根据不同聚簇进行SMOTE过采样,使数据最终平衡。将RF、SMOTE+RF、GMM-SMOTE+RF 3种算法在6组UCI标准的公开数据集上进行分类效果实验,结果表明该模型AUC值平均提高了6.09%,可有效平衡不平衡的数据集。 展开更多
关键词 GMM聚类 smote算法 随机森林 肘部法则 不平衡数据集
在线阅读 下载PDF
基于少数类合成的过采样算法和贝叶斯优化神经网络的结构可靠性分析方法
5
作者 葛福林 吴宗辉 何建 《船舶力学》 北大核心 2025年第5期767-775,共9页
为提高滑油冷却器抗冲击可靠性的计算精度和分析效率,本文提出一种基于少数类合成的过采样(SMOTE)算法和贝叶斯优化(BO)神经网络的结构可靠性分析方法。该方法首先采用均匀设计(UD)方法和少数类合成的过采样算法提高样本点的利用效率,... 为提高滑油冷却器抗冲击可靠性的计算精度和分析效率,本文提出一种基于少数类合成的过采样(SMOTE)算法和贝叶斯优化(BO)神经网络的结构可靠性分析方法。该方法首先采用均匀设计(UD)方法和少数类合成的过采样算法提高样本点的利用效率,其次使用贝叶斯优化算法优化BP神经网络超参数、初始权值和初始偏置,以提高模型的拟合精度和泛化能力,最后利用优化后的代理模型结合Monte Carlo法计算结构可靠度。研究表明:相较于传统的代理模型法,本文的方法具有计算精度高、分析时间短、计算成本低的优势。本文提出的分析方法在滑油冷却器抗冲击可靠性分析中具有良好的适用性,分析结果可为滑油冷却器的抗冲击设计提供技术指导和理论支撑。 展开更多
关键词 结构可靠性 BP神经网络 贝叶斯优化 smote算法 滑油冷却器
在线阅读 下载PDF
基于F分布的非均匀自适应过采样方法
6
作者 王昊宇 李鹏 郎恂 《电子器件》 2025年第4期781-790,共10页
针对基于SMOTE的不平衡数据过采样方法极容易使新数据集中出现类间样本重叠问题,提出基于F分布的非均匀自适应过采样方法—F-SMOTE。首先,F-SMOTE根据原始样本中多数类与少数类的分布计算密度系数,自适应强调边界少数类样本并移动决策边... 针对基于SMOTE的不平衡数据过采样方法极容易使新数据集中出现类间样本重叠问题,提出基于F分布的非均匀自适应过采样方法—F-SMOTE。首先,F-SMOTE根据原始样本中多数类与少数类的分布计算密度系数,自适应强调边界少数类样本并移动决策边界;其次,基于F分布优化样本合成机制,以非均匀方式合成新边界样本,使新样本出现在原样本的安全邻域内,解决采样后的类重叠问题;最后,将提出方法应用于仿真不平衡数据和14种真实场景中的不平衡数据,并训练3种分类器。实验结果表明,本文方法过采样后的数据集能有效提高每种分类器的F1-score和AUC值,在超过半数的数据集上均优于其他基本过采样方法。 展开更多
关键词 过采样方法 不平衡数据 smote 线性插值
在线阅读 下载PDF
面向小样本安全生产数据的事故集成预警模型 被引量:4
7
作者 段在鹏 张灿 +2 位作者 谢汉青 黄月铃 李帆 《安全与环境学报》 CAS CSCD 北大核心 2022年第1期51-57,共7页
现有事故预警模型多依赖大量数据训练,而许多中小企业的安全生产数据积累不足。为了利用少量样本数据训练出相对精确的事故集成预警模型,首先,运用合成少数类过采样(SMOTE)算法对小样本数据进行预处理;其次,基于相关数据训练单个机器学... 现有事故预警模型多依赖大量数据训练,而许多中小企业的安全生产数据积累不足。为了利用少量样本数据训练出相对精确的事故集成预警模型,首先,运用合成少数类过采样(SMOTE)算法对小样本数据进行预处理;其次,基于相关数据训练单个机器学习算法,选择最优机器算法作为集成方法的基分类器;同时,利用特征重要性优化企业事故预警指标;最后,通过投票法、装袋法、提升法、堆叠法4种集成方法进行拟合,提高企业事故预警模型精度。结果表明:SMOTE方法能较好地模拟出企业事故预警数值,增加其数据量,较好地解决了小样本数据不平衡问题。此外,在基于4种集成方法的企业事故预警模型的比较中,发现基于装袋法的企业事故集成预警模型拟合效果最佳,测试精度可达到88.46%。 展开更多
关键词 安全工程 企业事故预警 小样本统计 smote算法 集成方法
原文传递
基于特征优化和BP神经网络的入侵检测方法 被引量:22
8
作者 王伟 代红 赵斯祺 《计算机工程与设计》 北大核心 2021年第10期2755-2761,共7页
为提高网络入侵检测率,提出一个集特征优化和人工神经网络于一体的网络入侵识别发现框架AS-BP。引入SMOTE技术和随机采样技术对数据进行平衡约简处理,解决数据不平衡问题,利用集成方法对网络入侵数据进行重要特征提取,降低数据处理维度... 为提高网络入侵检测率,提出一个集特征优化和人工神经网络于一体的网络入侵识别发现框架AS-BP。引入SMOTE技术和随机采样技术对数据进行平衡约简处理,解决数据不平衡问题,利用集成方法对网络入侵数据进行重要特征提取,降低数据处理维度,通过优化BP神经网络算法,对网络入侵数据进行判断完成分类。实验结果表明,该方法克服了传统BP神经网络建模时间过长的问题,在不降低其它攻击类型检测率的同时,提高U2R和R2L的检测率,克服了数据集中少数类数据量过少导致的少数类检测率低的问题。将实验结果与其它分类方法进行比较,验证了该方法的准确率、精确率和召回率优于其它方法。 展开更多
关键词 入侵检测 smote技术 随机采样技术 集成方法 BP神经网络
在线阅读 下载PDF
基于逻辑回归的不平衡数据算法适用性研究 被引量:1
9
作者 李超杰 温磊 《计算机科学与应用》 2020年第11期2049-2057,共9页
逻辑回归模型容易受到不平衡数据的影响,本文主要探究了随机欠采样法、Border Line-Smote (BLS)过采样法、自适应综合过采样法(Synthetic Minority Oversampling Technique)等三种不平衡数据算法对逻辑回归模型的适用情况。利用逻辑回... 逻辑回归模型容易受到不平衡数据的影响,本文主要探究了随机欠采样法、Border Line-Smote (BLS)过采样法、自适应综合过采样法(Synthetic Minority Oversampling Technique)等三种不平衡数据算法对逻辑回归模型的适用情况。利用逻辑回归模型分别对三种方法平衡之后的数据,处理之后发现BLS过采样法得出的各项指标最优,ADASYN过采样法得出的各项指标最差,最终得出BLS过采样法更适用于逻辑回归模型的不平衡数据集的处理。 展开更多
关键词 逻辑回归 随机欠采样法 BSL过采样法 ADASYN过采样法
在线阅读 下载PDF
一种基于改进BTS的多类非平衡分类的集成学习方法
10
作者 汤志亚 赵亮 +2 位作者 杨玲 甄小琼 杨志鹏 《商丘师范学院学报》 CAS 2015年第6期30-34,共5页
提出一种适用于多类不平衡数据的集成学习方法,以解决多类样本分布不均衡问题.首先,利用合成少类样本的过采样技术(Synthetic Minority Over-sampling Technique,SMOTE)得到一组类别平衡的训练集.然后,对每个训练集采用二叉树支持向量机... 提出一种适用于多类不平衡数据的集成学习方法,以解决多类样本分布不均衡问题.首先,利用合成少类样本的过采样技术(Synthetic Minority Over-sampling Technique,SMOTE)得到一组类别平衡的训练集.然后,对每个训练集采用二叉树支持向量机(SVM of Binary Tree,BTS)进行训练,最后,采用Bagging进行集成.通过5组UCI测试数据表明该算法在Gmean参数上比SMOTEBagging算法提高2.55%. 展开更多
关键词 多类不平衡分类 集成方法 二叉树支持向量机 smote算法
在线阅读 下载PDF
基于改进梯度提升决策树-蒙特卡罗法的超大型集装箱船绑扎桥可靠性分析 被引量:5
11
作者 李放 王德禹 《中国舰船研究》 CSCD 北大核心 2020年第2期63-69,共7页
[目的]对超大型集装箱船绑扎桥结构而言,复杂的设计结构和恶劣的载荷环境对其可靠性提出了更高的要求。针对大型船舶结构可靠性分析时计算效率低、计算精度差等问题,提出基于改进梯度提升决策树—蒙特卡罗(GBDT-MC)方法。[方法]首先,通... [目的]对超大型集装箱船绑扎桥结构而言,复杂的设计结构和恶劣的载荷环境对其可靠性提出了更高的要求。针对大型船舶结构可靠性分析时计算效率低、计算精度差等问题,提出基于改进梯度提升决策树—蒙特卡罗(GBDT-MC)方法。[方法]首先,通过Python库建立改进梯度提升决策树(GBDT)的近似模型,根据实验生成较少的样本点,并筛选位于失效面附近的样本点;接着,运用SMOTE算法合成新的样本点并参与有限元计算,进而结合原有的样本点形成训练集;然后,采用已训练的近似模型预测蒙特卡罗(MC)方法所产生的样本点信息,完成结构的可靠性分析;最后,运用算例验证改进GBDT-MC方法的可行性和准确性,并将其应用于超大型集装箱船绑扎桥结构的可靠性分析。[结果]计算结果表明:案例中超大型集装箱船绑扎桥在静态绑扎力作用下的失效概率误差为3.5%,改进GBDT-MC方法的计算耗时为2.55 h,而MC方法则需要416.7 h,可见在允许的计算误差范围内,改进GBDT-MC方法可以大为缩减可靠性分析的计算时间。[结论]改进GBDT-MC方法能显著提高计算精度并缩短计算时间,可为结构可靠性的优化设计提供支持。 展开更多
关键词 绑扎桥 可靠性分析 smote算法 梯度提升决策树 蒙特卡罗方法
在线阅读 下载PDF
基于混合神经进化算法的风电爬坡分类预测
12
作者 徐正华 刘三明 王致杰 《新一代信息技术》 2019年第7期39-45,共7页
针对风电场风电功率爬坡事件预测问题,提出一种分类预测模型。该模型将大气再分析数据输入的预测问题建模为二分类问题。另一方面,提出一种混合神经进化算法,将极限学习机等人工神经网络与进化算法相结合,对训练后的模型进行优化。由于... 针对风电场风电功率爬坡事件预测问题,提出一种分类预测模型。该模型将大气再分析数据输入的预测问题建模为二分类问题。另一方面,提出一种混合神经进化算法,将极限学习机等人工神经网络与进化算法相结合,对训练后的模型进行优化。由于风电爬坡事件发生的概率很低,因此是不平衡的。本文采用SMOTE采样方法,通过减少大多数类的数据样本来获得良好的结果。采用进化算法进行特征选择,以选择最优的训练模型。最后,通过算例仿真对模型进行评价,验证了模型的精度性能。结果表明,该方法在分类预测性能上具有较好的精度。 展开更多
关键词 混合神经进化算法 极端学习机 smote采样方法 风电爬坡预测
在线阅读 下载PDF
基于先验信息分类的客户消费动态终身价值估计研究
13
作者 热依木江·克里木 《新疆财经大学学报》 2022年第4期69-78,共10页
文章借助SMOTE方法平衡客户消费行为数据,结合受限玻尔兹曼机和区制转移动态因子模型,给出客户初步动态分类先验信息及处于各消费阶段的概率,在此基础上估计客户动态终身价值,并通过库尔勒香梨的网络销售样本数据进行实证分析。研究表明... 文章借助SMOTE方法平衡客户消费行为数据,结合受限玻尔兹曼机和区制转移动态因子模型,给出客户初步动态分类先验信息及处于各消费阶段的概率,在此基础上估计客户动态终身价值,并通过库尔勒香梨的网络销售样本数据进行实证分析。研究表明,SMOTE方法可以较好地增加客户的消费行为数据而不影响其统计特征;受限玻尔兹曼机可将库尔勒香梨的消费群体划分为统计特征完全不同的3类客户,区制转移动态因子模型估计得到的3类客户的动态特征有明显区别。另外,各类客户的动态终身价值均呈倒“U”形特征,与理论一致,仅消费一次客户在大多数时间点上终身价值会更高。 展开更多
关键词 先验信息 客户消费行为 smote方法 顾客终身价值
在线阅读 下载PDF
基于非均衡数据的管道堵塞状态识别方法
14
作者 王菲 冯早 李洋 《化工自动化及仪表》 CAS 2019年第12期993-1000,1016,共9页
针对城市排水管道正常与堵塞故障状态在数据获取上的非均衡性造成的运行状态识别准确率下降的问题,提出基于非均衡数据的管道堵塞状态识别新方法。实验结果表明:相比单一重采样方法,笔者设计的混合采样方法的识别结果的准确率和F-measur... 针对城市排水管道正常与堵塞故障状态在数据获取上的非均衡性造成的运行状态识别准确率下降的问题,提出基于非均衡数据的管道堵塞状态识别新方法。实验结果表明:相比单一重采样方法,笔者设计的混合采样方法的识别结果的准确率和F-measure、G-mean两种评价指标都更具优势。 展开更多
关键词 管道堵塞 状态识别 非均衡数据 K-MEANS 聚类改进 smote 最小二乘法 支持向量机
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部