期刊文献+
共找到412篇文章
< 1 2 21 >
每页显示 20 50 100
A Fine-Grained Defect Prediction Method Based on Drift-Immune Graph Neural Networks
1
作者 Fengyu Yang Fa Zhong +1 位作者 Xiaohui Wei Guangdong Zeng 《Computers, Materials & Continua》 2025年第2期3563-3590,共28页
The primary goal of software defect prediction (SDP) is to pinpoint code modules that are likely to contain defects, thereby enabling software quality assurance teams to strategically allocate their resources and manp... The primary goal of software defect prediction (SDP) is to pinpoint code modules that are likely to contain defects, thereby enabling software quality assurance teams to strategically allocate their resources and manpower. Within-project defect prediction (WPDP) is a widely used method in SDP. Despite various improvements, current methods still face challenges such as coarse-grained prediction and ineffective handling of data drift due to differences in project distribution. To address these issues, we propose a fine-grained SDP method called DIDP (drift-immune defect prediction), based on drift-immune graph neural networks (DI-GNN). DIDP converts source code into graph representations and uses DI-GNN to mitigate data drift at the model level. It also analyses key statements leading to file defects for a more detailed SDP approach. We evaluated the performance of DIDP in WPDP by examining its file-level and statement-level accuracy compared to state-of-the-art methods, and by examining its cross-project prediction accuracy. The results of the experiment show that DIDP showed significant improvements in F1-score and Recall@Top20%LOC compared to existing methods, even with large software version changes. DIDP also performed well in cross-project SDP. Our study demonstrates that DIDP achieves impressive prediction results in WPDP, effectively mitigating data drift and accurately predicting defective files. Additionally, DIDP can rank the risk of statements in defective files, aiding developers and testers in identifying potential code issues. 展开更多
关键词 Software defect prediction data drift graph neural networks information bottleneck
在线阅读 下载PDF
高速公路路基路面健康监测数据处理方法及其效果评估 被引量:1
2
作者 王书娟 陈志国 +1 位作者 王亚博 易军艳 《市政技术》 2025年第2期175-181,共7页
随着交通运输行业的快速发展,高速公路作为重要的基础设施,面临着日益增长的交通量及其带来的重载压力与气候变化等外部因素的挑战,对路基和路面结构的安全性与使用寿命产生了深远影响。为保障高速公路的安全性与耐久性,实施路基路面的... 随着交通运输行业的快速发展,高速公路作为重要的基础设施,面临着日益增长的交通量及其带来的重载压力与气候变化等外部因素的挑战,对路基和路面结构的安全性与使用寿命产生了深远影响。为保障高速公路的安全性与耐久性,实施路基路面的健康监测尤为重要。基于吉林某高速公路长寿命沥青路面试验段,构建了一个综合性的健康监测系统,布设了横向和纵向应变传感器、温度和湿度传感器、土压力计和渗压计等多种设备,实时采集路基和路面的动态响应特征和环境数据。然而,在监测过程中,存在数据冗余与存储、数据噪声、基线漂移和数据缺失或不完整等问题,严重影响了数据的质量及后续分析的可靠性。为此,提出了一系列数据处理方法,包括使用阈值法和斜率阈值法进行有效数据筛选,采用基线归零方法消除基线漂移,利用Savitzky-Golay滤波进行信号降噪,以及使用卡尔曼滤波处理数据缺失或不完整问题。研究结果表明,这些方法显著提高了数据质量和信噪比,其中Savitzky-Golay滤波有效保留了信号的关键特征。该研究为高速公路路基路面健康监测提供了高效且可靠的数据处理方案,显著提升了监测系统的整体性能,为路面养护和管理提供了科学依据。 展开更多
关键词 路基路面 健康监测 噪声过滤 基线漂移 数据缺失 数据筛选
在线阅读 下载PDF
结合数据流和控制流漂移发现的业务过程异常检测方法
3
作者 孙晋永 许乾 +2 位作者 闻立杰 邓文伟 马瑞阳 《计算机集成制造系统》 北大核心 2025年第5期1672-1683,共12页
现有的业务过程异常检测方法不能发现业务过程模型可能发生的数据流漂移,会将合理的数据流漂移案例判定为异常案例,降低了异常检测的准确性。因此,提出一种结合数据流和控制流漂移发现的业务过程异常检测方法。首先,将事件日志中的事件... 现有的业务过程异常检测方法不能发现业务过程模型可能发生的数据流漂移,会将合理的数据流漂移案例判定为异常案例,降低了异常检测的准确性。因此,提出一种结合数据流和控制流漂移发现的业务过程异常检测方法。首先,将事件日志中的事件名(即控制流)与其他事件属性(即数据流)一样看待,使用独热编码对其进行统一编码,得到案例特征数据集。然后,构建事件属性预测模型来获取业务过程实例的下一事件的所有可能发生事件及其属性的概率分布。进一步,将以上概率分布转换为异常评分,得到候选异常案例集。接着,使用基于霍夫丁不等式的双层滑动窗口机制、概念漂移比率从候选异常案例集中识别出数据流、控制流漂移案例,进而得到真正的异常案例。最后,采用循环更新策略,使用得到的漂移案例集作为新知识来更新事件属性预测模型,使得所提出的方法更准确地检测出真正的业务过程异常。仿真实验结果表明,相比现有的业务过程异常检测方法,所提出的方法能够较准确地发现事件日志中的数据流漂移,对于包含数据流和控制流漂移的事件日志可以获得较高的异常检测准确性。 展开更多
关键词 业务过程异常检测 数据流漂移 事件属性 概念漂移比率 模型更新
在线阅读 下载PDF
基于Kolmogorov不等式的数据流漂移检测方法
4
作者 韩萌 孟凡兴 +3 位作者 李春鹏 张瑞华 何菲菲 丁剑 《计算机工程与应用》 北大核心 2025年第9期102-115,共14页
在现实数据环境中,数据分布经常随着时间推移而变化,该现象称为概念漂移。概念漂移会显著影响原分类模型的性能。因此,当概念漂移出现时,分类模型需及时调整以适应数据分布变化,从而保证学习的有效性。探讨了Kolmogorov不等式在概念漂... 在现实数据环境中,数据分布经常随着时间推移而变化,该现象称为概念漂移。概念漂移会显著影响原分类模型的性能。因此,当概念漂移出现时,分类模型需及时调整以适应数据分布变化,从而保证学习的有效性。探讨了Kolmogorov不等式在概念漂移检测领域的应用潜力。提出了一种基于错误率的Kolmogorov漂移检验策略,利用Kolmogorov不等式设计了概念漂移检测方法,并利用该算法来检测数据流中突然或逐渐出现的概念漂移。提出了一种尾部实例调整策略,减轻了漂移检测样本集中旧实例的影响,从而进一步降低了漂移检测延迟。实验表明,与经典或先进的漂移检测器相比,提出的算法在分类准确率方面表现最佳。在漂移检测性能方面,提出的算法在误检率和检测延迟方面的表现均位于前列,达到了较好的平衡。在运行时间方面也表现出了良好的性能。在上述四个指标的总体比较中优于其他算法,达到了该研究的预期。 展开更多
关键词 概念漂移 漂移检测 数据流 分类 Kolmogorov不等式
在线阅读 下载PDF
基于代价敏感学习的上市公司财务困境动态预测模型
5
作者 李大元 颜卓惠 曾阳艳 《系统工程》 北大核心 2025年第2期1-14,共14页
为了保障企业的财务健康,准确且有效的财务困境预测模型至关重要。然而,类别不平衡和概念漂移是财务困境预测领域需要解决的两个关键问题。为此,本文基于代价敏感学习和带时间加权的Adaboost方法提出了一种兼顾类别不平衡和概念漂移的... 为了保障企业的财务健康,准确且有效的财务困境预测模型至关重要。然而,类别不平衡和概念漂移是财务困境预测领域需要解决的两个关键问题。为此,本文基于代价敏感学习和带时间加权的Adaboost方法提出了一种兼顾类别不平衡和概念漂移的动态财务困境预测方法,并在2005年至2022年间中国上市公司的动态不平衡数据集上进行了实证分析。结果表明,该方法在动态不平衡数据集上的预测性能优于改进前的模型,能够同时处理财务困境预测领域的概念漂移问题和数据分布不平衡问题。 展开更多
关键词 动态财务困境预警 不平衡数据 概念漂移 代价敏感学习 ADABOOST算法
原文传递
工业互联网平台驱动下的伺服电机生产数据实时分析方法
6
作者 周雪会 陈慧 《移动信息》 2025年第11期117-120,共4页
针对伺服电机生产质量不稳定、能耗效率低和故障预测难等问题,文中提出了一种基于工业互联网平台的数据分析方法,通过分析伺服电机生产数据特征,构建了包含质量预测、异常检测和能效优化的算法框架。实验结果表明,应用该方法后,产品良... 针对伺服电机生产质量不稳定、能耗效率低和故障预测难等问题,文中提出了一种基于工业互联网平台的数据分析方法,通过分析伺服电机生产数据特征,构建了包含质量预测、异常检测和能效优化的算法框架。实验结果表明,应用该方法后,产品良品率提升了2.3%,故障预警准确率达91.7%,能耗下降8.6%,经济效益达2050万元/年,为伺服电机智能制造提供了有效的解决方案。 展开更多
关键词 工业互联网平台 伺服电机 实时数据分析 质量预测 异常检测 数据漂移
在线阅读 下载PDF
基于主动−被动增量集成的概念漂移适应方法 被引量:1
7
作者 祁晓博 陈佳明 +3 位作者 史颖 亓慧 郭虎升 王文剑 《自动化学报》 北大核心 2025年第5期1131-1144,共14页
数据流是一组随时间连续到来的数据序列,在数据流不断产生的过程中,由于各种因素的影响,数据分布随时间推移可能以不可预测的方式发生变化,这种现象称为概念漂移.在漂移发生后,当前模型需要及时响应数据流中的实时分布变化,并有效处理... 数据流是一组随时间连续到来的数据序列,在数据流不断产生的过程中,由于各种因素的影响,数据分布随时间推移可能以不可预测的方式发生变化,这种现象称为概念漂移.在漂移发生后,当前模型需要及时响应数据流中的实时分布变化,并有效处理不同类型的概念漂移,从而避免模型泛化性能下降.针对这一问题,提出一种基于主动–被动增量集成的概念漂移适应方法(CDAM-APIE).该方法首先使用在线增量集成策略构建被动集成模型,对新样本进行实时预测以动态更新基模型权重,有利于快速响应数据分布的瞬时变化,并增强模型适应概念漂移的能力.在此基础上,利用增量学习和概念漂移检测技术构建主动基模型,提升模型在平稳数据流状态下的鲁棒性和漂移后的泛化性能.实验结果表明,CDAMAPIE能够对概念漂移做出及时响应,同时有效提高模型的泛化性能. 展开更多
关键词 概念漂移 数据流分类 增量学习 在线集成
在线阅读 下载PDF
基于机器学习的海洋浮标传感器观测数据的偏差校正方法
8
作者 钟国荣 李学刚 +4 位作者 宋金明 曲宝晓 马骏 袁华茂 段丽琴 《海洋学报》 北大核心 2025年第10期146-154,共9页
海洋浮标观测是海洋研究数据的重要获取手段,但受传感器本身基线漂移、海洋生物附着和海水腐蚀等多种因素的影响,浮标观测的直接观测数据必须进行严格的偏差校正,以确保其数据的可靠性。当前针对物理海洋参数浮标数据的质控方案已有较... 海洋浮标观测是海洋研究数据的重要获取手段,但受传感器本身基线漂移、海洋生物附着和海水腐蚀等多种因素的影响,浮标观测的直接观测数据必须进行严格的偏差校正,以确保其数据的可靠性。当前针对物理海洋参数浮标数据的质控方案已有较多研究和报道,然而对于更加复杂多变的化学参数尚无完善可行的在浮标传感器端的质控方案。为此,本研究基于对实验室溶解氧、叶绿素、pH值和CO_(2)分压参数为期90 d的传感器监测数据的变化分析,发现监测参数的漂移偏差与电导率、传感器读数电压等基础参数呈现较强的相关性,同时也不同程度地与生物因素相关。在此基础上,建立了基于机器学习拟合漂移偏差与传感器基础参数间非线性关系的漂移偏差校正方法,使浮标传感器化学参数监测数据有效化。应用该方法对不同参数的观测数据进行校正,可有效减小漂移数据与真实值间的偏差,为实现海洋化学参数浮标观测数据的长期、稳定、高质量获取提供了一种新的质控思路。 展开更多
关键词 监测数据 漂移偏差 质量控制 机器学习 浮标观测
在线阅读 下载PDF
基于加权与动态选择的不平衡数据流分类算法
9
作者 韩萌 李春鹏 +3 位作者 李昂 孟凡兴 何菲菲 张瑞华 《计算机工程与应用》 北大核心 2025年第10期79-95,共17页
在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别... 在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别不平衡比和概念漂移等实际挑战,会极大地降低分类器的性能。针对这些问题,提出了一种基于加权与动态选择的不平衡数据流分类算法(sample difficulty weighting and dynamic ensemble selection,SDW-DES),通过综合考虑样本难度和数据动态性,为实时应用提供可靠解决方案。引入一种基于样本分类难度的加权策略,结合样本的边际值和Focal Loss,以更有效地关注易分类错误的样本和少数类样本,从而提高分类器的准确性。提出一种灵活的动态集成选择方法,通过设计样本滑动窗口和困难样本滑动窗口,来综合分析分类器在不同窗口上的表现并加权,选出集成中最好的分类器进行预测,以适应数据分布的动态变化。在多种数据流环境和评估指标上与9种先进的算法进行了全面的实验评估,实验结果表明SDW-DES在4个评估指标中平均排名第一,并且更能够适应数据流中的不平衡和概念漂移问题。 展开更多
关键词 数据流分类 多类不平衡 概念漂移 样本加权 动态集成选择
在线阅读 下载PDF
新型往返平漂式探空资料对长江中下游数值预报质量的影响
10
作者 张鑫 王秋萍 +3 位作者 马旭林 张旭鹏 成巍 夏元彩 《大气科学》 北大核心 2025年第1期245-256,共12页
对于新型观测系统的建立,准确客观地评估其性能对系统的完善和发展具有重要的意义。我国新一代往返平漂式探空系统(Round-trip Drifting Sounding System,RDSS)创新性地突破了传统探空观测模式,通过一次释放实现“上升—平漂—下降”三... 对于新型观测系统的建立,准确客观地评估其性能对系统的完善和发展具有重要的意义。我国新一代往返平漂式探空系统(Round-trip Drifting Sounding System,RDSS)创新性地突破了传统探空观测模式,通过一次释放实现“上升—平漂—下降”三段式观测,拓展了现有探空观测的能力和范围。本文利用基于伴随模式的预报敏感性方法(Forecast Sensitivity to Observations,FSO),研究了长江中下游目标区数值预报质量对新型探空观测资料的敏感性。结果表明:试验时段内同化常规观测资料均能够不同程度地减小预报误差,提高预报质量,其中风场和温度观测的贡献最为显著。新型探空试验资料对长江中下游目标区预报具有显著正贡献,71.4%时次的预报误差有了进一步的减小。经向风和湿度观测对预报质量的改善最为明显。新型探空风场观测对预报误差的贡献具有明显的空间差异,预报误差减小的大值区主要分布在试验站本站及其附近区域;整层新型探空风场、温度、湿度观测对预报质量的正贡献比较显著,仅对流层中低层的纬向风观测对预报质量呈现弱的负贡献。 展开更多
关键词 数值预报 资料同化 预报敏感性 往返平漂式探空系统
在线阅读 下载PDF
利用Excel实现快速整理CG-5型重力仪静态试验数据和计算漂移常量DRIFT 被引量:2
11
作者 高鹏 李增涛 +2 位作者 于峰丹 张旭 刘生荣 《物探与化探》 CAS 北大核心 2019年第1期209-214,共6页
重力仪静态试验是重力勘探工作开始之前对仪器性能检查的必要环节,由于原理简单,其数据整理常不被人们重视,没有系统的方法,但整理的计算过程却又繁琐复杂,初学者在面对大量数据和多重目标时或顾此失彼,或重复计算,往往要耗费较多的工... 重力仪静态试验是重力勘探工作开始之前对仪器性能检查的必要环节,由于原理简单,其数据整理常不被人们重视,没有系统的方法,但整理的计算过程却又繁琐复杂,初学者在面对大量数据和多重目标时或顾此失彼,或重复计算,往往要耗费较多的工作时间。Excel电子表格具有强大的数学计算、图形显示功能,且应用广泛,易于操作,可系统整理CG-5型重力仪静态试验的原始观测记录,快速获取静态试验数据表、零点位移曲线及其拟合直线图等直观要素,同时计算得到静态零点位移曲线与直线偏差、平均零点位移率等结果参数,Excel的散点图趋势线功能也改进了静态零点位移校正参数漂移常量DRIFT的计算方法与准确度。这种静态试验数据的整理方法具有快速、准确和直观的优点。 展开更多
关键词 CG-5型重力仪 EXCEL 静态试验 数据整理 drift
在线阅读 下载PDF
基于生成式循环网络的伺服系统在线异常检测 被引量:1
12
作者 陈晓 王赞 路辉 《上海航天(中英文)》 2025年第2期157-165,共9页
在线异常检测是确保火箭伺服系统正常运行的关键技术。然而,目前大多数研究未考虑模型部署和应用时存在的概念漂移问题,进而影响检测精度。为此,本文提出一种基于生成式循环网络的伺服系统在线异常检测算法。首先,为建立系统输入输出关... 在线异常检测是确保火箭伺服系统正常运行的关键技术。然而,目前大多数研究未考虑模型部署和应用时存在的概念漂移问题,进而影响检测精度。为此,本文提出一种基于生成式循环网络的伺服系统在线异常检测算法。首先,为建立系统输入输出关系模型,提出深层循环神经网络,该网络通过引入多层记忆单元和跳跃连接,来提升其对数据多尺度时空依赖关系的拟合能力;其次,为缓解概念漂移问题,引入在线学习使模型具有持续学习能力,但也带来了灾难性遗忘问题;最后,为缓解灾难性遗忘问题,提出生成式网络,以生成包含历史数据、整体数据分布信息的回顾数据,使模型学习新数据分布的同时,避免遗忘历史数据。结果表明:基于火箭伺服系统所采集的真实运行数据,消融实验和对比实验证明了提出的算法能有效缓解上述问题,并取得较好的异常检测效果。 展开更多
关键词 伺服系统异常检测 多变量时间序列 流数据 概念漂移 灾难性遗忘
在线阅读 下载PDF
基于数据流的漂移性多光斑聚类算法研究
13
作者 申超屹 刘怡 +3 位作者 王雪梅 马蒙蒙 曾晶 刘东升 《激光技术》 北大核心 2025年第5期710-717,共8页
为了降低多接入通信系统误比特率,基于四象限探测器的多目标光斑分辨技术,分析了通信激光光斑数据流的特点,对3种传统聚类算法进行了比较。对在多光斑分辨方面表现出更好综合效果的k均值聚类算法进行了扩展,提出了基于数据流的漂移性多... 为了降低多接入通信系统误比特率,基于四象限探测器的多目标光斑分辨技术,分析了通信激光光斑数据流的特点,对3种传统聚类算法进行了比较。对在多光斑分辨方面表现出更好综合效果的k均值聚类算法进行了扩展,提出了基于数据流的漂移性多光斑聚类算法。首先通过初始聚类自适应选择最优簇数,然后对新光斑数据进行实时漂移检测和聚类,并对算法的分类判决参数进行实时更新。结果表明,该算法解决了光斑漂移下的多光斑分辨问题,光斑分辨精确度相比传统算法有显著提高,稳定在90%以上。该研究提高了通信质量,为多接入通信的实现提供了算法支撑。 展开更多
关键词 光通信 多光斑分辨 数据流聚类 光斑漂移
在线阅读 下载PDF
基于改进BiLSTM-KF的WSN数据漂移盲校准算法
14
作者 史志强 古丽米拉·克孜尔别克 +1 位作者 韩博 张瑛进 《计算机技术与发展》 2025年第2期122-129,共8页
无线传感器网络数据的准确性对智能系统的决策和环境监测的优化至关重要。针对传感器设备在工作过程中易受外部环境变化及自身特性的影响产生数据漂移现象,导致数据精确度产生偏差的问题,该文提出一种基于CNN-BiLSTM-Attention-KF的无... 无线传感器网络数据的准确性对智能系统的决策和环境监测的优化至关重要。针对传感器设备在工作过程中易受外部环境变化及自身特性的影响产生数据漂移现象,导致数据精确度产生偏差的问题,该文提出一种基于CNN-BiLSTM-Attention-KF的无线传感器网络数据漂移校准方法。首先,利用CNN提取数据的局部特征,BiLSTM捕获时序数据的长期依赖关系,并引入Attention增强模型处理数据序列中的关键信息,根据节点数据的时空相关性进行建模,得到待校准节点的预测值。其次,将其预测值与节点的实际观测值作为卡尔曼滤波器的输入,实现对漂移数据的跟踪和校准。在公开数据集IBRL上进行实验,结果表明该方法在各评价指标有所改善,其中平均绝对误差(MAE)降至0.3255,均方误差(MSE)降至0.2289,相关系数(R^(2))达到0.9882,均优于其他算法。CNN-BiLSTM-Attention-KF具有较好的校准效果,对于传感器在长时间工作中保持数据准确性具有重要意义。 展开更多
关键词 无线传感器网络 数据漂移 双向长短期记忆网络 卡尔曼滤波器 盲校准
在线阅读 下载PDF
有限标签下的非平衡数据流分类方法
15
作者 李艳红 李志华 +2 位作者 郑建兴 白鹤翔 郭鑫 《大数据》 2025年第2期107-126,共20页
数据流分类是数据流挖掘的重要研究内容,其核心任务是从实时到达的数据流中快速捕获概念漂移,并及时调整分类模型。极限学习机具有训练速度快和泛化性能好的优点,然而目前基于极限学习机的数据流分类方法很少可以同时处理数据流中常见... 数据流分类是数据流挖掘的重要研究内容,其核心任务是从实时到达的数据流中快速捕获概念漂移,并及时调整分类模型。极限学习机具有训练速度快和泛化性能好的优点,然而目前基于极限学习机的数据流分类方法很少可以同时处理数据流中常见的多类非平衡、概念漂移、标签成本昂贵的问题。为此,提出了一种有限标签下的非平衡数据流分类方法。该方法定义了预测概率差值与信息熵相结合的样本预测确定性度量,提出了不确定性标签请求策略;定义了基于类不平衡比率和样本预测误差的样本重要性度量;提出了基于概念漂移指数的分类器的更新与重构机制。在6个人工数据流和3个真实数据流上的对比实验表明,本文提出方法的分类性能优于已有的6种数据流分类方法的分类性能。 展开更多
关键词 数据流分类 多类非平衡 极限学习机 概念漂移 标签成本昂贵
在线阅读 下载PDF
基于扩展长短期记忆网络的电力系统短期负荷预测
16
作者 郁佳杰 付保川 +1 位作者 朱建业 韩雅明 《计算机测量与控制》 2025年第8期72-78,136,共8页
短期负荷预测在电力系统的运行与规划中扮演着至关重要的角色,准确地预测负荷变化不仅能够有效支持电网的调度优化、提升电网可靠性,而且可以为决策者提供科学依据以降低运营成本和提高系统效率;如何构建具有柔性特征的短期负荷预测模型... 短期负荷预测在电力系统的运行与规划中扮演着至关重要的角色,准确地预测负荷变化不仅能够有效支持电网的调度优化、提升电网可靠性,而且可以为决策者提供科学依据以降低运营成本和提高系统效率;如何构建具有柔性特征的短期负荷预测模型,成为影响短期负荷预测准确率的关键之所在;为了较好适应季节变化、外部环境因素以及用户行为的变化,提出一种由SLSTM和MLSTM两种架构组成的XLSTM短期负荷预测模型,并利用两种架构的优势捕捉负荷数据中空间和时间的耦合关系,以有效缓解长时间预测后出现数据漂移而导致预测精度下降的问题;通过利用跨季节划分的实际电力系统负荷数据进行单步预测和多步预测仿真,并与独立的LSTM和CNN-LSTM模型进行了对比分析;仿真结果表明,XLSTM模型在单步预测和多步预测中的精度都明显优于其他模型,验证了其具有较强的模型泛化性与缓解短期负荷预测数据漂移的有效性。 展开更多
关键词 短期负荷预测 电力系统 LSTM CNN-LSTM X-LSTM 模型泛化性 数据漂移
在线阅读 下载PDF
基于图结构的概念漂移检测
17
作者 周彦冰 马士伦 文益民 《山东大学学报(工学版)》 北大核心 2025年第2期88-96,共9页
为了解决传统的概念漂移检测方法,仅依赖错误率进行漂移检测不可靠的问题,提出一种基于图结构的概念漂移检测方法。该方法使用k关联最优图表示当前数据分布,定义样本的漂移率表示分类器与当前数据分布的不一致性,利用漂移率形成比特流,... 为了解决传统的概念漂移检测方法,仅依赖错误率进行漂移检测不可靠的问题,提出一种基于图结构的概念漂移检测方法。该方法使用k关联最优图表示当前数据分布,定义样本的漂移率表示分类器与当前数据分布的不一致性,利用漂移率形成比特流,使用概念漂移检测器在比特流上检测概念漂移。通过与传统的使用错误率的概念漂移检测方法的对比和分析,结果表明在人工数据集上基分类器的准确率提高1%~5%,在真实数据集上提高1%~2%。所提出的方法有效提高概念漂移检测的准确性,帮助基分类器更好适应概念漂移。 展开更多
关键词 数据挖掘 数据流 概念漂移 图结构 k关联最优图
原文传递
一种适用数据流概念漂移检测与适应的增量密度聚类算法
18
作者 陆昊阳 范玉雷 +1 位作者 高楠 杨良怀 《电子学报》 北大核心 2025年第6期2050-2062,共13页
为处理随时间不断演化、非平稳数据流中的概念漂移问题,本文提出一种适用数据流概念漂移检测和适应的增量密度聚类算法(InCremental Density-based Clustering algorithm,ICDC).ICDC改进了1次遍历聚类框架,采用惰性方式处理离群点,由新... 为处理随时间不断演化、非平稳数据流中的概念漂移问题,本文提出一种适用数据流概念漂移检测和适应的增量密度聚类算法(InCremental Density-based Clustering algorithm,ICDC).ICDC改进了1次遍历聚类框架,采用惰性方式处理离群点,由新达数据触发离群点评估,以区分潜在微簇和噪声;聚类过程中要求数据点和微簇满足特征依赖及时序依赖的条件,有效去除离群点集中的异常值,克服了现有离群点处理方式中因异常点的加入导致类簇结构以不可逆转方式持续恶化的情形;设计了一种离群点生命周期调节机制,有效控制缓存大小的增长;以类簇结构变化作为概念漂移指示器,设计了相应检测算法,提升了增量密度聚类算法对数据流演变过程中局部模式和全局模式变化的敏感性.在多个真实和合成数据集上对数据流聚类质量及聚类性能、概念漂移检测和适应、算法的内存开销和计算开销等方面开展实验,结果表明,该算法在大多数数据集上的聚类结果都优于现有算法,同时能够有效检测概念漂移. 展开更多
关键词 概念漂移 增量聚类 密度聚类 数据流
在线阅读 下载PDF
基于GBDT和双层漂移检测的用户评论分类算法 被引量:1
19
作者 章涂义 刘三民 《湖北民族大学学报(自然科学版)》 2025年第1期60-66,共7页
为应对用户评论数据流中的概念漂移问题并提高算法的准确率,提出基于梯度提升决策树(gradient boosted decision tree, GBDT)和双层漂移检测(GBDT with double-layer drift detection, GBDT-D3)的用户评论分类算法。首先,通过计算GBDT... 为应对用户评论数据流中的概念漂移问题并提高算法的准确率,提出基于梯度提升决策树(gradient boosted decision tree, GBDT)和双层漂移检测(GBDT with double-layer drift detection, GBDT-D3)的用户评论分类算法。首先,通过计算GBDT算法中的损失改进比率快速检测潜在漂移。接着,在漂移警告基础上监测数据块中样本质心的移动情况,以精确验证漂移。然后,通过双层漂移检测机制降低用户评论数据流中的漂移误报与漏报,同时增强对动态文本数据流的分类。最后,根据双层漂移检测报告更新GBDT算法,提升分类算法的稳定性。在7个真实用户兴趣漂移文本数据集上开展实验,结果表明GBDT-D3算法在分类准确性和性能稳定性方面明显优于传统在线集成学习算法。GBDT-D3算法能够高效识别用户评论数据流中的概念漂移并增强分类精度,为动态文本数据流的分类任务提供了有效解决方案。 展开更多
关键词 文本数据流分类 概念漂移检测 用户评论 梯度提升决策树 数据分布
在线阅读 下载PDF
基于本地漂移和多样性算力的联邦学习优化算法
20
作者 张一鸣 曹腾飞 《计算机应用》 北大核心 2025年第5期1447-1454,共8页
针对联邦学习(FL)在边缘计算应用中所面临的非独立同分布(non-IID)数据和异构算力挑战,为了避免non-IID数据导致客户端模型更新出现较大偏差,从而引发模型不稳定的收敛,引入本地漂移变量的概念;并通过校正本地模型参数,将本地训练过程... 针对联邦学习(FL)在边缘计算应用中所面临的非独立同分布(non-IID)数据和异构算力挑战,为了避免non-IID数据导致客户端模型更新出现较大偏差,从而引发模型不稳定的收敛,引入本地漂移变量的概念;并通过校正本地模型参数,将本地训练过程与全局聚合过程分离,优化FL在non-IID数据训练过程中的性能。此外,鉴于边缘服务器算力的多样性,提出一种新的策略:从全局模型中划分出一个简化的神经网络子模型下发给算力受限的边缘服务器进行训练,而高算力的边缘服务器则使用整个全局模型进行训练;低算力边缘服务器训练所得的参数将上传至云服务器,通过冻结部分参数提高整个模型的拟合速度。结合以上2种方法,提出一种基于本地漂移和多样性算力的联邦学习优化算法(FedLD),旨在解决联邦学习在边缘计算应用中所面临的non-IID数据和多样性算力带来的异构挑战。实验结果表明,FedLD比FedAvg、SCAFFOLD和FedProx算法收敛更快、准确率更高,相较于FedProx,在50个客户端参与训练时,FedLD在MNIST、CIFAR-10和CIFAR-100数据集上分别将模型准确率提升了0.39%、3.68%和15.24%;与最新的FedProc算法相比,FedLD通信开销更低;在K最近邻(KNN)算法、长短期记忆(LSTM)模型和双向门控循环单元(GRU)模型上的对比实验结果也表明,结合FedLD后,这3种模型的预测精度均有约1%的提升。 展开更多
关键词 联邦学习 边缘计算 异构性 非独立同分布数据 客户端漂移 多样性算力
在线阅读 下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部