期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
Drift DetectionMethod Using DistanceMeasures and Windowing Schemes for Sentiment Classification
1
作者 Idris Rabiu Naomie Salim +3 位作者 Maged Nasser Aminu Da’u Taiseer Abdalla Elfadil Eisa Mhassen Elnour Elneel Dalam 《Computers, Materials & Continua》 SCIE EI 2023年第3期6001-6017,共17页
Textual data streams have been extensively used in practical applications where consumers of online products have expressed their views regarding online products.Due to changes in data distribution,commonly referred t... Textual data streams have been extensively used in practical applications where consumers of online products have expressed their views regarding online products.Due to changes in data distribution,commonly referred to as concept drift,mining this data stream is a challenging problem for researchers.The majority of the existing drift detection techniques are based on classification errors,which have higher probabilities of false-positive or missed detections.To improve classification accuracy,there is a need to develop more intuitive detection techniques that can identify a great number of drifts in the data streams.This paper presents an adaptive unsupervised learning technique,an ensemble classifier based on drift detection for opinion mining and sentiment classification.To improve classification performance,this approach uses four different dissimilarity measures to determine the degree of concept drifts in the data stream.Whenever a drift is detected,the proposed method builds and adds a new classifier to the ensemble.To add a new classifier,the total number of classifiers in the ensemble is first checked if the limit is exceeded before the classifier with the least weight is removed from the ensemble.To this end,a weighting mechanism is used to calculate the weight of each classifier,which decides the contribution of each classifier in the final classification results.Several experiments were conducted on real-world datasets and the resultswere evaluated on the false positive rate,miss detection rate,and accuracy measures.The proposed method is also compared with the state-of-the-art methods,which include DDM,EDDM,and PageHinkley with support vector machine(SVM)and Naive Bayes classifiers that are frequently used in concept drift detection studies.In all cases,the results show the efficiency of our proposed method. 展开更多
关键词 data streams sentiment analysis concept drift ensemble classification adaptive window
在线阅读 下载PDF
An ensemble method for data stream classification in the presence of concept drift 被引量:3
2
作者 Omid ABBASZADEH Ali AMIRI Ali Reza KHANTEYMOORI 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2015年第12期1059-1068,共10页
One recent area of interest in computer science is data stream management and processing. By ‘data stream', we refer to continuous and rapidly generated packages of data. Specific features of data streams are imm... One recent area of interest in computer science is data stream management and processing. By ‘data stream', we refer to continuous and rapidly generated packages of data. Specific features of data streams are immense volume, high production rate, limited data processing time, and data concept drift; these features differentiate the data stream from standard types of data. An issue for the data stream is classification of input data. A novel ensemble classifier is proposed in this paper. The classifier uses base classifiers of two weighting functions under different data input conditions. In addition, a new method is used to determine drift, which emphasizes the precision of the algorithm. Another characteristic of the proposed method is removal of different numbers of the base classifiers based on their quality. Implementation of a weighting mechanism to the base classifiers at the decision-making stage is another advantage of the algorithm. This facilitates adaptability when drifts take place, which leads to classifiers with higher efficiency. Furthermore, the proposed method is tested on a set of standard data and the results confirm higher accuracy compared to available ensemble classifiers and single classifiers. In addition, in some cases the proposed classifier is faster and needs less storage space. 展开更多
关键词 data stream Classificaion ensemble classifiers concept drift
原文传递
基于加权与动态选择的不平衡数据流分类算法
3
作者 韩萌 李春鹏 +3 位作者 李昂 孟凡兴 何菲菲 张瑞华 《计算机工程与应用》 北大核心 2025年第10期79-95,共17页
在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别... 在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别不平衡比和概念漂移等实际挑战,会极大地降低分类器的性能。针对这些问题,提出了一种基于加权与动态选择的不平衡数据流分类算法(sample difficulty weighting and dynamic ensemble selection,SDW-DES),通过综合考虑样本难度和数据动态性,为实时应用提供可靠解决方案。引入一种基于样本分类难度的加权策略,结合样本的边际值和Focal Loss,以更有效地关注易分类错误的样本和少数类样本,从而提高分类器的准确性。提出一种灵活的动态集成选择方法,通过设计样本滑动窗口和困难样本滑动窗口,来综合分析分类器在不同窗口上的表现并加权,选出集成中最好的分类器进行预测,以适应数据分布的动态变化。在多种数据流环境和评估指标上与9种先进的算法进行了全面的实验评估,实验结果表明SDW-DES在4个评估指标中平均排名第一,并且更能够适应数据流中的不平衡和概念漂移问题。 展开更多
关键词 数据流分类 多类不平衡 概念漂移 样本加权 动态集成选择
在线阅读 下载PDF
基于主动−被动增量集成的概念漂移适应方法 被引量:1
4
作者 祁晓博 陈佳明 +3 位作者 史颖 亓慧 郭虎升 王文剑 《自动化学报》 北大核心 2025年第5期1131-1144,共14页
数据流是一组随时间连续到来的数据序列,在数据流不断产生的过程中,由于各种因素的影响,数据分布随时间推移可能以不可预测的方式发生变化,这种现象称为概念漂移.在漂移发生后,当前模型需要及时响应数据流中的实时分布变化,并有效处理... 数据流是一组随时间连续到来的数据序列,在数据流不断产生的过程中,由于各种因素的影响,数据分布随时间推移可能以不可预测的方式发生变化,这种现象称为概念漂移.在漂移发生后,当前模型需要及时响应数据流中的实时分布变化,并有效处理不同类型的概念漂移,从而避免模型泛化性能下降.针对这一问题,提出一种基于主动–被动增量集成的概念漂移适应方法(CDAM-APIE).该方法首先使用在线增量集成策略构建被动集成模型,对新样本进行实时预测以动态更新基模型权重,有利于快速响应数据分布的瞬时变化,并增强模型适应概念漂移的能力.在此基础上,利用增量学习和概念漂移检测技术构建主动基模型,提升模型在平稳数据流状态下的鲁棒性和漂移后的泛化性能.实验结果表明,CDAMAPIE能够对概念漂移做出及时响应,同时有效提高模型的泛化性能. 展开更多
关键词 概念漂移 数据流分类 增量学习 在线集成
在线阅读 下载PDF
A Classifier Using Online Bagging Ensemble Method for Big Data Stream Learning 被引量:6
5
作者 Yanxia Lv Sancheng Peng +4 位作者 Ying Yuan Cong Wang Pengfei Yin Jiemin Liu Cuirong Wang 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2019年第4期379-388,共10页
By combining multiple weak learners with concept drift in the classification of big data stream learning, the ensemble learning can achieve better generalization performance than the single learning approach. In this ... By combining multiple weak learners with concept drift in the classification of big data stream learning, the ensemble learning can achieve better generalization performance than the single learning approach. In this paper,we present an efficient classifier using the online bagging ensemble method for big data stream learning. In this classifier, we introduce an efficient online resampling mechanism on the training instances, and use a robust coding method based on error-correcting output codes. This is done in order to reduce the effects of correlations between the classifiers and increase the diversity of the ensemble. A dynamic updating model based on classification performance is adopted to reduce the unnecessary updating operations and improve the efficiency of learning.We implement a parallel version of EoBag, which runs faster than the serial version, and results indicate that the classification performance is almost the same as the serial one. Finally, we compare the performance of classification and the usage of resources with other state-of-the-art algorithms using the artificial and the actual data sets, respectively. Results show that the proposed algorithm can obtain better accuracy and more feasible usage of resources for the classification of big data stream. 展开更多
关键词 big data STREAM classification ONLINE BAGGING ensemble LEARNING concept drift
原文传递
一种面向不平衡数据流的动态加权集成学习算法
6
作者 江军 于化龙 《电子设计工程》 2025年第8期17-21,共5页
概念漂移现象的出现会极大影响在线学习模型的性能,特别是当数据的分布还不均衡时,模型的性能往往会受到更大的影响。针对上述问题,提出了一种面向不平衡数据流的动态加权集成增量学习算法(Incremental Dynamic Weighted Ensemble,IDWE)... 概念漂移现象的出现会极大影响在线学习模型的性能,特别是当数据的分布还不均衡时,模型的性能往往会受到更大的影响。针对上述问题,提出了一种面向不平衡数据流的动态加权集成增量学习算法(Incremental Dynamic Weighted Ensemble,IDWE),该算法可同时兼顾数据流中的分布不均衡和潜在的概念漂移问题。在每个新到达的数据块上,IDWE算法均利用多元高斯一类分类器对其中的少数类样本进行建模,算法在内存中维持固定数量的分类器,根据性能反馈实时更新分类器的决策权重,并根据权重变化对分类器进行动态更新。通过在6个合成数据流和2个真实数据流上进行实验,验证了算法的有效性和优越性,证明了该算法可以有效适应数据分布不均时存在的概念漂移现象。 展开更多
关键词 概念漂移 不平衡数据流 在线学习 动态加权 集成学习
在线阅读 下载PDF
面向非平衡数据流的重采样集成分类方法研究
7
作者 章涂义 刘三民 +2 位作者 陈燕菲 余文韬 朱健 《重庆工商大学学报(自然科学版)》 2025年第3期34-43,共10页
目的类不平衡和概念漂移是数据流分类任务中的两个主要挑战,当它们同时发生时,将显著影响数据流分类算法的性能,因此,针对传统数据流分类算法难以应对类别不平衡和概念漂移同时存在的问题,提出一种专注于非平衡数据流的重采样集成模型... 目的类不平衡和概念漂移是数据流分类任务中的两个主要挑战,当它们同时发生时,将显著影响数据流分类算法的性能,因此,针对传统数据流分类算法难以应对类别不平衡和概念漂移同时存在的问题,提出一种专注于非平衡数据流的重采样集成模型。方法首先,设计一种适用于数据流的边界过采样方法,利用三角形重心的特点,在边界样本内侧合成新样本,使得块中的少数类得到增强的同时,尽可能保持数据原有分布并且避免引入新的概念,有效改善数据块中类别不平衡情况;在此基础上,融合时间衰减策略和加权集成策略,设计基于马修斯相关系数作为权重的动态加权集成模型,解决概念漂移问题,同时增强分类挖掘模型的自适应性和健壮性。结果在3个真实数据流和6个模拟数据流上的仿真实验结果表明:所提方法在非平衡数据流场景中,展现出对多数类和少数类均有高效的识别能力,并且对突变和增量概念漂移都具有更好的漂移感知和适应能力,分类模型整体性能优于对比算法。结论实验验证:所提方法构建出一种鲁棒的非平衡数据流分类模型,在处理非平衡数据流和适应两种类型的概念漂移方面具有更好的优势。 展开更多
关键词 非平衡数据流 概念漂移 集成学习 马修斯相关系数
在线阅读 下载PDF
一种不平衡数据流集成分类模型 被引量:24
8
作者 欧阳震诤 罗建书 +1 位作者 胡东敏 吴泉源 《电子学报》 EI CAS CSCD 北大核心 2010年第1期184-189,共6页
针对不平衡数据流的分类问题,结合基于权重的集成分类器与抽样技术,本文提出了一种处理不平衡数据流集成分类器模型.理论分析与实验验证表明,该集成分类器具有更低的计算复杂度,更能适应存在概念漂移的不平衡数据流挖掘分类,其整体分类... 针对不平衡数据流的分类问题,结合基于权重的集成分类器与抽样技术,本文提出了一种处理不平衡数据流集成分类器模型.理论分析与实验验证表明,该集成分类器具有更低的计算复杂度,更能适应存在概念漂移的不平衡数据流挖掘分类,其整体分类性能优于基于权重的集成分类器模型,能明显提升少数类的分类精度. 展开更多
关键词 分类 集成分类器 不平衡数据流 概念漂移
在线阅读 下载PDF
基于信息熵的数据流自适应集成分类算法 被引量:10
9
作者 孙艳歌 王志海 +1 位作者 原继东 白洋 《中国科学技术大学学报》 CAS CSCD 北大核心 2017年第7期575-582,共8页
数据流分类模型是面向连续变化的实时分析的基本问题.目前大多数的数据流算法只针对突变式或渐变式概念漂移进行处理的,并未充分考虑概念会重现的特点.为此提出了一种具有概念漂移检测机制的自适应集成算法.从信息熵的角度出发,用Jensen... 数据流分类模型是面向连续变化的实时分析的基本问题.目前大多数的数据流算法只针对突变式或渐变式概念漂移进行处理的,并未充分考虑概念会重现的特点.为此提出了一种具有概念漂移检测机制的自适应集成算法.从信息熵的角度出发,用Jensen-Shannon散度度量相邻两个窗口间数据分布的距离,不仅能检测出不同类型的概念漂移,且能有效地发现重现的概念;采用分类器池机制来保存历史概念,从而实现对概念的重用.将所提出的算法与几种经典的学习算法在人工合成和真实数据集上进行了广泛的对比实验.实验结果表明,所提出的算法在平均分类准确率上具有明显的优势,比其他集成算法消耗更少的时间,适合多种类型概念漂移的环境,并具有较高的抗噪性. 展开更多
关键词 数据流 概念漂移 集成分类器 信息熵 重复概念
在线阅读 下载PDF
数据流上概念漂移的检测和分类 被引量:9
10
作者 柴玉梅 周驰 王黎明 《小型微型计算机系统》 CSCD 北大核心 2011年第3期421-425,共5页
挖掘带有概念漂移的数据流对于许多实时决策是十分重要的.本文使用统计学理论估计某一确定模型在最新概念上的真实错误率的置信区间,在一定概率保证下检测数据流中是否发生了概念漂移,并将此方法和KMM(核平均匹配)算法引入集成分类器框... 挖掘带有概念漂移的数据流对于许多实时决策是十分重要的.本文使用统计学理论估计某一确定模型在最新概念上的真实错误率的置信区间,在一定概率保证下检测数据流中是否发生了概念漂移,并将此方法和KMM(核平均匹配)算法引入集成分类器框架中,提出一种数据流分类的新算法WSEC.在仿真和真实数据流上的试验结果表明该算法是有效的. 展开更多
关键词 概念漂移 数据流挖掘 分类 集成
在线阅读 下载PDF
面向噪音和概念漂移数据流的集成分类算法 被引量:8
11
作者 王中心 孙刚 王浩 《小型微型计算机系统》 CSCD 北大核心 2016年第7期1445-1449,共5页
隐含概念漂移的数据流分类问题是数据挖掘领域研究的热点之一,而实际数据流中的噪音会影响数据流的分类质量,为此,提出一种面向噪音和概念漂移数据流的集成分类算法.该算法使用支持向量机作为基分类器,采用贝叶斯分类器过滤噪音,利用Hoe... 隐含概念漂移的数据流分类问题是数据挖掘领域研究的热点之一,而实际数据流中的噪音会影响数据流的分类质量,为此,提出一种面向噪音和概念漂移数据流的集成分类算法.该算法使用支持向量机作为基分类器,采用贝叶斯分类器过滤噪音,利用Hoeffding Bounds不等式确定的双阈值检测概念漂移,并动态地更新分类模型以适应数据流环境的变化.实验结果表明,本文提出的算法可以有效地跟踪检测含噪数据流中的概念漂移,并且具有较好的分类精度. 展开更多
关键词 数据流 噪音 概念漂移 分类 集成模型
在线阅读 下载PDF
数据流滑动窗口方式下的自适应集成分类算法 被引量:4
12
作者 孙艳歌 王志海 +1 位作者 原继东 韩萌 《北京交通大学学报》 CAS CSCD 北大核心 2016年第5期9-15,共7页
针对基于数据块的集成算法,存在数据块大小影响分类效果,且不能及时应对完整式概念漂移的问题,提出了一种考虑数据流局部特征的和能应对多种类型概念漂移的集成分类算法.用滑动窗口作为概念漂移检测器,当检测到概念漂移时,则建立新的分... 针对基于数据块的集成算法,存在数据块大小影响分类效果,且不能及时应对完整式概念漂移的问题,提出了一种考虑数据流局部特征的和能应对多种类型概念漂移的集成分类算法.用滑动窗口作为概念漂移检测器,当检测到概念漂移时,则建立新的分类器并加入到集成分类器中.本文提出的算法在人工合成和真实数据集上与经典算法进行了广泛的对比实验.结果表明:提出的算法在分类准确率上具有明显优势,消耗更少的内存,更适合多种类型概念漂移的环境. 展开更多
关键词 数据挖掘 数据流 概念漂移 集成分类器 滑动窗口
在线阅读 下载PDF
一种面向不平衡数据流的集成分类算法 被引量:4
13
作者 孙艳歌 王志海 白洋 《小型微型计算机系统》 CSCD 北大核心 2018年第6期1178-1183,共6页
大部分数据流算法都是基于类分布大致平衡这一假设的,然而在现实世界中数据流中类的分布往往是不平衡的.同时,数据流中目标概念可能会随着时间发生变化,即概念漂移.本文针对数据流中的概念漂移和类不平衡问题,提出了一种基于集成的不平... 大部分数据流算法都是基于类分布大致平衡这一假设的,然而在现实世界中数据流中类的分布往往是不平衡的.同时,数据流中目标概念可能会随着时间发生变化,即概念漂移.本文针对数据流中的概念漂移和类不平衡问题,提出了一种基于集成的不平衡数据流分类算法.在分类之前加入采样方法应对类不平衡问题,并采取有效的基分类器更新和加权策略应对概念漂移现象,从而提高分类器的性能.针对本文所提出的算法,和几种经典学习算法,在人工合成和真实数据集上进行了广泛的对比实验.实验结果表明本文所提出的算法,其整体分类性能优于其他算法,更能适应存在概念漂移和类不平衡的数据流环境. 展开更多
关键词 数据流 概念漂移 集成分类 类不平衡
在线阅读 下载PDF
结合无监督学习的数据流分类算法 被引量:10
14
作者 徐树良 王俊红 《模式识别与人工智能》 EI CSCD 北大核心 2016年第7期665-672,共8页
为了能有效应对数据流中的概念漂移现象,提出结合无监督学习的数据流分类算法.该算法以集成式分类技术为基础,在分类过程中引入属性约简,利用聚类算法对数据进行聚类,通过对比分类和聚类结果的准确率,判断是否发生概念漂移.实验表明,文... 为了能有效应对数据流中的概念漂移现象,提出结合无监督学习的数据流分类算法.该算法以集成式分类技术为基础,在分类过程中引入属性约简,利用聚类算法对数据进行聚类,通过对比分类和聚类结果的准确率,判断是否发生概念漂移.实验表明,文中算法在综合时间花销和准确率上取得较好效果. 展开更多
关键词 数据流 概念漂移 集成式分类 属性约简 无监督学习
在线阅读 下载PDF
基于实例加权方法的概念漂移问题研究 被引量:5
15
作者 胡学钢 潘春香 《计算机工程与应用》 CSCD 北大核心 2008年第21期188-191,共4页
数据流上的漂移概念发现已成为数据挖掘领域的研究热点之一。针对存在概念漂移的数据流分类问题,提出一种基于实例加权方法的数据流分类算法(EWAMDS),根据基分类器在训练实例上的分类结果调整该实例的权值,以增强漂移实例在新分类器中... 数据流上的漂移概念发现已成为数据挖掘领域的研究热点之一。针对存在概念漂移的数据流分类问题,提出一种基于实例加权方法的数据流分类算法(EWAMDS),根据基分类器在训练实例上的分类结果调整该实例的权值,以增强漂移实例在新分类器中的影响,同时引入动态的权值修改因子以提高算法的适应性。实验结果表明,动态地调整实例的权值时算法的适应性更强;与weighted-bagging相比,EWAMDS的时间开销显著降低、分类正确率显著提高。 展开更多
关键词 数据流 概念漂移 集成分类器 分类
在线阅读 下载PDF
一种基于分类器相似性集成的数据流分类研究 被引量:2
16
作者 刘余霞 吕虹 刘三民 《计算机科学》 CSCD 北大核心 2012年第12期208-210,共3页
数据流分类已成为当前研究热点之一,如何解决其中的概念漂移和噪声是关键问题,为此提出了一种新的基于分类器相似性的动态集成算法。由于数据流中相邻数据具有相同概念的概率较大,因此用最新基分类器代表数据流中即将出现的概念,同时基... 数据流分类已成为当前研究热点之一,如何解决其中的概念漂移和噪声是关键问题,为此提出了一种新的基于分类器相似性的动态集成算法。由于数据流中相邻数据具有相同概念的概率较大,因此用最新基分类器代表数据流中即将出现的概念,同时基于此分类器求出基分类器之间的相似性作为权值进行加权多数投票,并根据相似性大小淘汰较弱基分类器以适应概念漂移和噪声。在标准仿真数据集上进行了仿真实验,结果表明该算法相比其他集成方法在抗噪性能和分类准确性方面均得到显著提高。 展开更多
关键词 概念漂移 相似性 集成学习 数据流分类 加权多数投票
在线阅读 下载PDF
融合分类器可信度的数据流集成分类 被引量:1
17
作者 刘三民 刘涛 +3 位作者 王忠群 修宇 刘余霞 孟超 《应用科学学报》 CAS CSCD 北大核心 2017年第2期226-232,共7页
提出基于分类器可信度的权重计算策略,解决动态数据流集成分类中子分类器权重分配难题.该方法充分考虑了所处不同位置样本对权重计算的影响,利用信息熵描述分类器对预测结果的不确定性,建立分类器可信度与样本之间的关系,进而给出分类... 提出基于分类器可信度的权重计算策略,解决动态数据流集成分类中子分类器权重分配难题.该方法充分考虑了所处不同位置样本对权重计算的影响,利用信息熵描述分类器对预测结果的不确定性,建立分类器可信度与样本之间的关系,进而给出分类器可信度的定量计算方法.最后结合动态数据流分类需求和概念漂移特点,借助批量学习和时间遗忘策略构建基于分类器可信度的动态加权集成分类模型.理论分析和实验结果表明该分类方案可行,相比传统集中方法具有一定的优势. 展开更多
关键词 数据流分类 集成学习 可信度 概念漂移
在线阅读 下载PDF
概念漂移数据流半监督分类综述 被引量:16
18
作者 文益民 刘帅 +2 位作者 缪裕青 易新河 刘长杰 《软件学报》 EI CSCD 北大核心 2022年第4期1287-1314,共28页
在开放环境下,数据流具有数据高速生成、数据量无限和概念漂移等特性.在数据流分类任务中,利用人工标注产生大量训练数据的方式昂贵且不切实际.包含少量有标记样本和大量无标记样本且还带概念漂移的数据流给机器学习带来了极大挑战.然而... 在开放环境下,数据流具有数据高速生成、数据量无限和概念漂移等特性.在数据流分类任务中,利用人工标注产生大量训练数据的方式昂贵且不切实际.包含少量有标记样本和大量无标记样本且还带概念漂移的数据流给机器学习带来了极大挑战.然而,现有研究主要关注有监督的数据流分类,针对带概念漂移的数据流的半监督分类的研究尚未引起足够的重视.因此,在全面收集数据流半监督分类研究工作的基础上,对现有带概念漂移的数据流的半监督分类算法进行了多角度划分;并以算法采用的分类器类型为线索,对已有的多个算法进行了介绍与总结,包括现有数据流半监督分类采用的概念漂移检测方法;在一些被广泛使用的真实数据集和人工数据集上,对部分代表性数据流半监督分类算法进行了多方面的比较与分析;最后,提出了当前概念漂移数据流半监督分类中一些值得进一步深入探讨的问题.实验结果表明:数据流半监督分类算法的分类准确率与众多因素有关,但与数据分布的变化关系最大.本综述将有助于感兴趣的研究者快速进入数据流半监督分类问题领域. 展开更多
关键词 数据挖掘 概念漂移 数据流 集成学习 半监督分类
在线阅读 下载PDF
基于概念漂移检测的数据流集成分类 被引量:3
19
作者 张宝菊 陈一迪 薛磊 《天津师范大学学报(自然科学版)》 CAS 北大核心 2019年第1期76-80,共5页
提出一种概念漂移的并行检测机制及数据流集成分类系统.该系统从错误率和漂移度2个方面周期性地并行检测数据流,并利用Choquet模糊积分辅助构建集成分类器,动态调整每个分类器的权重,从而在保证分类准确性的同时,自适应不断变化的数据... 提出一种概念漂移的并行检测机制及数据流集成分类系统.该系统从错误率和漂移度2个方面周期性地并行检测数据流,并利用Choquet模糊积分辅助构建集成分类器,动态调整每个分类器的权重,从而在保证分类准确性的同时,自适应不断变化的数据流环境.在公开数据集上进行实验,并与已有算法进行比较,实验结果表明所提算法在分类性能和应对新概念能力方面均优于其他算法. 展开更多
关键词 数据流 概念漂移 CHOQUET模糊积分 集成分类
在线阅读 下载PDF
基于串行交叉混合集成的概念漂移检测及收敛方法 被引量:2
20
作者 郭虎升 高淑花 王文剑 《数据采集与处理》 CSCD 北大核心 2022年第5期997-1011,共15页
概念漂移处理大多采用集成学习策略,然而这些方法多数不能及时提取漂移发生后新分布数据的关键信息,导致模型性能较差。针对这个问题,本文提出一种基于串行交叉混合集成的概念漂移检测及收敛方法(Concept drift detection and convergen... 概念漂移处理大多采用集成学习策略,然而这些方法多数不能及时提取漂移发生后新分布数据的关键信息,导致模型性能较差。针对这个问题,本文提出一种基于串行交叉混合集成的概念漂移检测及收敛方法(Concept drift detection and convergence method based on hybrid ensemble of serial and cross,SC_ensemble)。在流数据处于平稳状态下,该方法通过构建串行基分类器进行集成,以提取代表数据整体分布的有效信息。概念漂移发生后,在漂移节点附近构建并行的交叉基分类器进行集成,提取代表最新分布数据的局部有效信息。通过串行基分类器和交叉基分类器的混合集成,该方法兼顾了流数据包含的整体分布信息,又强化了概念漂移发生时的重要局部信息,使集成模型中包含了较多“好而不同”的基学习器,实现了漂移发生后学习模型的高效融合。实验结果表明,该方法可使在线学习模型在漂移发生后快速收敛,提高了模型的泛化性能。 展开更多
关键词 流数据 概念漂移 集成学习 串行分类器 交叉分类器 混合集成
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部