期刊文献+
共找到192篇文章
< 1 2 10 >
每页显示 20 50 100
Vertical redistribution of drifting benthic invertebrates in the Kedrovaya River, Primorsky Region of Russia
1
作者 Maxim V. Astakhov Victor V. Bogatov 《Open Journal of Ecology》 2014年第2期53-59,共7页
The vertical distribution of morphologically different drifting invertebrates (mayfly and dipteran larvae) in a small salmon river was studied. Drifting invertebrates were caught with the Astakhov’s sampler equipped ... The vertical distribution of morphologically different drifting invertebrates (mayfly and dipteran larvae) in a small salmon river was studied. Drifting invertebrates were caught with the Astakhov’s sampler equipped with three driftnets placed one above another. The average annual drift rate in different levels of a water column was practically the same, while the drift density decreased from the bottom to the surface. Over the course of 24 hours, the drifting organisms did not show clear preference for a particular water layer. Invertebrates were constantly redistributed between the upper and lower levels at approximately 30 - 90 min intervals. This redistribution appears to be linked to the fact that invertebrates of the same taxa, which entered into water column from different bottom sites become active at different times. 展开更多
关键词 Sampling BENTHOS stream drift VERTICAL Distribution
暂未订购
Two Stream Instability as a Source of Coronal Heating
2
作者 Antony Soosaleon Blesson Jose 《International Journal of Astronomy and Astrophysics》 2015年第2期61-69,共9页
Recent observation of oscillating the two stream instability (TSI) in a solar type III radio bursts and spatial damping of Langmuir oscillations has made this instability as an important candidate to understand the co... Recent observation of oscillating the two stream instability (TSI) in a solar type III radio bursts and spatial damping of Langmuir oscillations has made this instability as an important candidate to understand the coronal heating problem. This instability has been studied by several authors for cold plasma found to be stable for high frequencies (greater than plasma frequency ωp). In this paper, we prove that this instability is unstable for warm plasma for higher frequencies (greater than plasma frequency ωp) and much suitable to study the solar coronal heating problem. We have derived a general dispersion relation for warm plasma and discussed the various methods analyzing the instability conditions. Also, we derived an expression for the growth rate of TSI and analyzed the growth rate for photospheric and coronal plasmas. A very promising result is that the ion temperature is the source of this instability and shifts the growth rate to high frequency region, while the electron temperature does the reverse. TSI shows a high growth rate for a wide frequency range for photosphere plasma, suggesting that the electron precipitation by magnetic reconnection current, acceleration by flares, may be source of TSI in the photosphere. But for corona, these waves are damped to accelerate the ions and further growing of such instability is prohibited due to the high conductivity in coronal plasma. The TSI is a common instability;the theory can be easily modifiable for multi-ion plasmas and will be a useful tool to analyze all the astrophysical problems and industrial devices, too. 展开更多
关键词 CORONAL Heating TWO stream INSTABILITY LANGMUIR Waves Ion Temperature drift Velocity Photosphere Fusion Plasma
在线阅读 下载PDF
基于Kolmogorov不等式的数据流漂移检测方法
3
作者 韩萌 孟凡兴 +3 位作者 李春鹏 张瑞华 何菲菲 丁剑 《计算机工程与应用》 北大核心 2025年第9期102-115,共14页
在现实数据环境中,数据分布经常随着时间推移而变化,该现象称为概念漂移。概念漂移会显著影响原分类模型的性能。因此,当概念漂移出现时,分类模型需及时调整以适应数据分布变化,从而保证学习的有效性。探讨了Kolmogorov不等式在概念漂... 在现实数据环境中,数据分布经常随着时间推移而变化,该现象称为概念漂移。概念漂移会显著影响原分类模型的性能。因此,当概念漂移出现时,分类模型需及时调整以适应数据分布变化,从而保证学习的有效性。探讨了Kolmogorov不等式在概念漂移检测领域的应用潜力。提出了一种基于错误率的Kolmogorov漂移检验策略,利用Kolmogorov不等式设计了概念漂移检测方法,并利用该算法来检测数据流中突然或逐渐出现的概念漂移。提出了一种尾部实例调整策略,减轻了漂移检测样本集中旧实例的影响,从而进一步降低了漂移检测延迟。实验表明,与经典或先进的漂移检测器相比,提出的算法在分类准确率方面表现最佳。在漂移检测性能方面,提出的算法在误检率和检测延迟方面的表现均位于前列,达到了较好的平衡。在运行时间方面也表现出了良好的性能。在上述四个指标的总体比较中优于其他算法,达到了该研究的预期。 展开更多
关键词 概念漂移 漂移检测 数据流 分类 Kolmogorov不等式
在线阅读 下载PDF
基于加权与动态选择的不平衡数据流分类算法
4
作者 韩萌 李春鹏 +3 位作者 李昂 孟凡兴 何菲菲 张瑞华 《计算机工程与应用》 北大核心 2025年第10期79-95,共17页
在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别... 在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别不平衡比和概念漂移等实际挑战,会极大地降低分类器的性能。针对这些问题,提出了一种基于加权与动态选择的不平衡数据流分类算法(sample difficulty weighting and dynamic ensemble selection,SDW-DES),通过综合考虑样本难度和数据动态性,为实时应用提供可靠解决方案。引入一种基于样本分类难度的加权策略,结合样本的边际值和Focal Loss,以更有效地关注易分类错误的样本和少数类样本,从而提高分类器的准确性。提出一种灵活的动态集成选择方法,通过设计样本滑动窗口和困难样本滑动窗口,来综合分析分类器在不同窗口上的表现并加权,选出集成中最好的分类器进行预测,以适应数据分布的动态变化。在多种数据流环境和评估指标上与9种先进的算法进行了全面的实验评估,实验结果表明SDW-DES在4个评估指标中平均排名第一,并且更能够适应数据流中的不平衡和概念漂移问题。 展开更多
关键词 数据流分类 多类不平衡 概念漂移 样本加权 动态集成选择
在线阅读 下载PDF
基于主动−被动增量集成的概念漂移适应方法 被引量:1
5
作者 祁晓博 陈佳明 +3 位作者 史颖 亓慧 郭虎升 王文剑 《自动化学报》 北大核心 2025年第5期1131-1144,共14页
数据流是一组随时间连续到来的数据序列,在数据流不断产生的过程中,由于各种因素的影响,数据分布随时间推移可能以不可预测的方式发生变化,这种现象称为概念漂移.在漂移发生后,当前模型需要及时响应数据流中的实时分布变化,并有效处理... 数据流是一组随时间连续到来的数据序列,在数据流不断产生的过程中,由于各种因素的影响,数据分布随时间推移可能以不可预测的方式发生变化,这种现象称为概念漂移.在漂移发生后,当前模型需要及时响应数据流中的实时分布变化,并有效处理不同类型的概念漂移,从而避免模型泛化性能下降.针对这一问题,提出一种基于主动–被动增量集成的概念漂移适应方法(CDAM-APIE).该方法首先使用在线增量集成策略构建被动集成模型,对新样本进行实时预测以动态更新基模型权重,有利于快速响应数据分布的瞬时变化,并增强模型适应概念漂移的能力.在此基础上,利用增量学习和概念漂移检测技术构建主动基模型,提升模型在平稳数据流状态下的鲁棒性和漂移后的泛化性能.实验结果表明,CDAMAPIE能够对概念漂移做出及时响应,同时有效提高模型的泛化性能. 展开更多
关键词 概念漂移 数据流分类 增量学习 在线集成
在线阅读 下载PDF
有限标签下的非平衡数据流分类方法
6
作者 李艳红 李志华 +2 位作者 郑建兴 白鹤翔 郭鑫 《大数据》 2025年第2期107-126,共20页
数据流分类是数据流挖掘的重要研究内容,其核心任务是从实时到达的数据流中快速捕获概念漂移,并及时调整分类模型。极限学习机具有训练速度快和泛化性能好的优点,然而目前基于极限学习机的数据流分类方法很少可以同时处理数据流中常见... 数据流分类是数据流挖掘的重要研究内容,其核心任务是从实时到达的数据流中快速捕获概念漂移,并及时调整分类模型。极限学习机具有训练速度快和泛化性能好的优点,然而目前基于极限学习机的数据流分类方法很少可以同时处理数据流中常见的多类非平衡、概念漂移、标签成本昂贵的问题。为此,提出了一种有限标签下的非平衡数据流分类方法。该方法定义了预测概率差值与信息熵相结合的样本预测确定性度量,提出了不确定性标签请求策略;定义了基于类不平衡比率和样本预测误差的样本重要性度量;提出了基于概念漂移指数的分类器的更新与重构机制。在6个人工数据流和3个真实数据流上的对比实验表明,本文提出方法的分类性能优于已有的6种数据流分类方法的分类性能。 展开更多
关键词 数据流分类 多类非平衡 极限学习机 概念漂移 标签成本昂贵
在线阅读 下载PDF
基于数据流的漂移性多光斑聚类算法研究
7
作者 申超屹 刘怡 +3 位作者 王雪梅 马蒙蒙 曾晶 刘东升 《激光技术》 北大核心 2025年第5期710-717,共8页
为了降低多接入通信系统误比特率,基于四象限探测器的多目标光斑分辨技术,分析了通信激光光斑数据流的特点,对3种传统聚类算法进行了比较。对在多光斑分辨方面表现出更好综合效果的k均值聚类算法进行了扩展,提出了基于数据流的漂移性多... 为了降低多接入通信系统误比特率,基于四象限探测器的多目标光斑分辨技术,分析了通信激光光斑数据流的特点,对3种传统聚类算法进行了比较。对在多光斑分辨方面表现出更好综合效果的k均值聚类算法进行了扩展,提出了基于数据流的漂移性多光斑聚类算法。首先通过初始聚类自适应选择最优簇数,然后对新光斑数据进行实时漂移检测和聚类,并对算法的分类判决参数进行实时更新。结果表明,该算法解决了光斑漂移下的多光斑分辨问题,光斑分辨精确度相比传统算法有显著提高,稳定在90%以上。该研究提高了通信质量,为多接入通信的实现提供了算法支撑。 展开更多
关键词 光通信 多光斑分辨 数据流聚类 光斑漂移
在线阅读 下载PDF
基于生成式循环网络的伺服系统在线异常检测 被引量:1
8
作者 陈晓 王赞 路辉 《上海航天(中英文)》 2025年第2期157-165,共9页
在线异常检测是确保火箭伺服系统正常运行的关键技术。然而,目前大多数研究未考虑模型部署和应用时存在的概念漂移问题,进而影响检测精度。为此,本文提出一种基于生成式循环网络的伺服系统在线异常检测算法。首先,为建立系统输入输出关... 在线异常检测是确保火箭伺服系统正常运行的关键技术。然而,目前大多数研究未考虑模型部署和应用时存在的概念漂移问题,进而影响检测精度。为此,本文提出一种基于生成式循环网络的伺服系统在线异常检测算法。首先,为建立系统输入输出关系模型,提出深层循环神经网络,该网络通过引入多层记忆单元和跳跃连接,来提升其对数据多尺度时空依赖关系的拟合能力;其次,为缓解概念漂移问题,引入在线学习使模型具有持续学习能力,但也带来了灾难性遗忘问题;最后,为缓解灾难性遗忘问题,提出生成式网络,以生成包含历史数据、整体数据分布信息的回顾数据,使模型学习新数据分布的同时,避免遗忘历史数据。结果表明:基于火箭伺服系统所采集的真实运行数据,消融实验和对比实验证明了提出的算法能有效缓解上述问题,并取得较好的异常检测效果。 展开更多
关键词 伺服系统异常检测 多变量时间序列 流数据 概念漂移 灾难性遗忘
在线阅读 下载PDF
基于图结构的概念漂移检测
9
作者 周彦冰 马士伦 文益民 《山东大学学报(工学版)》 北大核心 2025年第2期88-96,共9页
为了解决传统的概念漂移检测方法,仅依赖错误率进行漂移检测不可靠的问题,提出一种基于图结构的概念漂移检测方法。该方法使用k关联最优图表示当前数据分布,定义样本的漂移率表示分类器与当前数据分布的不一致性,利用漂移率形成比特流,... 为了解决传统的概念漂移检测方法,仅依赖错误率进行漂移检测不可靠的问题,提出一种基于图结构的概念漂移检测方法。该方法使用k关联最优图表示当前数据分布,定义样本的漂移率表示分类器与当前数据分布的不一致性,利用漂移率形成比特流,使用概念漂移检测器在比特流上检测概念漂移。通过与传统的使用错误率的概念漂移检测方法的对比和分析,结果表明在人工数据集上基分类器的准确率提高1%~5%,在真实数据集上提高1%~2%。所提出的方法有效提高概念漂移检测的准确性,帮助基分类器更好适应概念漂移。 展开更多
关键词 数据挖掘 数据流 概念漂移 图结构 k关联最优图
原文传递
一种适用数据流概念漂移检测与适应的增量密度聚类算法
10
作者 陆昊阳 范玉雷 +1 位作者 高楠 杨良怀 《电子学报》 北大核心 2025年第6期2050-2062,共13页
为处理随时间不断演化、非平稳数据流中的概念漂移问题,本文提出一种适用数据流概念漂移检测和适应的增量密度聚类算法(InCremental Density-based Clustering algorithm,ICDC).ICDC改进了1次遍历聚类框架,采用惰性方式处理离群点,由新... 为处理随时间不断演化、非平稳数据流中的概念漂移问题,本文提出一种适用数据流概念漂移检测和适应的增量密度聚类算法(InCremental Density-based Clustering algorithm,ICDC).ICDC改进了1次遍历聚类框架,采用惰性方式处理离群点,由新达数据触发离群点评估,以区分潜在微簇和噪声;聚类过程中要求数据点和微簇满足特征依赖及时序依赖的条件,有效去除离群点集中的异常值,克服了现有离群点处理方式中因异常点的加入导致类簇结构以不可逆转方式持续恶化的情形;设计了一种离群点生命周期调节机制,有效控制缓存大小的增长;以类簇结构变化作为概念漂移指示器,设计了相应检测算法,提升了增量密度聚类算法对数据流演变过程中局部模式和全局模式变化的敏感性.在多个真实和合成数据集上对数据流聚类质量及聚类性能、概念漂移检测和适应、算法的内存开销和计算开销等方面开展实验,结果表明,该算法在大多数数据集上的聚类结果都优于现有算法,同时能够有效检测概念漂移. 展开更多
关键词 概念漂移 增量聚类 密度聚类 数据流
在线阅读 下载PDF
基于GBDT和双层漂移检测的用户评论分类算法 被引量:1
11
作者 章涂义 刘三民 《湖北民族大学学报(自然科学版)》 2025年第1期60-66,共7页
为应对用户评论数据流中的概念漂移问题并提高算法的准确率,提出基于梯度提升决策树(gradient boosted decision tree, GBDT)和双层漂移检测(GBDT with double-layer drift detection, GBDT-D3)的用户评论分类算法。首先,通过计算GBDT... 为应对用户评论数据流中的概念漂移问题并提高算法的准确率,提出基于梯度提升决策树(gradient boosted decision tree, GBDT)和双层漂移检测(GBDT with double-layer drift detection, GBDT-D3)的用户评论分类算法。首先,通过计算GBDT算法中的损失改进比率快速检测潜在漂移。接着,在漂移警告基础上监测数据块中样本质心的移动情况,以精确验证漂移。然后,通过双层漂移检测机制降低用户评论数据流中的漂移误报与漏报,同时增强对动态文本数据流的分类。最后,根据双层漂移检测报告更新GBDT算法,提升分类算法的稳定性。在7个真实用户兴趣漂移文本数据集上开展实验,结果表明GBDT-D3算法在分类准确性和性能稳定性方面明显优于传统在线集成学习算法。GBDT-D3算法能够高效识别用户评论数据流中的概念漂移并增强分类精度,为动态文本数据流的分类任务提供了有效解决方案。 展开更多
关键词 文本数据流分类 概念漂移检测 用户评论 梯度提升决策树 数据分布
在线阅读 下载PDF
基于可扩展子空间学习的数据流聚类方法
12
作者 尹宏伟 倪钰洲 胡文军 《电讯技术》 北大核心 2025年第11期1836-1843,共8页
传统数据流聚类方法缺乏对高维数据的在线降维能力,导致其聚类性能受限。为解决此问题,提出了一种基于可扩展子空间学习的数据流聚类方法(Scalable Subspace Learning for Clustering Data Streams,S2LCStream)。首先,通过可扩展子空间... 传统数据流聚类方法缺乏对高维数据的在线降维能力,导致其聚类性能受限。为解决此问题,提出了一种基于可扩展子空间学习的数据流聚类方法(Scalable Subspace Learning for Clustering Data Streams,S2LCStream)。首先,通过可扩展子空间学习建立历史数据与新增数据之间的投影关系,将新增数据投影至历史数据张成的子空间中,以实时获取其聚类划分。其次,为保持不同时刻聚类划分的准确性,对持续到达的数据流进行数据分布的一致性检测,捕获其中存在的概念漂移,并结合回溯机制对聚类划分进行调整以适应动态变化的数据分布。最后,通过在多个真实数据集上进行测试,验证了所提方法在处理高维数据流的效能。所提方法在保持较高聚类性能的同时,能够高效处理数据流中的概念漂移。 展开更多
关键词 数据流聚类 子空间学习 可扩展子空间学习 概念漂移检测
在线阅读 下载PDF
面向非平衡数据流的重采样集成分类方法研究
13
作者 章涂义 刘三民 +2 位作者 陈燕菲 余文韬 朱健 《重庆工商大学学报(自然科学版)》 2025年第3期34-43,共10页
目的类不平衡和概念漂移是数据流分类任务中的两个主要挑战,当它们同时发生时,将显著影响数据流分类算法的性能,因此,针对传统数据流分类算法难以应对类别不平衡和概念漂移同时存在的问题,提出一种专注于非平衡数据流的重采样集成模型... 目的类不平衡和概念漂移是数据流分类任务中的两个主要挑战,当它们同时发生时,将显著影响数据流分类算法的性能,因此,针对传统数据流分类算法难以应对类别不平衡和概念漂移同时存在的问题,提出一种专注于非平衡数据流的重采样集成模型。方法首先,设计一种适用于数据流的边界过采样方法,利用三角形重心的特点,在边界样本内侧合成新样本,使得块中的少数类得到增强的同时,尽可能保持数据原有分布并且避免引入新的概念,有效改善数据块中类别不平衡情况;在此基础上,融合时间衰减策略和加权集成策略,设计基于马修斯相关系数作为权重的动态加权集成模型,解决概念漂移问题,同时增强分类挖掘模型的自适应性和健壮性。结果在3个真实数据流和6个模拟数据流上的仿真实验结果表明:所提方法在非平衡数据流场景中,展现出对多数类和少数类均有高效的识别能力,并且对突变和增量概念漂移都具有更好的漂移感知和适应能力,分类模型整体性能优于对比算法。结论实验验证:所提方法构建出一种鲁棒的非平衡数据流分类模型,在处理非平衡数据流和适应两种类型的概念漂移方面具有更好的优势。 展开更多
关键词 非平衡数据流 概念漂移 集成学习 马修斯相关系数
在线阅读 下载PDF
基于双缓冲区的概念漂移检测方法
14
作者 李盟 温伍正宏 潘甦 《计算机技术与发展》 2025年第3期103-108,共6页
在数据分析中概念漂移问题是经常发生的,这导致了模型不能适应数据分布的动态变化。针对如何处理流数据中的概念漂移这一问题进行了研究,以提高数据分析性能。为此,在在线序列极限学习机(OS-ELM)与漂移检测方法(DDM)结合(DDM-OS-ELM)的... 在数据分析中概念漂移问题是经常发生的,这导致了模型不能适应数据分布的动态变化。针对如何处理流数据中的概念漂移这一问题进行了研究,以提高数据分析性能。为此,在在线序列极限学习机(OS-ELM)与漂移检测方法(DDM)结合(DDM-OS-ELM)的基础上,提出了双缓冲区(缓冲区A和缓冲区B)方法。DDM-OS-ELM通过结合漂移检测机制和在线序列极限学习机来处理概念漂移,这种方法在检测到概念漂移时就会触发模型更新,在检测过程中,通过双缓冲区解决概念漂移的问题。缓冲区A是解决发生概念漂移后数据量不足导致无法重新训练模型这一问题;缓冲区B收集发生概念漂移后的数据,使模型适应概念漂移后的数据分布。实验结果表明,利用双缓冲区不仅可以减少模型更新次数,还提高了模型预测的精度。 展开更多
关键词 概念漂移 双缓冲区 在线序列极限学习机 漂移检测机制 不确定数据流
在线阅读 下载PDF
一种面向不平衡数据流的动态加权集成学习算法
15
作者 江军 于化龙 《电子设计工程》 2025年第8期17-21,共5页
概念漂移现象的出现会极大影响在线学习模型的性能,特别是当数据的分布还不均衡时,模型的性能往往会受到更大的影响。针对上述问题,提出了一种面向不平衡数据流的动态加权集成增量学习算法(Incremental Dynamic Weighted Ensemble,IDWE)... 概念漂移现象的出现会极大影响在线学习模型的性能,特别是当数据的分布还不均衡时,模型的性能往往会受到更大的影响。针对上述问题,提出了一种面向不平衡数据流的动态加权集成增量学习算法(Incremental Dynamic Weighted Ensemble,IDWE),该算法可同时兼顾数据流中的分布不均衡和潜在的概念漂移问题。在每个新到达的数据块上,IDWE算法均利用多元高斯一类分类器对其中的少数类样本进行建模,算法在内存中维持固定数量的分类器,根据性能反馈实时更新分类器的决策权重,并根据权重变化对分类器进行动态更新。通过在6个合成数据流和2个真实数据流上进行实验,验证了算法的有效性和优越性,证明了该算法可以有效适应数据分布不均时存在的概念漂移现象。 展开更多
关键词 概念漂移 不平衡数据流 在线学习 动态加权 集成学习
在线阅读 下载PDF
基于多分类器的数据流中的概念漂移挖掘 被引量:28
16
作者 孙岳 毛国君 +1 位作者 刘旭 刘椿年 《自动化学报》 EI CSCD 北大核心 2008年第1期93-97,共5页
数据流中概念漂移的检测是当前数据挖掘领域的重要研究分支,近年来得到了广泛的关注.本文提出了一种称为M_ID4的数据流挖掘算法.它是在大容量数据流挖掘中,通过尽量少的训练样本来实现概念漂移检测的快速方法.利用多分类器综合技术,M-ID... 数据流中概念漂移的检测是当前数据挖掘领域的重要研究分支,近年来得到了广泛的关注.本文提出了一种称为M_ID4的数据流挖掘算法.它是在大容量数据流挖掘中,通过尽量少的训练样本来实现概念漂移检测的快速方法.利用多分类器综合技术,M-ID4实现了数据流中概念漂移的增量式检测和挖掘.实验结果表明,MID4算法在处理数据流的概念漂移上表现出比已有同类算法更高的精确度和适应性. 展开更多
关键词 数据挖掘 数据流 概念漂移
在线阅读 下载PDF
一种不平衡数据流集成分类模型 被引量:24
17
作者 欧阳震诤 罗建书 +1 位作者 胡东敏 吴泉源 《电子学报》 EI CAS CSCD 北大核心 2010年第1期184-189,共6页
针对不平衡数据流的分类问题,结合基于权重的集成分类器与抽样技术,本文提出了一种处理不平衡数据流集成分类器模型.理论分析与实验验证表明,该集成分类器具有更低的计算复杂度,更能适应存在概念漂移的不平衡数据流挖掘分类,其整体分类... 针对不平衡数据流的分类问题,结合基于权重的集成分类器与抽样技术,本文提出了一种处理不平衡数据流集成分类器模型.理论分析与实验验证表明,该集成分类器具有更低的计算复杂度,更能适应存在概念漂移的不平衡数据流挖掘分类,其整体分类性能优于基于权重的集成分类器模型,能明显提升少数类的分类精度. 展开更多
关键词 分类 集成分类器 不平衡数据流 概念漂移
在线阅读 下载PDF
基于信息熵的数据流自适应集成分类算法 被引量:10
18
作者 孙艳歌 王志海 +1 位作者 原继东 白洋 《中国科学技术大学学报》 CAS CSCD 北大核心 2017年第7期575-582,共8页
数据流分类模型是面向连续变化的实时分析的基本问题.目前大多数的数据流算法只针对突变式或渐变式概念漂移进行处理的,并未充分考虑概念会重现的特点.为此提出了一种具有概念漂移检测机制的自适应集成算法.从信息熵的角度出发,用Jensen... 数据流分类模型是面向连续变化的实时分析的基本问题.目前大多数的数据流算法只针对突变式或渐变式概念漂移进行处理的,并未充分考虑概念会重现的特点.为此提出了一种具有概念漂移检测机制的自适应集成算法.从信息熵的角度出发,用Jensen-Shannon散度度量相邻两个窗口间数据分布的距离,不仅能检测出不同类型的概念漂移,且能有效地发现重现的概念;采用分类器池机制来保存历史概念,从而实现对概念的重用.将所提出的算法与几种经典的学习算法在人工合成和真实数据集上进行了广泛的对比实验.实验结果表明,所提出的算法在平均分类准确率上具有明显的优势,比其他集成算法消耗更少的时间,适合多种类型概念漂移的环境,并具有较高的抗噪性. 展开更多
关键词 数据流 概念漂移 集成分类器 信息熵 重复概念
在线阅读 下载PDF
基于并行约简的概念漂移探测 被引量:20
19
作者 邓大勇 徐小玉 黄厚宽 《计算机研究与发展》 EI CSCD 北大核心 2015年第5期1071-1079,共9页
数据流挖掘是当前数据挖掘研究的一个热点,概念漂移检测是数据流挖掘的一个重要研究方向.虽然有不少概念漂移的探测方法,但是它们都有一些共同的缺陷:没有整体上删除冗余属性以及利用外部属性去探测概念漂移(比如利用对外部数据的分类... 数据流挖掘是当前数据挖掘研究的一个热点,概念漂移检测是数据流挖掘的一个重要研究方向.虽然有不少概念漂移的探测方法,但是它们都有一些共同的缺陷:没有整体上删除冗余属性以及利用外部属性去探测概念漂移(比如利用对外部数据的分类准确率)等.利用粗糙集和F-粗糙集的基本原理和基本方法,把数据流中的滑动窗口当成决策子表簇,提出了一种对数据流进行并行约简、整体删除冗余属性的方法,并运用并行约简后数据流决策子表簇中属性重要性的变化探测概念漂移现象.与传统的方法不同,新方法利用数据的内部特性对概念漂移进行探测.实验结果显示,该方法能够有效地整体删除冗余属性、探测概念漂移现象,并且基于互信息的属性重要性在概念漂移探测效果方面比基于正区域的属性重要性要好些. 展开更多
关键词 数据流 概念漂移 粗糙集 F-粗糙集 并行约简
在线阅读 下载PDF
基于C4.5和NB混合模型的数据流分类算法 被引量:8
20
作者 李燕 张玉红 胡学钢 《计算机科学》 CSCD 北大核心 2010年第12期138-142,共5页
具有概念漂移的含噪数据流的分类问题成为数据流挖掘领域研究的热点之一。提出了一种基于C4.5和Nave Bayes混合模型的数据流分类算法CDSMM。它以C4.5作为基分类器,采用朴素贝叶斯分类器过滤噪音,同时引入假设检验中的μ检验方法检测... 具有概念漂移的含噪数据流的分类问题成为数据流挖掘领域研究的热点之一。提出了一种基于C4.5和Nave Bayes混合模型的数据流分类算法CDSMM。它以C4.5作为基分类器,采用朴素贝叶斯分类器过滤噪音,同时引入假设检验中的μ检验方法检测概念漂移,动态更新模型。实验结果表明,CDSMM算法在处理带有噪音的概念漂移数据流时具有比同类算法更好的分类正确率。 展开更多
关键词 数据流 概念漂移 分类 噪音
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部