期刊文献+
共找到114篇文章
< 1 2 6 >
每页显示 20 50 100
有限标签下的非平衡数据流分类方法
1
作者 李艳红 李志华 +2 位作者 郑建兴 白鹤翔 郭鑫 《大数据》 2025年第2期107-126,共20页
数据流分类是数据流挖掘的重要研究内容,其核心任务是从实时到达的数据流中快速捕获概念漂移,并及时调整分类模型。极限学习机具有训练速度快和泛化性能好的优点,然而目前基于极限学习机的数据流分类方法很少可以同时处理数据流中常见... 数据流分类是数据流挖掘的重要研究内容,其核心任务是从实时到达的数据流中快速捕获概念漂移,并及时调整分类模型。极限学习机具有训练速度快和泛化性能好的优点,然而目前基于极限学习机的数据流分类方法很少可以同时处理数据流中常见的多类非平衡、概念漂移、标签成本昂贵的问题。为此,提出了一种有限标签下的非平衡数据流分类方法。该方法定义了预测概率差值与信息熵相结合的样本预测确定性度量,提出了不确定性标签请求策略;定义了基于类不平衡比率和样本预测误差的样本重要性度量;提出了基于概念漂移指数的分类器的更新与重构机制。在6个人工数据流和3个真实数据流上的对比实验表明,本文提出方法的分类性能优于已有的6种数据流分类方法的分类性能。 展开更多
关键词 数据流分类 多类非平衡 极限学习机 概念漂移 标签成本昂贵
在线阅读 下载PDF
基于加权与动态选择的不平衡数据流分类算法
2
作者 韩萌 李春鹏 +3 位作者 李昂 孟凡兴 何菲菲 张瑞华 《计算机工程与应用》 北大核心 2025年第10期79-95,共17页
在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别... 在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别不平衡比和概念漂移等实际挑战,会极大地降低分类器的性能。针对这些问题,提出了一种基于加权与动态选择的不平衡数据流分类算法(sample difficulty weighting and dynamic ensemble selection,SDW-DES),通过综合考虑样本难度和数据动态性,为实时应用提供可靠解决方案。引入一种基于样本分类难度的加权策略,结合样本的边际值和Focal Loss,以更有效地关注易分类错误的样本和少数类样本,从而提高分类器的准确性。提出一种灵活的动态集成选择方法,通过设计样本滑动窗口和困难样本滑动窗口,来综合分析分类器在不同窗口上的表现并加权,选出集成中最好的分类器进行预测,以适应数据分布的动态变化。在多种数据流环境和评估指标上与9种先进的算法进行了全面的实验评估,实验结果表明SDW-DES在4个评估指标中平均排名第一,并且更能够适应数据流中的不平衡和概念漂移问题。 展开更多
关键词 数据流分类 多类不平衡 概念漂移 样本加权 动态集成选择
在线阅读 下载PDF
基于数据流的漂移性多光斑聚类算法研究
3
作者 申超屹 刘怡 +3 位作者 王雪梅 马蒙蒙 曾晶 刘东升 《激光技术》 北大核心 2025年第5期710-717,共8页
为了降低多接入通信系统误比特率,基于四象限探测器的多目标光斑分辨技术,分析了通信激光光斑数据流的特点,对3种传统聚类算法进行了比较。对在多光斑分辨方面表现出更好综合效果的k均值聚类算法进行了扩展,提出了基于数据流的漂移性多... 为了降低多接入通信系统误比特率,基于四象限探测器的多目标光斑分辨技术,分析了通信激光光斑数据流的特点,对3种传统聚类算法进行了比较。对在多光斑分辨方面表现出更好综合效果的k均值聚类算法进行了扩展,提出了基于数据流的漂移性多光斑聚类算法。首先通过初始聚类自适应选择最优簇数,然后对新光斑数据进行实时漂移检测和聚类,并对算法的分类判决参数进行实时更新。结果表明,该算法解决了光斑漂移下的多光斑分辨问题,光斑分辨精确度相比传统算法有显著提高,稳定在90%以上。该研究提高了通信质量,为多接入通信的实现提供了算法支撑。 展开更多
关键词 光通信 多光斑分辨 数据流聚类 光斑漂移
在线阅读 下载PDF
基于多维传感数据流的滑坡灾害预警方法 被引量:1
4
作者 郭文帮 郝光耀 +1 位作者 陶虹 陈群 《计算机仿真》 2025年第7期300-306,共7页
目前我国的滑坡灾害预警系统主要通过对单个传感器数据(如雨量计和位移计等)设置阈值实现。一方面,传感器运行过程中经常产生异常数据,导致预警的误报或漏报;另一方面,滑坡灾害往往与多种传感数据均有关联,单一维度的传感数据无法捕捉... 目前我国的滑坡灾害预警系统主要通过对单个传感器数据(如雨量计和位移计等)设置阈值实现。一方面,传感器运行过程中经常产生异常数据,导致预警的误报或漏报;另一方面,滑坡灾害往往与多种传感数据均有关联,单一维度的传感数据无法捕捉全面的信息。现根据滑坡的诱发因素,选取了降雨、地表位移和裂缝等多维的数据流信息,根据多维数据流的关联性特征和时序性特征提出一种融合LSTM的Transformer模型来实现滑坡灾害预警。通过在陕西省内5个滑坡灾害隐患点真实数据上的实验表明,跟现有的机器学习模型相比,提出的方法可以有效提升灾害预警的综合性能,以F1指标衡量提升幅度超过5%。 展开更多
关键词 多维数据流 滑坡灾害预警 机器学习语言模型
在线阅读 下载PDF
无监督多视图特征选择研究进展 被引量:1
5
作者 吴建生 李艳兰 +1 位作者 黄冲 闵卫东 《软件学报》 北大核心 2025年第2期886-914,共29页
多视图数据从不同角度描述数据对象,数据在不同视图中的特征表示之间存在着相关性、互补性及多样性信息.综合利用这些信息对多视图数据处理至关重要.然而,多视图数据通常具有高维度特点,且常含有噪声特征,这为多视图数据的处理与分析带... 多视图数据从不同角度描述数据对象,数据在不同视图中的特征表示之间存在着相关性、互补性及多样性信息.综合利用这些信息对多视图数据处理至关重要.然而,多视图数据通常具有高维度特点,且常含有噪声特征,这为多视图数据的处理与分析带来了许多困难.无监督多视图特征选择无需样本标记信息,从多个视图源的原始高维特征中学习更紧凑、更准确的特征表示以提高数据分析的效果,在多视图数据处理领域起着重要作用.根据已有的无监督多视图特征选择模型的工作机制的异同,对这些模型进行归纳和总结,分析其中存在的不足,并指出未来研究的方向. 展开更多
关键词 多视图数据 无监督特征选择 聚类 结构保持 流数据
在线阅读 下载PDF
应用于流数据的连续多维度广义轮廓查询
6
作者 杨洋 李艳红 +1 位作者 彭亚威 肖梦 《中南民族大学学报(自然科学版)》 2025年第4期546-559,共14页
轮廓运算符自提出以来引起了研究人员的极大兴趣,随后各种轮廓查询的变体不断涌现,其中包括流数据上的子空间轮廓查询.为研究针对实际应用中复杂数据维度的需求,提出了广义轮廓(Genl-Skyline)的概念,并结合现有变体进一步提出了连续多... 轮廓运算符自提出以来引起了研究人员的极大兴趣,随后各种轮廓查询的变体不断涌现,其中包括流数据上的子空间轮廓查询.为研究针对实际应用中复杂数据维度的需求,提出了广义轮廓(Genl-Skyline)的概念,并结合现有变体进一步提出了连续多维度广义轮廓(CMGS)问题.为解决该问题,提出了倒排轮廓支配表(ISDT),引入了嵌套轮廓方案以最小化ISDT结构,以及提出了基于连续数据属性的强弱修剪策略用于数据集剪枝,同时还设计了伴生索引ISDT-BM以支持在ISDT上高效搜索CMGS结果.最后,广泛的对比实验验证了ISDT结构及相关算法在解决CMGS查询问题上的可行性和高效性. 展开更多
关键词 轮廓查询 多维度轮廓 流数据 动态维护
在线阅读 下载PDF
一种面向并发AI数据流边缘处理集群的资源配置算法
7
作者 陈逸飞 陈庆奎 《智能计算机与应用》 2025年第11期1-8,共8页
面对多个AI (Artificial Intelligence)数据流需要并发处理以及边缘处理集群中各个单元的处理能力不同的情况,如何充分利用边缘集群中的各类资源,降低AI数据流任务的处理时间和能耗,是一个具有重要意义的课题。本文设计了一个面向并发A... 面对多个AI (Artificial Intelligence)数据流需要并发处理以及边缘处理集群中各个单元的处理能力不同的情况,如何充分利用边缘集群中的各类资源,降低AI数据流任务的处理时间和能耗,是一个具有重要意义的课题。本文设计了一个面向并发AI数据流的边缘集群架构,并对并发AI数据流以及边缘处理集群中的处理单元资源进行建模,提出了一种面向并发AI数据流边缘处理集群的资源配置算法DLBE-PSO,该算法是基于粒子群的多目标优化算法,采用混沌映射与非线性递减结合的方式来更新权重,提高算法后期的局部搜索能力,同时对任务处理时间、边缘集群能耗、边缘集群负载均衡这3个关键指标进行分析。 展开更多
关键词 并发AI数据流 多目标优化 粒子群 任务处理时间 能耗 负载均衡
在线阅读 下载PDF
水利云环境下多源异构数据流式处理框架研究
8
作者 王娟 舒林新 《软件》 2025年第7期94-96,共3页
随着水利行业对数据处理需求的增长,传统的数据处理方式已无法满足实时性要求。本研究提出了一种基于水利云平台的多源异构数据流式处理框架,通过数据接入、流计算与智能调度技术,提升了多源异构数据的实时处理能力。采用强化学习优化... 随着水利行业对数据处理需求的增长,传统的数据处理方式已无法满足实时性要求。本研究提出了一种基于水利云平台的多源异构数据流式处理框架,通过数据接入、流计算与智能调度技术,提升了多源异构数据的实时处理能力。采用强化学习优化资源调度,实现了数据流的高效处理与实时响应。实验表明,框架在处理延迟、资源利用和系统稳定性方面优于传统方法,具备较强的应用潜力,对水利大数据智能化管理具有重要意义。 展开更多
关键词 水利云平台 多源异构数据 流式处理 数据优化 云资源调度
在线阅读 下载PDF
基于统计推理的多类不平衡数据流集成仿真
9
作者 梁晓波 王一惠 张露 《计算机仿真》 2025年第8期496-500,共5页
多类不平衡数据流是动态变化的,这种动态性使得类别分布可能随时间发生变化,使得多类不平衡数据流集成难度增加。在处理不平衡数据流时,贝叶斯统计推理网络中的贝叶斯分类器可以通过自适应地调整不同类别的权重来平衡分类决策,以此为后... 多类不平衡数据流是动态变化的,这种动态性使得类别分布可能随时间发生变化,使得多类不平衡数据流集成难度增加。在处理不平衡数据流时,贝叶斯统计推理网络中的贝叶斯分类器可以通过自适应地调整不同类别的权重来平衡分类决策,以此为后续的数据流集成奠定重要基础,为此提出了基于统计推理的多类不平衡数据流集成仿真方法。通过过采样方法获取多类不平衡数据流,将多类不平衡数据流输入至贝叶斯统计推理网络中,网络通过调整分类器集成权重、分类器剔除、集成目标函数构建等输出多类不平衡数据流集成结果。通过仿真可知,所提方法的F-value和G-mean值较高,多类不平衡数据流集成效果好。 展开更多
关键词 统计推理 多类不平衡数据流 数据流集成 过采样方法 贝叶斯统计推理网络
在线阅读 下载PDF
融合时空注意力机制与多尺度特征的恶意网络流量深度检测
10
作者 王骞 《无线互联科技》 2025年第23期67-71,共5页
受流量数据复杂性的影响,检测恶意网络流量过程中提取的流量特征集存在高维、冗余等特点,这增加了检测过程中的计算难度,影响了检测结果的准确率。为此,文章提出融合时空注意力机制与多尺度特征的恶意网络流量深度检测。通过引入时空注... 受流量数据复杂性的影响,检测恶意网络流量过程中提取的流量特征集存在高维、冗余等特点,这增加了检测过程中的计算难度,影响了检测结果的准确率。为此,文章提出融合时空注意力机制与多尺度特征的恶意网络流量深度检测。通过引入时空注意力机制,设置时间滑动窗口,对窗口中观察到的数据进行切分,计算切分后数据流的互信息数值,提取具有显著相关性的特征,以构建网络流量时空特征集合。引入多级离散小波变换技术,将小波基函数值输入转换层,结合所得特征集合进行多尺度特征聚合,再添加时空注意力机制,从而得到网络流量特征融合结果。构建恶意网络流量深度检测模型,设置损失函数和分类器,输出检测结果,实现对恶意网络流量的深度检测。对上述设计方法进行实验后,结果显示该方法对恶意网络流量的检测准确率达到89%以上,这表明该方法能够准确检测出恶意网络流量,从而提高网络安全性。 展开更多
关键词 时空注意力机制 多尺度特征 恶意网络流量 滑动窗口 数据流切分
在线阅读 下载PDF
挖掘多数据流的异步偶合模式的抗噪声算法 被引量:6
11
作者 陈安龙 唐常杰 +2 位作者 元昌安 彭京 胡建军 《软件学报》 EI CSCD 北大核心 2006年第8期1753-1763,共11页
挖掘多数据流的异步偶合模式是具有挑战性的工作.主要的研究工作包括:(1)研究Haar小波滤波技术在挖掘流数据的异步偶合模式中的应用;(2)引入小波系数序列来度量数据流的异步局域偶合度;证明了一系列定理,保证了度量方法的正确性;(3)设... 挖掘多数据流的异步偶合模式是具有挑战性的工作.主要的研究工作包括:(1)研究Haar小波滤波技术在挖掘流数据的异步偶合模式中的应用;(2)引入小波系数序列来度量数据流的异步局域偶合度;证明了一系列定理,保证了度量方法的正确性;(3)设计了环形滑动窗口和挖掘异步偶合模式的抗噪声增量算法,其时间复杂性小于O(n2);(4)使用真实数据进行模拟实验,验证了算法的有效性. 展开更多
关键词 多数据流 异步偶合模式 HAAR小波 环形滑动窗口
在线阅读 下载PDF
基于嵌入式平台的公交车辆监控系统 被引量:8
12
作者 林绿洲 陆起涌 +1 位作者 田小芳 杨迎新 《电讯技术》 2006年第3期78-81,共4页
系统基于ARM9嵌入式软硬件平台,整合了GPS(全球定位系统)、GPRS(通用无线分组业务)以及多数据流传感器,实现对公交车辆位置、温度、人数等数据的采集、传输及反馈,提高了公交系统调度效率和增强了安全性。介绍了系统的构成,并给出软硬... 系统基于ARM9嵌入式软硬件平台,整合了GPS(全球定位系统)、GPRS(通用无线分组业务)以及多数据流传感器,实现对公交车辆位置、温度、人数等数据的采集、传输及反馈,提高了公交系统调度效率和增强了安全性。介绍了系统的构成,并给出软硬件的设计方案。 展开更多
关键词 公交监控系统 ARM平台 GPS GPRS 多数据流
在线阅读 下载PDF
基于负载均衡的随机作业流密码服务调度算法 被引量:5
13
作者 李莉 史国振 +2 位作者 耿魁 董秀则 李凤华 《通信学报》 EI CSCD 北大核心 2018年第6期11-19,共9页
针对安全领域业务流并行处理系统面临数据密码服务请求多样,串行工作模式和并行工作模式交叉,不同业务的数据流相互交叉的现状以及服务响应的高速、高可靠性需求的问题,为了提高多密码算法并行处理的效率,以负载均衡为调度目标,在基于... 针对安全领域业务流并行处理系统面临数据密码服务请求多样,串行工作模式和并行工作模式交叉,不同业务的数据流相互交叉的现状以及服务响应的高速、高可靠性需求的问题,为了提高多密码算法并行处理的效率,以负载均衡为调度目标,在基于业务标识的分层硬件调度方法 HHS-ACDID基础上,综合考虑算法处理节点的存储容量和处理速度,设计一种同时支持非关联任务和关联任务的负载均衡作业调度算法,实现了高速的密码处理吞吐率。仿真结果表明,该算法能够完成对数据流系统的动态调度并且得到较优的负载均衡效果,与HHS-ACDID相比,执行效率提高12%左右。 展开更多
关键词 作业调度 并行处理 负载均衡 多密码算法 数据流
在线阅读 下载PDF
基于多维数据流挖掘技术的入侵检测模型与算法 被引量:25
14
作者 毛国君 宗东军 《计算机研究与发展》 EI CSCD 北大核心 2009年第4期602-609,共8页
网络访问数据有着数据流的高速、无穷达到的特点,所以利用传统多遍扫描数据库的挖掘技术来构建入侵检测模型是不可行的.针对网络访问数据流的特点,提出了一种基于多维数据流挖掘技术的入侵检测模型.此模型将传统的误用检测和异常检测两... 网络访问数据有着数据流的高速、无穷达到的特点,所以利用传统多遍扫描数据库的挖掘技术来构建入侵检测模型是不可行的.针对网络访问数据流的特点,提出了一种基于多维数据流挖掘技术的入侵检测模型.此模型将传统的误用检测和异常检测两种入侵检测方法进行有机融合,因此能够克服目前广泛使用的误用检测方法无法检测新的攻击类型的缺点,并且也能够保持检测的高效性.网络访问数据记录的结构是复杂的,一个访问行为总是联系到许多属性,所以分析的难度很大.因此,引入多维频度等概念来解决网络数据流的模式表示和生成问题.同时,针对多维频度模式的特点,提出了一种新型数据结构MaxFP-Tree.在MaxFP-Tree的基础上,给出了一种高效的挖掘网络访问数据流的学习算法MaxFPinNDS.MaxFPinNDS采用衰减机制挖掘,可以快速地形成一个数据流的最近时期数据所隐含的最大频繁项目集.实验表明,设计的入侵检测模型是有效的. 展开更多
关键词 多维数据流 入侵检测 异常检测 误用检测 最大频繁项集
在线阅读 下载PDF
基于多帧数据的目标分群算法 被引量:8
15
作者 龙真真 张策 +1 位作者 吴伟胜 刘飞裔 《计算机工程》 CAS CSCD 北大核心 2009年第23期168-171,共4页
针对在多帧数据条件下的目标分群问题,提出一种基于数据流聚类的动态目标分群算法TG-Stream,该算法由在线和离线2个部分组成。在线部分采用临时存储结构(TSS)和金字塔时间框架保存侦察数据集的概要信息,离线部分采用CNM算法对时间框架... 针对在多帧数据条件下的目标分群问题,提出一种基于数据流聚类的动态目标分群算法TG-Stream,该算法由在线和离线2个部分组成。在线部分采用临时存储结构(TSS)和金字塔时间框架保存侦察数据集的概要信息,离线部分采用CNM算法对时间框架的信息进行聚类,最终得到分群的结果。实验结果表明,TG-Stream具有灵活的精度和效率平衡性,能较好地满足决策辅助系统处理实时信息的需要。 展开更多
关键词 目标分群 多帧数据 数据流聚类 态势估计
在线阅读 下载PDF
面向电力大数据的多数据流实时处理技术研究 被引量:8
16
作者 孟庆强 胡牧 +1 位作者 孙立华 郑浩泉 《计算机与数字工程》 2018年第5期987-991,共5页
随着电力大数据的形成与深化应用,传统数据批处理技术已不能满足当前电网实时应用要求,多源数据的即时获取和实时关联计算已成为制约电力大数据全面应用的关键因素。论文梳理了国内外大数据实时处理的技术发展现状,探讨了电力大数据实... 随着电力大数据的形成与深化应用,传统数据批处理技术已不能满足当前电网实时应用要求,多源数据的即时获取和实时关联计算已成为制约电力大数据全面应用的关键因素。论文梳理了国内外大数据实时处理的技术发展现状,探讨了电力大数据实时处理的应用需求,提出了一种面向多用户的电力大数据流计算服务体系,搭建了电力大数据实时流计算处理平台,以低压用户电量计算为典型应用场景对电力大数据实时计算平台的处理性能进行了验证。 展开更多
关键词 电力大数据 批处理 多数据流 实时处理 流计算
在线阅读 下载PDF
面向大数据流的半监督在线多核学习算法 被引量:8
17
作者 张钢 谢晓珊 +1 位作者 黄英 王春茹 《智能系统学报》 CSCD 北大核心 2014年第3期355-363,共9页
在机器学习中,核函数的选择对核学习器性能有很大的影响,而通过核学习的方法可以得到有效的核函数。提出一种面向大数据流的半监督在线核学习算法,通过当前读取的大数据流片段以在线方式更新当前的核函数。算法通过大数据流的标签对核... 在机器学习中,核函数的选择对核学习器性能有很大的影响,而通过核学习的方法可以得到有效的核函数。提出一种面向大数据流的半监督在线核学习算法,通过当前读取的大数据流片段以在线方式更新当前的核函数。算法通过大数据流的标签对核函数参数进行有监督的调整,同时以无监督的方式通过流形学习对核函数参数进行修改,以使得核函数所体现的等距面尽可能沿着数据的某种低维流形分布。算法的创新性在于能同时进行有监督和无监督的核学习,且不需要对历史数据进行再次扫描,有效降低了算法的时间复杂度,适用于在大数据和高速数据流环境下的核函数学习问题,其对无监督学习的支持有效解决了大数据流中部分标记缺失的问题。在MOA生成的人工数据集以及UCI大数据分析的基准数据集上进行算法有效性的评估,其结果表明该算法是有效的。 展开更多
关键词 大数据流 在线多核学习 流形学习 数据依赖核 半监督学习
在线阅读 下载PDF
分布式实时多数据流的并发协作处理 被引量:2
18
作者 胡侃 刘云生 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第2期55-57,69,共4页
基于C/S模型分析了分布式实时计算环境中多数据流并发处理的事务问题.采用复杂事件驱动技术,设计了一个适于多数据流并发协作处理的事务机制ARTs-MDS,能够自组织地将对分布式实时数据产生作用的并发任务组成一个原子的事务单位.系统维... 基于C/S模型分析了分布式实时计算环境中多数据流并发处理的事务问题.采用复杂事件驱动技术,设计了一个适于多数据流并发协作处理的事务机制ARTs-MDS,能够自组织地将对分布式实时数据产生作用的并发任务组成一个原子的事务单位.系统维护着一个永久性的请求/响应队列将物理的设备的实操作与实时事务相分离,通过保证并发协作任务的事务特性获得以分布式局部采集数据为基础产生的微观层操作行为协作产生的整体效果的原子性.测试结果分析表明:该系统能提高对连续的外部采集数据进行协作处理的实时响应,减少了数据丢失. 展开更多
关键词 分布式实时应用 多数据流 并发协作执行 事务处理
在线阅读 下载PDF
Spark Streaming动态资源分配策略 被引量:6
19
作者 刘备 谭新明 曹文彬 《计算机应用》 CSCD 北大核心 2017年第6期1574-1579,共6页
针对Spark Streaming作为混合大数据计算平台流处理组件时资源调整周期长和不能满足多应用多用户个性化需求的问题,提出了一种多应用下动态资源分配策略(DRAM)。该策略增加了应用全局变量来控制动态资源分配过程。首先,获取历史执行数... 针对Spark Streaming作为混合大数据计算平台流处理组件时资源调整周期长和不能满足多应用多用户个性化需求的问题,提出了一种多应用下动态资源分配策略(DRAM)。该策略增加了应用全局变量来控制动态资源分配过程。首先,获取历史执行数据反馈和应用全局变量;然后,进行资源增减计算;最后,进行资源增减执行。实验结果表明,所提策略能够有效调整应用资源配额,且在稳定数据流和不稳定数据流两种情况下,其处理延时相比原Spark平台的Streaming策略和Core策略都有所降低;同时该策略也能够提高集群资源利用率。 展开更多
关键词 SPARK 实时数据流 多应用 动态资源分配
在线阅读 下载PDF
ETL多数据流并行抽取系统的设计与实现 被引量:2
20
作者 崔英敏 魏文国 谢桂园 《广东技术师范学院学报》 2015年第8期47-50,共4页
针对传统ETL数据抽取的低效,设计实现了一种ETL多数据流并行抽取系统,对异构平台及各种类型的数据源进行多数据流并行抽取,扩展了ETL现有的系统架构,为今后对海量数据的处理提供了一种新的思路并将依此开发的ETL工具应用到"广州市... 针对传统ETL数据抽取的低效,设计实现了一种ETL多数据流并行抽取系统,对异构平台及各种类型的数据源进行多数据流并行抽取,扩展了ETL现有的系统架构,为今后对海量数据的处理提供了一种新的思路并将依此开发的ETL工具应用到"广州市社会治安智能分析系统"项目上,发现对数据的抽取效率有明显提高. 展开更多
关键词 ETL 数据集成 多数据流 并行抽取
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部