期刊文献+
共找到445篇文章
< 1 2 23 >
每页显示 20 50 100
基于OPCUA和ETL的伺服阀综合应用系统设计 被引量:1
1
作者 何军红 黎长鑫 董方辰 《工业仪表与自动化装置》 2025年第1期29-35,87,共8页
针对伺服阀生产过程中存在的设备种类繁多、不同供应商设备之间无法交换数据、数据集成工作复杂困难的问题,提出基于OPC UA (Object Linking and Embedding for Process Control Unified Architecture)和ETL (Extract-Transform-Load)... 针对伺服阀生产过程中存在的设备种类繁多、不同供应商设备之间无法交换数据、数据集成工作复杂困难的问题,提出基于OPC UA (Object Linking and Embedding for Process Control Unified Architecture)和ETL (Extract-Transform-Load)的综合解决方案。该方案使用OPC UA作为通信协议完成设备之间的高效通信,利用ETL技术设计并实现了伺服阀综合应用系统。样机试验验证了方案的有效性。该方案实现了产线信息化过程中的设备互操作能力,是确保伺服阀质量可靠性和性能一致性的关键基础技术。 展开更多
关键词 OPC UA etl技术 伺服阀 多源数据融合
在线阅读 下载PDF
Optimizing Healthcare Big Data Processing with Containerized PySpark and Parallel Computing: A Study on ETL Pipeline Efficiency
2
作者 Ehsan Soltanmohammadi Neset Hikmet 《Journal of Data Analysis and Information Processing》 2024年第4期544-565,共22页
In this study, we delve into the realm of efficient Big Data Engineering and Extract, Transform, Load (ETL) processes within the healthcare sector, leveraging the robust foundation provided by the MIMIC-III Clinical D... In this study, we delve into the realm of efficient Big Data Engineering and Extract, Transform, Load (ETL) processes within the healthcare sector, leveraging the robust foundation provided by the MIMIC-III Clinical Database. Our investigation entails a comprehensive exploration of various methodologies aimed at enhancing the efficiency of ETL processes, with a primary emphasis on optimizing time and resource utilization. Through meticulous experimentation utilizing a representative dataset, we shed light on the advantages associated with the incorporation of PySpark and Docker containerized applications. Our research illuminates significant advancements in time efficiency, process streamlining, and resource optimization attained through the utilization of PySpark for distributed computing within Big Data Engineering workflows. Additionally, we underscore the strategic integration of Docker containers, delineating their pivotal role in augmenting scalability and reproducibility within the ETL pipeline. This paper encapsulates the pivotal insights gleaned from our experimental journey, accentuating the practical implications and benefits entailed in the adoption of PySpark and Docker. By streamlining Big Data Engineering and ETL processes in the context of clinical big data, our study contributes to the ongoing discourse on optimizing data processing efficiency in healthcare applications. The source code is available on request. 展开更多
关键词 Big data Engineering etl Healthcare Sector Containerized Applications Distributed Computing Resource Optimization data Processing Efficiency
在线阅读 下载PDF
基于ETL的飞行数据复盘软件设计研究
3
作者 王凯 殷华杰 张彦 《航空电子技术》 2024年第2期62-69,共8页
本文针对飞行数据集成复杂、处理效率低等问题,提出了一种基于ETL的飞行数据复盘软件系统设计方案。以飞行数据复盘技术为背景,结合大数据处理技术的ETL方法,提出了一种基于ETL工具的飞行数据融合处理流程和设计方法,描述了系统功能组... 本文针对飞行数据集成复杂、处理效率低等问题,提出了一种基于ETL的飞行数据复盘软件系统设计方案。以飞行数据复盘技术为背景,结合大数据处理技术的ETL方法,提出了一种基于ETL工具的飞行数据融合处理流程和设计方法,描述了系统功能组成、设计流程和实现原理。该方案降低了系统开发的复杂度,提高了飞行数据管理的效率和数据复盘自动化水平。 展开更多
关键词 飞行数据 etl 数据复盘
在线阅读 下载PDF
基于Teradata应用工具的ETL策略设计与实践 被引量:2
4
作者 戴邵红 古春笑 权毅 《机械工程与自动化》 2009年第1期162-163,166,共3页
ETL是构建数据仓库的重要环节。介绍了数据仓库和ETL的概念;并针对Teradata数据仓库应用工具,讨论了基于ETL Automation这个ETL进程调度工具,设计了实现ETL的具体策略。
关键词 数据仓库 TERAdata etl etl AUTOMATION
在线阅读 下载PDF
Teradata数据仓库的ETL在电信行业中的设计与实施 被引量:2
5
作者 张琴和 李民 《机械设计与制造工程》 2012年第A07期10-13,17,共5页
介绍了Teradata数据仓库和ETL的相关概念,结合电信行业中对数据仓库的ETL流程的要求和特点,对Teradata数据仓库的ETL工具进行模型设计与研究,设计了一套普遍适合电信行业数据仓库的ETL框架模型,并对该模型进行实施,实施结果证明该模型... 介绍了Teradata数据仓库和ETL的相关概念,结合电信行业中对数据仓库的ETL流程的要求和特点,对Teradata数据仓库的ETL工具进行模型设计与研究,设计了一套普遍适合电信行业数据仓库的ETL框架模型,并对该模型进行实施,实施结果证明该模型可行。 展开更多
关键词 数据仓库 TERAdata etl etl工具
在线阅读 下载PDF
基于大数据ETL引擎的批量智能开发平台研究 被引量:4
6
作者 曾国文 梁华生 钟玲 《电信工程技术与标准化》 2024年第3期20-25,共6页
大数据时代,为了能更好提升多样化源数据类型情况下的ETL开发效率,本文提出了一种基于大数据ETL引擎的批量智能开发平台,重构ETL核心代码完善组件功能,用Java代码自研发class方法,智能调度API接口,批量生成全删全插、增量同步、拉链表... 大数据时代,为了能更好提升多样化源数据类型情况下的ETL开发效率,本文提出了一种基于大数据ETL引擎的批量智能开发平台,重构ETL核心代码完善组件功能,用Java代码自研发class方法,智能调度API接口,批量生成全删全插、增量同步、拉链表和数据质量稽核等XML脚本,转译ETL的XML代码为可执行Java代码,降低操作员使用平台的技术难度。通过实操验证,本文提出的方法能增加平台的开发效率,更快速实现需求。 展开更多
关键词 数据仓库 etl引擎 XML脚本 批量开发
在线阅读 下载PDF
数据仓库中ETL技术的研究 被引量:120
7
作者 张宁 贾自艳 史忠植 《计算机工程与应用》 CSCD 北大核心 2002年第24期213-216,共4页
作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL... 作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL的具体设计和实现方法。 展开更多
关键词 数据仓库 etl 数据库 数据模型 数据抽取 数据转换 数据清洗 数据装载
在线阅读 下载PDF
面向数据集成的ETL系统设计与实现 被引量:21
8
作者 钟华 冯文澜 +1 位作者 谭红星 黄涛 《计算机科学》 CSCD 北大核心 2004年第9期87-89,F004,共4页
ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了... ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了一个ETL过程模型,开发了一个面向数据集成的ETL系统DataIntegrator。本文对ETL过程模型、系统总体结构及若干关键技术进行论述。DataIntegrator已经应用于信息系统的建设中,为企业应用集成提供了很好的支持。 展开更多
关键词 etl 数据集成 过程模型 数据抽取 企业应用集成 数据仓库 转换 系统总体结构 业务数据 信息系统
在线阅读 下载PDF
数据仓库中ETL技术的探讨与实践 被引量:32
9
作者 王克龙 王玲 +1 位作者 王平立 宋斌 《计算机应用与软件》 CSCD 北大核心 2005年第11期30-31,78,共3页
支持数据抽取、转换、清洗和装载的工具集对任何数据仓库工程都是一个必不可少的关键部件。本文重点探讨了ETL技术以及ETL工具的选择原则,并结合具体实例详细介绍了ETL过程的设计和实现方法。
关键词 数据仓库 etl技术 数据抽取 数据挖掘 联机分析 可靠性
在线阅读 下载PDF
基于CEP引擎的配电网运行监控信号大数据ETL方法 被引量:14
10
作者 葛贤军 艾明浩 +2 位作者 李志宏 汪旭 陈乃仕 《电工电能新技术》 CSCD 北大核心 2017年第9期36-42,共7页
电力系统规模在不断扩大,配电网电气设备数量急剧增长且趋于精细化。大量且散乱的运行监控数据使得主动配电网各应用无法快速有效地提取有用信息以形成决策支持。本文利用复杂事件处理(CEP)引擎作为运行监控信号处理核心,通过Apriori机... 电力系统规模在不断扩大,配电网电气设备数量急剧增长且趋于精细化。大量且散乱的运行监控数据使得主动配电网各应用无法快速有效地提取有用信息以形成决策支持。本文利用复杂事件处理(CEP)引擎作为运行监控信号处理核心,通过Apriori机器学习算法定义和完善规则库,通过核心算法库对信号数据流进行规范化处理。整体采用ETL(Extract-Transform-Load)框架,将主动配电网中分散、零乱、标准不统一的信号数据整合、清洗后加载到数据仓库,并以多种数据接口输出至不同介质,供不同应用调用。基于CEP引擎的大数据ETL方法,可对运行监控信号进行快速、精确、有效的规范化处理,实现多数据源集成与输出,为主动配电网设备仿真、故障分析、状态估计等多种重要应用提供数据准备。 展开更多
关键词 CEP引擎 运行监控 大数据 etl 主动配电网 规范化
在线阅读 下载PDF
数据仓库系统中Excel文档数据的ETL方法研究与实现 被引量:7
11
作者 周大海 安云哲 +1 位作者 夏秀峰 于戈 《小型微型计算机系统》 CSCD 北大核心 2007年第10期1813-1816,共4页
数据仓库的数据来源于组织内部的OLTP系统和其它格式的内部、外部数据,它们之中的许多是按照Microsoft Excel格式予以组织的,如何通过ETL程序将该格式的数据转换成数据仓库中有用的信息是目前亟待解决的问题.首先叙述了Excel文件的结构... 数据仓库的数据来源于组织内部的OLTP系统和其它格式的内部、外部数据,它们之中的许多是按照Microsoft Excel格式予以组织的,如何通过ETL程序将该格式的数据转换成数据仓库中有用的信息是目前亟待解决的问题.首先叙述了Excel文件的结构和Java Excel API的使用方法,给出了Java读取Excel文档的操作步骤,结合实例说明了从Excel文件向数据仓库实现抽取及存储的过程和方法. 展开更多
关键词 数据仓库 外部数据 etl EXCEL文档
在线阅读 下载PDF
面向数据质量的ETL过程建模与实现 被引量:23
12
作者 贾自艳 黄友平 +3 位作者 罗平 李嘉佑 秦亮曦 史忠植 《系统仿真学报》 CAS CSCD 2004年第5期907-911,914,共6页
为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程... 为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程统一的体系结构设计,包括ETL元数据对象建模、ETL转换函数设计、ETL任务建模以及ETL任务模型的描述语言(XTDL)。基于该体系结构和设计思想开发出一个ETL系统—MSETL,目的是为多策略数据挖掘平台(MSMiner)提供高质量的数据。它提供友好界面并对ETL过程进行统一的元数据管理,包括:ETL转换函数的注册和删除;任务模型的生成、执行和删除等功能。 展开更多
关键词 数据仓库 数据质量 抽取-转换-装载(etl) 数据挖掘 数据清洗
在线阅读 下载PDF
基于ETL的数据集成优化研究与实现 被引量:10
13
作者 王世水 王元元 高应波 《天津工业大学学报》 CAS 北大核心 2013年第3期78-81,共4页
通过分析数据源的数据量和异构数据库系统环境等情况,提出基于ETL技术的异构数据集成优化方案.对实验验证数据与现有集成方法进行对比和效能评估得出结果:该解决方案对异构数据源的集成效率较高,尤其是针对海量数据效果尤其明显.
关键词 异构数据 etl 数据集成 XML
在线阅读 下载PDF
地理编码在空间数据仓库ETL中的应用 被引量:11
14
作者 陈细谦 迟忠先 +1 位作者 昃宗亮 苏立强 《小型微型计算机系统》 CSCD 北大核心 2005年第4期628-630,共3页
空间数据仓库可以有效地管理和利用空间信息以便支持空间分析和决策支持.在空间数据的抽取、转换和加载中如何有效地把非空间信息与空间信息融合起来,是空间数据仓库ETL实现的难点.将地理编码技术引入到空间数据仓库ETL中,给出了融合地... 空间数据仓库可以有效地管理和利用空间信息以便支持空间分析和决策支持.在空间数据的抽取、转换和加载中如何有效地把非空间信息与空间信息融合起来,是空间数据仓库ETL实现的难点.将地理编码技术引入到空间数据仓库ETL中,给出了融合地理编码模块的ETL体系机构.同时为了提高地址匹配能力,将动态规划算法应用到地理编码地址匹配中,并对算法做了改进,给出了完整的应用示例. 展开更多
关键词 地理编码 空间数据仓库 etl 动态规划
在线阅读 下载PDF
一种可靠的数据仓库中ETL策略与架构设计 被引量:46
15
作者 尤玉林 张宪民 《计算机工程与应用》 CSCD 北大核心 2005年第10期172-174,229,共4页
作为数据仓库系统的关键部件,ETL完成数据抽取、清洗、转换和装载的工作,它是构建数据仓库的重要环节,同时也是构建数据仓库过程中出现问题最多的环节,所以针对这点,该文给出了一个可靠的同时易于扩展的ETL策略和架构。文章首先简单地... 作为数据仓库系统的关键部件,ETL完成数据抽取、清洗、转换和装载的工作,它是构建数据仓库的重要环节,同时也是构建数据仓库过程中出现问题最多的环节,所以针对这点,该文给出了一个可靠的同时易于扩展的ETL策略和架构。文章首先简单地介绍了数据仓库技术和ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位;然后重点介绍了这种ETL的具体策略和架构设计。 展开更多
关键词 数据仓库 etl 数据抽取 数据转换 数据清洗 数据装载
在线阅读 下载PDF
一种元数据驱动的ETL方法的研究 被引量:15
16
作者 宋杰 王大玲 +1 位作者 鲍玉斌 于戈 《小型微型计算机系统》 CSCD 北大核心 2007年第12期2167-2173,共7页
数据仓库研究中最重要的问题之一是对ETL方法的研究.本研究提出ETL工具是元数据驱动的,以提供更好的柔性机制、扩展能力和可操作性.本文给出了一种基于SQL的元数据驱动的ETL方法的设计和实现细节,并且以国家海洋环境数据仓库为例,证明... 数据仓库研究中最重要的问题之一是对ETL方法的研究.本研究提出ETL工具是元数据驱动的,以提供更好的柔性机制、扩展能力和可操作性.本文给出了一种基于SQL的元数据驱动的ETL方法的设计和实现细节,并且以国家海洋环境数据仓库为例,证明了这种方法的高效性. 展开更多
关键词 etl 数据仓库 元数据
在线阅读 下载PDF
数据仓库ETL中相似重复记录的检测方法及应用 被引量:15
17
作者 张永 迟忠先 闫德勤 《计算机应用》 CSCD 北大核心 2006年第4期880-882,共3页
检测和消除数据仓库中的相似重复记录是数据清洗和提高数据质量要解决的主要问题之一。将位置编码技术引入到数据仓库ETL中,提出了一种相似重复记录的检测算法PCM(位置编码方法)。该算法不仅可以应用到西文字符集中,而且也成功的应用到... 检测和消除数据仓库中的相似重复记录是数据清洗和提高数据质量要解决的主要问题之一。将位置编码技术引入到数据仓库ETL中,提出了一种相似重复记录的检测算法PCM(位置编码方法)。该算法不仅可以应用到西文字符集中,而且也成功的应用到了中文字符集中,实例表明该算法具有很好的效果。 展开更多
关键词 位置编码 数据仓库 etl 相似重复记录
在线阅读 下载PDF
ETL综述 被引量:23
18
作者 缪嘉嘉 邓苏 刘青宝 《计算机工程》 CAS CSCD 北大核心 2004年第3期4-5,21,共3页
阐述了ETL在创建数据仓库过程中的重要地位;分析了整个ETL流程,把它分为数据源验证、数据源改造、一般性变换、装载目标表和数据聚合5个阶段。最后分析了ETL产品现状、现有ETL产品的功能特点,以及今后ETL产品的发展趋势。
关键词 抽取转换和加载 数据仓库 数据集成 元数据
在线阅读 下载PDF
增量ETL过程自动化产生方法的研究 被引量:19
19
作者 张旭峰 孙未未 +2 位作者 汪卫 冯雅慧 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2006年第6期1097-1103,共7页
ETL过程用于将数据从数据源装载到数据仓库中,它可以被划分为两种类型:全量ETL过程和增量ETL过程·全量ETL过程只能处理全量数据,但易于设计·而增量ETL过程设计起来比较复杂,但适用于处理增量数据·主要对增量ETL过程的自... ETL过程用于将数据从数据源装载到数据仓库中,它可以被划分为两种类型:全量ETL过程和增量ETL过程·全量ETL过程只能处理全量数据,但易于设计·而增量ETL过程设计起来比较复杂,但适用于处理增量数据·主要对增量ETL过程的自动化产生方法进行了研究,根据已有的全量ETL过程,可以自动产生增量ETL过程,从而降低设计增量ETL过程的代价·利用已有的物化视图增量维护的方法,给出了根据全量ETL过程自动产生增量ETL过程的方法·但是已有的研究集中在包含选择、投影、联接和聚合运算情况下物化视图的增量维护,未见对包括差运算情况下的讨论·作为研究工作的基础,还详细讨论了包含差运算情况下物化视图的增量维护问题· 展开更多
关键词 etl 数据仓库 增量维护 物化视图 自维护
在线阅读 下载PDF
ETL执行的流水线优化 被引量:15
20
作者 韩京宇 徐立臻 董逸生 《小型微型计算机系统》 CSCD 北大核心 2005年第6期1013-1017,共5页
ETL工具是构建和维护数据仓库的基本构件,由于它处理的是海量数据,如何有效地加快响应时间成为值得研究的问题.本文提出了ETL过程的“主表衍生”模式,并针对这种模式采用流水线算法来提高并行性从而加快ETL过程的响应时间,理论分析和实... ETL工具是构建和维护数据仓库的基本构件,由于它处理的是海量数据,如何有效地加快响应时间成为值得研究的问题.本文提出了ETL过程的“主表衍生”模式,并针对这种模式采用流水线算法来提高并行性从而加快ETL过程的响应时间,理论分析和实验表明具有好的效果. 展开更多
关键词 etl 数据仓库 流水线
在线阅读 下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部