摘要
ETL是一类用于从一个或多个业务数据库中抽取数据,进行清理转换并加截到数据仓库中的工具。这个数据抽取、转换和加载的过程能够很好地应用于数据集成领域中,实现不同机构之间数据的交换与整合。通过分析数据集成的一些特点,我们提出了一个ETL过程模型,开发了一个面向数据集成的ETL系统DataIntegrator。本文对ETL过程模型、系统总体结构及若干关键技术进行论述。DataIntegrator已经应用于信息系统的建设中,为企业应用集成提供了很好的支持。
ETL tools are pieces of software responsible for the extraction of data from several sources,their cleansing,customization and insertion into a data warehouse. The extraction-transformation-loading operations are also capable of data integration and realize data exchange between different organizations. By analyzing characteristic of data integration,we contribute an ETL processes model and develope DataIntegrator system for data integration. In this paper,we will discuss the model,DataIntegrator architecture and several key technologies. DataIntegrator has been used for information system development and enterprise application integration.
出处
《计算机科学》
CSCD
北大核心
2004年第9期87-89,F004,共4页
Computer Science
基金
国家863高科技发展计划项目(编号Z002AA113040)
国家重点基础研究发展规划973项目(编号2002CB312005)的资助