数据抽取转换工具中数据映射关系的设计及其关键技术研究

被引量 : 0次 | 上传用户:wfljk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前信息化建设呈现出“数据集中化、业务综合化、管理扁平化、决策科学化”的发展趋势,因此大多数过去遗留下来的异构系统已不能满足这样的需求。企业信息和数据的集成交换需求越来越强烈。因为数据集成和交换必须解决复杂的数据处理过程,所以出现了专门的数据抽取、转换和载入(Extract,Transform,Load)工具——即ETL工具。ETL工具在数据集成过程中起到了举足轻重的作用。 论文首先介绍了ETL工具的相关背景知识,并分析了ETL工具的研究现状。分析得出结论:现有关于ETL的研究对源-目数据的映射关系重视不够,而这一内容是数据抽取转换的核心。基于这一结论,在第一章提出了本文的研究目标和研究内容。 根据论文的研究目标,本文论述了一种基于网络的异种数据抽取转换工具ETLA(Extract-Transform-Load-Analysis的缩写)的分析和设计,该工具根据数据映射关系定义ETL任务,根据映射关系生成执行脚本。论文在第二章阐述了该工具的系统框架、功能划分,以及数据处理和数据映射流程。 本文随后重点研究了ETLA中的数据映射关系。分析了各种数据映射后,提出了数据映射关系的形式化描述。在ETLA中,映射关系是以表达式表示。表达式由源数据项、目标数据项、以及源数据项之间的关系构成,并符合一定表示规则。按照表达式表示映射关系后,ETLA的数据转换模块将解析表达式,生成数据转换执行脚本,并执行。 论文最后设计了ETLA映射索引库。索引库按照主题组织源数据,用户能够根据目标表的定义能尽快地找到与之映射的数据源,定义源-目数据映射关系。
其他文献
混凝土结构裂缝问题是混凝土施工中常见的质量问题,本文主要针对大体积混凝土裂缝的成因与控制措施进行简单的探讨。
本文针对我国各类博物馆展览普遍存在的传播目的不明确、不按传播目的进行策划设计的问题,从理论与实践两个方面就如何准确设定和忠实执行展览传播目的进行了论述,提出:要准
目的:探讨管道滑脱风险评估量表在防范泌尿外科置管患者非计划性拔管中的应用效果,以降低患者管道滑脱风险。方法:将2016年下半年的置管患者330例纳入实验组,使用患者管道滑
本文运用人格心理学的相关知识,从郁达夫的日记、自传、郁达夫的朋友的回忆文章以及郁达夫的研究者对其作的比较客观的评传中,分析、归纳出郁达夫的五种人格特质:人格首要特
1.研究目的本课题从P170、MRP、GST-π、LRP基因蛋白表达方面进行中药复方“癌复康”对乳腺癌化疗患者获得性多药耐药(MDR)的研究,旨在探索出中药“癌复康”对乳腺癌在含蒽环类
随着社会经济的发展和新技术的传播,以互联网为代表的新媒体正逐渐改变着传统的信息传播形式,颠覆了原有的媒介生态格局。新媒体时代,党刊的发展面临着严峻挑战,陷入读者流失和影
目的:1、通过与正常青少年的体感诱发电位(SEP)、脑干听觉诱发电位(BAEP)和肌电图(EMG)进行比较,探讨青少年期颈椎病的脊髓和周围神经以及相关血管、肌肉的生理病理状态和功能
生存和发展是人类社会所面临的永恒主题。自第一次产业革命以来,科学技术飞速发展,社会生产力极大提高,人类创造了前所未有的物质财富,使人类文明达到了一个新阶段,但同时也
目的以人参Ginseng Radix和白术Atractylodis Macrocephalae Rhizoma药对为研究对象,分析人参、白术单煎液与合煎液的化学成分变化,以期从化学成分角度阐明人参-白术药对配伍
研究大中型气田形成的地质条件和主控因素,对于天然气工业的发展有重要意义。中国目前只有西藏及福建、浙江、湖南等少数省、自治区没有工业性气田,除志留系、泥盆系外,从前