论文部分内容阅读
随着计算机和网络技术的飞速发展,地学研究也相应出现适应计算机和网络技术创新发展的新特点。20世纪中后期地理信息系统(Geographic Information System,简称GIS)引入地学研究后,地学数据集成与地学科学决策得到长足发展、取得丰硕成果,吉林大学地学G4I系统随之应运而生。本文所指4G地学空间数据,是对地质学(Geology)、地理学(Geography)、地球化学(Geochemistry)、地球物理学(Geophysics)数据(首字母都为G,简称4G)的统称。地学G4I系统研究所涉及4G地学空间数据具有多学科综合的特点,存在多元、语义和多维复杂空间结构等因素引起的异构问题,系统应用必须进行数据分析、处理、融合等集成操作以构建地学数据模型进而满足用户需求。数据集成操作因此成为地学研究的基本前提和必须步骤。特别是受4G地学空间数据在数据结构、空间模型与格式转换上的较大差异影响,数据共享难以有效实现。较好地研究解决数据集成面临的这些难题,可以大幅减少数据重复采集冗余,降低数据采集成本,充分挖掘数据信息,提高数据利用率,实现数据网络共享,增强经济效益。本文针对4G地学空间数据多源异构分布的特点和集成数据质量控制难的实际,在认真分析国际国内数据集成及其关键技术研究现状的基础上,采用地学空间数据仓库和数据质量评价控制等关键技术加以研究解决,并对空间数据质量保障及质量评价技术进行改进。该研究便于进一步数据挖掘和信息融合并利于4G地学空间数据共享操作的实现。现将本论文的工作和成果简述如下:1.数据集成技术研究现状阐明4G地学空间数据集成各主要方面的研究现状和发展趋势,提出4G地学空间数据集成中的关键问题及研究现状,说明解决4G地学空间数据集成的关键技术。2.4G地学空间数据特征研究讨论4G地学空间数据的来源,分析了4G地学空间数据特征,详细分析地学研究对4G地学空间数据集成的需求,讨论了集成结果的数据特征,讨论了4G地学空间数据的预处理,重点研究物探数据与化探数据的特征提取技术。3.应用数据仓库技术构建4G地学空间数据集成模型通过比较数据集成主要方法,指出应用数据仓库技术处理4G地学空间数据集成问题是可行的与必要的。根据4G地学空间数据特点和各种数据集成的方式,以及应用数据仓库技术进行4G地学空间数据进行数据集成的方案。根据数据仓库技术、中间件技术在集成数据时存在的各自优缺点,本文采用数据仓库和中间件相结合的方法。同时介绍应用数据仓库构建4G地学空间数据集成模型的方法流程,重点论述了地学地质数据仓库的设计架构,并通过SQL Server数据仓库工具进行实例验证。4.4G地学空间数据集成中的元数据研究概述元数据的定义、内容、作用、元数据研究现状及标准,重点讨论了数据集成中元数据的设计与元数据管理系统架构。5.4G地学空间集成数据质量控制体系研究讨论了4G地学空间集成数据质量及质量控制的概念,阐述4G地学空间集成数据质量问题的来源,提出4G地学空间集成数据质量评价标准,给出质量评价流程。重点介绍4G地学空间数据集成质量评价方法,根据集成数据自身存在的规律,分析集成数据过程中的常见误差,应用改进的层次分析法对4G地学空间数据质量进行评价,以达到数据质量控制的目的。本文的4G地学空间数据集成关键技术研究为数据集成和信息共享提供尝试性的方法,并为后续的数据挖掘和数据融合处理奠定了基础。文中的地质空间数据集成技术、元数据和数据质量控制技术等关键内容对地学G4I系统升级开发有所助益。同时,对于地学数据研究中的集成问题有一定借鉴作用。