论文部分内容阅读
近年来,基于网络传输与管理的空间数据库服务系统被广泛应用,如基于位置服务(Location Based Service,LBS)的Google Map地图查询服务等。这些系统集成多源空间数据以满足用户的查询需求。由开放地理空间联盟(Open Geospatial Consortium,OGC)提出的WFS(Web Feature Service)规范定义了基于HTTP协议访问和更新矢量地理要素的接口,在分布式集成应用系统中具有很好的应用前景。但以GML文档作为数据传输媒介,在WFS服务端生成GML、网络间传输、客户端解析等开销很大,成为WFS服务分布式集成应用的瓶颈。 本论文是以面向多路连接的 WFS数据服务的空间查询优化策略为主要的研究内容。由于针对不同的WFS服务进行空间连接查询时,网络数据的传输代价较高且常占主导作用,本论文结合基于网络服务传送的特点并借鉴国内外在空间连接处理方面的研究成果,本文主要进行以下几个方面的探讨: 首先,介绍了涉及面向多路连接的WFS数据库空间查询的相关基础知识。包括空间数据集以及分布式空间数据库的相关特点、WFS传输规范的相关操作以及用于数据集之间的网络传输格式XML(Extensible Markup Language)等主要内容。 其次,主要分析讨论MP直方图法(MP Histogram Statistic)与幂指数法算法(Power Laws)这两种选择率估算公式,并且基于这两种估算公式提出了新的算法用于估算非点类数据集,如:线要素集、面要素集,等复杂要素集之间的选择率。 再次,根据空间数据集分布越均匀通过选择率估算算法得到的选择率越准确的特性,提出面向WFS规范的网络服务的四叉树划分优化策略。通过四叉树策略对整体查询区域 进行划分得到数据分布更加均匀的小格网的集合,最后依次分析并统计小格网集合内数据集的选择率就能有效的提高整体选择率结果的准确性。 最后,本文着重研究了选择率估算算法以及四叉树划分优化策略的优化技术以及实现过程,利用四叉树划分策略对查询数据分布进行优化,并且结合选择率估算算法估算传输代价分析,证明了结合选择率估算算法与四叉树的优化策略的WFS网络服务系统能够有效的减少中间关系的数据量,降低网络通信代价,进而达到查询优化的目的。最后通过在 MP直方图算法与幂指数算法的基础上,提出了一种新的选择率估算算法,通过具体的选择率计算并与传统算法相比较,证明了新算法的可行性。 本论文的工作丰富和拓展了基于分布式数据库网络传输的空间查询选择率优化理论与方法,扩展了基于WFS服务系统优化模型的研究范围与内容,为提高面向WFS的空间数据查询优化策略提供了一条可行的途径