论文部分内容阅读
地理信息系统(GIS)是一种通过先进的计算机技术对地理空间信息进行抽象采集、存储管理、位置描述和综合信息显示的系统。它应用的领域主要包括交通运输、信息整合、地图导航、资源管理等。空间数据具有下面的这些特点,以点、线、面结构来描述地理空间实体,空间数据的数据量十分庞大;而对大数据的处理需要在存储之前对空间实体进行综合、归类、抽象地描述;并且数据一旦形成一般情况下不进行修改操作,修改只能是批量的修改,数据的存储具有一定的存储期限;地理空间数据跟随着地理空间实体的动态变化定期的更新变化。传统的关系型数据库对空间数据的存储需要通过对空间数据模型进行扩展来实现海量大数据的存储,这种存储模式存在的扩展性差、处理服务效率低下、数据存取性能不足等局限。空间数据的上述特点以及关系型的数据库存储空间数据的局限性促使我们要找一种更好的数据存储方案来存储空间数据。在地理信息系统的带动下,空间数据如何存储成为了一个突出的技术问题,而web2.0技术的广泛普及,也为空间数据云存储的发展制造了压力。因此,将空间数据以一种先进的存储策略高效地存储在云端,势必会带动整个地理信息系统的发展,也将成为空间数据存储研究的动力。在此基础上,我们提出了一种基于云环境下的NoSQL分布式存储技术来存储空间数据的方案,为了获得更加优越的存储性能和访问效率。根据当前的研究现状,本文通过对NoSQL数据库MongoDB、云存储技术、空间数据特点的研究,设计了空间数据的存储管理框架结构,即把空间数据分片后存储在部署于集群服务器上的MongoDB数据库中。根据研究内容,本文主要做的工作描述如下:(1)MongDB具有面向文档存储、全索引支持、高可用性、自动分片、弱一致性(最终一致)等的特点,这些特点能够提高海量数据的可靠性和存取访问效率。本文基于此,运用MongoDB数据库来存储海量空间数据,保证了空间数据高可用性、可扩展性、安全性和灵活性,不用像关系型数据存储大数据一样需要对数据进行复杂的扩展。(2)对比MongoDB和传统关系型数据库在存储大数据上的不同方法,分析了MongoDB存储地理空间数据的优越点和创新性,分析了运用MongoDB集群架构下大数据云存储的优势,归纳了这种存储方案的理论和技术支撑。(3)利用MongoDB分布式部署方案,将空间数据分片部署到集群服务器上;通过对地理实体抽象生成空间数据,在K-Means算法的基础上对生成的数据进行分类,然后按类别存储在不同的shards上;文章实现了对存储在MongoDB集群架构上的空间数据进行读写、查询操作的系统来实现数据的存取和查询并来验证其性能及查询效率,经过对数据存取性能的综合分析,验证了此种基于NoSQL的空间数据云存储方案是高效可行的。