矢量空间数据云存储与马尔可夫并行聚类算法研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:F8251256
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着地理空间数据的爆炸型增长,矢量空间数据存储与挖掘日益成为空间信息科学领域的研究热点。如何高效地存储和管理海量矢量空间数据,并从中挖掘有用的地学知识,成为地学领域亟待解决的问题。本文在非关系数据库和MapReduce模型等理论的基础上,以矢量空间数据为研究对象,提出了在云环境下多用户存储、多类型数据转换和海量矢量空间数据处理等三种矢量空间数据存储与处理机制,基于文档型数据库MongoDB和并行计算框架Hadoop实现了矢量空间数据云存储系统,并最终实现与自主研发的地理知识云服务平台GeoKSCloud的紧密集成;总结了MapReduce模型下对图算法进行整体优化设计的三种途径及其具体解决方法,据此设计并实现了马尔可夫并行聚类算法。主要研究内容和成果如下:1.综述了矢量空间数据存储理论与技术的研究现状,探讨了NoSQL数据库的特点,阐述了MongoDB数据数据库的特点及应用场景;从并行聚类和数据挖掘平台两个方面总结了云环境下的并行聚类研究现状,并详细介绍了MapReduce模型、聚类概念与流程、经典聚类算法、图聚类算法等相关理论与技术。2.开展了矢量空间数据存储机制以及云存储系统设计与实现方面的研究。提出了多用户存储、多类型数据转换和海量矢量空间数据处理等三种存储与处理机制:即利用MongoDB存储矢量空间数据及其元数据,利用开源简单要素库OGR实现异构矢量空间数据的转换与读写,借助Hadoop完成海量矢量空间数据的处理与挖掘任务。之后,依托于地理知识云平台GeoKSClou d的基本框架,提出了由数据层、业务层和表现层三部分组成的系统架构,通过集群搭建、数据存储、导入导出、数据库访问、数据处理等方面对系统进行了详细设计,最终实现了矢量空间数据云存储系统。3.开展了在MapReduce模型下图算法的优化设计方法,以及马尔可夫聚类算法并行化方面的研究。根据图结构拓扑关系的复杂性,探讨了MapReduce模型下图算法的优化设计方法,主要对消息传递机制、基于本地聚合的数据约简、基于Mapper内部聚合的数据约简等三个途径进行了优化,并提出了相应的具体解决方法。之后,将MCL算法分解为矩阵表示、扩张操作、膨胀操作和算法整合等部分。采用子矩阵方式表达矩阵,在扩张操作和膨胀操作中提出了并行化方案,并进行了并行策略的多次优化。最终,通过整合各操作实现了并行化算法MR-MCL。4.开展了VectorDB云存储系统、MR-MC L算法的性能测试与评价工作。结果显示,VectorDB比PostGIS具有更加强大的读取性能,VectorDB在并行处理方面比MongoDB更有优势,MR-MCL算法具有良好的扩展性与高效性。
其他文献
本论文主要工作有两部分,第一部分是建立上行闪电放电参数化方案,通过建立不同的雷暴云电荷结构分布产生不同的雷暴云空间电荷背景,定量探讨了建筑物高度对上行闪电的触发和
Pif1解旋酶是一类依靠ATP提供能量,沿着DNA链从5’-3’方向移动打开DNA螺旋的核酸解旋酶。Pif1广泛存在于生物体内,研究较多的物种有:酿酒酵母、裂殖酵母、人类和小鼠。体内
本文利用了再分析资料和CMIP5的22个气候模式中的工业革命前控制试验(piControl)和真实的历史强迫试验(historical)所提供的对气候模式模拟的结果,通过环流指数的方法对阿留
为研究云辐射强迫效应对热带气旋的发展和结构的影响,本文利用高分辨率中尺度WRF_ARW模式,通过改变云辐射强迫(CRF)参数(icloud=0或1)进行一系列敏感性数值试验。数值试验结
本文研究两个方面的内容:第一部分研究了一类具有捕获项的四种群捕食系统。主要是讨论该系统的多个正周期解的存在性。首先,利用重合度理论以及不等式的放缩法得到了该系统有1
众所周知,均衡问题和分裂可行问题是当前非线性分析领域中的两个热点问题。均衡问题能够给我们提供统一的框架去研究在金融、交通运输、结构分析、弹性力学、博弈学、最优问
时序InSAR技术凭借其在地表形变监测中全天候、高覆盖、低成本、高精度等诸多优势得到了迅速的发展和应用,目前已成为国际雷达遥感界的研究热点之一。为了克服传统DInSAR技术
在金融市场上,人们的决策行为如判断和选择行为,总是面临风险和不确定性。一定的行为总是由—定的心理支配的,行为反映了心理活动,因此心理学是行为金融学的基础。许多实验证
1952年,Schaeffer和Duffin在研究非调和Fourier级数时第一次提出了Hilbert空间中框架的概念并给出了框架的一些性质.1986年,框架被Daubechies, Grossmann和Meyer再次提及并从
在20世纪80年代初,Cech和Altman等分别在四膜虫内含子和细菌RNase P中发现具有催化功能的RNA分子,称为核酶,其发现打破了“酶即蛋白质”的传统学术观念,是酶学研究的一个重要