基于空间数据的聚类DLIS-R树算法研究

来源 :昆明理工大学 | 被引量 : 1次 | 上传用户:zhanbusha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网和基于位置服务(LBS,Location-Based Services)应用的日益普及,空间数据量也在不断增长。这些迅速增加的空间数据给传统的空间数据索引机制带来了新的问题,而这些传统的索引方法往往是基于内存的或者优化磁盘访问的先决条件。因此,大规模空间数据索引面临着新的要求与挑战。本文针对目前应用最广泛的R树空间索引结构节点重叠率高和索引大数据集时效率差的问题进行优化,以大规模数据集作为空间索引研究对象,主要从以下几个部分进行研究:首先针对传统R树构建过程中节点重叠率高的问题,引入K-means聚类算法对节点聚类来减小最小包围矩形MBR(Minimum Bounding Rectangle)的重叠程度。研究中,发现由于K-means聚类算法在处理大数据集时时间效率差,随着数据集点数增长聚类时间开销呈指数增长,造成基于K-means聚类R树构建时间过长。为此,本文又引入空间点模式分析法来对K-means聚类算法的时间效率进行优化。空间点模式分析运用分区统计方法来区分空间对象的分布模式,合理确定初始质心,减少迭代次数。从而降低基于K-means聚类R树的构建时间。其次针对地理空间点数量不断增加,聚类开销远远大于R树构造所需的开销的问题,本文提出一种基于改进K-means聚类的双层索引结构R树(DLIS-R,Double-Layered Index Structure R-tree)。聚类DLIS-R树利用X-means聚类算法将研究区域划分得到的多个子空间作为全局索引,对子空间数据分别建立R树索引作为局部索引。以全局索引和局部索引结合的方式来提升R树索引的效率。最后,本文将上述的两种算法以Java语言在Eclipse编辑器中编程实现,通过多组数据集进行测试,实验结果统计得到,聚类DLIS-R树相比R树节点重叠率降低了20%,效率提升最高为91.56%,最低为69.39%,表明聚类DLIS-R树算法优化了R树空间索引的检索效率。
其他文献
随着社会的发展,人们对于微型化大视场光学系统的需求与日俱增,传统的光学系统因为衍射效应的限制,在小型化的同时难以兼顾分辨率和视场角,因此需要研究新型光学系统。仿昆虫
在信息时代迅猛发展的大环境前提下,数据量也随之增长到海量级别,例如图像分类、病理检测、网页推荐等领域,其中标记数据特别稀少,无标记数据大量存在。基于该现实状况,迫切
燃油温度的升高和环境压力的降低均会使液体更容易达到过热状态,而当燃油温度和压力均高于其临界值时,便会进入到超临界态。这两种状态均有助于混合气的快速制备,从而实现高
主题模型是文本主题聚类的关键技术,被广泛应用于文本分析、新闻推荐、舆情监控等涉及到文本主题的领域。隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)是一个成功的主
计算机网络覆盖率的不断扩大与互联网技术的极速发展在很大程度上改变了分布式系统的规模与复杂程度,系统在规模与复杂程度方面的改变对通信模型的动态性和系统的松耦合性的
随着互联网的飞速发展,网络安全形势也愈加严峻。网络蠕虫以其迅猛的传播能力,成为威胁互联网安全的一个重要因素。近些年出现的“Stuxnet”蠕虫病毒在钢铁、电力、化工等多
推进剂的燃烧性能包括燃速和压强指数,对增产弹的压裂效果有直接的影响,添加燃速调节剂是调节推进剂燃烧性能的最佳选择之一,其用量少,活性高,效果好。而研究燃速调节剂对推
蓝思科技(长沙)公司作为电子终端配套产品生产型企业在全球化进程加快,中国经济地位上升的背景下迎接着新的挑战与机遇。然而世界经济大环境的恶化,也促使公司必须向“第三利
如今,在工业生产中扮演重要角色的工业厂房建设规模越来越大,将荒废面积最大的屋顶空间利用起来建设屋顶花园,将是未来的一种设计方向。预应力钢桁架在传统非预应力平面桁架结构的基础上通过合理的引入预应力拉索以使多数杆件卸载、降低内力峰值或提高结构刚度,因其以更轻的自重提供更高的承载力被广泛应用在大跨度钢结构中,然而在类似屋顶花园的大跨度、重荷载屋盖结构中却鲜有预应力钢桁架结构的相关应用研究。如今新建项目的
张大千先生是中国近现代绘画史上具有传奇色彩的绘画大师,他的绘画作品深受海内外广大书画爱好者的喜爱。近年来,艺术品市场上有关张大千绘画作品的收藏热度不断升温,现已出
会议