论文部分内容阅读
空间数据挖掘或空间知识发现是指从包含空间信息的数据库中抽取隐含的知识、空间关系或非显式存储在数据库中有意义的特征或模式。此技术在理解空间数据、获取空间与非空间数据的内在关系上具有重要意义。随着以GIS(地理信息系统)为代表的空间信息系统的快速发展,空间信息大量产生,空间数据挖掘已成为当前亟待研究的重要课题。 聚类是数据挖掘领域中的一个主要问题,聚类操作主要指在将一组样本划分为若干簇,使得簇内样本具有较大的相似性,而簇间样本具有较小的相似性。空间聚类是在空间信息上的聚类,它继承了一般聚类的基本特征,研究对分布在空间中的对象实施聚类,从而发现空间集簇的过程。本文首先研究了以GIS为代表的空间信息系统中所存储的空间对象的分布特征,介绍了地理空间对象分布的二重性,研究了基于坐标的二维空间聚类的主要内容和特点,最后总结了应用于GIS系统的空间聚类方法的主要任务和所应具有的特点。 随后,本文研究了目前已有的各类主要聚类算法,分析其特点,并着重研究了基于网格密度的聚类方法及其在基于坐标的二维空间聚类上的应用。进一步的,分析了该方法的特点和不足,在保留原方法的功能(即发现二维空间中高密度网格的最大密集连通区域作为聚类集簇)不变的前提下改进原方法,使其可以同时发现最大密集连通区域中以密集中心为代表的若干子区域,并且构造两种不同类型区域的二层结构。进一步的设计了一种推荐参数的方法,可以在用户不主动设定参数的情况下,自动产生一组可以获得较优结果的参数值。 在处理二维空间障碍上,本文介绍并研究了目前已有的处理空间障碍的主要方法,并通过提出特有的障碍抽象方法将二维空间障碍引入网格密度方法,使得改进算法可以处理二维空间障碍。 最后,本文完成了改进方法及两类其它聚类方法与GIS系统的集成,介绍了智能化GIS系统的组成结构及空间聚类方法在其中的应用,并演示了应用效果。