空间数据挖掘中的分类方法及其应用研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:lbtx368
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着空间技术在各个行业的应用以及数据挖掘、空间数据采集技术、数据库技术的迅速发展,对从空间数据库发现隐含知识的需求日益增长,出现了用于在空间数据库中进行知识发现的崭新研究领域——空间数据挖掘。空间数据挖掘是从空间数据库中提取隐含的、用户感兴趣的空间、非空间模式和普遍特征的过程,它是多学科和多种技术交叉综合的新领域,综合了机器学习、空间数据库系统、专家系统、可移动计算、统计学、遥感、基于知识的系统、可视化等领域的有关技术。尽管数据挖掘最初产生于关系数据库和事务数据库,但由于空间数据的特殊性,从空间数据库中发掘知识很快引起了数据挖掘研究者的关注。 本文系统的介绍了空间数据挖掘的基本理论,比较传统数据挖掘与空间数据挖掘的不同之处,进而分析了空间数据挖掘中数据分类的研究现状和目前存在的问题。通过对已有方法的研究以及在与统计学、粗糙集理论、信息论等领域相关技术的结合,提出针对空间数据挖掘中连续数据离散化、谓词选取以及数据分类的解决方法,并最终以空间数据挖掘原型系统的形式加以实现。 本文所做的主要工作有以下几个方面: ● 利用统计学中的方差分析方法,本文根据数据总平方和可以分解为效应平方和与误差平方和的思想,提出了基于效应平方和的连续数据离散化算法,先利用直方图法对数据进行初始化,然后计算相应的效应平方和和误差平方和,直至效应平方和最大。 ● 本文利用最大熵原理对不同层次空间对象的空间关系进行分析,采用Kullback-Leibler距离作为迭代条件,使用互信息和Z-测试方法选取最能表征空间对象之间关系的空间谓词及与之相关联的非空间数据集。 ● 空间数据挖掘中需要不确定性处理的一个基本方面是空间对象之间的拓扑关系。本文提出了采用概率粗糙集模型处理空间关系的空间数据分类方法,此方法可以处理空间数据中的不确定性关系,在保持信息分类能力不变的前提下进行数据约简,能够处理多种类型的噪声,输出最终的空间数据分类规则。 ● 通过对空间数据挖掘中数据预处理、空间谓词选取及数据分类的研究,最后实现了一个空间数据挖掘的原型系统。原型系统是在Windows操作系统下,以
其他文献
近年来,基于卫星的互联网的发展已经成为宽带卫星通信发展的一个主要方向。卫星与互联网相结合具有更强大的功能,能够提供更广泛的服务。但是在设计和实现基于卫星的互联网时,卫
随着互联网的普及,电子邮件已经成为一种不可或缺的信息交流手段,然而与之相关的各种安全问题,包括广受关注的垃圾邮件,给广大网络用户带来极大的困扰。如何提高邮件系统的安全性
随着数字媒体技术和计算机网络通讯技术的蓬勃发展,数字媒体应用日益广泛。但随之而来的是数字媒体可以在无任何减损品质的状况下被轻易的拷贝并通过网络迅速传播,而且费用低
随着信息技术的发展和数字化产品的普及,从消费电子到工业设备,嵌入式系统被应用到网络、手持通信设备、国防军事等各个领域。嵌入式系统是以应用为中心,以计算机技术为基础,其软
为了让计算机具有处理甚至理解自然语言的能力,人们发明了很多自然语言语义分析理论。而在汉语的计算机处理中,大部分的语义分析都是以汉语分词作为基础。目前,很多的汉语分
随着市场的发展和成熟,业务过程越来越复杂和细化,而对“过程”管理和控制缺失,只注重“结果”的管理方式是片面的和不稳定的,有可能导致管理失控。为了对企业各管理层面各种过程
铁路罐车是国家法定强制检定的计量器具,传统的容积计量方式由于存在着技术落后、操作受人为因素影响较大、使用经验公式等问题导致罐车容积计量不能保证精度要求。而基于光学
TinyOS作为一种典型的无线传感器网络操作系统被广泛使用,但它现有的调度策略采用非剥夺的先来先服务(first-come-first-served,FCFS)调度策略,不能够保证系统的响应性能,当系统
随着社会信息化程度的提高,人们越来越多地依靠将搜索引擎作为中介去获取Web上的资源。因此,搜索引擎在Web资源检索时所起的作用越来越重要。通过在搜索引擎模块设计中大量采用
我国社会总能耗中工业能耗占70%以上,其中高耗能行业能耗占工业能耗的75%以上,工业是我国能源消耗大户,也是国家节能政策关注的重点,有效的节能能够明显降低企业的生产成本,