论文部分内容阅读
遥感图像数据挖掘是一个有着广阔应用前景的研究领域。由于遥感图像数据库的海量特征,遥感图像数据挖掘已成为空间数据挖掘的主流。近年来,随着图像获取和图像存储技术的迅速发展,使得人们能够较为方便地得到大量有用的遥感图像数据。图像数据挖掘是用来挖掘图像数据中隐含的知识、图像内或图像间的各种关系以及其他隐藏在图像数据中的各种模式的一种技术,目前仍处于实验研究阶段,是一个新兴的、但极有发展潜力的研究领域。其中一类方法是通过卫星收集数据,并通过Apriori等基本算法以及系列算法,挖掘出不同对象不同属性间的关联规则。这意味着序列模式挖掘算法可以集成到遥感图像数据挖掘算法之中。作为遥感图像数据挖掘方法的核心,序列模式挖掘算法的性能一直是影响方法性能的瓶颈。由于Apriori算法、PrefixSpan算法在挖掘大数据集上的劣势,针对遥感图像数据集,本文提出了基于BIDE的遥感图像数据挖掘方法,并对其中的闭序列模式挖掘算法进行了深入的研究与改进,使之能够更好的挖掘遥感图像数据集。本文把BIDE算法集成到遥感图像数据挖掘方法中。这种闭序列模式挖掘算法不需要维护候选闭序列,可以直接进行闭序列检查,并且可以快速完成搜索空间削减。针对遥感图像数据集,本文对算法的各个模块进行了测试,证明了方法的有效性、高效性。对于更大规模的遥感图像数据集,BIDE算法在闭序列检查和搜索空间削减的过程中需要进行大量字符匹配和支持度计算操作。这两种操作产生了大量的时间开销。针对其弱点,本文提出一种基于位置扩展的闭序列模式挖掘算法—CSBIDEP算法,通过记录每个事件的位置信息,利用位置信息得到频繁1-序列,并对其进行直接位置扩展验证,以减少对投影数据库的扫描,节省时间的开销。针对不同规模的数据集,本文将基于位置扩展的闭序列模式挖掘算法与BIDE算法进行了比较实验。从实验结果看出,前者的时间性能有了显著地提高。