论文部分内容阅读
数据挖掘技术和地理信息系统技术作为信息技术中的两个重要技术,在处理气象资料方面有着极其重要的地位和作用。数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,其在处理海量气象信息方面有独特的优势,能有效解决不断增长的气象数据有可能带来的“数据丰富,知识贫乏”问题;地理信息系统技术可以将气象数据所具有的空间特征、属性特征及时间特征等特点较好地表现出来,是实现空间数据管理的有效手段。传统的数据挖掘是在关系数据库或事务型数据库中发现知识,无法揭示气象信启、中包含的时空特征。开展时空数据挖掘研究,发现潜藏在数据中的时空规律,对于提高海量气象数据的使用效率,提高气象预测预报水平具有重要的意义。本文将数据挖掘技术和地理信息系统技术进行综合集成,开展基于地理信息系统的气象数据时空挖掘研究,对气象数据进行空间分析、空间聚类和时空关联规则等三方面的挖掘计算。论文首先论述了数据挖掘、时空数据挖掘和地理信息系统的基本概念、主要技术方法和三者之间的联系。在此基础上,提出了基于地理信息系统进行时空数据挖掘的想法,论述了主要的集成模式,进行了集成框架的设计,简述了主要的技术手段,为论文研究奠定了理论和技术基础;为了提高本文研究使用的气象数据的质量,论文从数据概况、质量控制、格式转换和气象数据库设计等几个方面对气象资料的处理方法和步骤进行了论述,为论文研究奠定了数据基础。为了挖掘气象数据潜在的时空规律,论文分别从空间分析、空间聚类和时空关联规则三个方面开展了数据挖掘研究。空间插值既是解决观测资料缺测问题的有效手段,又是基本的数据挖掘方法,本文利用空间插值方法对东北地区气象资料进行了计算,得到了适应于东北地区气象资料较好的插值方法;为了得到东北地区气温和降水量的气候区划,论文利用k-means算法对东北地区气象资料进行聚类分析,针对k-means算法初值k问题,提出了改进的基于层次的k-means算法,有效解决了k值确定问题;为了挖掘气象要素之间潜在的时空关联规则,论文以能见度预报规则为例,以时空数据模型和时空数据库理论为基础,以挖掘空间谓词和时间谓词为方法,构建了能见度时空数据模型,对影响能见度的时空因子进行了挖掘,得到了影响能见度的时空关联因子;为了发挥地理信息系统在空间信息管理和显示方面的优势,论文开发了气象综合信息显示软件,实现了挖掘结果的直观显示,并分析了东北地区气象要素的时空分布特征和规律。