论文部分内容阅读
气温要素是气象研究的热点对象,深入了解气温要素的变化规律有助于提高气象预报精度,对指导农业生产、生态治理也具有重要意义。随着气象事业信息化程度的不断提高,气象科研和管理活动中采集并积累了大量气象信息资料。气象信息种类繁多,格式迥异、管理分散等特点,极大阻碍了公共气象信息服务的发展。目前对气象数据的研究存在海量气象数据处理效率低,多种研究技术的融合程度低等问题,无法满足气象服务的时效性和内容丰富性的要求。此外还缺乏针对于气温日变化的时空分异特征的大尺度、多维度的研究。Hadoop这一开源的云计算框架为海量气象数据的研究提供了新的手段。基于此,本文在已有的气象学理论研究基础上,以Hadoop和GIS为技术支撑,引入云计算和地理学中相关的数据分析、处理方法,顾及地域对气湿的影响,以美国国家气候数据中心(以下简称NCDC)2009-2013五年的全球地面小时观测数据为数据源,进行数据组织方法的设计和气温日变化时空分异特征的提取。主要研究内容和研究成果如下:(1)针对气温观测日志数据的特点,基于HBase研究海量气象时空数据组织方法。研究并设计了气象数据的表结构,索引机制及入库方式,并提出了HBase运行参数的优化方案。通过引入Solr分布式搜索引擎的索引机制解决了HBase不支持二级辅助索引的问题。(2)借助Hadoop平台和GIS平台,研究气温日变化时空分异特征提取的方法。基于MapReduce编程模型研究并设计了气温因子提取、统计,气温日变化曲线模拟的分布式算法。在此基础上,借助GIS地学分析方法研究并设计了气温日变化空间影响因素提取、计算方法。(3)对文中提出的气象数据组织方法、气温日变化时空分异特征提取方法分别从高效性和准确性方面进行验证。实验结果表明,本文提出的基于HBase设计的气象数据组织方法和借助Hadoop和GIS技术设计的气温日变化时空分异特征提取方法高效、准确。