论文部分内容阅读
聚类分析是数据挖掘领域的重要研究内容之一,吸纳了计算机科学、统计学、数学等各领域的知识和思想。对于没有明显特征的数据集,聚类能够挖掘出数据对象的“相异性”或“相似性”,并根据这种特性把集合分为若干子集,使相同子集内部对象差别较小而不同子集间的差别较大。近年来,聚类分析理论呈多样化发展,应用范围也已扩展至图像处理、气象分析、医学等领域。图像处理是聚类分析应用研究的一个新兴的方向,而图像分割则是该方向研究的一个分支。气象分析领域有规模庞大的卫星云图图像资源,如何使用计算机方法对卫星云图进行图像处理并从中提取有效的云团信息进而对雷暴、降水等基于云团的天气系统进行分析预报,是气象和计算机信息处理研究人员有待解决的难题之一。本文将聚类分析用于卫星云图图像分割,实现定性定量的云团分割识别,为雷暴等天气的识别提高了效率和准确率,拓宽了聚类分析在卫星气象中的应用。本文的主要研究内容为:(1)用模糊C均值聚类(FCM)对卫星云图进行首次分割,实现了云地分离。云图图像分割的关键在于根据多光谱图像中像素点间灰度特征的“相似性”对像素进行划分来达到云区域与地表区域分割的目的。传统的阈值方法属于图像硬分割方法,不仅难以取得一个合适的阈值,而且受环境因素影响,准确率难以保证。本文考虑到云图复杂性和模糊性等因素,研究了一种基于FCM的云地分离算法。该方法能有效进行云图不确定性分割和提升分割准确率。实验表明,本文方法能更好地反映云和地表灰度阈值的动态变化特性,得到更加接近实际的效果。(2)用密度聚类法对云图进一步分割处理,实现了云团识别。云图云团识别指根据云图中像素点间的空间分布关系,识别出大尺度云系、小尺度云团的目标过程。基于像素点间的“密度连通性”,结合基于区域的图像分割思想,提出一种基于DBSCAN密度聚类的云团识别算法。该方法利用相同云团内的像素点“高密度连通”,不同云团内像素点“低密度连通”,实现从云图中提取出独立的云团。实验表明,该方法不仅实现简单、效率高,而且还能通过对邻域相关参数的调整获取最佳的云图分割效果。(3)最后本文将上述两种算法应用到雷暴云团识别的数据预处理中,基于此提出了一种基于云团的雷暴云团识别方法。该方法以云团分析为前提,结合光谱阈值和纹理特征识别的优点,能够快速、准确地识别出雷暴云团。实验结果说明聚类分析在气象卫星云图的分割处理方面具有较高的研究和应用价值。