论文部分内容阅读
高光谱遥感技术是遥感技术研究的重点,广泛应用于农业、地质、草原监测、森林研究、海洋研究、环境监测、减灾等领域。高光谱遥感图像的分类是高光谱遥感图像处理的重要环节,但是由于高光谱遥感图像的高维特性以及人为标定类别信息的昂贵成本,带有类别信息的训练样本数量一般较少,“Hughes”现象表明其分类精度往往比较低。高光谱遥感图像的聚类不需要类别信息,免去了人为标定类别信息的成本,作为分类等后续环节的前驱步骤显得越来越重要。生成式对抗网络(GAN)是最新最热的生成式模型之一,它利用博弈理论,同时训练两个网络:生成器(Generator)和鉴别器(Discriminator)。生成器试图模拟一种数据分布,使得生成的数据无法被鉴别器识别为伪造数据;而鉴别器试图最大化其鉴别能力,尽可能地区分生成数据和真实数据。本文从数据增广和特征提取的角度,利用生成式对抗网络兼具生成能力和特征提取能力的特性,提出了基于生成式对抗网络的高光谱遥感图像聚类算法。本文的主要工作为:(1)分析了传统聚类算法(K均值算法及其变体、层次聚类算法、密度聚类算法等)的优缺点,用C++编程语言实现了五种聚类算法,并在Indian Pines AVIRIS数据集上测试了它们针对高光谱遥感数据的聚类性能。实验表明,迭代自组织数据分析(ISODATA)算法的聚类精度高、耗时少,具有最佳的综合性能和最好的实用性。(2)HSGAN[85]是针对高光谱遥感图像光谱数据分类的一维特征设计的GAN网络模型。本文基于HSGAN从以下三个角度研究了高光谱遥感图像聚类:一是从数据增广的角度,利用生成器的生成能力,把生成的伪造光谱数据作为增广数据加入到真实光谱样本集中一起进行聚类分析。二是从特征提取的角度,利用鉴别器的特征提取能力,对真实光谱样本进行不同层次的特征提取,对提取的特征进行聚类分析。三是结合数据增广和特征提取,利用鉴别器对生成的伪造光谱数据进行特征提取,把提取的伪造光谱数据特征作为增广数据加入到真实光谱样本特征集中一起参与聚类分析。在Indian Pines AVIRIS数据集上的实验表明,以上三种方法都能在一定程度上提高K-Means算法的聚类指标,其中浅层特征在第二种方法中的表现更好,深层抽象特征在第三种方法中的表现更好。(3)在上文的基础上,改进了HSGAN的网络结构并把它应用在高光谱遥感图像的聚类问题上。一是利用变分自编码器的生成特性,把HSGAN的生成器部分替换为变分自编码器,形成VAE-GAN[53]模型;二是在HSGAN的鉴别器中再添加一个卷积块单元,包括两个卷积层和一个最大池化层(MaxPooling),并在每个卷积层后添加了批量标准化层(Batch Normalization),提高HSGAN训练的稳定性。在Indian Pines AVIRIS数据集上的实验表明,以上两种改进均能提高K-Means算法的聚类指标,在改进后的HSGAN模型中,深层抽象特征在(2)中的第二和第三种方法中的表现都优于浅层特征。(4)设计并实现了一个高光谱遥感图像聚类分析软件,实现了高光谱遥感图像的读入、模拟数据生成、光谱特征提取、聚类、光谱曲线可视化以及聚类结果的可视化功能。