论文部分内容阅读
不同的植被受到气候周期变化的影响时,会出现不同的节律变化。这些节律变化可以在时间序列遥感数据的观测结果中得到表现。从时间序列数据中提取的植被分类特征,可以比较准确地反映不同植被的物候差异。从不同时间序列数据中提取的多种分类特征,这些特征组成具有高维和异构特点的特征集,而且这种特征集的空间分布不符合正态分布规律,所以传统的基于正态分布假设的降维算法不能对这种特征集进行特征选择。为了对高维异构非正态分布的特征集实现降维处理,解决不同种类数据在植被分类应用中的限制,本文以甘肃省张掖市和云南省腾冲市作为研究区,从多种时间序列遥感数据中进行植被分类特征提取,提取方法分为两种,分别是:基于时间序列曲线的分类特征提取和基于数据降维方法的分类特征提取,接着对基于时间序列曲线提取的分类特征进行基尼系数计算,然后按照基尼系数的大小进行特征选择,同时对基于数据降维方法提取的特征按照波段中信息量的大小来进行波段选择,最后利用以上两种方法选取的特征子集进行随机森林分类,分析不同特征选择方法对分类精度的影响,得出以下结论:(1)本文基于信息熵原理对分类特征进行选择,实现了对具有多源异构、非正态分布的特征集进行降维,能够解决不同类型数据在植被分类应用中的限制。(2)根据不同植被的物候差异,可以从各种植被的时间序列曲线中提取出物候特征并组成各自的物候特征集。这些特征集可以比较准确地反映植被物候特征差异。(3)基于基尼系数对植被分类特征进行选择,可以得到最佳分类特征集,而且这些特征集具有维数低和信息冗余度低的特点。本文利用这样的特征集进行分类,可以有效提高分类精度。结果显示,本文利用通过基于基尼系数选取的特征进行分类,张掖地区的分类精度为77.31%,腾冲地区分类精度为75.85%。两个研究区的分类精度都高于未进行特征选择的分类结果的精度。