论文部分内容阅读
二十一世纪以来,人类对地球表面覆盖进行多尺度、全方位实时动态观测的能力进一步提升,遥感对地获取影像能力日益精进,进入了海量数据、多源遥感、多时相、全天候信息获取和以快速即时自动化处理数据为突出特征的对地观测新时代。地表水资源在地球环境演变,人类日常生产生活中扮演重要角色,如何有效利用丰富的遥感影像资料对地表水进行提取分析一直是科研人员广泛探讨的问题。集成学习算法是通过构建并结合多个相同种类或者不同种类的学习器进行学习,通过将构建的多个学习器以不同的结合方法进行组合,通常可以获得比单一学习器学习效果更佳,泛化性能更优越的学习器。现实中往往可以轻易找到一种简单低效的学习器,通过集成框架将简单低效易实现的学习器构建成学习能力强,稳定性高,泛化能力强的强学习器具有很大的实用意义。本文利用决策树算法和随机森林(RF)、梯度提升树(GBDT)以及AdaBoost三种集成学习算法对中国长江流域洞庭湖区域的GF-1两米分辨率融合遥感影像、GF-2一米分辨率融合影像和GF-6两米分辨率遥感影像进行水体信息提取,在此基础上,研究高分遥感影像水体提取过程中的最佳样本采集比例和最优特征组合,取得主要主要成果如下:(1)利用决策树算法和三种集成学习算法对洞庭湖区域三种高分遥感影像进行水体提取,试验结果表明,GBDT性能最佳,可以在相对较短的时间内完成分类任务并获得最佳分类效果,针对三种遥感影像的平均分类时间为0.309小时,在三种集成学习算法中用时最短,平均总体精度为0.976,平均Kappa系数为0.951,在四种分类算法中定量精度最高。(2)基于GBDT的采样比例对比试验中,定量精度评估表明,在0.1%,0.2%,1%和2%四种采样比例中,0.1%的采样比例达到的精度最佳,最高总体精度为0.991,最高Kappa系数为0.982。并且分类时间最短。证明样本数量并不是越大分类效果越好。样本采集时在保证水体种类采集全面完整的前提下,0.1%的采样比例可以获得最优分类效果。(3)利用GBDT集成学习算法,以0.1%样本采集比例进行样本采集,对武汉地区GF-1融合后两米分辨率遥感影像进行水体提取试验,对影像进行主成分分析并计算NDVI和NDWI两种指数,由实验结果分析可得,利用主成分分析转换后的四个分量与NDVI和NDWI波段组合进行水体提取分类效果最佳,相对于一般只利用四光谱波段的方法精度有所提高。