论文部分内容阅读
随着大数据技术发展,很多平台能够存储并对外提供海量地表图片,Flickr就是其中之一。全球地表覆盖利用地图一直是很多研究内容的基础平台,然而地表每天都在发生变化,这就导致地表覆盖利用地图时效性不高。目前获取地表覆盖利用地图常用的方法有通过遥感影像分析提取,一方面提取内容的准确率跟遥感影像分辨率以及分析技术有关,另一方面获取全球的遥感影像分析并提取地表覆盖利用地图也是一件浩大的工作。因此在如何获取精准、低成本、时效性高的地表覆盖利用地图是当前研究的热点与难点。随着人工智能浪潮的推进,深度学习在计算机视觉领域的应用已经有很多成功的案例。将深度学习应用在地理与环境的研究是一件比较有创新性的工作。大数据为深度学习提供了海量地表图片数据,但是图片的筛选获取与标注也是工作难点。目前也存在相关的地表覆盖图片数据集,但是并没有按照某一分类体系划分类别,创建按照地表覆盖分类体系划分的图片数据集也是非常具有难度和创新性。数据决定模型的上限,因此目前存在的地表覆盖分类模型准确率也有待提高。研究如何提高模型的准确率也是一个重要的研究方向。因此,本文基于现有的网络技术获取海量数据集,按照LCCS分类体系创建图片数据仓库,并在数据仓库的基础上研究深度学习在地表覆盖分类上的应用。本文首先概述了地表覆盖利用地图在各个领域的重要性,以及目前提取地表覆盖利用地图所遇到的问题。陈述目前存在的地表覆盖分类系统,深度学习的发展历程以及深度学习在自动识别地表覆盖类型研究现状,分析了目前深度学习在识别地表覆盖类型领域的应用还存在一些不足。其次,在研究地表覆盖数据集建设的基础上,对现有数据集的不足,提出按照LCCS分类系统对数据集进行标注划分;并建设一个能够自主的根据地理空间范围、关键字等条件,索引出相应图片数据集的数据仓库。此项工作能够为识别地表覆盖类型领域提供强大的数据基础。最后在建设的数据仓库基础上,选择欧洲地区为研究区,研究欧洲地区的地表覆盖分类模型训练,并对标注数据做了准确性验证。通过调节Dropout、初始学习率,利用Adam、RMSProp自适应学习率算法等方法选择网络识别性能最优的模型算法。实验结果表明,网络模型的初始学习率设置为0.005,Dropout设置为0.5,优化算法选用Adam算法会有更好的表现。其中准确率Top1 59%,Top383%。该模型能够达到好的识别效果,为地表覆盖类型识别应用提供了技术支持,为全球地表覆盖利用地图的提取提供了新的方法。并且本文建设的基于LCCS分类系统全球地表覆盖图片数据仓库为更多的研究内容提供了数据支持。