论文部分内容阅读
为保护河湖生态空间的健康,对于乱建、乱占等侵占河湖空间的行为,要实施有力的监管。包括遥感影像在内的大量空间数据为河湖的智慧管控提供了有价值的信息,而大数据技术中的分布式存储与计算,为这些数据的可靠管理与信息挖掘提供了良好的支持。论文以大数据平台为基础,对河湖空间侵占管控的关键技术展开研究,对如何在大数据平台下为管控范围划定提供合理的处理框架,以及如何识别管控范围内的侵占区域进行了探索。
论文以斧头湖为背景,以其多时相影像为数据源,结合空间大数据技术、河湖管控策略、图像处理算法与机器学习等多方面的知识,在分布式环境下开展研究。论文主要研究工作如下:
(1)以大数据平台架构为基础,设计了分布式环境下的河湖空间侵占管控模型。模型利用HDFS文件系统和HBase数据库实现遥感影像及其瓦片集的分布式存储,并以分布式计算框架Spark与地理空间数据计算引擎GeoTrellis结合实现对空间数据的处理。模型包括了管控范围划定与疑似侵占区域识别两个模块。
(2)面向河湖缓冲带与多规合一的河湖管控场景,设计了管控范围划定的处理框架。在大数据平台下利用NDWI直方图双峰法实现水体自动化提取,并通过图像处理技术获取湖泊轮廓,从而拟定管控的基准边界,作为平台默认的缓冲区叠加对象。此外,结合矢量计算与栅格化技术,设计了包括目标影像、管控区矢量、附加管控区和非管控区等要素在内的参数表,实现管控范围的动态划定。
(3)将机器学习技术应用于疑似侵占区域的识别中,运用“直方图截尾法”对多时相影像样本特征进行归一化处理,并利用Spark完成了随机森林模型的构建与评估,实现对目标影像像元的有效分类。
(4)基于模拟的管控范围,以分割后的瓦片为单位区域,利用Spark和GeoTrellis实现对HBase中的目标影像瓦片集的分布式分类与统计,最终根据设定的人工建筑占比阈值自动识别出疑似侵占区域。
论文的研究验证了以大数据平台相关技术助力河湖空间侵占管控的可行性,为河湖空间的智慧化管控提供了一定的技术参考。
论文以斧头湖为背景,以其多时相影像为数据源,结合空间大数据技术、河湖管控策略、图像处理算法与机器学习等多方面的知识,在分布式环境下开展研究。论文主要研究工作如下:
(1)以大数据平台架构为基础,设计了分布式环境下的河湖空间侵占管控模型。模型利用HDFS文件系统和HBase数据库实现遥感影像及其瓦片集的分布式存储,并以分布式计算框架Spark与地理空间数据计算引擎GeoTrellis结合实现对空间数据的处理。模型包括了管控范围划定与疑似侵占区域识别两个模块。
(2)面向河湖缓冲带与多规合一的河湖管控场景,设计了管控范围划定的处理框架。在大数据平台下利用NDWI直方图双峰法实现水体自动化提取,并通过图像处理技术获取湖泊轮廓,从而拟定管控的基准边界,作为平台默认的缓冲区叠加对象。此外,结合矢量计算与栅格化技术,设计了包括目标影像、管控区矢量、附加管控区和非管控区等要素在内的参数表,实现管控范围的动态划定。
(3)将机器学习技术应用于疑似侵占区域的识别中,运用“直方图截尾法”对多时相影像样本特征进行归一化处理,并利用Spark完成了随机森林模型的构建与评估,实现对目标影像像元的有效分类。
(4)基于模拟的管控范围,以分割后的瓦片为单位区域,利用Spark和GeoTrellis实现对HBase中的目标影像瓦片集的分布式分类与统计,最终根据设定的人工建筑占比阈值自动识别出疑似侵占区域。
论文的研究验证了以大数据平台相关技术助力河湖空间侵占管控的可行性,为河湖空间的智慧化管控提供了一定的技术参考。