大气污染大数据平台的设计与实现

来源 :陕西科技大学 | 被引量 : 0次 | 上传用户：cjfalx

【摘要】

：

近年来中国大气环境质量问题频现,以PM2.5为主要代表的大气污染物对人体健康以及大气环境造成了很大危害。大气污染问题涉及多个层面,影响因素众多,需要对PM2.5地面监测数据

【作者】

：

赵滨

【出处】

：

陕西科技大学

【发表日期】

：

2020年01期

【关键词】

：

大数据 Hadoop Spark 集成学习 PM2.5 大气污染

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来中国大气环境质量问题频现,以PM2.5为主要代表的大气污染物对人体健康以及大气环境造成了很大危害。大气污染问题涉及多个层面,影响因素众多,需要对PM2.5地面监测数据、气象数据、卫星遥感数据及污染源等海量数据进行分析处理才能得出正确结论。因此,大气污染的监测中海量数据的分析处理成为了关键。大数据技术为解决上述问题提供了一种新思路,利用大数据技术解决大气污染数据集成、存储以及信息挖掘,成为大气污染领域的研究热点。我国虽已建成全国性PM2.5地面监测网络,但由于地面站点分布不均,对高密度、宽覆盖的大气污染监测数据进行采集处理,成为大气污染领域又一研究热点。为了解决大气污染数据的采集、存储、分析以及应用问题,设计了基于Hadoop与Spark的大气污染大数据平台,并针对地面站点数据空间分布不均的问题,通过引入AOD(Aerosol Optical Depth)数据实现了中国区域的PM2.5应用研究。主要工作有以下几个方面:(1)大气污染平台的设计与实现。首先针对大气污染大数据平台中的分布式采集框架、分布式文件系统、分布式并行计算框架等相关技术开展研究。然后对大气污染大数据平台进行需求分析,设计能够满足不同数据源采集、海量大气数据存储以及不同应用场景数据分析的大数据平台架构。之后集成Hadoop与Spark构建了大气污染大数据平台,采用Flume与Kafka从多源的前端服务器完成数据的分布式采集;通过Spark Streaming与Kafka相结合方式,将Kafka缓冲区中实时流入的数据进行处理和计算;利用HDFS与HBase完成数据分布式存储,并针对大气污染数据的特性对Row Key进行了重新设计,对其存储进行了优化。整合各大数据组件完成了集群环境的搭建,设计并实现了具有4层结构的大气污染大数据平台,包括数据采集和预处理模块、数据存储模块、数据分析模块以及数据可视化模块。(2)PM2.5估算及预测算法的研究与设计。对集成学习框架Bagging和Boosting进行比较,针对两种不同集成框架的特点,基于文中所涉及到随机森林、GBRT和XGBoost算法,结合大气污染数据特征,利用各自算法的特点和优势,融合三种算法对模型进行优化,设计了多模型融合算法,并应用于大气污染大数据分析引擎中。通过仿真测试结果表明多模型融合算法各方面性能均优于随机森林、GBRT和XGBoost三种算法,进一步提升了模型精度,证明了该算法对大气污染数据分析的有效性。(3)将PM2.5的估算及预测算法应用于大气污染大数据平台的数据分析中。进行了地面PM2.5浓度估算与地面PM2.5浓度逐小时预测,测试了大气污染大数据平台的各项功能,并通过对预测结果的时空分析验证了算法的准确性。通过中国环境监测总站2016年里1497个站点的地面PM2.5数据测试,证明平台的各项功能可以满足PM2.5的小时级预测与估算,实现了 PM2.5浓度变化的实时监测。通过实践表明平台各功能模块工作正常高效,运行稳定,能满足大气污染数据集成、数据存储和数据分析的需求,平台为有效防范大气污染提供了科学决策的依据。

其他文献

语言学视角下的顾城诗歌研究

顾城是朦胧诗派的代表诗人之一,一生当中创作了大量优秀的诗歌。在不同的创作阶段,其诗歌语言有着不同的特征。我们在词汇学、功能语言学的语域理论的指导下,采用统计归纳法

学位

顾城诗歌语言词频语义类语域理论

新时代大学生生态文明观教育研究

在人类文明的演进史中,从最初的原始文明、农业文明、工业文明到现如今提倡和进行的生态文明,我们不断探索和追寻适合人类生存和发展的道路。随着工业文明发展进程的加快,人

学位

新时代大学生生态文明观教育

破产重整程序中债转股问题研究

破产重整程序是指《企业破产法》中的破产重整制度,是我国《企业破产法》规定的法律制度之一,是指当企业无能力偿付债权人债务或者资不抵债的情况下由各方利害关系人提出申请,并在法院的主持下由债务人与债权人达成协议,进行业务重组或者债务调整的一种制度。企业债务转化为股本在破产重整程序中是一种传统的市场化、常态化的法律手段,可以降低债务人负债,帮助债务人摆脱破产困境、重获生机。债转股可以划分为政策性的债转股与

学位

破产重整债转股商业银行重整计划完善建议

预防及管理ICU成人失禁相关性皮炎的循证护理研究

目的:本研究包括两个部分。基于循证的护理方法,第一部分旨在检索并分析预防及管理ICU成人失禁相关性皮炎的相关证据,并对证据进行总结。第二部分将所检索到的最佳证据应用于

学位

失禁性皮炎预防管理循证护理

含聚硅氧烷超支化的合成及对非固化沥青防水涂料耐热性的研究

非固化橡胶沥青防水涂料是近十几年来研发出的一种新型防水涂料。它的主要成分是橡胶和沥青,还包含增粘树脂,软化油和添加剂等多种填料。橡胶和增粘树脂的加入可使沥青在室温

学位

非固化橡胶沥青防水涂料耐热性超支化聚合物聚硅氧烷

预冷式蒸发空冷器传热性能的研究

环境问题日益突出、能源危机进一步加深,为积极响应国家号召的节能减排政策,石油化工、电厂和炼油等领域都在不断探索高效、节能、环保的换热设备。利用水的汽化潜热大量带走

学位

预冷式蒸发空冷器传热性能给热系数SPSS数学模型

从深入的人物理解到细致的舞台呈现

话剧要求演员在固定的空间中、规定的时间内、通过舞台形象、形体动作、语言等将角色完美的呈现在观众面前。本文结合毕业大戏《无人生还》的演出实践,以饰演剧中“伊丽莎白”角色为例,主要阐述演员拿到剧本后对剧本的解读以和人物文学形象的分析,以及排演过程中对人物形象构思,到最终呈现舞台形象的过程。本论文主要分为三部分,首先演员通过对剧本角色形象的解读,理清角色的行动线索,把握角色内外部性格特征、人物之间的关系

学位

形象构思形象塑造形象呈现剧本解析伊丽莎白

论通过网络涉外侵害知识产权的法律适用

现代社会,随着网络技术的日新月异和网络使用的日益普及,互联网成为人们日常工作和生活中不可或缺的重要工具。整个社会都享受着互联网飞速发展带来的益处。互联网的飞速发展

学位

通过网络侵害知识产权法律适用意思自治原则最密切联系原则

大气污染大数据平台的设计与实现

其他学术论文