论文部分内容阅读
藻类生长影响因子的识别和建模预测一直是藻类水华防治的研究重点,水质监测及自动化的发展所引领即将到来的水质大数据时代需要一种大数据与传统分析结合的数据分析平台,对于藻类生长这一复杂系统演化过程需要一种直观的描述方式。针对这些问题,本文做了如下研究:(1)通过组合大数据生态圈的多个组件在虚拟机上部署集群环境,以MySQL+Hive+SparkR为主体框架搭建了一整套从数据的输入、存储、调度到应用分析的SparkR水质分析平台。大数据技术与R语言分析进行结合,满足水质监测数据可靠存储、统一调度和数据量可伸缩性分析的需求。同时应用ECHarts技术实现了水质数据可视化查询展示。(2)为避免环境及人为等不定因素的干扰,在室内模拟草、藻型人工湖环境,设计了室内模拟培养的实验组及重复实验组,监测未植苦草的对照组和植有苦草的苦草组的各项指标。通过SparkR平台对数据进行处理和调度,对结果进行藻类生长的过程分析、相关性分析,应用Adaptive-Lasso算法识别出对照组和苦草组藻类生长主要影响因子,并建立Adaptive-Lasso回归方程进行验证,在集群环境中应用GBRT算法建立藻类预测模型。通过对比分析证明苦草对水体环境具有一定的除磷、除氮和抑藻作用,对照组的藻类主要影响因子分别为pH、溶解氧、浊度、电导率、总磷、总氮,苦草组的为pH、溶解氧、浊度、电导率、总磷、总氮,经重复实验验证,两组的GBRT藻类预测模型未来3天的相对误差均值分别为15.3%、14.8%。(3)应用WASP模型的EUTRO富营养化模块来构建藻类生长模型,结合实验数据,选取了藻类生长、氨氮、总磷和溶解氧模块构建模型和进行参数率定,并对相应模型进行了检验。以藻类能量值为属性指标,结合模型与藻类活动行为,对藻类抽象为智能体主体并定义行为规则,同时将氨氮、总磷和溶解氧抽象为主体,结合多智能体层和环境层共同构建多智能体模型,最后通过NetLogo平台对藻类生长多智能体模型进行仿真。