基于Flink的大规模水文传感器数据异常检测系统的研究与应用

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:pipiskin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国物联网、传感器以及通信技术发展日趋加快,各个领域数据规模不断增加,数据成为一种在大数据时代新兴的资产。水文传感器在水文领域中扮演着重要角色,大规模水文传感器异常检测技术的飞跃也促进了水利建设和经济的发展。本文基于传统水文异常检测的不足,设计并实现了一套基于Flink的大规模水文传感器数据异常检测系统。结合ARIMA模型和Markov链来提高灵敏度和特异度,同时利用Flink大大的提升了计算效率。利用资源监控和基准测试,在一定资源情况下的,使得决策者能够做出最佳的选择。本文主要包括以下几方面工作:(1)基于传统ARIMA模型结合滑动窗口,使得ARIMA模型可以处理流数据。同时引入异常校验机制,利用Markov链计算出的一步转移矩阵对异常值进行评估,使得异常检测的特异度和灵敏度都有着显著地提升。本文通过建立组合模型,使用滁河实际数据来验证本文方法的可行性。结果表明,在计算百万级数据时,两个节点的计算时间比一个节点的计算时间长,但在计算千万级数据时,两个节点的计算时间比一个节点的时间短,最大缩减为17.43%。异常检测的灵敏度由5.75%提高到92.98%。在延迟方面,不同节点的平均延迟大致相同,均保持在20ms以内;(2)对时间序列数据库和Nosql的基准测试进行了研究。设计开发了整个Benchmark平台,实现了一个通用的基于Kafka的数据接口,用于同步向不同Nosql发送消息。对数据存储进行了选型和测试,给出了最适合水文数据的测试结果;(3)对大规模水文传感器异常检测系统的软件组成进行了设计,并建立了数据采集系统中消息中间件的设计方案。建立了Flink和Kafka之间的通信联系,并利用Flink进行流处理,实现了相关的异常检测功能,并对关键实现进行了展示和说明。最后阐述了持久化的设计以及整个系统的运行模式等;(4)设计并实现了管理平台,建立管理平台与大规模传感器异常检测系统的连接,基于滁河水文传感器测试了平台的各项不同的功能,结果表明该平台可实时显示滁河传感器的数据并进行相应的分析,并为工作人员提供账户管理和数据访问。
其他文献
蓝果忍冬的氮磷钾肥施入量直接影响到叶片及果实品质和产量,对其进行精准地研究对蓝果忍冬产业的良性发展尤为重要。本试验于2019~2020年在东北农业大学蓝果忍冬种质资源圃进行,试验材料为六年生‘乌蓝’,试验共10个处理,氮、磷、钾肥均以10g梯度递增,0g/株、10g/株、20g/株、30g/株。研究氮、磷、钾肥不同施入量对蓝果忍冬叶片及果实品质的影响,旨在为蓝果忍冬的精确施肥提供科学依据。本文主要
氮杂环化合物是众多天然产物、生物活性分子、药物制剂以及其他功能分子的重要结构要素;在催化领域,含氮杂环还被广泛用作催化剂的辅助配体。其中,七元氮杂环在含氮化合物中
随着计算机信息技术的发展,人工智能、大数据时代的来临,船舶制造理念正经历着从自动化到智能化的转变。船舶柴油机作为智能机舱的核心设备,其重要性不言而喻,依靠专家知识经验进行故障诊断的方式已经不能满足“智能船舶”时代的要求,船舶柴油机故障作为船舶安全可靠运行的“潜在杀手”,需要智能故障诊断方法与理论的保驾护航。本文在总结和汲取前人研究成果的基础上,以R6105AZLD型船用柴油机为研究对象,以表面振动
随着“大数据”时代的来临,人们的经济活动日趋复杂,相比于传统的时间序列数据和截面数据,面板数据更能反映经济变量的动态变化趋势,体现人们复杂的活动.由于面板数据广泛存在于经济学、金融学等领域,它已然成为经济学家和统计学家研究的新热点.对面板数据模型的研究可以有效地提高估计的精确度,包含了更多的现实意义.本文主要对面板数据下带固定效应的部分线性模型进行了研究,着重讨论了模型中未知回归系数和非参数函数的
汽车作为人们日常出行的必备工具,已经融入了千家万户的生活之中,人们对汽车的安全性、便捷性的要求也越来越高,因此驾驶员辅助驾驶系统应运而生,路标识别是环境感知领域的重
本文考辨上古時期的青黑系顏色詞,辨別與統計上古時期的字書和文獻中出現的青黑色系顏色詞,得到青系顏色詞27個,黑系顏色詞41個。論文結合字形分析、用例解讀,參考字書說解和前人的相關著述,對這68個青黑系顏色詞的本義、顏色義來源等進行探究,辨析其顏色性質和詞義變化源流,從中析分出已經具備成熟顏色義項的中心顏色詞和尚未發育完全的附加顏色詞,並剔出無法認定確實有顏色義的詞。顏色詞的範疇及其意義具有歷史特征
光催化技术以取之不尽的太阳光为驱动源,将太阳能转化为化学能,它为解决环境问题与能源危机提供一种绿色方案。光催化技术的基础和核心是半导体光催化剂,然而,目前传统半导体
由于其丰富的物理内涵与巨大的潜在应用价值,多铁性材料已成为凝聚态物理与材料科学领域的研究热点。多铁性材料是指具有两种及以上初级铁性并存在初级铁序间耦合效应的材料。其中,最近最受关注的是磁电耦合多铁材料。然而,由于其电子结构的互斥性,自然界很少(反)铁磁铁电共存的化合物,而仅有的少数(反)铁磁铁电化合物的铁电性或磁性转变温度往往远低于室温,难以实际应用。BiFeO_3是目前唯一公认的单相室温多铁性材
自工业革命以来,以变暖为主要特征的全球气候变化给当今社会造成了极大的挑战。气候变化导致极端事件的频次、强度可能变大,且事件的影响范围、持续时间等基本特征也可能发生
γ-PGA是由枯草芽孢杆菌发酵产生的高分子聚合物,具有生物可降解、无毒、可食用等特点。γ-PGA通过交联反应得到水凝胶具有良好的吸水性与生物相容性,在食品、农业、医药等领域中具有广泛的应用。本论文主要对γ-PGA原料及γ-PGA水凝胶的制备与性质以及γ-PGA水凝胶在杏保鲜中的应用进行了研究。对表面活性剂影响γ-PGA合成与分泌量进行研究的结果表明,在第36h添加5g/L的Tween 80可以显著