基于Spark的网络数据分析系统研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ayun33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代社会互联网的高速发展,网络数据逐渐变得种类繁多且数量巨大,与此同时,新型攻击手段的不断涌现也使得网络安全问题变得更加棘手。因此,在大数据时代下,如何充分利用海量数据来实现对网络异常数据的分析与检测是一项非常重要的课题。近几年来随着人工智能技术的发展,利用深度学习等机器学习方法对海量数据进行分析能够取得比较好的效果。但与此同时,深度学习会带来非常大的计算资源的消耗。因此能够将深度学习能力与大数据处理能力结合在一起在网络数据分析中是非常重要的。针对上述问题,设计了一种基于Spark的网络数据分析系统。首先,将深度学习框架Keras与大数据处理平台Spark相结合,为Spark扩展深度学习能力,实现深度学习的分布式计算,使得大数据的获取与处理、数据模型的学习与应用都在一个统一的分布式集群中。其次,利用Spark Streaming流式计算的特点,系统能够对网络数据进行实时监控,对异常数据及时作出判断和响应。且通过对有效参数的调整控制实现对Spark Streaming实时计算的性能分析与预测。最后,对于Spark Streaming实时计算性能的优化,设计了一种批次时间间隔的动态调整策略,实现了实时系统低延迟与高吞吐量之间的平衡,提升计算性能。相较于传统的分布式Keras深度学习集群,基于Spark的网络数据分析系统不需要在深度学习与数据处理两个独立集群之间传递大型数据,并且能够轻松将Keras代码迁移到此平台上,减少了系统复杂性和数据传输延迟。同时对于Spark Streaming流计算来说,本系统能够更好的适应外部条件的变化,保持系统稳定性,提升计算性能。
其他文献
网络市场的快速发展,使得在网上购买有机食品成为可能,研究消费者对食品可追溯标识的信任将有助于推动食品网络市场的良性发展。实证分析发现:消费者对有机食品可追溯标识信息
沥青路面施工工艺影响高速公路质量,为获得更好的高速公路施工效果,就必须要对沥青路面的施工工艺与质量控制的要点进行讨论。本文由高速公路沥青路面摊铺材料的技术控制入手,分
无线传感器和移动电子设备的普及推动了无线输能技术的研究,并随着近年物联网技术的发展,无线节点大幅增加,无线输能有了更广泛的应用空间。微波输能作为一种有效的无线输能
随着大规模和超大规模集成电路的不断发展,场效应晶体管(FET)器件的特征尺寸不断缩小,传统栅介质SiO_2由于其较低的介电常数,已经达到了物理极限。因此,高介电常数(高k)材料已经越来越引起人们的注意。高k栅介质薄膜的制备方法有很多,如物理气相沉积(PVD),化学气相沉积(CVD),原子层沉积(ALD)等,都需要高成本,长时间和高真空条件。溶液法是另一种非真空制备方法,具有低成本,操作简单灵活,材
“三主”教学模式是钱梦龙先生在上世纪针对传统的课堂教学模式提出的。“三主”即“以学生为主体,以教师为主导,以训练为主线。笔者作为一名幼师舞蹈教学工作者,在一年多的幼儿
目的:观察溃疡性结肠炎患者的护理效果,总结护理体会。方法:选取我院2014年7月~2015年11月收治并已确诊的溃疡性结肠炎患者40例,对其临床资料进行回顾性分析,总结出护理的有
职业成熟度作为一种主要的理论越来越受到职业发展研究的青睐,成为研究个体职业心理发展特点并对职业生涯辅导和咨询产生重大影响的理论之一。通过梳理和分析经典职业成熟度
三峡水库消落带在高压淹水浸泡和干湿交替作用下,土壤力学特性必然发生变化,影响土体抗侵蚀性能,破坏库岸稳定性。目前对消落带土壤力学特性变化及其对淹水—落干驱动的响应
介绍了延长石油集团兴化节能及综合利用工程的锅炉分离除尘工艺方案。
自李克强总理在2014年9月夏季达沃斯论坛上提出“大众创业、万众创新”的号召以来,创业创新成为一股新的浪潮席卷全国。大学生作为时代先锋,积极响应创新创业的号召。9月16号