基于深度神经网络GRU的并行网络流量异常检测方法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:wuzhaoan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前大规模复杂网络环境下,网络流量异常检测一直是网络安全领域内最为活跃的研究分支之一。它能够对网络中的流量数据进行检测,及时发现异常的网络活动,从而做出预警,是保障网络安全的关键技术。随着信息网络技术的迅速发展,网络类型逐渐多元化,并且网络规模也不断扩大,网络流量数据也越来越复杂,呈现出多源化和异构化特征,为网络流量异常检测工作带来了巨大的挑战,如何提高网络流量异常检测的准确性和效率成为了该领域的热门研究课题。因此,论文利用自学习的GRU(Gated Recurrent Unit)深度神经网络以及Spark大数据处理技术以实现网络流量异常的高精度和高效率检测。论文主要研究工作如下:针对大规模复杂网络环境下的网络流量数据具有海量、多源以及时间依赖特性等特点,结合GRU神经网络和Spark大数据平台,提出一种基于GRU的并行网络流量异常检测模型及方法设计。系统模型层次化地分为网络流量数据采集层、网络流量数据预处理层、网络流量异常检测层和应用服务层。网络流量异常检测层的核心为设计基于GRU的并行网络流量异常检测方法,该方法以GRU网络作为检测模型对网络流量的时间依赖模式进行学习,实现了长时期依赖情景下的高精度网络流量异常检测。并且,整个模型借助Spark大数据处理技术的并行优势,大大提升了异常检测的效率。最后,基于提出的模型,实现了相应的原型系统,并验证了其有效性。考虑到并行GRU训练模型之间存在个体差异性,会导致整体检测精度下降的问题,引入集成学习算法Bagging对GRU并行网络流量异常检测方法进行改进,提出一种基于Bagging改进的GRU并行网络流量异常检测方法(PB-GRU)。Bagging算法以并行拟合的方式对GRU检测模型进行训练,利用模型平均法降低GRU训练模型之间的均方误差,改善泛化误差,提升集成GRU检测模型的检测精度。实验结果表明,与普通的神经网络方法和其它常用方法相比,所提方法将集成检测器的均方误差降至了极低的水平(0.0178),并且具备更高的检测精度和效率。针对网络流量特征存在大量冗余,且GRU网络调参过程复杂及耗时的问题,利用遗传算法(Genetic Algorithm,GA)优化GRU并行网络流量异常检测方法,提出一种基于GA优化的GRU并行网络流量异常检测方法(PG-GRU)。该方法先利用遗传算法对流量数据的输入特征进行选择和约简,以降低GRU检测器的负担;然后对GRU的网络参数进行自动化寻优,使用最优参数训练出优质的检测模型,保证网络流量的异常检测精度。实验结果表明,与单纯的神经网络方法和其它常用方法相比,所提方法在网络流量异常检测的精度和效率上都得到了很大的提升。
其他文献
伪卫星是一种能发射类GPS/BDS信号的地面无线导航设备,能有效弥补GNSS系统在室内等复杂遮蔽环境信号弱、定位精度差的缺陷,可辅助GNSS系统用于提高定位精度,也可搭建伪卫星独立组网,实现室内外等特殊环境的导航定位。一般的伪卫星设备只单纯实现导航信号发射、接收,其接口少、扩展性差,仅限于单纯应用环节,大大限制了伪卫星相关技术与算法的设计和验证等研究工作的开展,也不能很好辅助多元化的GNSS系统的
随着通信技术的发展,现代军事无线通信对作战车辆信息集成度要求越来越高。同时为了满足跳频、扩频技术的需要,天线必然朝着小尺寸、宽频带和多频段等方向发展,特别是对于工作在VHF/UHF频段的天线,为了满足隐蔽性其较大物理尺寸也必然会向小型化方向发展。本文围绕实现VHF/UHF频段车载天线的小型化、多频段、宽频带以及高增益等展开研究。主要研究内容如下:1.VHF/UHF三频段宽带小型化天线的研究与设计。
图节点的分类被广泛的应用于社交网络、生物医学、电子商务等领域,一直是当今学者研究的热门话题。图节点规模的增加给现有的分类算法带来了巨大的挑战,探索高效的分类算法以满足人们迫切的实际应用需求是非常有必要的。本文对图卷积神经网络半监督节点分类的关键技术进行研究,首先在图卷积神经网络中加入图池化层和随机游走,有效的提高了模型的准确性。其次,在图卷积神经网络的效率上进行改进,设计一种新的自适应采样的快速图
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术具有传输速率高和抗多径干扰强的优势,被广泛应用于无线宽带通信领域,是第五代移动通信的关键技术。差分幅度相移键控(Differential Amplitude Phase Shift Keying,DAPSK)实现方法简单,不用信道估计也能获得很好的性能。本论文将OFDM技术与DAPSK
随着信息技术的深入发展,大家对于导航定位的精准度、可靠性、高动态等要求越来越多。在室外定位方面人们运用的往往是全球卫星导航定位系统(GNSS,Global Navigation Satellite System),2020年我国的北斗卫星导航系统将正式建成,为全球提供服务。即便于此,在实际应用中由于卫星导航本身的一些不足导致单一导航系统存在一定局限性。GNSS与捷联惯性导航系统(SINS,Stra
纳米材料由于其量子尺寸效应等特性,具有独特的电学、光学和磁学性能,优于传统光电材料,是制作光电器件和高性能电子器件的重要材料之一,在许多领域都有优秀的应用前景。目前有大量纳米材料应用案例,如基于纳米线的场效应晶体管,气体传感器,日盲光电探测器等通过使用纳米材料技术提升了器件性能。在众多材料科学研究的课题之中,纳米材料生长工艺和表征手段的研究备受关注。近年来,许多研究团队使用不同的制备工艺技术成功地
针对多数传统能量收集系统的能量来源单一,而现有的多源能量收集系统的追踪效率较低,输入功率范围较窄等问题,提出一种双源最大功率同步追踪电路(DSSMPPT),该系统采用基于比较器结构的最大功率追踪(MPPT)电路实时同步地追踪两个环境能量源的最大输出功率,通过设计的数字控制电路,MPPT电路中两个比较器可以共用单边延时电路从而提高电路的能量转换效率,且该数字控制电路根据比较器的输出信号切换输入能量源
随着智慧交通的快速发展,智能汽车的研发已然进行的越来越快,像自动驾驶,车路协同等需求的提出,加速了交通业新形态的产生,与此同时,道路安全愈发引起人们重视。而车辆再识别可以实现车辆的跨摄像头的定位、追踪,对于道路安全和实现智慧交通都有着重要的意义。车辆再识别问题的本质是目标再识别,与目标再识别中最经典的行人再识别不同,因为众多同一型号的车辆具有类似的视觉外观,车辆再识别会更有难度,而当唯一标记不同车
传统的大多数机器学习算法在静态封闭环境下运行,且通常假定数据的分布在算法执行时保持不变。但是在众多实际应用环境中,大量数据以高速无限流的形式产生,这些数据的分布受设备损耗、环境变化等因素的影响而不断地发生变化从而产生概念漂移现象,数据的这种产生和变化方式给传统的静态数据挖掘提出了极大的挑战。数据流挖掘在此背景下应运而生,且数据流分类在大规模实时数据处理中起着至关重要的作用。受到标注成本高、数据量大
随着信息时代的到来,信息总量已经大大超过了个人所能接受、处理或有效利用的范围,针对层出不穷、纷繁复杂的信息,用户怎么辨别信息的价值、如何才能得到自己真正需要的信息是一个值得思考并且极为迫切的问题。推荐系统的出现有效地解决了信息过载问题,利用推荐系统能够以一种智能化、自动化的方式为用户过滤无价值的信息同时满足用户的需求,从而降低了用户获取信息的时间和精力。以协同过滤及基于内容为代表的传统推荐方法尽管