面向未知协议识别的聚类方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hwen1023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络协议识别是指根据协议或者某种应用产生的流量中包含的代表性特征对协议进行分类,确定该协议所隶属的应用层协议。研究出高效的识别协议的方法对于提升网络环境的安全以及网络通信的管理有重大意义。然而网络环境中不断涌现出的各种不知名的、未公开的通信协议,使得现有的大部分网络协议识别方法都不再满足实际需求。所以识别未知协议成为协议识别领域亟待解决的问题。针对未知协议的识别,无监督学习算法中的聚类方法成为其中一个热点研究课题。结合传统的基于负载的协议识别方法,以应用层协议数据为研究对象,论文在前人的基础上提出了一种基于AGNES层次聚类算法的自适应聚类未知协议识别方法。该方法以协议数据的负载特征为基础,基于相似度对协议进行分类。首先在对数据进行预处理中,通过流重组获得应用层协议单向数据流,针对文本型协议利用切片操作有效过滤掉噪声数据对相似度计算的影响,用切片集之间的相似度代替协议数据间的相似度,根据相似度进行聚类得到最终的簇集合,且结果中含有相似度值作为聚类效果评价标准。论文还对AGNES算法中的相似度计算方法进行了改进,将相似度计算划分为聚类前和聚类中两个部分。该划分有效的避免了应用层协议数据间相似度的重复计算,提高了算法的效率。该方法克服了传统协议识别算法需要先验知识的缺点,而且不需要训练过程,提高了时间效率。而且也克服了现在的大部分聚类算法需要提前确定目标簇数量的缺点,论文所提方法可以自适应确定目标簇数量。经过实验证明,改进后的聚类算法能够实现识别未知协议的目的,而且相对改进前的算法,效率得到了显著的提升。
其他文献
在大数据时代,如何有效地对大数据处理的结果进行展示具有重要意义。目前针对大规模图数据处理的Web可视化系统需要消耗大量CPU资源完成计算和渲染,在展示大量图数据时受到浏览器性能的限制,导致效率较低。许多工具库通过不断优化算法,在布局性能上有了很大提升,然而渲染方面仍然效率不足。相比于CPU,图形处理器(Graphics Processing Unit,GPU)更适合处理大规模运算,但是在GPU上的
光纤陀螺仪是基于Sagnac效应的高精度角速度传感器,具有体积小、成本低、寿命长、功耗低、动态范围大等一系列优点,在航空、航天、陆地、航海等军用、民用领域都具有广泛的应用。然而,光纤陀螺关键元器件几乎都是从美国进口,国产率远远达不到95%的要求,设计具有自主知识产权的光纤陀螺专用芯片具有重要的意义。本文针对干涉式闭环光纤陀螺数字控制电路进行优化集成,设计光纤陀螺数字控制专用芯片,以满足光纤陀螺电路
受在线评论的评论质量参差不齐以及评论数量爆炸式增长的影响,消费者已经开始逐渐转变评论阅读的方式,从大范围阅读评论转变为只阅读顶端少数几条或十几条评论。在目前实际的评论领域中,对评论进行简单的分类排序,其粗略的排序结果已经不符合当今需求,而对评论进行简单的回归排序,其全局的排序结果又不够精确,也不满足目前消费者阅读评论的需求。针对现有评论排序研究在目前实际需求中存在的不足,通过将分类排序和回归排序进
相对于线极化天线,圆极化天线因其自身特点在遥控、遥测、雷达和卫星通信等领域得到了广泛的应用,特别是在Ku波段卫星通信中的应用。随着现代通信技术的飞速发展,对圆极化天线的带宽、增益等性能指标提出了更高的要求,基片集成腔(Substrate Integrated Cavity,SIC)天线具有尺寸小,高增益以及能有效抑制表面波等优点,已成为天线设计领域研究的热点之一。基于SIC结构,开展Ku波段宽带、
为了更好存储多元化的数据,存储系统中引入了局部修复码技术。局部修复码能够在保证可靠存储的同时,显著降低数据重构开销,因此适合应用于冷数据的存储。但是随着存储系统的不断发展,局部修复码的编码性能逐渐成为了限制存储系统发展的重要瓶颈。因此,充分利用存储节点所使用的廉价图形处理器(GPU)并设计实现一个能显著提高编码性能的局部修复码优化方案是当务之急。为了更好利用局部修复码提高存储系统性能,提出了一种基
工控系统涉及众多关键基础设施,一旦受到攻击将造成惨重的经济损失,然而工控网络相对比较封闭,内部没有足够的数据支撑,缺乏对于外部威胁的应对能力,并且传统的网络安全分析方法具有一定限制,只能预测已知攻击,无法预测未知攻击。为了提高工控网络安全分析能力,本文提出了一种数据驱动的工控网络安全分析框架,并围绕工控网络安全知识图谱的构建和应用开展研究。针对工控网络安全分析缺乏数据支撑的问题,本文将互联网中海量
文字,作为一种传播信息的载体,其往往包含了丰富的同时也是人们需要的重要信息。自然场景文本识别就是检测识别自然场景中的文本实例,包括车牌、路牌和广告牌等,所以自然场景文本识别在日常生活中有着广泛的应用前景。本文的研究内容就是如何准确提取医疗票据图像中文本信息,从而保证后续文本识别的准确性。因为人工录入效率低、成本高,并且录入人员会因疲劳而导致出错,而如果能够使用场景文本检测算法通过机器完成录入票据信
随着网络技术、数据通讯技术、人工智能等的不断发展,智能视频监控系统的应用在不断扩大。在网络通讯高速发展和计算机技术快速进步的情况下,基于监控摄像头下的人脸识别技术的智能视频监控系统能够减轻大型场所监管人员的工作压力并且提高工作效率,对加强安全和自动化管理有着重大的作用,拥有巨大的发展空间。另外,由于监控场景下的人脸识别技术需要面对运动模糊、光线不一,姿态各异等众多非约束场景的不定因素,这些问题值得
在压水堆冷管段小破口失水事故(SBLOCA)中,一回路蒸汽发生器与主冷却剂泵之间的U型管内会形成阻碍一回路循环流动的环路水封。一回路循环的中断会导致堆芯上腔室内蒸汽不断聚积,引起堆芯坍塌液位下降和燃料包壳峰值温度上升,直到发生环路水封清除(LSC)现象。因此,研究LSC现象发生的时间及影响因素对燃料包壳峰值温度的精确安全分析具有重要意义。本文利用最佳估算程序RELAP5/MOD3.4对压水堆小破口
双目立体视觉是通过模拟人的眼睛对目标物体的感知来获取目标物体的三维深度信息。目前双目立体视觉技术在机器视觉领域发展已经成为最为关注的方向,在自动驾驶、无损探伤以及无人机飞行等领域已经得到了大量的应用。立体匹配是双目视觉技术的重要环节,传统的稠密立体匹配算法具有计算速度慢,视差精度低的特点,因此很难适用于实际场景,使用稀疏立体匹配的方法虽然计算速度快,但其计算精度差,容易受到噪声干扰。为了解决上述问