基于概念漂移检测的自适应流量识别研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hensun01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的高速发展和硬件水平的提高,互联网感知技术扮演的角色愈发重要。由于网络应用程序复杂化和个人隐私的重视,流量识别作为最典型的网络感知技术,正在从基于端口和深层数据包检测等面向数据包识别向面向数据流识别的方向过渡。虽然有机器学习和数据挖掘方面的研究作为基础,但是基于机器学习的网络流量识别仍然面临着很多挑战,概念漂移问题就是首当其冲的一个。对概念漂移问题的研究,将会对网络流量识别技术的发展有很大的促进作用。首先本文从网络流量角度对概念漂移检测的基本原理做出了详细的阐述,从概念、目标概念和概念漂移及其检测的定义到概念漂移检测的不同类型,论文都有涉及,为后面的研究奠定了理论基础。其次,对目前数据流挖掘领域处理概念漂移的基于误差率的概念漂移检测方法进行了分析,误差率方法的局限性限制了它的应用范围。然后,在分析概念漂移检测的原理和利用卡方检验、Fisher检验的相关知识的基础上,提出了基于统计学理论的概念漂移算法,且进行了详细的理论论证,并通过实验验证了基于统计学的理论方法的有效性。另外,考虑真实网络环境的类别不平衡现象,比较了贝叶斯核估计、决策树和支持向量机三种机器学习算法的优劣,并选择了决策树算法用于进一步的网络流量识别研究。最后,结合基于统计学理论的概念漂移检测方法,我们设计了三种基于不同集成方式自适应流量识别算法,通过实验我们验证了三种算法都有各自的特点,适用于不同的网络流量识别情景。
其他文献
煤炭资源是我国重要的基础能源,在国民经济的发展中具有重要的作用,但在煤炭开采的过程中,矿井事故频繁发生,不仅直接危害劳动者的生命安全、造成重大的经济损失,同时也造成了恶劣
无线自组织网络是终端节点自发组织形成的网络,具有分布式运行、拓扑动态变化等特点。移动自组织网络以及无线传感器网络都是被广泛研究的无线自组织网络。由于部署方式灵活,无
目前,重大经济领域内草拟后待颁布政策很多,如何保证这些政策的一致性,作为国民经济和社会发展中迫切需要解决的关键问题,受到了越来越多的关注。在研究政策的一致性时,需要对政策
云计算为数据处理工作带来了新的机遇与挑战。传统的关系型数据库在大数据的需求面前显得力不从心,而分布式非关系型数据库由于其高可靠性、高可用性的特性,能够满足大数据带来
近年来,自然语言处理的相关技术研究中,基于统计的研究方法占据了主导,基于实例和统计的翻译方法为机器翻译技术提供新的研究思路。对于机器翻译领域来说,语料库是机器翻译统计学
情感机器人就是运用人工的方法和技术赋予机器人类似人的情感,使机器人具有自主性,能够在情感机制的作用下调节自身的行为选择。多情感机器人任务分配问题即在传统的任务分配问
人脸表情是进行交往和表达情绪的一种重要手段,不经过特殊训练,人类对其面部表情往往很难掩饰,所以,通过对人脸表情进行分析,可以获得重要的信息。人脸表情识别是人机交互的
自治水下机器人(Autonomous Underwater Vehicles,AUV)是具有一定自主能力的智能化水下设备,能在特定的环境任务信息下执行人类自身所不能进行的高难度、高危险作业任务。随着
目前许多网站与应用仍使用安全性较差﹑易受攻击的验证码,且尚不存在设计验证码和评估其安全性的系统与标准。验证码图像识别涉及到图像处理﹑模式识别等多种领域的相关知识,对其进
就目前现状,建筑信息模型(Building Information Modeling,BIM)理念,即在整个建筑行业中的各个部门(如:施工企业,政府部门,设计机构,建设单位等)之间协同工作的概念已经成为