基于SVM的P2P数据流检测技术的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:yangzhouzhoudaojun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P(Peer to Peer)技术在Internet中占有举足轻重的地位,近年来迅速成为计算机网络界关注的焦点;但是P2P技术发展的同时带来了网络带宽的大量占用、知识产权纠纷、安全威胁等问题。为了促进P2P网络健康发展,对P2P数据流进行有效的监管,准确识别P2P数据流显然已经成为P2P流管理中重要的研究课题。本文针对目前P2P数据流检测中存在的小数据流检测准确率不高、伪装的P2P数据流和新出现的P2P数据流学习能力低,识别效率不高的问题,设计实现了一个改进的基于SVM的P2P数据流识别技术,主要围绕以下几方面的问题进行了研究和讨论:(1)在数据包采样阶段应用SGS变频率数据包采样策略,相比于传统的固定频率数据包采样方法,能够实时地灵活控制数据包采样频率,根据现实网络情况更好地实现小数据流的采样,创建均衡的数据流量样本集;(2)设计构造了SVM训练样本集,根据正例反例样本的均衡性,样本代表性等原则,对不同的P2P网络应用和非P2P网络应用中200余个流量特征进行统计分析,权衡P2P样本训练的效率与分类器准确率,选取五个数据流特征作为样本特征;(3)首次训练采用训练样本集生成数据流分类器,之后将增量学习算法应用到SVM迭代训练当中,将分类错误的样本与已有的支持向量集组成新的训练样本,并且对新的训练样本进行分组训练以达到对样本学习规模、训练时间复杂度和迭代训练样本对SVM分类器灵敏度影响的控制。本文采用Andew Moore数据集和某网络服务器截获的数据流集作为测试样本,分别应用本文所实现的分类器对普通流量数据流、小流量数据流的检测精度、漏报率和误报率三个性能指标做了统计分析;并且与传统的SVM技术、BP神经网络技术、贝叶斯技术、决策树模型的数据流分类器的测试结果做了对比。
其他文献
电容层析成像(ECT)系统是近年来发展起来的一种新技术。该技术具有非侵入,无辐射,结构简单且成本低廉等优点,因此在检测多相流问题上具有广阔的应用前景。但由于现在离实际应
曲面细分技术是计算机图形学的一个重要分支,因为该方法规则简单、效率高、造型效果好而在CAD和动画的造型中都有广泛的应用,曲面细分的基本思想是对一个粗糙的初始网格应用
模糊C均值算法(FCM)是当前比较流行且应用广泛的一种模糊聚类算法,已经成功应用于模式识别、图像处理等诸多领域。但是,它存在着需要聚类数目先验知识、对初始值敏感和易陷入
随着计算机技术的不断深入发展,信息和数据处理能力的不断提高,多层次的复杂分布式结构越来越多的出现在大型信息/数据系统当中。相比于传统集中式系统的单一结构,多级分布式
文本蕴涵识别在自然语言处理的各种应用中具有重要作用,是当前的研究热点问题之一。本文针对中文文本蕴涵关系自动分类问题,提出了以下三种方法:1.基于特征融合的中文文本蕴
科学工作流作为一种新的应用泛型具有众多优点,例如可提高科学实验过程的自动化,在很大程度上能节约人员和资源的的消耗。科学工作流的任务一般具有数据量大、计算复杂的特点
中药提取是中药制药的工序之一,中药提取的目的是提取药材中药效成分,避免药效成分的流失和无效成分的溶出。由于中药提取是在封闭的容器内进行,中药界大都通过经验判断提取
随着音乐喷泉在实际应用中的需求不断提升,而现有音乐喷泉产品仍处于曲目单一、固定的状态,不能灵活根据实际需求来改变喷泉的形式。要改变现状,必须借助计算机来对音乐信号
在无线信道多媒体通信系统中,信号在多媒体信道中的传输编码效率与码流抗误码性能是无线信道数据传输过程中的主要矛盾。在信源编码中,减少编码冗余会提升编码的效率但相应的
随着互联网的广泛应用,人们的生产和生活越来越离不开计算机。但是,人们在享受到信息技术飞速发展带来的便利的同时,也遭受到了网络安全事件的困惑。为此,计算机安全专家和学