论文部分内容阅读
伴随着P2P(peer-to-peer)对等网络应用技术迅速发展,P2P业务成为了重量级的互联网应用,在给网络用户带来方便的同时,同时也长时间占据大部分的网络带宽,吞噬大量的网络资源,在很大程度上导致网络拥塞,加重了网络负担,最终导致所有用户应用性能下降。因此,对网络中的P2P进行高效、合理的控制是改善网络环境的重要手段。其中,对P2P网络数据的识别检测是控制的先决条件,本论文旨在通过对基于DPI的P2P流量检测的研究,提出一个更加高效合理的检测模型,寻找出提高DPI检测效率的方法。为了更好地检测和控制P2P流量,本文通过对DPI深度报文扫描技术进行了深入了解,详细研究了目前较为流行的多模字符串匹配算法AC(Aho-Corasick)算法、Wu-Manber算法和SBOM算法,分析了这三个算法的原理,在同等测试环境下,分别采用三种算法进行DPI扫描,对比三种算法在DPI扫描应用中的预处理时间、分析速度和准确度,探讨三种算法在不同应用条件下的优劣性,总结出它们的相对适用范围。针对DPI技术存在的执行速度上的不足,结合国内外各种优化手段,设计了具有分片机制的抽样方法,提出了固定机械抽样、固定随机抽样、时间机械抽样、时间随机抽样、速度机械抽样和速度随机抽样,共六种抽样策略,讨论并测试了该六种策略在不同网络环境下对DPI识别系统性能的影响。通过大量的测试,验证了该方法的可行性和有效性,在此基础上又进一步提出了基于信任机制的抽样方法,以降低硬件负担、网络延迟,使之能够在保证准确率的前提下,以更少的损耗和更高的效率工作。整体达到以下几点效果:1、完成了对AC(Aho-Corasick)、Wu-Manber、SBOM三种算法的对比研究,得出了这三种算法在DPI技术上的性能优劣和适应范围。2、设计了具有分片机制的抽样方法,探讨了该方法的数学理论基础,和软件设计流程。3、实现了具有分片机制的抽样方法,并以此为基础,通过大量实际实验数据,充分证明了该抽样方法的可行性和有效性,最终得出了不同方法在不同网络环境下表现出的差异性。4、创新性提出了基于信任机制的DPI抽样方法,该方法是在分片抽样方法上的进一步衍生。在理论上,对新型抽样方法进行了详细阐述,包括如何构建新型抽样方法的步骤,如何实现信任机制,如何设定信任判断规则,如何设计抽样率更改规则等。该设计具备创新发明性质。