论文部分内容阅读
当今世界,移动互联网对人们生活的影响日益加强,使用各种移动终端访问互联网已经成为一种趋势,同时也带来了海量的移动互联网流量。在近些年,移动互联网一直在改变人们的生活习惯。通过网络数据,人们可以很方便地使用很多互联网服务,如社交服务、移动广告和电子商务等等。而实际上这些网络流量大部分都是由HTTP协议承载的,因此有必要对移动互联网流量,特别是HTTP流量进行分析,以便更加清晰地了解网络运行情况和用户行为习惯,进而及时优化网络以及对用户提供有针对性的网络服务。本文首先介绍了超文本传输协议目前的发展情况,分析了HTTP协议的报文格式和通信流程,然后提出了基于实时流量的HTTP采集系统。本文首先对插件式报文解析系统(PPP)进行了简单的介绍,该系统将每一个协议编译成一个动态库进行动态调用,因此可以方便地实现协议扩展解析。本文进一步设计实现了HTTP业务组件,将HTTP报文按照五元组进行匹配,并将匹配话单输出到日志。同时对该系统进行计数监控,以便能够及时地检测出异常情况。然后对HTML报文的HEAD提取方法进行了详细的论述。随后深入地分析了采集系统的性能并提出了优化方法。针对输出的日志,利用统计的方法对匹配率、HTTP报文流量特征规律进行了分析。最后,论文对移动网络HTTP流量监控的研究成果进行了总结和展望。