论文部分内容阅读
近年来,我国的移动互联网发展迅猛,已逐渐成为全球互联网的重要组成部分。截止到2013年12月,我国网民规模达6.18亿,互联网普及率为45.8%。而移动互联网用户数规模达5亿,占全体网民的比例上升至81.0%。伴随着移动互联网的高速发展,所暴露出来的问题也日益突出。首先,不断增加的移动互联网用户数和各种新兴业务,使得移动互联网流量激增,网络所承担的压力日益繁重,对网络服务质量与稳定性有了更高的要求。其次,互联网的网络体系结构越来越复杂,使得对于网络整体负载、用户行为、网络流量整体趋势等问题都还缺乏深入的研究和精确的描述,从而严重影响了骨干网网络资源的有效利用和移动互联网的进一步发展。最后,移动互联网络流量的指数型增长,使得传统的流量分析方法已无法满足海量数据的存储和处理要求,需要引入更加可靠、更加高效的方式进行处理。而Hadoop正是一个能够对海量数据进行可靠、高效的分布式处理的可扩展开源软件框架,并已经被越来越多的应用于研究领域。论文介绍了网络流量分析与预测的意义,以及网络流量分析与预测的研究现状,描述了Hadoop分布式平台和自主研发的省级骨干网数据处理系统,分析了自主研发的省级骨干网数据处理系统的工作原理和工作流程。使用省级骨干网数据处理系统,对骨干网网间流量从粗粒度(一个月)和细粒度(一天)两个方面进行特征分析,并从IP协议分布、大类业务分布、用户在线时长分布、应用热度分析、平均逗留时间分析和上网体验分析等方面对用户行为分析。最后,论文研究了季节性差分自回归移动平均模型的原理和建模方法,对省级骨干网网络流量进行预测,并对预测结果进行评估。