基于网络流量监测的移动互联网特征研究

来源 :北京邮电大学 | 被引量 : 18次 | 上传用户:liuguoqiangswu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动通信技术的发展,移动互联网用户逐年增多,多种移动网络应用已经成为人们生活的一部分。移动互联网因其场景的复杂性,流量的众多特征还未被学术界所认识。网络流量监测技术可以对移动网络流量进行保存,再借助数据挖掘等技术可以分析移动互联网的流量特征并对网络的特征值构建模型,从而为移动网络的设计和优化提供参考。本文的主要研究内容和创新点如下:(1)将云计算技术引入网络流量监测领域,创新性的利用云计算平台实现移动网络流量的存储和分析,构建了基于Hadoop云计算的海量网络流量分析平台。该平台可以实现对网络流量数据的分布式存储,用户通过提交脚本的方式实现分布式运算,极大的便利了海量网络流量的存储和处理。相关实验也证明本文基于Hadoop云计算的海量网络流量分析平台具有非常高的效率。平台由数据导入模块、脚本解析模块、作业执行模块三大部分构成。数据导入模块是整个系统的基础,主要负责原始网络流记录的导入,清洗和索引的建立。脚本解析模块对用户编写的脚本进行检查后转换成MapReduce任务,由作业执行模块提交到Hadoop平台进行执行。本文对各模块的流程进行了说明,并对本文设计的网络流量分析脚本Log-QL语言的设计及解析方案进行详细说明。文中还对实验室的云计算平台进行了简要说明,并利用国内真实互联网采集的流量数据进行性能测试,证明了基于Hadoop云计算的海量网络流量分析平台的高效性。(2)采用从国内某大城市骨干节点采集的CDMA移动互联网流量和ADSL固定互联网流量,对两种网络流量特征进行对比研究。首先对根据采集自真实网络流量的流量数据进行ARIMA模型建模,选取了较为合理的网络流量样本。并进行流量特征分析研究,内容包括协议分布,网络流长分布,流持续时间分布,两种网络的业务分布等。并对P2P流媒体协议特征进行研究及建模。研究发现,监测的CDMA网络和ADSL网络流量分布都符合ARIMA模型。CDMA网络的传输协议以TCP为主,ADSL网络UDP协议流量占比更大。CDMA网络流的平均报文长度小于ADSL网络,且CDMA网络流的流持续时间小于ADSL网络,反映了移动网络的不稳定性。此外,在CDMA网络中的流下行/上行的比例要大于ADSL网络网络。基于两种网络的不同应用的流量分布,可以看到在CDMA网络中,网页浏览类应用占主导的地位,而新媒体类的应用逐渐占据了ADSL网络中的大部分流量。最后本文对网络中重点业务P2P流媒体的节点数分布进行了研究,发现CDMA网络和ADSL网络的P2P流媒体业务节点数符合不同的分布模型。(3)利用云计算平台对彩信业务的流量分布规律及统计特性进行研究分析,基于国内某省采集的时长为1年的彩信流量。研究内容包括移动用户维度以及不同时间维度的彩信业务流量分布规律等。通过长时间粒度和短时间粒度对监测省份的彩信业务发送量、发送时间及发送速率等内容进行分析,并对短时间粒度的2G/3G彩信、个人与非个人彩信进行分析,最后对个人彩信到达间隔构建了模型。本文使用在现网骨干网节点部署的10G速率的流量监测设备,采集南方某省时长为1年的彩信流量。文中对彩信的服务架构及数据采集过程进行了说明。流量特征分析分为长时间粒度和短时间粒度的分析。长时间粒度包含全年彩信发送量、彩信协议类型与端口号分布、全年彩信的成功率与失败率、彩信内容长度分布、接收时长分布以及传输速率分布。发现监测网络主要使用WAP2.0协议发送彩信,彩信长度集中在30至70KB,彩信接收时间通常为10秒,彩信发送速率集中在20至40Kbps。在进行短时间粒度的分析时,选取一周的彩信流量作为分析样本,主要研究了个人彩信与非个人彩信的流量特征,2G和3G彩信流量特征。发现监测网络中97%的彩信由2G网络进行发送,3G彩信的平均传输速度是2G彩信的三倍。最后对个人彩信的到达间隔进行了建模,发现Weibull分布可以较好的对个人彩信到达间隔进行拟合。(4)针对网络的服务质量分析的需要,本文提出了一种基于K均值算法和C4.5算法的级联式的网络质量分析算法。该算法可以适用于不同种类的网络质量监测数据,通过现网采集的网络质量测量数据进行实验,验证了该算法的有效性和高效性。算法处理对象为本研究团队研发的“面向用户的主动网络测量系统”采集的移动网络测量数据。该系统部署在国内南方某省的多个城市的移动网络节点,进行网络质量测量。网络质量分析算法分为训练模块和分析判别模块两个模块,训练模块对历史数据进行建模,分析判别模块利用建模数据对新的测量数据进行综合判定。在进行算法效果验证时,本文进行了大量的实验选取合理的K值和C4.5算法的等距离散值,并利用KKZ算法来进行聚类中心点的初始化选取。利用多个监测数据,证明了本文提出的级联算法的高效性。且该算法适用于不同的监测数据,它可以有效的调节单一算法的缺陷,总体提升判别指标的性能。
其他文献
随着经济发展,无人机飞行环境日趋复杂,选择飞行航区日益困难,安全威胁日趋增多。若飞行中一旦失控,将会带来不同程度的经济损失及人员伤亡,甚至引起严重的政治事件及国际纠纷。本
时至今日,我国的艾滋病传染状况尚未得到有效的遏制,沈阳市作为低流行区同样面临控制艾滋病蔓延问题。本文以沈阳市艾滋病感染者和病人所接受的社工机构的关怀为研究主题,来反映
目的:本研究通过对天津市胸科医院近2年来的杂交式单操作孔胸腔镜治疗早期肺癌的临床观察,来探讨杂交式单孔胸腔镜肺叶切除术治疗早期肺癌的临床效果。方法:自2010年12月-2012
近代,很多的国家和地区都已经完成了现代意义的行政程序法律法规的制定,行政程序违法的法律责任在理论上也得到了长足的发展。然而,回望我国近几十年的行政程序法,虽有较大的发展
共青团协助政府管理青少年事务,是党在新的发展阶段对共青团职能的新定位。而作为非权力机构,共青团在协助政党、政府、社会管理青少年事务时,只有得到家庭、社区、法律政策
微晶玻璃凭借其优越的综合性能成为硬盘基板的理想材料,为了获得具有超光滑表面的微晶玻璃,在实际生产中需要对其表面进行研磨、预抛光、粗抛光、精抛光等过程,而氧化铈(CeO2)作为
生态体育是在全球生态环境急剧恶化的背景下酿生的一种"体育文化演进新思维","生态体育教学改革"是这一前沿认识的代表性教育理念。新的课程体系应该注重向受教育者传授快乐
随着我国经济的快速发展,能源需求也越来越大,环境污染也越来越严重,制约了我国的可持续发展。因此,急需寻找新的能源利用形式。太阳能作为一种清洁的可再生能源,越来越受到世界各
近些年来,在国家和遂宁经开区政府统一规划和指导下,遂宁市土地资源信息化建设正在经历蓬勃发展的时期,这将全面推进行业领域的信息化、区域建设的信息化和企业资源的信息化,促使
目的:膝关节骨性关节炎(Osteoarthritis, OA)是一种常见的骨性关节炎疾病,该病破坏了人体膝关节的生物力学分布规律,产生疼痛,降低膝关节平衡功能水平,增加患者跌倒风险,严重