Internet路由级宏拓扑结构的TL模型

来源 :东北大学 | 被引量 : 0次 | 上传用户:holyturtle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet作为一个典型的复杂网络实例,对其宏观拓扑结构的特征分析及建模研究是目前研究的热点问题,受到学术界广泛关注。近年来人们在该领域的研究取得了长足的进展,尤其是在Internet拓扑结构的分析中发现了幂律分布规律之后,提出了许多遵循幂律特征的拓扑生成算法以及拓扑模型,完成了从早期纯粹的经验假设到客观数据分析,从单纯的计算机网络研究到复杂系统特征化研究的建模过程的飞跃。但这些提出的模型大多为自治系统层面(autonomous system,AS-level)的Internet拓扑模型,而在相对更细粒度的,更能表现:Intemet本质特征的路由器层面(router-level)Internet拓扑建模,由于规模巨大,以及获取完整的路由级拓扑方面的困难,目前研究还较少。揭示路由级Internet宏观拓扑结构的特征规律并建模,是帮助人们用其来对Internet进行分析、预报、决策或控制的需要,也是进行Internet相关的研究的基础,因此必然具有重要的意义。 Internet拓扑研究与复杂网络学术界将Internet拓扑建模研究的内容大致归结为三个问题:(1)如何获得一份完整而准确的Internet拓扑数据;(2)如何对Internet网络拓扑特征进行分析并建立模型;(3)如何使用模型构造一幅类似于Internet的拓扑图。这三个问题分别对应于三个研究方向,即拓扑结构测量、拓扑特征发现与建模以及可视化拓扑生成器开发。其中拓扑特征发现与建模是重点,拓扑特征发现指针对Internet测量拓扑结构的特征分析与特征参量提取,建立模型指根据特征参量建立拓扑模型,即本文提出的TL模型,这是本文研究的核心内容;拓扑结构测量作为拓扑特征分析与建模的基础与前提,也是本文中比较重要的部分;而拓扑结构的可视化问题由于涉及范围较广,可单独做为研究课题,因此不在本文中做为重点研究内容。 本文首先针对分布在世界范围内的21个CAIDA监测点通过主动探测方法得到的路由级Internet拓扑测量结果,分别进行同名IP解析与单点测量导致的采样偏见问题分析。在使用CAIDA iffinder同名IP测量结果集对多组Internet测量数据解析时,发现每组中合并的路由数占总路由数的3%~8%,边数则从7%~30%不等。合并路由数增长比较平缓,说明测量结果集数量庞大,基本上已经完全覆盖了iffinder提供了同名解析空间。在单点测量问题分析中发现,随着测量点数的增加,新测量到的路由增量呈y=88782.0-18993×ln(x)的对数曲线分布形式。进一步分析表明,以目前CAIDA监测点的分布情况,只有当测量点数达到至少107个时才可能完全解决采样偏见问题,即没有路由器在测量中遗失。而本文测量结果集中CAIDA监测点数为21,因此需要在未来工作中对拓扑测量问题做进一步研究。其次,本文对Internet拓扑结构特征进行了不同层面的分析与研究。首先论述了Internet测量拓扑的幂律分布特征,包括frequency-degree幂律分布、degree-rank幂律分布与CCDF(d)-degree幂律分布等,发现Internet测量拓扑具有非常明显的frequency-degree幂律分布与degree-rank幂律分布规律。其中。frequency-degree幂律分布符合幂律指数为2.1406的分布规律,而degree-rank幂律分布则分为两部分,主体节点服从幂律指数为0.84639的分布,而度值最大的部分节点却符合幂律指数为0.29981的分布规律。在CCDF(d)-degree幂律分布研究中发现,Weibull分布要比幂律分布拟合效果更好,也就是说,对于本文Internet拓扑来说,其节点度的CCDF不一定符合幂律分布。其次研究了Internet平均度值分布情况,并统计得出叶子路由在Internet测量路由总数所占比重平稳地保持在17%附近的结论,说明Internet拓扑结构中,叶子路由的分布具有一定规律性;之后研究了Internet拓扑结构的谱密度分布与无符号拉普拉斯谱(SLS)分布结果,通过对拓扑结构各异的五种采样拓扑图,分别进行谱密度.特征值分布分析,发现五组分析结果表现出高度的一致性,证明了Internet拓扑结构的自相似性。而通过四组3000点采样拓扑进行SLS分布分析,发现尽管四组3000点采样路由与连接互不相同,但SLS谱分布却非常相似,四组采样拓扑在特征值λ=1处重数均较高,重数次高的特征值都群聚在λ=2处。在特征值从2~10<3>变化过程中表现出较明显的幂律分布特性,其幂指数值保持在3.2813至3.8013之间,特征指数接近。这同样从另一个角度证明了Internet拓扑结构的自相似性。 之后,本文根据Internet拓扑特征分析结果(特征参量)提出了一个基于三层(ThreeLevel)路由节点的TL模型。针对部分源于Internet拓扑统计分析的模型特征参数,进行了以无符号拉普拉斯谱密度(SLS)分布结果的为校验值(评估函数)的遗传优化。对优化后模型,本文从定性分析、定量分析与可视化结果的直观视觉角度予以了分析与评价。定性分析结果表明,TL模型兼具纯静态与纯动态模型的优点,即避免了纯静态模型下过多的人为干预与控制,也避免部分纯动态模型不能产生叶子节点的问题。在定量分析部分,对两份3000节点的TL生成拓扑分别进行了幂律分布分析、谱密度分布分析及规格化拉普拉斯谱(NLS)分析,分析结果表明,TL生成拓扑表现了Internet拓扑特征,TL模型可接受。本文最后给出了TL模型的生成算法。
其他文献
在大量的数据库应用中,如面向 Web 的数据集成、电子商务、数据仓库、数据库设计等,都需要用到模式信息。而操作模式信息的一个最基本的操作就是匹配,即将两个模式作为输入,产生
随着数据获取方式的多样性,数据挖掘和机器学习使用的数据集规模越来越大。而随着时间的推移,在大规模数据集的基础上,新的数据也在不停的加入进来,同时,数据集中已有的记录
分布式并行计算可以提供相对廉价且强大的处理能力,在研究和应用领域都得到了广泛的关注。负载平衡是影响分布式并行计算性能的重要因素之一,负载平衡策略的效率直接关系到分
随着社会的进步、科技的发展,互联网早已深入到人们日常生活的方方面面,成为人们生活中不可或缺的一部分。但是目前互联网面临着诸如扩展性、地址空间、端到端高性能传输、实
传统基于角色的访问控制(RBAC)系统需要在业务逻辑代码中加入访问控制逻辑来实现访问控制的细粒度。这种实现方式会导致系统代码的分散和缠绕,而面向方面的程序设计(AOP)可以
本文首先概述了Web的产生及其发展历程,从而引出了网络检索问题,并分析了目前搜索引擎的工作原理及其研究现状。由于Web上海量的信息处于不断的变化中,通用搜索引擎己经很难
数字游戏是计算机行业中最有价值和发展潜力的领域之一,它同时有着非常高的技术要求。它集中体现了计算机科学在图形处理、网络通信、实时运算和人工智能等方面的最新成就,它的
软件测试是软件工程的一个重要阶段。随着软件工程的发展,软件设计规模的增大,软件测试的地位变得日益重要。测试用例的设计和编制是软件测试最重要的活动。测试用例是测试工
用户界面(UI)是用户直接与软件进行交互的部分,其舒适度和美观性备受用户关注和重视。传统开发和构造人机界面的方法存在一定局限性,它忽略了用户界面设计的交互性。现有用户界
随着VoIP技术的不断发展和成熟,各种形态的VoIP应用层出不穷,并以其低廉的价格吸引了众多的用户,对传统的PSTN语音业务产生了巨大的冲击。由于其业务实现的简单性和灵活性,很