论文部分内容阅读
故障管理是现代网络管理的重要方面。其目的是检测、定位和记录网络中发生的故障,以便能够对故障进行及时的恢复,将产生的影响降到最低。当前的故障管理方案中普遍存在的问题是需要占用额外网络带宽或占用被管理设备的CPU时间,这无疑降低了网络的性能。在本文中,提出了基于链路状态路由协议进行故障管理的新思路。链路状态路由协议中每个路由器都维护反映整个区域内网络拓扑的链路状态数据库,并在链路状态发生变化时通告全体以保证所有路由器都获得更新。根据这个原理,监测网络中一台路由器数据库的变化便能获知整个网络拓扑结构的改变。本文以运行典型链路状态路由协议——I-ISIS(Intergrated IS-IS)协议的TCP/IP网络为例,将代理(Agent)与网络中的一台路由器相连,建立故障管理模型。在模型中,将网络中的主要故障划归为四种类型,定义路由器的链路状态数据库的原子性变化为七种事件。首先,代理获取路由器的链路状态数据库,据此计算出当前网络拓扑中可能发生的故障与数据库变化事件之间的内在关联,这是故障管理模型的核心;随后,代理实时监测该路由器上链路状态数据库的变化并触发相应的事件;最后,收集事件并根据预先计算出的故障与事件的关联推断网络中发生故障的类型并定位。在模型中,由于代理仅与一台路由器相连,并且仅仅被动接收数据包,所以不占用额外的网络带宽;另外,所有的分析运算都在代理上运行,也不占用被监控路由器的任何CPU时间,因此不影响网络的性能。I-ISIS协议是TCP/IP网络中广泛使用的路由协议,模型以此为基础能充分利用网络中容易获得的信息;另外,I-ISIS协议快速收敛的特性,使得故障的检测和定位更为迅速。本文将故障管理模型集成到朗讯贝尔实验室中国基础研究院的科研成果ROMA(Router Online Management Agent)中,并在模拟的CERNET(中国教育网)主干网中进行了测试。结果表明,此模型能够迅速的检测到网络中发生的故障并准确定位,同时对网络的性能没有任何影响。