论文部分内容阅读
随着网络系统的规模扩大,网络的异构性、应用的广泛性和复杂性,以及网络服务等方面的增长,网络系统的有效管理变得越来越重要,也越来越困难。就网络系统的故障管理功能而言,管理者不得不面对不稳定的、不确定的和不完整的管理信息。单个硬件故障或软件故障或不同系统组件的不同故障的组合都可能导致网络其它组件(有时是远程)的服务退化,甚至会由于管理对象间的功能或结构依赖关系引起整个网络系统的崩溃。同时,动态变化在复杂的网络系统中是不可避免的。这种情形给网络系统故障管理带来更大的挑战。因此,需要有效的故障检测机制来支持网络系统管理的快速决策及网络系统复杂环境中的故障管理的自动化。
目前,现有的故障诊断技术和商用的网络管理软件在面临网络系统中不确定和不完整的管理信息,以及动态变化时还不能提供有效解决方案来进行故障管理。针对以上问题,本文主要研究网络管理系统中的不确定性故障管理。其创新性研究成果主要有以下几方面:
1.对网络管理的历史和发展现状进行综述与分析,特别是对现有的网络故障管理中的故障定位和诊断进行了深入的分析。为解决网络管理中的不确定和不完全信息,引入贝叶斯网络来解决网络故障定位和诊断,并且提出了如何在真实网络管理系统中构建贝叶斯网络模型。
2.提出了基于贝叶斯网络模型的不确定性的逆向推理算法(SDR算法),以计算在故障证据和故障原因之间的最强依赖路径。本研究运用贝叶斯网络将管理对象间的依赖关系模型化,从而提供有效的方法来定位由不确定性管理信息引起的故障源。最强依赖路径的获取使管理者能从故障症状追溯到可能的故障源,并且能提供潜在故障原因的序列,这样有助于首先检修最可能的故障原因,从而提高网络故障诊断和恢复的效率。
3.提出了不确定动态网络系统中的故障预测方法。通过把时间因素引入到标准贝叶斯网络里来,可以研究系统退化或系统改善过程中不可避免的动态变化。网络系统管理运用动态贝叶斯网络来引入时间维,把管理组件的动态变化和它们间依赖关系的更新模型化。
4.提出了针对故障管理的贝叶斯网络及动态贝叶斯网络仿真设计及仿真过程的实施细节和实验结果,用以评估网络故障管理的逆向推理技术及预测措施。该仿真模型可以用于一般意义上的贝叶斯网络仿真和模拟。