论文部分内容阅读
随着计算机网络技术不断发展,新型分布式计算模式被逐渐广泛应用,许多重要领域对大规模分布式计算系统要求也变得更高。不仅要求系统能更迅速正确的完成相关业务,同时要求系统具有高可靠性、高扩展性、低耗费、低成本等特点,以提高分布式系统的服务质量。对于在复杂网络环境中提供服务的节点,确保其可靠性和可用性尤为重要,这就需要引入节点失效检测技术。该技术为进一步提供容错和故障恢复服务奠定了基础。然而面对目标网络大规模化、动态化、复杂化等趋势,传统的失效检测方法已很难达到高扩展性和自适应性的要求,并且常常造成局部网络拥塞、传输时延和误判率增加等现象,这直接导致检测的效率严重下降。本文在现有研究基础上,提出了基于自组织邻域的动态节点失效检测方法,本文的主要研究工作如下:①分析P2P通信方式的障碍,设计实现了基于UDP的NAT穿透方案,使位于不同局域网的节点顺利进行P2P通信;在此基础上,研究自组织邻域技术,设计了失效检测系统,通过分层次的自组织划分方法,将大规模的目标网络划分为较小的自治域,提高了系统的可扩展性和自适应性;②针对通信耗费较高及传输延时过长等问题,本文研究符合物理拓扑的P2P逻辑覆盖网,提出了基于IP地址聚类的分组预处理和基于网络距离的邻域划分方法,使覆盖网逻辑拓扑高度符合实际物理拓扑结构,提高通信效率;③通过分析不同类型节点间通信需求,设计实现了高效消息传输方式,并提出了基于记录路径的自适应Gossip改进机制,该方法有效提高了组内消息的散播效率;④针对传统Δt失效检测方法的不足,提出了基于指数平滑的动态心跳预测方法,并且结合静态和动态检测方式,提出了多状态失效检测机制,以适应网络环境的动态性,减少由于网络拥塞或短暂节点异常引起的误判率上升的现象。综上,本文分析节点失效检测技术在新型分布式计算模式中面临的若干关键问题,设计及改进了相关自组织邻域节点管理和消息散播的方法,实现节点动态失效检测,通过理论分析和实验验证了本方法的高效性。