【摘 要】
:
在高可用计算机的研究当中,如何保证系统的可用性和应用可靠性一直是需要首先考虑的问题。机群以其高性价比和高扩展性成为构造高性能计算机的一种主要方法,而节点间松散耦合
论文部分内容阅读
在高可用计算机的研究当中,如何保证系统的可用性和应用可靠性一直是需要首先考虑的问题。机群以其高性价比和高扩展性成为构造高性能计算机的一种主要方法,而节点间松散耦合的结构也使得机群系统更易于保证系统的性能。但是随着机群系统规模的增大,节点数目的增多,也带来了许多的问题。因此本系统以提高机群系统的可用性为目的,设计并实现了基于Linux的机群容错系统。系统由4个模块组成:用户模块、中心模块、进程模块和心跳模块。各个模块之间相互协作实现系统功能。本文对各个模块以及模块之间的关系进行了介绍。系统采用分布式的松散耦合体系结构来组织节点,使系统具有良好的可扩展性和更好的容错性。尽可能地避免因故障导致的停机和服务的中断。服务节点可以随时的加入或离开监控关系并且不会对服务造成影响。本文设计为具有二级容错功能,利用机群系统普遍应用的心跳协议来实现节点间的检测。为了避免任务调度因素对检测的影响和完成对节点失效快速准确的检测,设计和实现了专用心跳检测协议。使其作为网络协议实体运行在操作系统核心态,使得检测器运行更加稳定,从而大大提高了检测速度。对于服务级别的检测采用进程事件连接器来主动的检测服务的行为变化。对于受监控的服务只有系统撤销对其的监控才可以看作正常退出,否则就会对其进行容错处理。对于容错,本文选择由分布式选举算法选出的代理节点保证失效节点上的服务得到有效处理,采用简单的服务迁移来保证服务的不间断性,从而提高系统的可用性。
其他文献
语义Web的构建不仅需要由本体来定义基本知识骨架,同时也需要由遵循本体而定义的实例层知识库来构建内容。虽然语义Web数据逐渐增长,但是实例层的数据却依然较为稀少。语义关
城市公交查询系统为乘客提供了优化、及时的信息服务,通过合理的引导,很大程度上方便了他们的出行,同时减少了不必要的交通流量,提高了整个公交线网的运行效率和城市信息服务
语言是人类特有的功能,是自然界中人类区别于其他生物的特殊能力。随着世界一体化的到来,第二语言学习者逐年增加。计算机辅助发音训练技术应运而生,它不仅可以缓解语言教师
当前用户在多个终端进行办公和娱乐已经成为一种普遍的现象。根据应用场景的不同,用户可以选择不同的终端进行使用。当用户使用不同的终端时,将会面临在不同终端进行切换的问
车流量检测技术是智能交通系统系列技术中的关键基础,基于视频图像处理技术的车流量检测技术的研究已成为该领域的研究热点。视频检测技术日益成为最具优势、最有发展潜力的检
由于期货市场的行情受到政治、经济等多方面因素的影响,其内部规律非常复杂,传统的预测技术的预测效果并不理想,而神经网络具有优良的非线性特性,特别适用于处理高度非线性系
长距离无线Mesh网络非常适合部署在偏远或者人口稀疏的地域,用于宽带网络接入。但基于IEEE 802.11n的长距离无线Mesh网络,在长距离链路传输中,由于原有的停等传输方式的限制
随着Internet互连网络的飞速发展,流媒体技术已经被广泛应用。流媒体的访问流量在Internet的访问中占据了越来越重要的地位。在有限的资源条件下,如何满足快速增长的用户需求
TAC竞赛是专为交易性Agent之间的竞争而创造的平台,Agent通过游戏服务器提供的市场进行交易并且实现竞争目标。竞赛的目的不仅仅是为了人工智能技术的运用,更主要的是要将人工
随着信息化的发展和深入,许多企业投入大量的资金在企业信息化的发展和改革中。企业的信息化系统在生产和工作中也为企业带来了极大的便利和较高的效率。但是随着各种信息系