基于统计学习方法的容错计算

来源 :天津大学 | 被引量 : 0次 | 上传用户:panzhengdang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代计算机系统不断增长的复杂性使得故障检测与诊断工作极其困难,因此如何实现快速的故障恢复从而提高系统的可用性变得更加重要了。由于即使在实际故障源未知的情况下,很大一部分故障仍能通过执行一些特殊的恢复操作,例如,重起操作,来进行修复。然而,通常设计合理的恢复策略来有效的调度潜在的恢复操作通常是极其困难而且容易出错的。因此,我们希望能找到一种自动的方式来生成高效的恢复策略。在本文中,我们提出了一种基于增强学习算法的新技术来自动产生恢复策略。我们首先将自动故障恢复问题形式化,在理论上分析出了增强学习方式的有效性。然后,基于一个由原始人工策略生成的故障恢复日志,我们对此方法的两种不同实现方式进行了实验验证:一种是直接的在线学习方式,即直接将该学习过程应用于运行的系统中。通过实验分析我们可以发现,我们的学习方法能获得更优的性能,较好的扩展性,以及趋向于全局最优策略的收敛性。此外,通过引入故障发生的多种特征,我们仍然验证了我们方法的有效性。另一种是离线学习方式,即将该学习过程应用于故障恢复日志来生成恢复策略。由于受到原始人工定义的恢复策略的影响,该实现方式学习得到的是一个局部最优的恢复策略,然而它具有比原始手工策略更好的性能。在我们的实验中,基于真实的机群系统环境产生的恢复数据,我们发现自动生成的恢复策略最终能节省10%的恢复时间。此外,为了避免学习所得策略可能遇到的无法处理的情形,我们还提出了一个混合策略,它能兼两者之长,不仅能维持学习得到的策略的高性能,还能像人工定义策略那样处理所有可能的故障情形。
其他文献
搜索引擎解决了用户搜索信息的难题。但是,由于传统搜索引擎采用集中式架构,还存在许多问题,如服务器故障、存储容量有限、以及存储链接不能及时更新等,严重影响了搜索引擎的性能
多媒体视频监控业务虽然已经是成熟的互联网业务,但由于缺乏信令概念和相应体系,会话控制及相关的用户认证、授权和计费都比较困难,导致开展信息服务的技术门槛过高,难以通过
多年以来,面向对象编程(Object-Oriented Programming,OOP)作为软件开发领域的主要编程范式,大大提高了软件代码的模块性、可重用性,降低了软件的复杂度以及软件的维护成本。
近年来,由于IPv4地址匮乏、路由表急剧膨胀等问题,使得IPv6协议应运而生。与IPv4相比,IPv6具有内置的安全机制,增强的组播支持等优越性,而最关键的是IPv6提供了巨大的地址空
Web应用一种由前端浏览界面和后端服务器构成的软件。前端通过各种浏览器、嵌入的脚本语言和applets等为用户提供丰富的图形用户界面。后端服务器包括静态/动态网页文件、CGI
数字图像的逆半调处理是将二值半调图像恢复为连续色调图像的过程,该技术在许多典型的图像处理中有极大的实用价值。论文首先阐述了数字半调与逆半调技术的发展与现状。进一步
互联网中网页和它们之间的链接构成了一个庞大的有向图,称为网络图(Web Graph)。这个图包含了丰富的链接信息和有趣的性质,比如链接数目的幂法则分布,连通域等等。对Web Grap
无线Mesh网络(WirelessMeshNetwork,WMN)结合了移动Adhoc网络和无线局域网的优势,具有高吞吐量、高可靠性、自组织、自修复、部署快、低成本等特点,已成为下一代无线网络的研究热
基于契约进行程序验证的理论最早出现于20世纪70年代对大型系统的研究之中。20世纪90年代,Bertrand Meyer首次将契约式设计(Design by Contract, DbC)理念引入了面向对象编程
随着计算机、通信、网络技术的迅猛发展,许多应用领域出现了海量、高速、动态的数据,如交通工程和网络监控、电信记录管理和分析、商业交易管理和分析、金融信息监控、传感器网