论文部分内容阅读
近年来,随着大数据和云计算技术的发展,互联网数据中心的能源消耗越来越高,其中用于维护IT设备稳定性的空调系统能耗在数据中心总能耗的占比高达40%。数据中心用空调系统最常见的故障是制冷剂泄漏故障,制冷剂泄漏一方面导致空调系统偏离最佳运行区域,降低系统运行效率造成能耗浪费,另一方面导致空调系统制冷量降低,影响数据中心内部的温度和湿度,影响IT设备运行安全性。因此,数据中心用空调系统的制冷剂泄漏故障检测具有非常重要的现实意义。针对数据中心用空调系统制冷剂泄漏故障,本文提出一种基于关联规则的故障检测策略,构建故障检测模型的主要思路如下:首先将训练数据进行预处理得到训练项集,设定最小支持度和最小置信度阈值并采用FP-growth算法挖掘关联规则;其次,从关联规则中提取出规则右件为制冷剂泄漏故障的类别标签规则,其数量相比于关联规则大大减少;然后,根据规则等级原则对类别标签规则进行降序排列,剪枝消除冗余规则以保留剪枝规则;最后,根据基于关联规则的分类算法多次遍历和匹配训练项集,从剪枝规则中筛选出可用于故障检测的有限条规则,该部分规则记为故障检测规则,与此同时生成一个默认故障。基于关联规则的故障检测模型由故障检测规则和默认故障组成,可用于对空调系统制冷剂泄漏的故障检测。本文对某型号的数据中心用空调系统展开实验,采集了五种不同制冷剂充注量水平下的运行数据,包括制冷剂正常和分别发生10%,20%,30%和40%泄漏故障的运行数据,用于构建故障检测模型并对模型进行性能验证。实验结果表明模型对于五种不同制冷剂充注量水平的检测准确率分别为95.4%,93.5%,88.2%,90.9%和99.6%,平均准确率可达93.52%;被错误检测的泄漏故障主要被检测为与真实故障最邻近的故障,因此基于关联规则的故障检测模型对数据中心用空调系统制冷剂泄漏故障具有非常高的故障检测准确率。受到数据不平衡现象的影响,基于关联规则的故障检测模型可能发生故障偏倚问题。本文提出基于数据重采样方法优化的故障检测策略,利用SMOTE,SMOTESVM,ENN和SMOTEENN等四种重采样方法在三种数据不平衡的数据集上进行优化评估,结果表明四种数据重采样方法对故障检测模型均有优化效果,而且SMOTE,SMOTESVM和SMOTEENN三种数据重采样方法相比ENN具有更好的优化效果。