论文部分内容阅读
近年来,随着公共建筑节能监测系统监测质量的提高和楼宇自动化系统的普及,建筑运行监测平台中积累了海量的实时能耗数据,这些数据背后往往蕴涵着建筑节能的突破方向。并且,建筑能耗数据具有数据量大、数据维度高的特点,导致常规的分析方法难以发现和总结能耗数据中隐藏的建筑用能规律和分项能耗数据间的关联。数据挖掘技术具有处理海量数据以及发现潜在的、新颖有用知识的分析能力,为人们认识蕴藏在数据中的信息和知识提供了一条途径。本文运用数据挖掘技术进行公共建筑的能耗分析,以提高公共建筑的能效水平和节能策略的合理性,主要研究内容及方法如下:1.探究建筑能耗数据缺失值的填补方法。采用基于马氏距离的k均值填充法填补公共建筑能耗缺失数据,为降低能耗数据的维度并利用属性集蕴含的内在信息,通过相关性分析找到与缺失属性密切相关的属性,并使用信息熵计算最近邻域的系数矩阵,量化非缺失数据属性对缺失数据属性的影响程度。仿真实验结果表明,算法可以有效利用能耗数据属性间的内在联系,填补建筑能耗缺失数据。2.提出了适用于建筑能耗异常数据检测的算法LODCD。针对现有异常数据检测算法时间复杂度高、参数鲁棒性差的问题,本文在COF算法的基础上,提出基于聚类和密度的局部离群数据检测算法LODCD。算法利用聚类方法从原始数据集中筛选出候选离群数据集,降低算法的时间复杂度;同时,在进行数据对象之间距离计算时,引入信息熵的概念确定数据对象的离群属性以提高算法的检测准确率。确定数据集的离群属性后,采用新的局部链接离群因子LCOF度量候选离群数据集中数据的离群程度。算法在保证检测准确率的前提下,降低了时间复杂度并减小了检测准确率对参数的依懒性。仿真结果证明了所提方法的有效性和可行性。3.构建了基于决策树算法的建筑能耗预测模型。采用C4.5决策树算法处理公共建筑能耗数据,建立一个易于理解的公共建筑能耗预测模型,并利用C4.5算法选择影响建筑能耗的主要因素,将其作为自变量,构建公共建筑能耗回归分析模型。此外,采用主成分分析对原始属性进行处理,通过提取原始属性的主成分来降低建筑能耗数据的维度,达到提高算法扫描数据集速度的目的。仿真实验证明,该模型可以较好的预测建筑能耗值,为建筑能效提高提供理论依据。4.对商业建筑能耗数据进行静态和动态的关联规则挖掘,并通过建模分析关联规则挖掘结果应用在公共建筑能效管理的可行性。采用Apriori算法从静态和动态两个方面,分析公共建筑分项能耗数据、气象参数、人员活动规律之间所存在的内在相关性和连动关系,并运用专业知识对强关联规则进行解读,寻找提高建筑能效的关键切入点。使用SketchUp和OpenStudio模拟商业建筑全年各项能耗,验证关联规则挖掘结果对建筑能效提高的影响。仿真实验证明,本文提出的公共建筑能耗数据挖掘处理方法具有通用性、实时性等特点,能够有效地应用于建筑能耗预测分析,并指导建筑整体能效水平的提高。