论文部分内容阅读
稳定性是电力系统运行的核心关注点,机器学习作为解决新一代电力系统稳定评估问题的关键技术之一,其高效准确的特点被众多研究所证实,但多数机器学习算法构造的是“黑箱”模型,普遍存在模型可解释性不足的缺点。稳定评估机器学习模型的可解释性有助于建立使用者对模型评估结果的信任,且可为稳定控制提供依据,可帮助消除对模型可靠性和实用性存在的顾虑。为增强模型可解释性,本文按照从局部到整体的思路,研究了稳定评估机器学习模型的解释算法,首先对于单个数据及其稳定评估结果,计算输入特征的灵敏度与贡献度,揭示模型运算逻辑;然后提出电力系统状态变量聚类方法,并构建状态变量数据聚类簇的解释;最后通过计算特征重要度和偏相关函数,从特征角度对模型进行全局解释,主要工作归纳如下。
提出了一种基于线性代理模型的稳定评估机器学习模型输入特征灵敏度计算方法。该方法基于加权线性回归和正则化构造待解释数据邻域内的局部线性代理模型,代理模型的参数为对应特征的灵敏度。针对电力系统状态变量间高相关性的特点,基于弹性网络进行重要特征筛选,使解释结果更加简单易懂。此外提出了一种考虑特征相关性的代理模型训练数据采样方法,使采样数据更符合原数据分布。仿真算例验证了灵敏度解释的准确性,证明了所提数据采样与特征筛选方法提高了代理模型的精度。
提出了三种稳定评估机器学习模型贡献度计算方法。首先将合作博弈论中的Shapley值引入稳定评估模型中代表特征贡献度,并给出Shapley值在机器学习中的计算方法;然后针对特征数量大时Shapley值计算困难的问题,提出一种Shapley值的高效计算方法,该方法在线性模型中使用特殊构造的核函数并构建二元训练数据,使线性模型参数等于特征的Shapley值。最后,针对前述方法中获取训练数据标签运算量大的问题,基于局部线性拟合思想提出了一种贡献度评估方法,该方法通过构建函数将二元数据映射到原状态空间,来快速计算数据标签。仿真算例比较三种方法的运算耗时,验证了贡献度解释结果的准确性并分析不同解释方法的适用场景。
提出了一种电力系统状态变量数据的聚类算法,并构建单个聚类簇的解释。该方法首先对数据集基于孤立森林筛除离群点,并使用主成分分析法进行数据降维;然后基于高斯混合模型对预处理后的数据进行聚类,用变分推断求解模型,搜寻最佳的聚类簇数;最后,基于聚类簇中代表性数据的灵敏度与贡献度构建聚类簇的整体解释指标。仿真算例证明了所提聚类方法的优越性,并验证了聚类簇解释结果的正确性。
提出了稳定评估机器学习模型特征重要度评估及偏相关函数计算方法,构建模型总体解释。指出现有特征重要度计算方法结果可能存在的偏差,并提出了基于层次聚类的解决方法。提出两种偏相关函数构建算法,其中基于累积局部效应的方法适用于特征相关数据。算例仿真展示了原有重要度评估方法在稳定评估问题中存在的偏差,并验证了层次聚类结果与偏相关函数构建的有效性。
提出了一种基于线性代理模型的稳定评估机器学习模型输入特征灵敏度计算方法。该方法基于加权线性回归和正则化构造待解释数据邻域内的局部线性代理模型,代理模型的参数为对应特征的灵敏度。针对电力系统状态变量间高相关性的特点,基于弹性网络进行重要特征筛选,使解释结果更加简单易懂。此外提出了一种考虑特征相关性的代理模型训练数据采样方法,使采样数据更符合原数据分布。仿真算例验证了灵敏度解释的准确性,证明了所提数据采样与特征筛选方法提高了代理模型的精度。
提出了三种稳定评估机器学习模型贡献度计算方法。首先将合作博弈论中的Shapley值引入稳定评估模型中代表特征贡献度,并给出Shapley值在机器学习中的计算方法;然后针对特征数量大时Shapley值计算困难的问题,提出一种Shapley值的高效计算方法,该方法在线性模型中使用特殊构造的核函数并构建二元训练数据,使线性模型参数等于特征的Shapley值。最后,针对前述方法中获取训练数据标签运算量大的问题,基于局部线性拟合思想提出了一种贡献度评估方法,该方法通过构建函数将二元数据映射到原状态空间,来快速计算数据标签。仿真算例比较三种方法的运算耗时,验证了贡献度解释结果的准确性并分析不同解释方法的适用场景。
提出了一种电力系统状态变量数据的聚类算法,并构建单个聚类簇的解释。该方法首先对数据集基于孤立森林筛除离群点,并使用主成分分析法进行数据降维;然后基于高斯混合模型对预处理后的数据进行聚类,用变分推断求解模型,搜寻最佳的聚类簇数;最后,基于聚类簇中代表性数据的灵敏度与贡献度构建聚类簇的整体解释指标。仿真算例证明了所提聚类方法的优越性,并验证了聚类簇解释结果的正确性。
提出了稳定评估机器学习模型特征重要度评估及偏相关函数计算方法,构建模型总体解释。指出现有特征重要度计算方法结果可能存在的偏差,并提出了基于层次聚类的解决方法。提出两种偏相关函数构建算法,其中基于累积局部效应的方法适用于特征相关数据。算例仿真展示了原有重要度评估方法在稳定评估问题中存在的偏差,并验证了层次聚类结果与偏相关函数构建的有效性。