稳定评估机器学习模型可解释性研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户：kitwe

【摘要】

：

【作者】

：

韩天森

【机构】

：

华中科技大学

【出处】

：

华中科技大学

【发表日期】

：

2020年期

【关键词】

：

稳定评估机器学习模型计算方法训练数据特征筛选聚类 Shapley值偏相关函数代理模型系统状态变量贡献度构建

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

稳定性是电力系统运行的核心关注点，机器学习作为解决新一代电力系统稳定评估问题的关键技术之一，其高效准确的特点被众多研究所证实，但多数机器学习算法构造的是“黑箱”模型，普遍存在模型可解释性不足的缺点。稳定评估机器学习模型的可解释性有助于建立使用者对模型评估结果的信任，且可为稳定控制提供依据，可帮助消除对模型可靠性和实用性存在的顾虑。为增强模型可解释性，本文按照从局部到整体的思路，研究了稳定评估机器学习模型的解释算法，首先对于单个数据及其稳定评估结果，计算输入特征的灵敏度与贡献度，揭示模型运算逻辑；然后提出电力系统状态变量聚类方法，并构建状态变量数据聚类簇的解释；最后通过计算特征重要度和偏相关函数，从特征角度对模型进行全局解释，主要工作归纳如下。
　　提出了一种基于线性代理模型的稳定评估机器学习模型输入特征灵敏度计算方法。该方法基于加权线性回归和正则化构造待解释数据邻域内的局部线性代理模型，代理模型的参数为对应特征的灵敏度。针对电力系统状态变量间高相关性的特点，基于弹性网络进行重要特征筛选，使解释结果更加简单易懂。此外提出了一种考虑特征相关性的代理模型训练数据采样方法，使采样数据更符合原数据分布。仿真算例验证了灵敏度解释的准确性，证明了所提数据采样与特征筛选方法提高了代理模型的精度。
　　提出了三种稳定评估机器学习模型贡献度计算方法。首先将合作博弈论中的Shapley值引入稳定评估模型中代表特征贡献度，并给出Shapley值在机器学习中的计算方法；然后针对特征数量大时Shapley值计算困难的问题，提出一种Shapley值的高效计算方法，该方法在线性模型中使用特殊构造的核函数并构建二元训练数据，使线性模型参数等于特征的Shapley值。最后，针对前述方法中获取训练数据标签运算量大的问题，基于局部线性拟合思想提出了一种贡献度评估方法，该方法通过构建函数将二元数据映射到原状态空间，来快速计算数据标签。仿真算例比较三种方法的运算耗时，验证了贡献度解释结果的准确性并分析不同解释方法的适用场景。
　　提出了一种电力系统状态变量数据的聚类算法，并构建单个聚类簇的解释。该方法首先对数据集基于孤立森林筛除离群点，并使用主成分分析法进行数据降维；然后基于高斯混合模型对预处理后的数据进行聚类，用变分推断求解模型，搜寻最佳的聚类簇数；最后，基于聚类簇中代表性数据的灵敏度与贡献度构建聚类簇的整体解释指标。仿真算例证明了所提聚类方法的优越性，并验证了聚类簇解释结果的正确性。
　　提出了稳定评估机器学习模型特征重要度评估及偏相关函数计算方法，构建模型总体解释。指出现有特征重要度计算方法结果可能存在的偏差，并提出了基于层次聚类的解决方法。提出两种偏相关函数构建算法，其中基于累积局部效应的方法适用于特征相关数据。算例仿真展示了原有重要度评估方法在稳定评估问题中存在的偏差，并验证了层次聚类结果与偏相关函数构建的有效性。
　　

其他文献

100个硬笔字书写要诀(十五)

同学们，这次我们要观察三个常用字：“你、们、的”，这三个字用得太多了，一定要练好哟。练好的窍门在哪里呢？在图中，在口诀里，快去瞧瞧吧！　　　　左窄右宽右略高，横钩对着撇尖写。　　边竖略斜有规律，左倾右斜如凳腿。　　　　如果竖在字的中心，如“中”，竖画一定要写得直，如果在字的两边应该略倾斜，如凳腿一般，这样就更稳妥了。　　　　右部略宽撇要高，边竖内收对称美。

期刊

基于MATLAB平台的发电机温度状态辅助专家在线分析系统

大型发电机是电站的核心设备，其安全可靠运行是电网稳定的基本条件。温度是反映大型发电机健康状况的重要参量，通过对发电机的温度分析，可以及时发现缺陷，从而提高了设备的稳定性和利用率，延长了机组的使用寿命。
　　大型发电机是一个多特性耦合系统，温度分析模型复杂，MATLAB具有丰富的库函数资源、卓越的运算性能和良好的开发与使用环境，可以大大简化温度数据分析的开发，为探究温度与状态参量的关联关系提供有力工具，并利用其图形用户界面(GUI)开发面向专家的交互式分析平台。文章从在线数据提取、温度数据分析方法探究

学位

MATLAB平台发电机温度辅助专家分析平台数据分析稳态过程大型发电机状态参量文章温度变化率温度分析模型历史数据

《李思训碑》规矩中有变化

李邕勇于创新　　　　严老师：今天，我们要来认识一位唐代大书法家——李邕(yōnɡ)。李邕曾做过北海太守，所以，人们也称他“李北海”。　　小鹏：我以前没有听说过。他的代表作是什么？　　严老师：他的代表作有《云麾（huī）将军李思训碑》（简称《李思训碑》）《岳麓寺碑》，这次我们欣赏他的《李思训碑》。　　小钰：这是一种什么字体啊？我以前没有见过。　　严老师：这是行书，比正楷活泼，比草书规矩。　　李邕很善

期刊

竖画起\收及竖撇的用法

汉字宝宝：今天我受小朋友们委托，想了解汉字中，竖画起笔或竖画收笔的结字方法！　　字豪老师：汉字的特点是横画多竖画少，竖画在汉字中起到像我们的腿、脊椎一样“支撑”的作用。我们常说汉字的“间架”：间，笔画之间的距离；架，用竖画或与竖画相当的笔画支撑。这里与竖画相当的笔画还有：竖撇、竖钩、竖折折钩等，看右图。　　大家仔细看，竖画在左、竖画在右的一类汉字，书写时要比其他的汉字瘦一些，包围一类的汉字书写时四

期刊

100个硬笔字书写要訣(五)

同学们,撇画有多种形态,有直撇,有竖撇,有弧撇,不管哪种撇,撇有收笔都要写尖,或锐利,或飘逸,这样字才显得精神。

期刊

跟邹老师学写毛笔字(五)

笔名:豪曼.江苏省丹阳市书法家协会副主席.著有书法实用技法一书.

期刊

米米拜师

上一期，我们讲了小熊米米想要去森林里寻找木木老师，它找到了吗？后面又将会发生怎样的故事？　　在每一期的“汉字漂流瓶”中，你能读到一段有趣的汉字故事，而你也可以是它的创作者哟！你可以根据前一个故事的情节，编写后面可能发生的故事。续编的故事要与汉字有关哟！可以是“汉字与美化生活”“写字秘诀”“汉字与书法家”“汉字与数学”“汉字与科技”……加上标题，并且留有一定的再创造空间，试一试吧！　　　　走进了小木

期刊

愿做书坛引路人

小编：同学们，大家好！今天小编要给大家介绍一位来自中原的韦灵刚老师，掌声欢迎！　　小编：灵刚老师，我在《蜗牛书画报》看到您和学生的作品，您别具见地的硬笔字教法令人耳目一新，您的思路是怎样产生的呢？　　灵刚老师：我从小就酷爱写字。在学习书法的过程中，我走了不少弯路，究其原因，就是没有掌握合适的技法。对于初学者，重结构分析，轻笔画技法提升；重花钱买帖，轻手把手传授；重描红数量，轻循序渐进，这样往往事倍

期刊

面向整定计算应用的含直流接入交流电网故障计算研究

高压直流输电具有输送容量大、输送距离远、高度可控、运行灵活等技术特点，在长距离大容量输电和区域系统互联等方面得到了广泛应用。其中，基于晶闸管的传统高压直流输电技术具有输送容量更大、设备建造成本更低的优势，在电网中应用较多。然而，当发生交流电网故障时，高压直流输电系统具有不同于交流电网的故障暂态特性，在交直流间复杂的相互作用影响下，会给交流电网的故障特征带来新的特点，这势必会对交流保护整定计算产生影响。在这样的背景下，展开面向整定计算应用的含直流接入交流电网的故障计算研究，在理论和工程层面都有重要价值。

学位

保护整定计算计算应用高压直流输电系统接入交流电网电网故障计算方法故障计算故障特性等效模型影响因素输送容量

天伦之情

绿草地,小花圃,我扶爷爷去散步.风儿轻轻吹,蝴蝶绕花舞.爷爷靠着我,在爷爷慈爱的目光里,我觉得好幸福.

期刊

与本文相关的学术论文

稳定评估机器学习模型可解释性研究
电力系统稳定评估机器学习可解释代理模型研究
基于可解读机器学习的预测分析模型解释及评估方法
地震动强度参数估计的可解释性与不确定度机器学习模型
复杂岩性解释模型稳定性和可靠性评价
机器学习的可解释性
滑坡易发性机器学习优化模型及可解释性研究
滑坡易发性机器学习优化模型及可解释性研究
基于可解释机器学习的肝癌预测模型研究
基于可解释机器学习的肝癌预测模型研究
机器学习的可解释性综述
基于机器学习的个体出行决策模型可解释性研究
机器学习模型可解释性方法、应用与安全研究综述
深度学习模型可解释性研究综述
机器学习数据驱动与机理模型融合及可解释性问题
基于图模型机器学习算法的可解释性技术研究与实现
机器学习模型可解释性研究及其在PHM中应用现状综述
基于逻辑推理的机器学习树集成模型的可解释性研究
深度学习模型可解释性的研究进展
基于Transformer模型的机器翻译可解释性研究