基于图模型机器学习算法的可解释性技术研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:yuxia21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图结构数据在实际生活中有着广泛的应用,人们可以挖掘丰富的关联关系并将其建模成图模型,图机器学习算法通过充分利用这些结构信息,从而挖掘更多有价值的信息来提供更加精确的结果。虽然图机器学习算法利用节点间的依赖关系来辅助决策,但是图模型的复杂结构同样提高了算法可解释性技术的难度,现有的图模型可解释性算法未能将决策结果公平地归因到参与决策的因素上,并且多数方法都致力于简化计算,忽略了从人类感知角度的反事实推理。为了解决上述问题,本文首先提出了基于Shapley的图模型可解释性方法,该方法引入博弈论中Shapley理论,定义图模型上的概率贡献和拓扑贡献,提出图模型上Shapley值高效近似计算方法,公平有效地评估节点贡献度,并提出Shapley元解释来证明解释结果的有效性和可理解性。本文还提出了基于反事实的图模型可解释性方法,提出了反事实解释的两个度量指标可模拟性和反事实相关性,基于此设计了一种基于图表的反事实解释形式,定义了一个双目标优化问题来搜索解释,还提出了解释鲁棒性研究评估指标,从而找到与人类认知过程完全吻合的解释。实验结果表明,两个可解释性算法能够很好地解释图机器学习算法的预测结果,并且能很好地完成不同领域的可解释性任务。本文最后还实现了一套基于图模型的可解释性系统,该系统实现了从数据处理、模型训练、模型解释和结果展示的全自动化流程,并可与用户进行交互来调整算法参数以适应不同的可解释性任务。
其他文献
随着网络的飞速发展,工业领域也逐渐开始使用互联网进行通信,即工业互联网。其中,工业互联网使用的协议大多数是各个厂商自己制定的未公开协议,这些协议数据无法通过常用的协议工具进行解析,但是它们可能会对信息安全构成威胁。因此,尽可能的识别和分析这些协议数据对于保护工业互联网的信息安全极为重要。由于工业互联网中所使用的通信协议普遍都是未知的二进制协议,因此,工业互联网中的未知二进制协议是本文主要分析的数据
随着摩尔定律的失效,通用处理器的发展逐渐逼近天花板,定制化处理器开始兴起。人工智能、大数据和通信技术的蓬勃发展,推动物联网领域迅速发展。面对日益增长的数据量,物联网设备不能再像向过去一样只做简单的数据收集工作,而把复杂的计算任务交给云上服务器。同时物联网设备复杂的应用场景对处理器提出了高能耗比、小面积、灵活定制的要求。因此,本文对可配置的定制化处理器及其后端编译移植技术进行了深入分析和研究。本文首
随着科学技术的发展,人们对高速的信息速率的需求越来越迫切,与此同时,信息安全已经成为一个重要的研究内容。激光混沌安全通信是一种物理层的加密方法,它利用物理器件的硬件参数作为密钥,进行信息的加密、传输和解密。激光混沌源分为两种,即基于激光器内部非线性的全光混沌源和基于外部器件非线性的电光混沌源。外腔半导体激光器的混沌输出通常保留了激光器与外反射镜之间光路的时间延迟。因此,通过自相关函数等时序分析手段
随着计算机技术和移动互联网技术的讯速发展,观看和分享视频成为人们日常生活的一部分,视频数据也成为重要的信息载体。人工处理视频数据显然不现实,使用传统的神经网络模型需要大量标注数据,而人工标注数据费时费力。因此,小样本场景下视频分类问题成为计算机视觉中热点研究问题。小样本视频分类问题是指在标注样本少的情况下完成视频分类任务。本文主要研究视频分类中两个基本任务:动作分类和背景类的检测,研究在视频标注少
侧信道分析作为当前密码学的热门研究方向,利用密码芯片执行中产生的泄漏信息,通过建立合适的泄漏模型,破解加密设备中密钥信息。随着侧信道分析方法的迅速发展,对当今信息安全带来巨大的挑战。因此研究侧信道分析方法,保护密码芯片避免被入侵,意义重大。本文利用FPGA(Field Programmable Gate Array,场可编程逻辑门阵列)密码芯片平台,针对 AES(Advanced Encrypti
随着全球定位系统的发展,地理路由技术在无线自组网中广泛应用。基于地理位置的贪婪周边无状态路由协议(Greedy Perimeter Stateless Routing,GPSR)是采用节点信息为主、拓扑信息为辅的路由策略,不需要建立和维护路由表,能够适应拓扑高速变化的无线自组网。但是考虑到无线自组网通信的多跳特性和网络节点逐步扩展到无人机等电池供能的节点,基于地理位置的路由策略在安全性和节能性方面
金纳米棒(AuNRs)以其优异的等离子体和物理化学性质而闻名,因此已广泛应用于各个领域,包括光谱学、传感、诊断学、生物技术和催化反应。它们在制备化学样品和生物传感器时尤其首选,因为它们的形状是可调控的,并且它们的局域表面等离子体共振(LSPR)峰是可调的。然而,由于Au NRs的相对较大的尺寸和形状分布,纵向等离激元共振可能难以组装和不均匀展宽。此外,Au NRs的电场局域化还不够强,限制了其在等
物联网技术的快速发展使得大量互联网应用应运而生,伴随着大量的物理设备而产生大量的数据流。如数据流处理不及时则会丧失部分有价值的信息。本文对光纤授时运控系统中的设备进行建模,利用本体语言描述其类、实例及关系等信息。同时对事件进行建模并建立事件属性同知识属性之间的关系,利用逻辑推理的手段进行事件流的处理,发现其中隐藏的复杂事件。本文的工作主要包括以下四个方面:(1)本体描述语言建模与知识管理。分析授时
近年来,5G通信系统发展迅猛,且带宽需求高的应用数量迅速增长。混合光纤无线(Fiber-Wireless,Fi-Wi)接入技术被视为有潜力的下一代接入网络,其有望缓解日益增加的带宽压力并应对各种无处不在的业务请求带来的挑战。Fi-Wi网络技术为用户提供了建立高质量连接的可能性,同时保证了网络灵活性和经济性。然而,由于Fi-Wi网络的光与无线子网之间存在网络结构和资源类型异构现象,该异构网络的整体管
世界发展进入21世纪,传感器技术不断地向前发展,传感器节点的规模也逐渐扩大,各节点之间能够进行无线通信,构成了无线传感器网络(Wireless Sensor Network,WSN),它们通常部署在某些特定环境下,用来完成不同的功能,例如交通治理,环境监测等。在无线传感器网络中,其位置信息也是至关重要的一环,但是由于环境的复杂性,传感器节点的GPS信号往往会缺失,且使用GPS设备定位成本高,没有运