基于逻辑推理的机器学习树集成模型的可解释性研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:qt393761474
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人工智能技术得到长足发展,相关技术已广泛应用于各个产业以及人民的日常生活。从生活日常的消费、交通、医疗,到更高层面的信贷、司法、行政,人工智能技术在对越来越多的领域产生深层次的影响。随之而来的,也有人类对人工智能未来的担忧:这个发展迅猛的新“伙伴”,是不是值得人类信赖?最近的很多研究关注了可解释人工智能领域,人们尝试通过不同角度去解释各个机器学习算法的预测行为。树集成模型是一种流行的机器学习模型,在分析结构化数据时,它通常具有很好的预测性能。尽管单个的决策树通常被认为是一个白盒模型,可以自然解释。但树集成模型常包含了数量庞大的决策树,若干棵树同时作用于预测结果,形成了黑盒模型,这样的模型难以自然得到直观的解释。为了解释树集成模型的预测行为,了解其在实际任务中的预测逻辑,我们研究了树集成模型的可解释性问题。本文主要的工作和贡献如下:1.基于逻辑的解释集提取框架本文提出了一个基于逻辑推理的提取树集成模型解释集的框架,该框架能将一个树集成模型转换为一个包含若干IFT HEN形式的决策规则的解释。该解释集解决了树集成模型的可解释性问题,提供模型的全局解释帮助用户理解一个模型的预测逻辑。同时也是一个可用于预测的小型替代模型,能够为优化树集成模型的验证提供支持。2.优化解释集本文提出了评估解释集性能优劣的量化标准,该标准均衡考虑了解释集的大小与解释集的预测能力。并基于该标准,进一步优化,得到优化解释集(Opt Explain)。相比未优化的解释,Opt Explain是一个更优的可解释代理模型。3.等价类侧写本文提出了生成等价类侧写(Pro Class)的方法,是基于样例的解释。Pro Class基于Opt Explain,应用可满足性模理论(SMT),能够为每个类别提供一条公式,以描述模型视角中最接近该类别的特征分布。P ro Class为树集成模型的可解释性提供了另外的视角,为用户提供了数据类别的代表性范例。4.可解释性分析在多个数据集上的实验表明,本文的方法可以为大型树集成模型提供高质量的解释。相比相关工具in Trees、defrag Trees,Opt Explain能够生成规模更小、保真度更高的解释,且能够根据用户偏好设定生成更符合需求的解释。
其他文献
学位
诚信原则最初是民法领域确立的一项基本原则,至今已在民法领域拥有至高无上的地位。然而近现代诚信原则出现了向其它领域扩张的趋势,总体上看劳动法学界似乎都默认诚信原则可以在劳动合同中进行运用,但却一直缺少对劳动合同法领域诚信原则适用的系统性学理论证,对于诚信原则在劳动合同法领域中的地位和作用学界和司法界都始终未达成共识,导致该原则在司法实践的具体运用中仍存在诸多的疑问。同时,劳动法学界对于诚信原则的研究
学位
人权理事会特别程序是联合国人权理事会授权人权专家从专题角度或具体国别角度对国际或国家人权问题提供建议和报告的人权保护机制。半个世纪以来,人权理事会特别程序处理了来自世界各地的人权问题,设立了四十多个的人权议题。特别程序自建立之初就面临争议,此后尽管在二十一世纪初的人权理事会改革中继续存活下来,特别程序并没有完全消除对其运行状态的质疑。但不可否认的是,人权理事会特别程序凭借其丰富的人权议题和广泛的人
对赌协议,又称“估值调整机制”(Valuation Adjustment Mechanism),是在西方资本市场发展过程中,由经验丰富的风险投资家创新出的一种金融衍生工具,用以对投资标的进行估值调整。对赌协议在西方资本市场已经被作为普通商业条款应用广泛,并且在纽约交易所和纳斯达克都是被允许使用的。对赌协议是通过海外主要是西方投资机构在对国内的创业型企业进行投资时引入中国市场的,在我国不断快速发展的
《1994年关税与贸易总协定》(以下简称GATT1994)第21条中的成员“自裁决”,是指WTO成员在第21条安全例外条款下,对涉及其基本安全利益的事项可进行一定的自由裁量,并决定为保护该利益而采取措施的权利,这种“自裁决”不要求成员考虑到该措施是否可能构成对其他成员歧视或对国际贸易的变相限制。“基本安全利益”属于一国主权范畴,成员在多边贸易体制中对涉及国家安全事项享有一定的“自裁决”,是以主权国
胎盘是胎儿与母体之间物质交换的重要器官,是人类妊娠期间,由胚胎胚膜和母体子宫内膜联合长成的母子间器官。胎盘结构复杂,而绒毛是胎盘的基本功能单位,临床上需要对胎盘的绒毛层进行组织病理分析才能具体判断胎盘功能是否异常。但是胎盘绒毛组织是复杂多变的,这给病理专家对胎盘功能性诊断带来了挑战,而且诊断过程费时繁琐,无法定量化分析各项指标,只能由经验丰富的病理专家给予病理诊断,同时由于医生使用显微镜或使用主流
随着城市化建设的不断推进和经济建设的快速发展,城市机动车保有量不断飙升,在便利人们出行的同时也带来了严重的交通拥堵,阻碍我国城市和地区向智慧城市转型。传统的固定相位时长的交通信号灯控制方法整体通行效率低下,目前绝大多数交通信号灯控制方法仅关注交通路口的整体通行效率,当路口车流密度极不平衡时,一味追求全局通行效率的提高会使高密度的密集车辆优先通行,低密度的稀疏车辆长时间等待甚至无法通行,造成少数车辆
金砖国家在诸多新兴经济体中具有较强的代表性,近年来其发展态势备受瞩目。自金砖国家概念正式提出以来,各国间经贸关系得到迅速发展,综合国力显著增强。近年来,受全球金融危机、逆全球化等因素影响,金砖国家经济实力虽整体保持上升趋势,但在增长速度上出现了一定程度的减缓和分化现象。地缘政治等负面影响因素再度显现,随之兴起的唱衰论调也逐渐增多。在当前的国际环境下,合作行为本质上体现的是各行为体的利益博弈与诉求,
随着经济全球化的进一步深入,国家之间经济来往互动更加频繁,相互影响程度也逐渐加深。改革开放至今,我国惊人的经济增长和发展速度吸引了世界各国跨国公司的在华投资,外商直接投资规模不断扩大,始终保持着高速增长。不过,在外商直接投资不断助力经济发展的同时,所带来的环境问题也引人注目。在外商直接投资流入的同时,是否转移了更多的高污染企业,给中国带来了更多的环境污染,亦或是将清洁技术带入中国,对改善环境起到了