基于公理模糊集的扩展分类方法及其可解释性研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:cynosure
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可解释性是数据挖掘领域的研究热点,当数据处理结果具有可解释性时才能为决策者提供一种透明的指导作用。公理模糊集(Axiomatic Fuzzy Sets,AFS)理论是一种处理模糊不确定性和随机不确定性的新型方法,其隶属函数直接由原始数据的内在逻辑及信息转化而来。建立在公理模糊集上的分类方法能够产生具有较好语义的结果,并广泛应用于不同的领域,但其预测准确率往往是以降低结果的可解释性为代价的。本文通过结合传统AFS分类方法与其他工具,构建扩展分类方法,力求在准确率和可解释性之间达到一个平衡点。主要的研究内容如下:(1)传统AFS分类方法通过产生的模糊规则获取知识,当训练样本较多时,得到的类描述过于复杂,且其隶属函数易受到噪声数据影响。针对这一问题,引入非平稳割点样本选择算法,提出了基于样本选择的二型AFS分类方法。该方法利用非平稳割点样本选择算法设置合适的阈值保留非平稳割点附近样本,形成样本子集以减少训练样本的个数。同时借助区间二型隶属函数具有较强处理不确定信息的优势,在保证模型分类性能不变的前提下,简化类描述,使得语义描述相对简洁。(2)传统AFS分类方法采用最大隶属度原则确定测试样本的类标签,该原则忽略了测试样本的邻域信息。针对这一问题,本文设计了一种基于AFS理论和k近邻的可解释分类方法AFS-KNN。该方法首先将训练数据转化为语义描述,然后利用样本的隶属度来选择测试样本的k个邻域,将测试样本归为k个邻域中同类隶属度之和最大的一类,避免受到异常点的影响。通过对UCI数据库中的11个数据集进行比较,结果表明,AFS-KNN方法在可解释性和准确性方面较经典的k近邻方法、传统的AFS分类方法均有一定的提升。(3)在利用传统监督学习方法分类时,若要使分类结果更精确,往往需要较多的样本训练分类模型,但在实际问题中,标记样本的类标签比较困难且要付出较大的代价。针对这一问题,在AFS理论框架下,本文结合了代价敏感学习和互近邻方法构建了一种新的主动学习方法CS-AFS-KNN-MUL。该方法旨在训练尽可能少的带标签样本,利用代价敏感方法选取关键样本并将其加入到已知训练样本集中。此过程不断迭代,直到全部待测样本均获得类标签。通过对UCI数据库的13个数据集进行实验分析,结果表明CS-AFS-KNN-MUL方法在精度上优于其他方法,且总体的代价较低。
其他文献
2018年中共4号文件《关于全面深化新时代教师队伍建设改革的意见》的颁布,旨在推动和建设新时代高素质教师队伍。在推进教师队伍改革的过程中,关键在于促进每位教师个体自我
耐辐射奇球菌(Deinococcus radiodurans,DR)是在目前已知的150万种生物当中,抗辐射性能最强的物种之一,它对Ionizing radiation,UV,drying,H2O2等表现出强烈的抗性。这些胁迫
智能建筑指根据用户的需求对建筑物的结构、系统、服务和管理进行最优化组合,从而为用户提供一个高效、舒适、便利的人性化建筑环境。人在建筑物内的活动是影响建筑运行重要
经过四十年的改革开放,我国在政治体制改革和经济体制改革等方面都取得了显著成效,目前已进入攻坚克难时期,人民日益增长的对美好生活的向往同不平衡不充分的发展之间的矛盾
稀疏表示分类算法在模式识别领域已经取得了较大的突破,并成功应用于人脸识别中。基于稀疏表示的人脸识别算法是一种简洁高效的方法,对遮挡、光照以及噪声等现实情况具有鲁棒
近年来,分子荧光探针获得迅速发展。荧光探针是指在一定的波长光的激发下以荧光物质作为指示剂使其产生荧光,通过检测所产生的荧光来实现对被检测物质的定性或定量分析。分子
随着工业智能化发展的需要,机器视觉的研究正处于上升阶段,以视觉传感器指引机器人完成某些指定工作,可以达到提高工作效率和降低成本的目的。然而圆特征目标物如瓶盖、液化
如今,互联网上发布的功能多样化的Web服务比比皆是,使得服务提供商对如何在海量的服务资源池中挖掘出满足用户功能需求的Web服务提出更高的要求。基于融合社交信息的矩阵分解
鸭疫里默氏杆菌(Riemerella anatipestifer)主要感染1~8周龄雏鸭、火鸡和鹅等多种禽类,感染后以急性或慢性败血症和多发性传染性浆膜炎为特征。由于本病的高传染性和高死亡率,给
构建专业化的信访绩效工作体系,是加强党和政府与群众联系的有效途径,是维护群众合法权益,回应群众诉求,解决社会矛盾的重要渠道,更是构建和谐社会和树立党和政府形象的重要