解释性分类器研究及其在疾病辅助诊断中的应用

来源 :福州大学 | 被引量 : 0次 | 上传用户：weilai2010

【摘要】

：

在机器学习中,许多优秀的分类器大都具有良好的分类性能,但这些分类器模型通常是“黑盒”运算,使得它很难让用户去理解其背后的预测结果产生的原因和过程,如何提高分类器模型

【作者】

：

马源

【出处】

：

福州大学

【发表日期】

：

2017年01期

【关键词】

：

计算机辅助诊断解释性随机森林 t-SNE 稀疏编码

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在机器学习中,许多优秀的分类器大都具有良好的分类性能,但这些分类器模型通常是“黑盒”运算,使得它很难让用户去理解其背后的预测结果产生的原因和过程,如何提高分类器模型的准确性在过去得到广泛研究,而分类器的分类可解释性方面的研究还有待深入。随着实际应用需求,人们对计算机疾病辅助诊断的关注,疾病辅助诊断不仅要求具有较高的准确率,同时迫切需要可以给出解释的分类器模型。在国家自然科学基金(61471124)项目的支持下,本课题主要对分类器的分类可解释性进行研究,提出解释随机森林分类器的方法,并将提出的方法应用到疾病诊断中,提高诊断结果的解释性。具体内容为:一、提出一种将随机森林分类器结合 t-SNE(t-distributed Stochastic Neighbor Embedding,t分布随机邻域嵌入)的分类方法。本文针对随机森林解释性差的缺点,提出基于t-SNE流形学习方法可视化数据在随机森林模型中的内在关系。并在此基础上,提出随机森林结合t-SNE的分类方法:首先采用随机森林去度量不同样本特征数据之间的相似性,然后通过t-SNE流形学习方法产生一个低维空间表示,将低维空间表示数据采用随机森林分类器进行训练,测试样本通过映射到这个空间用来推断该样本数据的标签。最后将提出的方法应用到胎儿心率病态辅助诊断上面,实验表明通过本文方法可以更直观地观察到不同种类样本数据之间的区分程度,同时相比较其它分类方法准确性更高。二、设计基于决策树筛选与稀疏编码理论的随机森林分类规则提取方法。随机森林是一种由决策树组成的组合学习模型,可以从每棵树中提取IF-THEN的分类规则,相比决策树,随机森林由大量的规则组成,其解释性差。为了提高随机森林分类的可解释性,本文首先通过后向序列搜索的方法从随机森林中选择出能够保证分类准确性的决策树子集。其次,采用基于稀疏编码的方法提取决策树子集的稀疏规则。最后,将提出的方法应用到实际的胎儿心率病态诊断中,从医院获取不同类别的胎儿心率数据,依次对其进行降噪处理、特征提取、模型训练、结果解释。结果表明,本文提出的方法在只有三条分类规则的前提下,准确率达到90%以上,能够保证随机森林分类结果的准确性与可解释性。综上所述,本课题针对随机森林模型很难解释的难题,提出新的改进方案。在胎儿心率病态诊断中表明,通过本课题设计的方案,可以确保诊断的准确率,同时也确保诊断结果的可解释性,更加符合疾病诊断的要求,为后续设计出容易被人们理解的疾病辅助诊断系统奠定基础。

其他文献

文化生态视角下传统档案文化的历史考察与展望

从文化生态视角探究档案文化可以扩大档案工作的关注层面,更加注重研究与档案形成者、管理者和利用者有关的档案主体。纳入大文化观的档案文化能够体现文化的动态过程,与社会

学位

传统档案文化文化生态文化生态因素

江门市新会机电职业技术学校机械部技能竞赛兴趣小组管理系统的研究与分析

江门市新会机电职业技术学校机械部技能竞赛兴趣小组是学校打造品牌,强化专业建设的主要途径,是开展人才培养模式改革的试验项目,也是学校长期参加各级技能竞赛的人才“储水

学位

兴趣小组管理系统业务优化用例分析功能分析数据分析

《喜迎双胞胎》翻译实践报告

本文是一篇在关联理论指导下写成的翻译实践报告。翻译文本选自美国作家丽贝卡·温斯特的小说《喜迎双胞胎》中的第一章和第二章。本书讲述了一对美国夫妻已经申请了离婚,但

学位

《喜迎双胞胎》翻译关联理论

蒲某防卫过当案研究

在当代的中国司法实践当中,对正当防卫的成立总是裁判的过于严苛,裁判者总会要求防卫者在面对突如其来的侵犯行为时,立即对该侵犯行为的强度做出不超过法律界限的精确判断,然

学位

正当防卫特殊防卫行凶暴力犯罪暴力侵害外观

石墨烯基复合膜的电化学制备及其油水分离性能研究

针对当前石油工业和油田开采时产生的含油废水对环境造成污染的现状,研制新型、高效、易操作的油水分离材料具有重要的现实意义。石墨烯具有大比表面积、耐腐蚀、高孔隙率等优异特点,在诸多领域取得了大量优异成绩,并在油水分离领域具有潜在的使用价值,然而石墨烯基金属滤网在油水分离领域的应用较少。本论文运用电沉积和电聚合等电化学方法,在金属基体上制备了三种新型超疏水、耐腐蚀的石墨烯基复合膜,为油水分离材料提供了新

学位

石墨烯膜耐腐蚀油水分离电化学

具有认知特征的层次化学术图谱的构建及学术概念的影响力评估

随着信息技术和互联网的高速发展,爆炸式的网络信息给用户带来便利的同时,也给用户带来很大的学习负担,用户也面临着知识缺失的问题,这严重影响了个性化信息服务的质量。知识

学位

知识图谱认知性BRT层次聚类引用关系影响力评估

基于压缩感知的图像重构算法研究

在信号处理领域中,如何保留少量的有效数据来获得所需信息成为当前面临的新要求。压缩感知理论表明,如果信号是可压缩或在某个正交变换域是稀疏的,那么就可以通过测量矩阵进

学位

压缩感知稀疏表示测量矩阵重构算法施密特正交化

基于小波变换的ECG信号分析研究及硬件实现

心脏是人体的重要器官,由心脏引起的相关疾病已经成为危害人类健康的主要疾病。心电图(Electrocardiogram,ECG)作为一种无创、有效的诊断手段,在临床医学诊断中具有重要的参

学位

小波变换心电信号去噪特征波检测FPGA

《忠义直言》词汇研究

近年发现的域外汉籍《忠义直言》是近代汉语时期重要的文献资料,它为近代汉语的研究提供了最新的语言材料。《忠义直言》这本书的内容十分广泛、语料特别丰富,适合进行专书词

学位

忠义直言词汇汉语大词典

基于Android的恶意软件检测与防护技术研究

由于Android第三方应用程序市场众多,缺乏对应用安全性的统一审核和监管,针对Android移动设备的恶意软件数量急剧增加。个人隐私信息泄漏、恶意扣费等安全问题层出不穷。因此

学位

Android安全恶意软件静态检测动态检测机器学习

解释性分类器研究及其在疾病辅助诊断中的应用

其他学术论文