基于机器学习的疾病诊断模型研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:zhuang321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
健康是人类全面发展的基础,近年来,各种疾病的发病率都呈现增长趋势,尤其是在医疗不发达的地区,这无疑给医生增添了工作难度。基于机器学习的疾病诊断研究对提高疾病诊断的准确性和实时性,辅助医生完成疾病诊断具有重要的意义。机器学习算法对医疗机构产生的数据进行学习后得到疾病诊断模型,可以对未知的数据样本进行预测。然而传统的单分类器诊断模型很难取得优异的泛化能力,因此在机器学习算法应用中,还需要考虑各种技术的集成和优化。论文在研究基于传统机器学习的疾病诊断模型的基础上,重点研究了多分类器集成诊断模型和多分类器选择性集成诊断模型,研究的主要包括:1、提出了一种Bagging-Adaboost-SVM的多分类器集成诊断模型。首先,融合Bagging、Adaboost和SVM三种算法的二分类方法,利用Bagging算法的思想,每次只从疾病样本中抽取一小部分数据作为训练集;其次每个子训练集采用去噪算法,发现噪声数据并且根据它所在的类别的统计数据去修改它的类标签;接着,将Adaboost-SVM对每个子训练集进行训练并且筛选弱分类器的个数(根据弱分类器的准确率来确定);最后,整合弱分类器得到每个子数据集的最终分类模型作为Bagging的基分类器。实验结果表明,该模型在糖尿病数据集上准确率达到了92.36%,比应用在糖尿病诊断效果好的深度神经网络(DNN)算法提高了3.16%,验证了该模型更适合糖尿病诊断。2、提出了BDA-GA多分类器选择性集成诊断模型。首先,采用有放回重采样技术从原数据集选取训练样本,通过分类算法和训练集生成若干基分类器;其次,利用加权的方法来平衡分类器之间的多样性和分类器的准确率,即BDA;然后,基于验证集与基分类器进行训练并计算BDA的值,用选取算法(GA)以BDA的评价准则搜索最优的基分类器子集,最后,将得到的优质子集用投票法将诊断结果进行整合得到最终结果。实验结果表明,该模型在高血压数据集上准确率达到了93.83%,比适合高血压诊断的人工神经网络(ANN)算法提高了4.27%。
其他文献
精子中携带的RNA对发育的影响越来越受到人们的关注,而在人和小鼠的相关研究中,研究人员主要把目光集中在父系跨代遗传——环境和疾病等原因会诱导精子中的RNA发生改变并把这种变化通过受精带给后代。长非编码RNA(Long non-codingRNA,lncRNA)既不同于mRNA能够编码蛋白,也不同于其他的小RNA具有较为明确的作用机制,其功能较为复杂。本研究将关注点放在奶牛精源性的lncRNA,通过
皮下脓肿是羊的常见皮肤病之一,该病在全国广泛流行,其病程长,传染性强,该病可导致羊只消瘦、抵抗力下降,严重影响着养殖效益。环境中致病菌的存在及羊皮肤完整性被破坏是该病的主要病因,给羊皮下脓肿的预防与治疗造成极大的困难。近年来关于羊皮下脓肿病原菌研究报道显示,羊皮下脓肿致病菌主要为伪结核棒状杆菌(Corynebacterium pseudotuberulosis,C.p)和金黄色葡萄球菌(Staph
目的:在规模化猪场母猪的实际繁殖过程中,影响母猪繁殖性能的因素有很多,如管理不当、环境异常和营养不良等因素都能降低母猪的繁殖性能,在母猪繁殖过程中发情迟缓、异常或不发情,母猪分娩时产程、恶露持续时间过长和胎衣不下造成母猪产后乳房炎、子宫内膜炎等疾病的多发,这一系列的问题使得母猪淘汰率增高和使用年限的减少,给猪场造成了一笔不可估计的损失。为解决这些在实际生产中所存在的问题,本试验结合母猪的生殖特点,
强栅栏覆盖问题作为无线传感器网络中一个重要的研究方向,主要目的是对感兴趣区域内发生的事件进行有效监控。目前针对构建强栅栏覆盖的研究大多在二维平面上进行,这是一种理想化场景,不适用于更加复杂的三维真实应用场景。此外,由于传感器节点能量有限,强栅栏覆盖网络在一定时间后中会出现栅栏间隙,导致监控目标事件信息不准确。因此,本文针对三维强栅栏覆盖的构建和三维强栅栏覆盖间隙修复等方面的问题做更深一步的探讨,主
酰胺醇类抗生素主要包括氯霉素(CAP)、甲砜霉素(TAP)和氟苯尼考(FF),因它们较好的药代动力学和抗菌特性,常被用于畜牧生产和水产养殖中,但酰胺醇类部分药物残留于动物性食品中会直接威胁人体健康或使环境中耐药菌增加。随着各国对酰胺醇类药物残留监管力度的增加,探索更加精确、灵敏及高效的药物残留检测方法已成为大势所趋。其中免疫分析检测技术因其特异性强、灵敏度高、操作简便等优点常用于检测动物性食品中酰
猪流行性腹泻病毒(PEDV)是引起猪流行腹泻(PED)的病原,20世纪70年代PEDV在欧洲被首次发现,随后在世界范围流行。2010年,我国由于PED造成近100万头仔猪死亡,使养猪业遭受严重损失。猪是PEDV的唯一自然宿主,各品种和年龄的猪均可感染,但以仔猪易感性高、症状最为严重,发病仔猪病程7 d左右,表现为腹泻、呕吐、严重脱水等症状,最终衰竭而死,哺乳仔猪病死率达100%。对PED尚没有特异
文本蕴含识别旨在判断两段文本间的语义逻辑关系,推理过程涉及到句法分析、词汇理解、逻辑推理、社会经验和常识等多个方面的知识,是一项判断计算机是否在一定程度上“理解”文本语义的具有挑战性的研究任务,也是自然语言处理领域较为重要的基准任务之一。近年来基于深度学习的方法在文本蕴含识别研究领域得到了广泛应用,但是针对中文文本蕴含识别的研究工作仍然较为缺乏,所提出的方法也存在许多不足:如模型对于句子深层语义的
布鲁氏菌病(Brucellosis)是由于感染布鲁氏菌(Brucella)而引起的一种人畜共患的传染病,简称布病。近年来,随着我国家畜养殖业的快速发展,家畜及其产品的频繁流通,动物间和人间的布鲁氏菌病疫情呈现持续上升的趋势。其中,羊布鲁氏菌病最为常见,而且羊布鲁氏菌病更容易传染给人类。为了保障我国畜牧业持续稳定健康地发展,保障畜产品安全以及广大人民群众的生命健康,布鲁氏菌病的防控净化已成为当下的必
脉冲神经网络比传统的人工神经网络更加符合生物神经系统要求,适用于大脑神经信号的研究分析,同时具有强大的计算能力。因此,脉冲神经网络的相关研究与应用得到了越来越多的关注。但脑神经科学存在一个核心问题,即大脑通过什么方式来实现真实、有效的学习?针对这一问题,目前突触可塑性机制是大家普遍比较接受的方式。近年来,神经生理学研究表明,突触权值的变化与神经元发放脉冲的精确时间紧密相关,这种规律可以被称为脉冲时
家猪是我国家畜养殖中占比最高的产业,同时猪又在人类医学生物技术领域占有重要地位。无论在利用基因编辑提高家畜的生产力与安全性的应用中,还是在制造特定的疾病动物模型研究中,猪都占有重要的地位。目前,猪胚胎体外生产技术虽然已经建立,但大规模生产应用仍无法实现,这主要是由于猪的体外受精技术(In vitro fertilization,IVF)相较其他物种而言效率低下。主要原因在猪体外受精过程易发生多精入