【摘 要】
:
甲状腺结节是一种常见的疾病,发病的原因复杂多变,且发病率有逐年上升的趋势。目前,对甲状腺结节的诊断主要是利用超声图像诊断或者化学诊断的方法。但由于甲状腺结节的物理特征复杂多变,以及受医生经验水平和医疗设备等外在因素的影响,诊断结果的准确性很难得到保证。因此,本文利用医院收集到的甲状腺结节的物理特征数据,使用机器学习的方法,建立了一种科学直观的甲状腺结节良恶性预测模型,可为医生的诊断提供辅助手段。组
论文部分内容阅读
甲状腺结节是一种常见的疾病,发病的原因复杂多变,且发病率有逐年上升的趋势。目前,对甲状腺结节的诊断主要是利用超声图像诊断或者化学诊断的方法。但由于甲状腺结节的物理特征复杂多变,以及受医生经验水平和医疗设备等外在因素的影响,诊断结果的准确性很难得到保证。因此,本文利用医院收集到的甲状腺结节的物理特征数据,使用机器学习的方法,建立了一种科学直观的甲状腺结节良恶性预测模型,可为医生的诊断提供辅助手段。组合学习是机器学习中的一种新方法,被广泛应用于各领域。通常情况下,组合学习能获得比单一分类器更好的性能。因此,本文将组合学习引入到甲状腺结节良恶性预测中,利用动态组合方法建立了一个直观的甲状腺结节良恶性预测模型。采用基于k-means聚类划分的多分类器动态组合方法对甲状腺结节患者数据进行统计分析。首先,对甲状腺结节数据进行预处理,针对离散型变量的缺失数据,采用k-最近邻的方法进行填补;而对连续性变量缺失数据用中位数进行填补。对填补后的数据,引入交互项,进行变量选择。再采用C4.5、朴素贝叶斯(NB)、K-最近邻(KNN)算法训练基分类器。在此基础上,用聚类划分的方法划分样本能力区域,再在能力区域内训练最优分类器,进而得到多分类器动态组合模型。然后,用准确率、ROC曲线、AUC面积等指标,对模型进行评价。最后,对选定的模型进行模型检验。实证分析结果表明,导致甲状腺结节呈恶性的主要因素包括:回声比、大小、纵横比、形态、边缘成角、内部结构、钙化、声晕,以及大小与纵径、纵径与形态、纵径与血供程度的交互作用。基于选取的因素进行分类预测,其结果表明,用这些变量训练出的分类器取得了比用全部变量训练的分类器更好的预测效果,且采用聚类划分的多分类器动态组合方法得到比单一分类方法更好的分类效果。
其他文献
从2009年到如今,我国新能源汽车行业共经历了产品生命周期中的萌芽期、培育期和发展期三个阶段。各个时期的政策特点是在不断变化的,总的来说可以归纳为三个方面:技术指标不断提高,补贴额度逐渐降低,退坡速度以及车型范围逐渐扩大。究竟在政府补贴完全退坡的情况下,那些对政府补贴依赖度高的新能源汽车企业绩效水平会发生怎样的变化,本文选取安凯客车作为研究对象,探究其绩效受新能源补贴退坡政策的影响。在研究过程中,
ERP项目不是一个简单的软件培训,而是一项浩大的系统工程,是整合了企业管理理念、业务流程、基础数据、人力物力、计算机硬件和软件于一体,对企业可利用的所有内部和外部资源进
孔雀石绿(Malachite Green,MG)是一种三苯甲烷类物质,绿色、有金属光泽,以晶体形式存在,极易溶于水,水溶液呈蓝绿色。该物质是一种工业染料,可用作羊毛、纸张等材料的染色,也
近年来,高校在招投标内部控制方面,探索了许多行之有效的措施。过程监督即为其中典型之一。所谓过程监督,就是在招标过程中,由高校内部纪检监察部门牵头,利用行政监察手段,经济审计
对重庆市2018年食用农产品监督抽检通告进行汇总,按照食品种类、抽样场所、抽样区域和不合格项目4个方面进行分析,发现存在农兽药残留超标、使用禁用农兽药、重金属等元素污
近年来,雾霾污染问题愈发突出,严重影响了人们的生产和生活,因此对雾霾浓度的预测具有重要意义。PM2.5是雾霾形成的主要因素,PM2.5浓度越高,雾霾污染越严重,因此本文针对PM2.5浓度值进行短期预测研究。本文的具体研究如下:(1)通过对前人成果的研究,结合西安市地理环境信息,并使用相关性分析与逐步回归分析方法确定了PM2.5浓度预测的影响因素为:PM10、CO、NO2、SO2、O3、温度、湿度、