一种改进的AdaBoost乳腺癌诊断模型

来源 :佛山科学技术学院 | 被引量 : 0次 | 上传用户:a200638012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,乳腺癌已成为危害女性健康的罪魁祸首之一。早期治疗仍旧是挽救乳腺癌患者生命的基础。随着人工智能的发展,利用机器学习来建立乳腺癌智能诊断系统已成为医学领域的研究热点。乳腺癌诊断有三个方面的难点:一是样本数据不平衡,即正常样本大大多于患病样本,造成少量的正确诊断却对应虚高的准确率,因此需要采用强泛化的网络,本论文采用AdaBoost算法来解决这一问题;二是医学指标众多,在众多指标中找出与乳腺癌有关联的指标,一方面可以提高诊断速度,更重要的是找出影响疾病的本质因素,从而减少实际体检费用,科学提出治疗方案,本文采用传统的降维方法如主成分分析(Principal Component Analysis,PCA)等来处理这一问题;最后一方面,从神经网络理论看,乳腺癌诊断问题是一个多输入单输出的映射问题,无论采取何种神经元,网络的输出是输入的各种非线性组合后效果,因此输入指标是否能深刻反映疾病的本质关系,需要进行综合分析(数据挖掘),补充扩展已有样本指标。基于患病与正常的医学指标应具有较大差异这一常识,本文提出了增加样本与良性样本均值的差的平方与标准差之比作为基本指标参与诊断分类,此类思想即数学基础为高维映射。针对以上三个问题的解决,形成了本文对Ada Boost算法改进原理的ZsymBoost算法。根据ZsymBoost算法弱分类器选择的问题,以及不同的神经网络具有不同的特点,均具有各自的适应范围,本文提出了单一核网络诊断系统和复合核网络诊断系统。本文的主要研究工作和成果体现在以下几个方面:(1)ZsymBoost算法主要是在Ada Boost算法的基础上充分重视患病样本,因此在更新数据权值时,增加患病样本被错分为健康样本的数据权值,减少健康样本被错分为患病样本的数据权值。(2)单一的核网络诊断系统中本文选取BP神经网络(Back Propagation neural network,BP),RBF神经网络(Radial Basis Function neural network,朴素贝叶斯分类器(Na(?)ve Bayes,NB)这3种网络建立BP-ZsymBoost模型,RBF-ZsymBoost模型,Na(?)ve Bayes-ZsymBoost模型。针对威斯康辛乳腺癌数据集实验证明以BP为核网络建立的BP-ZsymBoost模型诊断效果最优,且与BP模型,BP-Ada Boost模型比较,BP-ZsymBoost模型各方面都优于这两个模型。(3)复合核网络诊断系统中本文给出一种由BP,RBF,Na(?)ve Bayes建立的BRB-ZsymBoost模型,该模型在处理分类器权重时降低模型的训练数据准确率低于0.97的分类器的权重;增加模型的训练数据准确率高于0.97的分类器实验证明复合核网络对乳腺癌的诊断能力优于其组成的单一核网络。(4)在处理数据时考虑良性样本和恶性样本各属性标准差的差异,在标准差差异相对明显的特征列后增加一组数据:此列特征数据与良性样本特征均值差的平方与标准差的比,实现对数据特征高维扩展。在BRB-ZsymBoost模型下,实验证明此种数据处理方法效果良好,有效提高了诊断准确率,准确率达到98.83%。为后续数据预处理方向的研究提供了一种新思路。
其他文献
自动导引车(Automated Guided Vehicle,简称AGV),是指装备有电磁或光学等自动导引装置,可沿预定路线导引行驶,拥有安全保护装置的运输车。目前国内的AGV主要集中在承载能力不超过1000kg的轻型搬运上,并对行驶路况有相应的要求,无法在颠簸及有坡度的恶劣路况下可靠行驶。针对铝型材行业转型升级的迫切需求,以及实际生产过程需要在相应工序及不同车间频繁搬运的加工状况,本文以实现铝型
抓取是一种典型的机器人末端操作形式,在分拣装配、农业采摘、灾难救援、微纳操作等领域具有广泛应用,如何对多规格、不确定的操作对象实现稳定、安全的抓取操作是机器人技术中的关键难题之一。夹持器主要用于目标物体的夹持、搬运、放置,是机器人抓取操作执行机构的主要实现形式。从机构学的角度,驱动单元数少于自由度数量的欠驱动机构具有良好的形状自适应性;而柔顺机构具有免装配、无摩擦磨损、高精度等优点,已成为精密工程
副溶血性弧菌(Vibrio parahaemolyticus,Vp)是一种革兰氏阴性病原菌,该菌在水产养殖中广泛存在,近年来在我国南方地区的水产养殖动物中检出率也较高。多种水产动物如鱼类、虾类、贝类等均可被其感染,是水产动物的主要致病菌之一。此外,它也可引起人类产生腹痛、呕吐等临床症状,严重者会脱水甚至死亡,给水产养殖企业以及人类健康都造成了严重威胁。为了探究我国南方水产养殖中副溶血性弧菌的流行病
移动机器人技术是机器人研究的重点之一,而路径规划问题又是移动机器人技术研究中的关键课题。研究路径规划问题,能更好的提高路径规划的效率,完成任务的同时也能降低生产成本。本文将移动机器人路径规划技术作为研究内容,选取平面自由移动机器人为研究对象,采用人工势场算法对机器人路径规划进行研究,研究的主要内容有:1.对传统人工势场算法的原理进行研究,通过仿真实验对人工势场算法进行验证,分析了算法中存在的缺陷问
视觉同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)技术是移动机器人进行自主定位和构建空间环境地图的核心技术,是机器人实现智能导航的关键。回环检测作为视觉SLAM的关键环节,协助构建环境地图并减小前端估计的误差。然而,现有回环检测方法的性能受到光照变化和场景切换的制约,具备高性能的回环检测方法是视觉SLAM研究的重难点。因此,本文针对光照变
仿生机器在国内外的科学技术研究繁多,但多数功能、工作环境单一,针对这一现象研究设计了一款可行走于硬实地面、柔软地带和水面行动的仿生智能机器,该仿生智能机器结构简单且应用更为范围。论文首先介绍了根据自然界六足生物的生物特性,研究设计出三态六足仿生机器系统的设计方案,主要包括三态足创新设计模块、六足契贝谢夫运动机构模块、链条传动模块及转向机构模块的机构组成和工作原理,并建立仿生机器各部分的三维模型。其
同时定位与构建地图(Simultaneous Localization and Mapping,SLAM)是实现移动机器人自主导航的关键技术,也被广泛应用于自动驾驶汽车和无人车等领域。作为视觉SLAM的重要组成部分,视觉地点识别(Visual Place Recognition,VPR)可以实现机器人定位,同时视觉地点识别对环境条件变化的鲁棒性影响着机器人构建环境地图的准确性。因此,如何提高视觉地
脊椎侧弯、脊柱变形和椎骨滑脱等是目前发病率很高的疾病,如果能在早期及时发现脊柱疾病的症状,会对治疗起到至关重要的作用。医生对椎骨进行疾病诊断的第一步就是影像学检查,然后通过医学图像对椎骨进行定位和识别工作。疾病的筛选、病情的诊断以及制定治疗方案的.常用的手段之一便是医学图像检查。日常作业产生医学图像由于图像清晰度不高、对比不明显等原因.给通过医学图像进行精准治疗带来了一定的困难,因此研究一种椎骨自
近年来,随着卫浴陶瓷行业对缺陷检测系统智能化程度要求的不断提高,对不规则表面上的微缺陷检测需求越来越大。传统的用于规则球面或具有漫反射性质的平面的检测方法难以满足使用要求,而基于深度学习的缺陷检测技术在复杂型面上仍然具有查准率高、泛化性强的特点,是当前高效获取表面缺陷的有效方法。本文以喷釉烧制后的卫浴陶瓷作为研究对象,采用深度学习与计算机视觉相结合的方法对表面微缺陷的检测进行研究。烧制后的卫浴陶瓷
互联网技术的快速发展,为视频的制作和传播,创造了有利条件。对于海量视频数据,传统基于文本方式的视频检索方法已不能满足用户的需求,为了快速、高效的对视频进行分析和管理,基于内容的视频检索技术成为目前研究的热点。目前基于内容特征的视频检索系统,大多采用提取视频关键帧的颜色、纹理、形状等底层特征,来进行视频相识度匹配,这些底层特征是基于全局统计或者人工设计的特征提取方式,存在泛化抽象能力不强、易受光照和