基于DNA倍体分析和深度学习的异常细胞分类识别应用

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:zmzsyx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症作为一种对身体健康破坏最为严重的恶性病症,一直以来都受到各界科研人员的关注,如何积极有效的预防与治疗癌症成为医疗领域共同的话题。同样对女性群体来说,宫颈癌是造成女性疾病死亡率的第二大杀手,经过多年的研究证实对宫颈细胞进行筛查,发现其存在的异常癌变细胞,通过早期的预防与治疗手段可有效降低该病的死亡率。近些年,随着机器学习中SVM算法在图像分类方面的巨大影响,基于此算法与DNA含量检测的DNA倍体分析系统在癌变异常细胞的检测中发挥出优势。该系统的运用相比于传统的人工阅片,效率明显提高,但是由于此系统产生的分类细胞中往往导致结果不准确且产生的类别较少,还需进行人工的筛选。因此,本课题选用目前效果较好的深度学习算法,结合DNA倍体分析系统的输出结果,将传统的机器学习与经典的神经网络方法进行融合,成为计算机辅助诊疗疾病的一种新方法。本文的研究内容是分类宫颈图像中存在的异常细胞,由于DNA倍体分析系统中认定的垃圾细胞通常会包含聚团细胞、黏连细胞、中性粒细胞和真正的垃圾细胞与杂质等非正常细胞类别,因此本文使用深度学习方法进行细胞分类模型的再训练。文中实验是基于Keras框架搭建的神经网络,采用卷积神经网络学习六类细胞特征得到细胞分类模型,并且计算出不同网络对应的实验模型准确率,最后通过界面程序对相应的识别结果予以展示。本课题先期实验采用Faster R-CNN方法进行细胞分类,该方法是基于区域建议的模型训练,它使用自动检测细胞区域方法得到预测的细胞坐标与类别。通过训练得到的模型参数对细胞样本集预测得到其平均精确度为0.563,在图像预测时对细胞的识别有较好的效果,但结果的准确度相比第四章中采用的识别方法低。后期主要采用基于DNA倍体分析系统产生的细胞位置信息与CNN融合的方法,对宫颈脱落细胞进行识别分类。实验首先采用ZFNet网络找出合适图像大小的细胞数据集,其结果证明64位图像的识别准确率比32位图像高,达到95.21%,但是会出现两种细胞识别结果区分不清的现象;而后采用OpenCV技术处理数据集,再经过VGG16与ResNet50两种不同深层的网络继续提高模型的准确性,最后结果中使用VGG16网络训练的细胞模型预测准确率整体高达98.74%效果较好,也证明了本文中提到的方法对识别细胞类型是可行的。实验结果表明,对比第三章中的Faster R-CNN方法,本课题采用基于DNA倍体分析与CNN融合的方法有较好的细胞分类表现,且该方法可作为一种DNA倍体分析系统的辅助识别手段,为后续的准确诊断提供可靠的依据。
其他文献
一、财务预警分析模式和Z-Score模型企业财务预警分析有两种模式,一种是单变量模式,即运用单一变量,用个别财务比率来预测财务危机。按照单变量模式的解释,企业发生财务危机
<正> 著名古城西安,在十一个朝代一千一百多年的建都过程中,伴随着经济繁荣和国势的强盛,曾发展成为国际性城市。特别是在唐代,形成以长安为中心的全国驰(驿)道交通网。外国
目的:选取2013年全国2型糖尿病患者为对象,以不同地区、城市、医院为单位进行数据统计,意在探究我国2型糖尿病患者治疗方案的地区差异及相关影响因素。方法:由中华医学会糖尿
<正>在性别控制中,最理想的方法是分离X精子和Y精子,这样就可以按照对后代性别的需要用X或Y精子授精。分离X、Y精子一直是人们研究的热门课题,到目前为止,研究者们已使用或试
期刊
本文通过翔实的资料考辨,对拂舞产生的时代、原因提出了新的看法。笔者认为拂舞产生于三国东吴时期,早期表现白鸠鸟的情态,祈望农业丰收;晋朝后内容变得丰富庞杂,舞蹈表演规
近些年来,招投标工作实现了工程建设项目的高效完成,充分发挥市场机制的竞争作用,而在项目招投标活动中评标是最关键的环节,其评标体系构建是否适用,评标方式选择是否科学,具体评标流程设置是否合理,都应深入研究和探讨。在建设工程招投标中,要通过公开、公平、公正及合理进行评标才能有效保护招投标各方的利益和施工的质量。目前老挝市场经济和各项建设法规,虽得到不断的发展,但现行的评标方法还存在着诸多问题,如评标过
烧结矿性能对高炉冶炼的影响,到目前为止对于低温粉化的认识,对碱性烧结矿的新近研究,化学成分与生产条件的影响,选择适用的粉化标准,在赤铁矿含量固定时粉化与碱度的关系,烧
地铁内的房建设施涉及面广、范围大、数量品种众多,如天花、墙面、地面、栏杆扶手、导向等是乘客直接接触最多的设施,它们的质量状态直接关系到乘客出行的安全和舒适度,且一
汉语多功能词由于具有跨词性、义项多的特点,一直以来都是留学生词语学习的重点和难点。本文选取了兼有多种词类语法功能的单音节多功能词“全”作为研究对象。在对北京语言大学动态作文语料库和北京大学中国语言学研究中心语料库中的“全”进行穷尽式搜索的基础上,采用偏误分析、数据统计和和问卷调查的方法,整体考察汉语学习者多义词“全”的习得情况,以期对汉语教师多义词“全”的教学提供参考。本文共分为五章,主要内容如下