论文部分内容阅读
癌症作为一种对身体健康破坏最为严重的恶性病症,一直以来都受到各界科研人员的关注,如何积极有效的预防与治疗癌症成为医疗领域共同的话题。同样对女性群体来说,宫颈癌是造成女性疾病死亡率的第二大杀手,经过多年的研究证实对宫颈细胞进行筛查,发现其存在的异常癌变细胞,通过早期的预防与治疗手段可有效降低该病的死亡率。近些年,随着机器学习中SVM算法在图像分类方面的巨大影响,基于此算法与DNA含量检测的DNA倍体分析系统在癌变异常细胞的检测中发挥出优势。该系统的运用相比于传统的人工阅片,效率明显提高,但是由于此系统产生的分类细胞中往往导致结果不准确且产生的类别较少,还需进行人工的筛选。因此,本课题选用目前效果较好的深度学习算法,结合DNA倍体分析系统的输出结果,将传统的机器学习与经典的神经网络方法进行融合,成为计算机辅助诊疗疾病的一种新方法。本文的研究内容是分类宫颈图像中存在的异常细胞,由于DNA倍体分析系统中认定的垃圾细胞通常会包含聚团细胞、黏连细胞、中性粒细胞和真正的垃圾细胞与杂质等非正常细胞类别,因此本文使用深度学习方法进行细胞分类模型的再训练。文中实验是基于Keras框架搭建的神经网络,采用卷积神经网络学习六类细胞特征得到细胞分类模型,并且计算出不同网络对应的实验模型准确率,最后通过界面程序对相应的识别结果予以展示。本课题先期实验采用Faster R-CNN方法进行细胞分类,该方法是基于区域建议的模型训练,它使用自动检测细胞区域方法得到预测的细胞坐标与类别。通过训练得到的模型参数对细胞样本集预测得到其平均精确度为0.563,在图像预测时对细胞的识别有较好的效果,但结果的准确度相比第四章中采用的识别方法低。后期主要采用基于DNA倍体分析系统产生的细胞位置信息与CNN融合的方法,对宫颈脱落细胞进行识别分类。实验首先采用ZFNet网络找出合适图像大小的细胞数据集,其结果证明64位图像的识别准确率比32位图像高,达到95.21%,但是会出现两种细胞识别结果区分不清的现象;而后采用OpenCV技术处理数据集,再经过VGG16与ResNet50两种不同深层的网络继续提高模型的准确性,最后结果中使用VGG16网络训练的细胞模型预测准确率整体高达98.74%效果较好,也证明了本文中提到的方法对识别细胞类型是可行的。实验结果表明,对比第三章中的Faster R-CNN方法,本课题采用基于DNA倍体分析与CNN融合的方法有较好的细胞分类表现,且该方法可作为一种DNA倍体分析系统的辅助识别手段,为后续的准确诊断提供可靠的依据。