论文部分内容阅读
当前,肺癌已经对人类的生命安全产生了致命威胁。CT(Computed Tomography)扫描技术是及早诊断和发现肺癌的关键技术。然而用肉眼从众多的CT图像中检测出有结节的图像不仅耗时,而且非常困难。虽然已经有计算机辅助诊断系统(CAD)被引入到肺结节的检测中,但是这些CAD系统需要专业人员花费大量时间标注CT图像中的肺结节ROI(Region Of Interest)区域,需要巨大的人力成本,而且从ROI区域中分割出肺结节,可能丢失肺结节的重要边界信息。此外CAD系统需要进行手工的特征提取,而手工特征提取的方法难以确定有效的特征。针对胸腔CT图像中肺结节的检测中存在的问题,卷积自编码神经网络(Convolutional AutoEncoder Neural Network,CAENN)的深度学习模型被提出,用于检测包含肺结节的胸腔CT图像。考虑到人工标注肺结节ROI区域需要巨大的人力成本,而且无标注的胸腔CT图像非常丰富的现状,首先大量无标注的胸腔CT图像patch被用来进行无监督地学习图像特征,随后少量的有标签的数据被用来进行有监督地微调,训练出一个优秀的分类器。整个模型只需要使用少量标注了肺结节ROI区域的胸腔CT图像,因此节约了大量的人力成本。而且该深度学习模型能够自动学习图像特征而不需要进行手工特征的提取,避免了重要信息的丢失。实验中LIDC/IDRI肺结节公开数据集被用来生成了50000张无标签的图像patch和5500有标签的图像,分别用于进行无监督的图像特征学习和有监督的微调,最终的分类准确率达到了91%。在验证数据量对模型的影响时,得到有标签的训练数据只有2200的情况下,分类的准确率已提升到84%。实验结果证明该算法模型相比于普通的卷积神经网络等其他图像分类算法,不仅性能上有所提升,而且在有标签数据较少时也体现出了很好的性能。