论文部分内容阅读
肺癌是一种有着较高发病率和死亡率的恶性肿瘤,严重威胁着人类的生命财产安全。肺癌的早期表现为肺结节,是肺内直径介于3-30mm的类圆形病灶。肺结节的良恶性判断对于肺癌的早期诊断有重大意义。计算机断层扫描(Computed Tomography,CT)是检查肺结节的常用影像学方式,其较高的空间分辨率可以使肺内组织清晰显示。计算机辅助诊断(Computer-Aided Diagnosis,CAD)是指利用模式识别和医学图像处理等方法,结合计算机的高效数据分析能力辅助医生发现并诊断病灶的一种技术。本研究基于采集自辽宁省肿瘤医院临床患者的胸部CT图像对肺结节的计算机辅助诊断进行了研究,主要工作如下:(1)胸部CT图像预处理:采用中值滤波对CT图像进行去噪,利用阈值法与形态学方法分割肺实质。针对阈值法不能完整分割含肺壁粘连结节肺实质的情况,本研究提出一种基于凸包算法与曲线拟合的肺实质修补方法。经验证,该方法可以在分割出初始肺实质的基础上有效修补异常凹陷区域,从而保证进行肺实质分割时肺壁粘连结节不被遗漏。(2)肺结节的计算机辅助真假性识别:在已分割出的肺实质基础上,利用阈值法分割疑似结节区域。为了降低因肺结节分割不准确对后续分类识别造成的影响,针对血管粘连结节,采用吹球法修正结节区域以去掉血管。将疑似结节区域分为训练集和测试集,对训练集数据采用随机旋转的方式扩充数据。利用带类标的训练集训练卷积神经网络(Convolutional Neural Network,CNN),利用训练好的模型对测试集进行分类预测并输出对每个样本真假性的评分,结果获得了较高的准确率和真阳性率以及较低的假阳性率,实验结果表明CNN用于肺结节的计算机辅助真假性识别效果较好。(3)肺结节的计算机辅助良恶性诊断:对真结节提取多种影像特征,对患者提取文本特征,文本特征包括临床特征和血清肿瘤标记物。通过受试者工作特征(Receiver Operating Characteristic,ROC)曲线和假设检验方法对特征进行分析,结果发现血清肿瘤标记物有较高的肺结节良恶性判别能力。本研究创新性采用影像特征和文本特征的融合特征作为支持向量机(Support Vector Machine,SVM)的输入,并将融合特征与文本特征及影像特征的分类预测结果进行了比较,结果发现融合特征可以有效改善肺结节良恶性诊断效果。通过比较K最近邻(K-Nearest Neighbor,KNN)、随机森林(Random Forest,RF)和SVM分类器及其与高低年资医生对肺结节良恶性的诊断效果,结果发现分类器大多评价参数介于高低年资医生之间,SVM分类器的诊断效果相对较优。实验结果表明,结合影像特征、临床特征和血清肿瘤标记物的融合特征可以改善对肺结节的良恶性诊断效果,从而达到更好地辅助医生的目的。