论文部分内容阅读
第一章 前言胸腺瘤是最常见胸腺上皮性肿瘤,但因其发病率较低,目前对其影像组学的研究相对较少,在胸腺瘤术前准确诊断及组织病理学风险评估方面仍面临较大挑战。计算机断层扫描(Computed tomography,CT)对于前纵隔肿瘤的诊断敏感性较高,是目前用于胸腺瘤识别与诊断的重要检查手段,胸腺瘤与前纵隔其它肿瘤或肿瘤样病变之间的CT影像表现多有重叠而难以鉴别,且难以准确区分低风险与高风险两类胸腺瘤。因此,尚需进一步研究基于CT影像学对于胸腺瘤的进行更为准确的诊断和组织病理学风险评估。影像组学(Radiomics)是流程化的计算机定量影像学分析方法,传统影像组学在实践中常需要手动勾画病灶进行分割以及难以设计算法全面提取图像特征,因而存在其固有的问题和缺陷。目前,胸腺瘤的影像组学研究仍然较少,对胸腺瘤的分割仍然采用手动或半自动的方法,且影像组学特征提取和分析方法局限,多采用肿瘤特征定量分析或纹理分析方法用于鉴别其风险类别或临床分期评估,因而智能化程度较低且难以获取全面和更有价值的病灶信息。基于深度学习的影像组学(Deep learning-based radiomics,DLBR)是在传统影像组学流程中采用深度学习的方法对图像进行处理,用于病灶自动分割及特征提取,最终针对所解决的临床问题构建模型进行分类预测,较好地解决了传统影像组学病灶分割及特征提取阶段存在的缺陷。因此采用DLBR对胸腺瘤进行研究,有望在不增加样本量的情况下提高影像组学流程的智能化程度和预测结果的准确性,具有较大的优势和临床应用价值。第二章 胸腺瘤CT影像诊断与征象分析目的:对胸腺瘤及前纵隔其它肿瘤或瘤样病灶的CT影像进行评阅并对其特征性表现进行总结分析;依据患者的病理学结果,对胸腺瘤和非胸腺瘤患者进行CT影像征象的组间比较,并在胸腺瘤患者中进一步评价CT影像征象与其组织病理学风险类别的关系,为临床诊疗方案的制订及预后判断提供影像学依据。材料和方法:回顾性分析中日友好医院(中心1)及东部战区总医院(中心2)两个中心,从2011年1月至2019年10月间进行前纵隔肿物手术切除并取得明确病理结果的354例患者,所有患者均在术前2周内进行了胸部增强CT扫描,采用重建后的5mm层厚图像结合薄层图像(0.5~1.25 mm)进行评价。CT图像由具有10年工作经验的两名放射科医师共同进行回顾性评阅,CT征象的描述标准参考国际胸腺恶性肿瘤兴趣小组(International thymic malignancy interest group,ITMIG)提出的前纵隔肿块标准报告术语描述规范,当两名医师对影像征象的意见不一致时,由一位具有30年工作经验的影像专家再次进行评阅并提出最终意见。根据WHO组织病理学分类方法,采用肿瘤上皮细胞的形态和淋巴细胞与上皮细胞的比率相结合的方法对胸腺瘤共分为5种不同的亚型:A型、AB型、B1型、B2型和B3型,进一步将其划分为低风险(A、AB及B1型)与高风险胸腺瘤(B2及B3型)两大类别。基于所有患者CT影像征象的评阅,总结胸腺瘤与非胸腺瘤的CT影像学表现。基于患者CT影像征象,在中心1与中心2分别进行胸腺瘤和非胸腺瘤患者的组间比较;以及分别对低风险和高风险胸腺瘤患者进行组间比较,分析CT影像征象与组织病理学风险类别的关系。结果:A型胸腺瘤的病灶一般较小,呈圆形或类圆形、边缘光滑、边界清晰、强化密度均匀;当病灶较大,呈不规则形、边缘分叶、强化密度不均匀,瘤内出现囊变、坏死及钙化,病灶边界不清、周围有纵隔脂肪浸润及大血管受侵、纵隔胸膜受累或胸腔积液等则高度提示为B3型胸腺瘤。AB型、B1及B2型胸腺瘤的CT影像征象存在一定重叠而难以准确区分。低风险胸腺瘤常需与胸腺囊肿、胸腺增生及成熟畸胎瘤进行鉴别,而高风险胸腺瘤则需要与淋巴瘤、胸腺癌及恶性生殖细胞肿瘤进行鉴别。胸腺瘤和非胸腺瘤患者组间比较,合并重症肌无力(myasthenia gravis,MG)的数量及病灶的轮廓具有统计学差异;低风险与高风险胸腺瘤患者组间比较,病灶的轮廓、血管包绕≥50%及胸腔积液具有统计学差异。结论:增强CT能够较为明确地反映肿块本身及其周围组织的侵犯或受累情况,依据CT影像表现可对胸腺瘤进行初步的诊断与鉴别诊断;基于标准化的CT影像征象的比较分析,为胸腺瘤诊断及风险类别评估提供了有意义的参数指标。第三章 胸腺瘤传统影像组学研究目的:基于胸部增强CT图像,采用传统影像组学的流程和方法,结合患者临床资料及CT影像征象构建预测模型用于胸腺瘤的诊断(Task1)及组织病理学风险评估(Task2)。材料和方法:回顾性分析中日友好医院及东部战区总医院两个中心从2011年1月至2019年10月间进行前纵隔肿物手术切除并取得明确病理结果的354例患者,基于重建后的纵隔窗薄层CT图像(0.5~1.25 mm)进行影像组学研究,Task1以中心2的238例患者作为训练集,中心1的116例患者作为验证集;Task2以中心2的122例患者作为训练集,中心1的73例患者作为验证集。两名具有10年工作经验的放射科医师手动勾画病灶,对勾画后的病灶提取影像组学特征并计算标签值,采用组内相关系数(Intraclass correlation coefficient,ICC)用于评价观察者间和观察者内勾画病灶的一致性。对于Task1和Task2采用相同方法分别提取病灶影像组学特征并对所提取的特征计算Z值进行标准化处理。基于计算特征的ICC、双样本T检验及最小绝对收缩和选择算子(Least absolute shrinkage and selection operator,LASSO)进行特征筛选并计算影像组学标签。在训练集中采用影像组学标签结合有意义的临床信息和CT影像征象作为最终的特征参数,使用多变量Logistic回归分析构建预测模型进行胸腺瘤与非胸腺瘤鉴别诊断以及区分胸腺瘤的风险类别,并分别在验证集中进行验证。使用Hosmer-Lemeshow检验在训练集和验证集中对预测结果分别进行拟合优度检验评价模型拟合值和观测值的吻合程度。结果:两名医师手动勾画病灶,勾画者内部的ICC值分别为0.911(95%CI:0.822-0.957)和0.897(95%CI:0.785-0.951),勾画者间的 ICC 值为 0.852(95%CI:0.713-0.927)。提取影像特征数量为1332个,采用LASSO回归Task1和Task2最终分别保留2个特征用于计算影像组学标签。使用多变量Logistic回归分析构建预测模型,其中Task1预测模型的变量有MG、病灶轮廓及影像组学标签,训练集中预测模型的AUC为 0.7936(95%CI:0.7368-0.8503),敏感性为 0.7586,特异性为 0.7213,准确率为0.7395,模型经HL检验P=0.9015;Task1在验证集中结果显示AUC为0.7025(95%CI:0.6041-0.8007),敏感性为0.8082,特异性为0.4419,准确率为0.6724,模型经HL检验P=0.5261。Task2预测模型的变量有病灶轮廓、血管包绕≥50%、胸腔积液及影像组学标签,训练集中预测模型的AUC为0.8094(95%CI:0.7298-0.8890),敏感性为0.8873,特异性为0.5686,准确率为0.7541,经HL检验P=0.7124;Task2在验证集中结果显示AUC为0.7930(95%CI:0.6699-0.9161),敏感性为0.9400,特异性为0.5217,准确率为0.7082,经HL检验P=0.8230。结论:传统影像组学为鉴别胸腺瘤及区分其组织病理学风险类别提供了客观量化的方法,有利于辅助临床对胸腺瘤诊断和治疗方案的选择。第四章 基于深度学习的前纵隔病灶自动分割目的:采用胸部增强CT图像,基于所有前纵隔病灶的手动勾画结果为金标准,采用深度学习的方法对病灶进行自动分割,并对分割后的结果进行评价。材料和方法:回顾性分析2011年1月至2019年10月间在中日友好医院及东部战区总医院两个中心进行前纵隔肿物手术切除并取得明确病理结果的354例患者,基于重建后的纵隔窗薄层CT图像(0.5~1.25mm)进行自动分割研究,以中心2的238例患者作为训练集,中心1的116例患者作为验证集。基于所有病灶的手动勾画结果为金标准,采用深度学习方法对前纵隔病灶进行自动分割,分割方法包括设计双肺掩膜文件去除纵隔以外区域、采用V_Net网络对病灶进行初步分割(Initial Segmentation)以及在初步分割基础上采用Morphological Snakes算法对病灶进行精细分割(Accurate Segmentation)。分割完成后采用Dice系数、精准率及召回率三个指标对分割结果进行评价。结果:在训练集中的平均Dice系数为0.942±0.066,精准率为0.915±0.083,召回率为0.907±0.091。在验证集中的平均Dice系数为0.911±0.051,精准率为0.926±0.042,召回率为0.89±0.059。病灶自动分割后的Dice系数曲线显示:在训练集中,患者的Dice系数最小值为0.623,最大值为0.999,有125例样本的Dice值大于0.95(52.51%);在验证集样本中,患者的Dice系数最小值为0.624最大值为0.999有78例样本的Dice值处于0.85-0.95的范围(67.24%)。结论:采用V_Net网络联合Morphological Snakes算法对前纵隔病灶进行自动分割的效果较好,为前纵隔病灶自动分割研究提供了方法学基础,能够满足进一步的深度学习定量特征的提取和分析。第五章 基于深度学习的影像组学研究目的:采用胸部增强CT图像,结合患者临床资料及CT影像征象,采用基于深度学习的影像组方法(Deep learning-based radiomics,DLBR),构建预测模型用于胸腺瘤的诊断(Task1)及组织病理学风险评估(Task2)。材料和方法:回顾性分析中日友好医院及东部战区总医院两个中心从2011年1月至2019年10月间进行前纵隔肿物手术切除并取得明确病理结果的354例患者,基于重建后的纵隔窗薄层CT图像(0.5~1.25 mm)进行研究。Task1以中心2的238例患者作为训练集,中心1的116例患者作为验证集;Task2以中心2的122例患者作为训练集,中心1的73例患者作为验证集。在病灶自动分割后采用深度学习方法提取病灶特征。深度学习网络使用包含两个残差块的ResNet-34进行训练并从第一个全连接层中提取深度学习特征,采用计算特征的Kendall相关系数、10折交叉验证法及LASSO回归筛选特征,最后进行多变量Logistic同归分析构建预测模型。使用Hosmer-Lemeshow检验在训练集和验证集中对预测结果分别进行拟合优度检验。采用Delong检验对预测结果与传统影像组学的结果进行比较。结果:在Task1和Task2中基于ResNet第1层全连接层的神经元响应数量提取的特征数为4096个,采用LASSO回归Task1和Task2最终分别保留3个影像组学特征用于计算特征标签。使用多变量Logistic回归分析构建预测模型,Task1预测模型的变量有MG、病灶轮廓及DLBR特征标签,训练集中预测模型的AUC为0.8344(95%CI:0.7833-0.8856),敏感性为0.8017,特异性为0.7309,准确率为0.7605,经HL检验P=0.8867;Task1在验证集中结果显示AUC为0.7415(95%CI:0.6496-0.8334),敏感性为0.7808,特异性为0.5581,准确率为0.6983,模型经HL检验P=0.6547。Task2预测模型的变量有病灶轮廓、血管包绕≥50%、胸腔积液及DLBR特征标签,在训练集中预测模型的 AUC 为 0.8255(95%CI:0.7454-0.9055),敏感性为 0.9014,特异性为 0.6078,准确率为0.787,经HL检验P=0.9033;Task2在验证集中结果显示AUC为0.7752(95%CI:0.6512-0.8992),敏感性为 0.9000,特异性为 0.6087,准确率为 0.8028,经HL检验P=0.5434。采用Delong检验在训练集中对Task1和Task2分别对DLBR与CR的ROC预测结果进行比较,在Task1中,DLBR模型的AUC为0.8344(SE=0.0261),CR 模型的 AUC 为 0.7936(SE=0.0290),两者差值 0.0409(95%CI:0.0001-0.0816),差别具有统计学差异(P=0.0493);在Task2中,DLBR模型的AUC为 0.8255(SE=0.0415),CR 模型的 AUC 为 0.8094(SE=0.0406),两者差值 0.0146(95%CI:-0.0242-0.0534),差别无统计学差异(P=0.4597)。DLBR 与 CR 模型决策曲线分析,在Task1中阈值概率大于46%时使用DLBR模型较CR模型有更多的临床受益;在Task2中,阈值概率大于60%时使用DLBR模型较CR模型有更多的临床受益。结论:在胸腺瘤组织病理学风险评估中,DLBR可以在不增加样本量的情况下用于代替传统影像组学病灶分割及特征提取的步骤,与传统影像组学的相比,DLBR可以提高诊断评估流程的智能化程度、预测效果较好并具有更大的临床受益。