论文部分内容阅读
目前,肺癌是全世界范围内发病率和死亡率最高的恶性肿瘤之一,严重威胁着人类健康和生命安全。大量的临床实践表明,早发现、早诊断、早治疗是降低肺癌死亡率和提高5年幸存率的最有效手段之一。肺癌早期主要是以肺结节形式表现出来,因此肺结节的早期诊断对肺癌早期诊治十分重要。近年来,随着计算机技术和医学影像学技术的飞速发展,恶性肺结节计算机辅助诊断(Computer-Aided Diagnosis,CAD)已经逐渐成为研究热点之一,具有很高的临床应用价值。CAD不仅可以减轻临床医生的工作负担,还可以提高对肺结节良恶性鉴别诊断的准确率,降低漏诊或误诊的风险。本文通过深入研究和分析了现有的恶性肺结节CAD的关键技术,提出了一系列的改进算法。本文主要的研究贡献如下:(1)针对磨玻璃型结节(Ground Glass Opacity,GGO)由于存在边界模糊、形状不规则、结节内灰度分布不均匀及对比度低等因素干扰而造成分割准确率低的问题,本文通过对传统的随机游走分割算法进行了深入研究,提出了一种改进的随机游走磨玻璃型结节分割算法。为了对肺结节进行增强,本文结合了Hessian矩阵的特征值和形状指数,提出了一种新颖的多尺度圆形滤波器。为了自动地获取肺结节内的种子点,本文对增强的GGO肺结节进行阈值化,获取了肺结节内的种子点。本文结合了形状指数和纹理特征,获取了背景内的种子点。为了解决传统随机游走算法中仅采用灰度信息而造成分割准确性低的问题,本文将肺结节的灰度、Gabor纹理特征和空间位置信息结合起来,构造了一个新的加权函数,更有效地衡量了无向加权图中8-邻域顶点之间的相似性关系。本文将标签限制能量项引入到随机游走的能量函数中,有效地使用了初始的种子点标签信息,从而提高了对磨玻璃型肺结节分割的准确性和效率。(2)本文深入研究了传统构图方法,指出了其存在参数选择困难和噪声敏感性等问题,在稀疏表示算法理论基础上,提出了一种基于稀疏表示和随机游走磨玻璃型结节分割算法。为了对肺结节进行增强,本文结合了形状指数及曲率,提出了一种新多尺度圆形滤波器。本文采用测地距离法选取了初始结节内的种子点,并提出了一种局部搜索策略来自动地获取了背景内的种子点和其他结节内的种子点。为了更好地衡量邻域顶点之间的相似性关系,本文构造了8-邻域的加权函数和稀疏k-近邻(k-Nearest Neighbors,k-NN)的加权函数,有效地避免了噪声干扰所引起的伪相似。最后,本文定义了一个随机游走的新能量函数,包括8-邻域数据惩罚项、稀疏k-NN数据惩罚项和标签限制项。实验结果表明,该算法进一步提高了对磨玻璃型肺结节分割的准确性和效率。(3)本文通过对肺结节特征提取和良恶性分类问题进行了研究,指出了其存在的局限性,提出了基于放射影像组学和随机森林肺结节良恶性分类算法。为了解决特征提取不全面的问题,本文采用了放射影像组学方法,挖掘了高维的结节灰度特征、几何形态特征和纹理特征,从而全面地表征了肺结节的特性。本文联合了灰度共生矩阵、局部二值模式和Gabor滤波器对肺结节进行了纹理特征提取,更好地描述了良性和恶性肺结节纹理的差异性。为了解决单一分类器分类准确率低、稳定性差等问题,本文提出了一种基于KL变换的随机森林预测模型,将各个决策树KL加权投票作为最终输出的分类结果。实验结果表明,该算法提高了对肺结节良恶性分类的准确性和稳定性。(4)针对标记训练样本不足而造成分类准确率低的问题,本文研究了半监督学习和标签传播算法,指出其存在噪声敏感和样本间的局部信息缺乏等问题,提出了基于迭代的标签传播肺结节良恶性分类算法。为了更好地捕捉样本间的连接关系,本文使用k-NN方法来构建了一个k-NN的无向加权图。为了有效地衡量邻域样本数据间的相似性关系,本文利用测地距离代替欧式距离来定义了一个加权函数。最后,本文考虑了k-NN其他样本数据的标签信息对未标记样本数据标签的影响,定义了一个标签传播的代价函数,使得标记结节样本数据的标签以迭代的方式准确地传播到未标记结节样本数据,从而提高了在小样本情况下对肺结节良恶性分类的准确性。实验结果表明,本文的算法对肺结节良恶性分类具有较高的准确率、敏感度及特异度,因此可以辅助医生对肺结节良恶性进行鉴别诊断。然而,为了满足临床应用,需要对分割和分类算法进行进一步优化和改进。