论文部分内容阅读
背景与目的在全世界范围内,占据癌症死亡率首位的是肺癌。肺癌的预后极差,其中非小细胞肺癌的5年生存率只有5%~7%。尽管从治疗效果来看,外科手术已经成为最理想的选择,Ⅰ期、Ⅱ期和部分Ⅲ期的患者都可以接受手术治疗,有些甚至可以通过手术完全治愈。但是晚期肺癌的总体5年生存率还不到14%,而早期肺癌的5年生存率可以达到70%。肺癌的早期发现、早期诊断可以使患者获得及时有效的治疗,是提高其生存率的关键。目前传统的检测方法,例如对人群进行定期的X线普查,使肺癌的早期诊断成为可能,但是仍然存在漏检率高且有一定的假阳性率的问题,而且医生自身的知识水平和阅片中不可避免的主观因素,都会对临床判断产生影响。肿瘤标志现在越来越多的被人们用来辅助检测癌症,其对于肿瘤的诊断、判断预后和转归、疗效评价有着重要的意义。但是肿瘤标志的组织特异性不高,单项检测的灵敏度和特异度都不理想,众多学者研究表明多种肿瘤标志联合检测可以提高检出率。人工神经网络是近年来国内外各个领域广泛应用研究的课题。在医学领域,人们开始探讨在临床疾病珍断方面利用人工神经网络解决非线性、多输入、不确定复杂问题的特点,提高临床疾病诊断的准确性。研究将6种肿瘤标志和人工神经网络联合检测建立肺癌预警模型、大肠癌预警模型和肺癌-大肠癌预警模型,以期实现肺癌、大肠癌的早期预警,为早期手术、提高5年生存率打下基础。材料与方法1.2007年9月~2008年7月在郑州大学第一附属医院呼吸实验室收集肺癌患者血清67例、肺良性疾病患者血清53例;在消化实验室收集大肠癌患者血清50例、大肠良性疾病患者血清50例;在体检中心收集正常人血清61例。2.用放射免疫分析试剂盒测定血清中的NSE、CEA、GAS;用钙离子测定试剂盒(偶氮砷Ⅲ终点法)测定血清中的Ca;用紫外分光光度法测定血清中的唾液酸:采用石墨炉原子吸收分光光度法和火焰原子吸收分光光度法测定血清中的铜和锌。3.随机将每组样本分为训练集和测试集,用反向传播算法对训练集进行检测。(1)将随机选取的54例肺癌、42例肺良性疾病、49例正常人的实验数据作为训练集放入BP网络进行训练,建立肺癌-肺良性疾病-正常人的人工神经网络模型。网络参数设置输入层6个节点,隐含层15个节点,输出层1个节点。目标误差为1.0×10-5,学习速率为0.7,动量因子0.95。(2)将随机选取的40例大肠癌、40例大肠良性疾病、49例正常人的实验数据作为训练集放入BP网络进行训练,建立大肠癌-肠良性疾病-正常人的人工神经网络模型。网络参数设置输入层6个节点,隐含层15个节点,输出层1个节点。目标误差为1.0×10-5,学习速率为0.7,动量因子0.95。(3)将随机选取的54例肺癌、40例大肠癌的实验数据作为训练集放入BP网络进行训练,建立肺癌-大肠癌的人工神经网络模型。网络参数设置输入层6个节点,隐含层15个节点,输出层1个节点。目标误差为1.0×10-5,学习速率为0.7,动量因子0.95。(4)合并课题组以前检测的实验数据,随机选取其中的92例肺癌,65例肺良性疾病,85例正常人作为训练集放入BP网络进行训练,建立总的肺癌-肺良性疾病-正常人的人工神经网络模型。网络参数设置输入层6个节点,隐含层15个节点,输出层1个节点。目标误差为1.0×10-5,学习速率为0.6,动量因子0.9。再用训练好的模型对相应的测试组(即剩下的12例正常人、11例肺良性疾病、13例肺癌、10例大肠良性疾病和10例大肠癌)进行盲法预测。4.用Logistic回归分析处理数据,对应以上4个人工神经网络模型建立相应的Logistic回归模型。5.用ROC曲线比较人工神经网络与Logistic回归对预测集样本的预测效果。结果1.人工神经网络训练结果采用反向传播(Back-Propagation,BP)算法,人工神经网络经反复训练达到预期目标后训练停止。上述4种人工神经网络模型对相应测试集样本的预测准确度为88.9%、81.8%、87.0%、87.3%。2.建立的4个ANN模型对测试集预测结果肺癌-肺良性疾病-正常人组的ANN模型对13例肺癌的预测结果其灵敏度为76.9%、特异度为95.7%、阳性预测值为90.9%、阴性预测值为88.0%,此模型对测试集预测结果的准确度为88.9%;大肠癌-大肠良性疾病-正常人组的ANN模型对10例大肠癌的预测结果其灵敏度为80.0%、特异度为91.3%、阳性预测值为80.0%、阴性预测值为91.3%,此模型对测试集预测结果的准确度为81.8%;肺癌-大肠癌组的ANN模型对13例肺癌的预测结果其灵敏度为76.9%、特异度为100.0%、阳性预测值为100.0%、阴性预测值为76.9%,此模型对测试集预测结果的准确度为87.0%;对10例大肠癌的预测结果其灵敏度为100.0%、特异度为76.9%、阳性预测值为76.9%、阴性预测值为100.0%,此模型对测试集预测结果的准确度为87.0%;总的肺癌-肺良性疾病-正常人组的ANN模型对13例肺癌的预测结果其灵敏度为92.0%、特异度为98.1%、阳性预测值为95.8%、阴性预测值为96.4%,此模型对测试集预测结果的准确度为87.3%。3.4个Logistics回归模型对测试集预测结果肺癌-肺良性疾病-正常人组的Logistics回归模型对13例肺癌的预测结果其灵敏度为84.6%、特异度为91.3%、阳性预测值为84.6%、阴性预测值为91.3%,此模型对测试集预测结果的准确度为88.9%;大肠癌-大肠良性疾病-正常人组的Logistics回归模型对10例大肠癌的预测结果其灵敏度为80.0%、特异度为100.0%、阳性预测值为100.0%、阴性预测值为92.0%,此模型对测试集预测结果的准确度为93.9%;肺癌-大肠癌组的Logistics回归模型对13例肺癌的预测结果其灵敏度为84.6%、特异度为100.0%、阳性预测值为100.0%、阴性预测值为83.3%,对10例大肠癌的预测结果其灵敏度为100.0%、特异度为84.6%、阳性预测值为83.3%、阴性预测值为100.0%,此模型对测试集预测结果的准确度为91.3%;总的肺癌-肺良性疾病-正常人组的Logistics回归模型对13例肺癌的预测结果其灵敏度为96.0%、特异度为94.4%、阳性预测值为88.9%、阴性预测值为98.1%,此模型对测试集预测结果的准确度为74.7%。4.ANN模型和Logistics回归模型对测试集预测结果的比较4种ANN模型的ROC曲线下面积分别为0.938(95%CI:0.802-0.989)、0.869(95%CI:0.663-0.971)、0.835(95%CI:0.622-0.954)、0.951(95%CI:0.877-0.986),对应的4种Logistics回归模型的ROC曲线下面积分别为0.880(95%CI:0.728-0.963)、1.000(95%CI:0.850-1.000)、0.923(95%CI:0.733-0.989)、0.952(95%CI:0.879-0.987)。由以上结果表明,ANN模型和Logistics回归模型对测试集的预测结果差异没有统计学意义(P>0.05)。结论1.人工神经网络联合多种肿瘤标志建立模型对肺癌、大肠癌的预测准确性优于多种肿瘤标志联合检测,并且可以很好地对肺癌和大肠癌预警。2.人工神经网络疾病诊断模型和Logistics回归模型对肺癌、大肠癌的预测结果差异没有统计学意义,但比Logistics回归分析更适合于临床数据的分析。