论文部分内容阅读
研究目的: 1. 子宫内膜癌是一种女性生殖系统中常见的恶性肿瘤。尽管早期的子宫内膜癌患者预后良好,但部分患者仍面临着癌症进一步恶化或复发的风险。当子宫内膜癌发展到晚期或者发生转移时,其预后效果会变得很差。本研究旨在寻找影响子宫内膜癌患者预后的分子标志物,并建立适用于多种子宫内膜癌组织病理类型的稳健而高效的预后模型; 2. 子宫内膜癌的准确诊断有助于促进患者的早期治疗和预后判断。本研究通过筛选能够准确诊断子宫内膜癌的特异性标志物,构建适用于子宫内膜癌的分子诊断模型; 3. 本研究基于多组高通量数据,探索影响子宫内膜癌的发生发展和预后的潜在分子差异。 研究方法: 1. 获取数据库中子宫内膜癌的转录组测序数据、miRNA表达测序数据和子宫内膜癌、宫颈癌和卵巢癌等妇科肿瘤的甲基化谱数据,并分别进行数据的标准化处理; 2. 基于子宫内膜癌的转录组测序数据,利用单因素Cox比例风险模型进行拟合,鉴定与子宫内膜癌患者生存相关的基因;利用KEGG富集分析,分析生存相关基因的代谢通路;利用逐步回归法,进一步筛选最佳预后相关基因,最终构建特征基因的预后模型; 3. 基于 miRNA 的表达量测序数据,通过子宫内膜癌和正常子宫组织的差异表达分析,以及单因素Cox分析,我们鉴定了与子宫内膜癌发生发展及预后相关的miRNA;通过机器学习和逐步回归的方法进行变量筛选,并构建miRNA的预后模型; 4. 基于甲基化谱数据,鉴定了不同组织之间的差异甲基化位点;利用机器学习的方法,筛选出组织特异性甲基化标志物,并构建子宫内膜癌的特异性诊断模型; 5. 通过单因素Cox比例风险模型进行拟合,鉴定子宫内膜癌的差异甲基化位点中与子宫内膜癌患者生存相关的甲基化位点;利用机器学习的方法,筛选得到预后甲基化标志物,并构建了甲基化预后模型; 6. 利用基因共表达网络分析和KEGG富集分析,探索甲基化标志物所调控的基因在子宫内膜癌中起到的生物学作用; 7. 利用ROC曲线和生存分析等方法,在数据集中分别评估诊断和预后模型,并对预后模型与 FIGO 分期、组织病理学分类和组织等级等预后相关的临床因素进行比较。 研究结果: 1. 通过数据库检索,共收集到1303例患者的甲基化谱数据,其中包括464例子宫内膜癌、576例宫颈癌、185例卵巢癌及78例相应的正常组织;共收集到521 例子宫内膜癌患者的转录组数据和 529 例子宫内膜癌患者的 miRNA 表达测序数据; 2. 基于521例子宫内膜癌的转录组数据,共鉴定1571个与子宫内膜癌预后相关的基因;KEGG富集分析发现这些基因主要富集在癌症相关的信号通路中;经变量筛选,最终确定了九个标志基因(SLC16A1-AS1、KDM4B、MAP2K5、SYP、MPP1、DLX4、BOLA3-AS1、HOMEZ和STAP2),其中六个基因在肿瘤组织中表达量显著降低,另外三个基因则显著高表达;利用这九个特征基因,我们构建了子宫内膜癌的基因预后模型;使用 ROC 曲线评估该模型,总体AUC值达0.713;运用该模型将子宫内膜癌患者分成高、低风险两组,Kaplan-Meier曲线显示两组患者总生存期存在显著性差异(p< 0.001); 3. 利用529例子宫内膜癌患者的miRNA表达量数据,我们获得了381个差异表达的miRNA和205个预后相关的miRNA;选择其中共有的74个miRNA,进行变量筛选,最终得到八个 miRNA 标志物(hsa-mir-605、hsa-mir-548au、hsa-mir-137、hsa-mir-6730、hsa-mir-1292、hsa-mir-4523、hsa-mir-191和hsa-mir-514a-1);基于这些miRNA标志物,我们构建了预后模型;ROC曲线显示,总体AUC值达到0.739;利用该模型可以将子宫内膜癌患者进行风险分组,Kaplan-Meier曲线显示两组患者的总生存期存在显著性差异(p < 0.001); 4. 通过子宫内膜癌、宫颈癌和卵巢癌样本与其相应正常组织之间的差异甲基化分析,确定了差异CpG位点,并进行变量筛选,最终获得48个组织特异性甲基化位点;利用这些CpG位点,构建了能够区分多种肿瘤组织的诊断模型;经验证,该模型在训练集中的正确率为99.08%,在验证集中为96.77%;利用ROC曲线评估该模型,各组织预测的AUC值均高于0.977; 5. 通过对子宫内膜癌甲基化谱数据的分析,获得一系列与子宫内膜癌预后相关的甲基化位点;经变量选择,共筛选到十五个预后标志位点,其中有八个位点( cg26697065、cg04385765、cg01750724、cg00143527、cg22032364、cg22912497、cg05165559和cg21233675)的甲基化水平在肿瘤组织中显著较低,而其余七个位点(cg03241649、cg14537713、cg00463767、cg20072442、cg14359824、cg11793269和cg19832521)显著较高;随后利用这十五个CpG位点构建子宫内膜癌的甲基化预后模型;使用 ROC 曲线评估该模型,AUC值为0.898;利用该模型,能够将子宫内膜癌患者进一步区分出高低风险,绘制Kaplan-Meier曲线和Cox比例风险回归预测曲线,证实两组患者总生存期存在显著性差异(p< 0.001); 6. 通过Spearman相关性检验,确定了标志物的甲基化水平与其所调控基因的表达量的关系;其中七个基因显著负相关:MESDC1(p = 2.38E-06),LRRTM1(p= 1.65E-07),NOVA1(p = 1.06E-51),C5orf38(p = 1.33E-11),IRX2(p = 4.92E-10),C9orf135(p = 9.10E-08)和SEPHS2(p = 4.55E-16),另外五个基因显著正相关ATP8A2(p = 1.50E-21),OTX1(p = 9.21E-23),RYR1(p = 0.012),KCNQ2 (p = 5.04E-09)和DLGAP2(p = 6.76E-10);利用表达谱数据构建了这些基因的共表达网络,包含1148个共表达基因;KEGG富集分析发现,这些共表达的基因主要富集在一些癌症相关的信号通路,以及MAPK信号通路、hippo信号通路、催产素信号通路和细胞粘附分子通路等。 研究结论: 本研究利用三种高通量数据,分别从基因表达、miRNA和基因甲基化三个层面对子宫内膜癌数据进行挖掘,鉴定了一系列子宫内膜癌诊断和预后相关的潜在的分子标志物,并成功构建了分子诊断和预后模型,可在临床实践中辅助指导子宫内膜癌的分子诊断、预后评估和合理治疗。本研究不仅促进了我们对子宫内膜癌发生发展及预后的潜在机制的理解,也为将来对子宫内膜癌的致病机制的实验研究提供了方向。