论文部分内容阅读
膀胱癌是男性中第四种常见的肿瘤类型,由于肿瘤复发,接近25%的Ⅰ~Ⅲ期膀胱癌患者在术后五年内会死亡。当前已经存在一些预测膀胱癌患者术后复发风险的转录组标志,这些标志通常基于计算标志基因表达水平的定量检测值对患者进行风险打分。但由于基因表达水平定量检测值对检测条件变化和样品质量高度敏感,这些定量标志在临床环境下几乎不适用。因此,有必要构建一种能够鲁棒地预测膀胱癌患者术后复发风险的转录组标志。
为了解决上述问题,本研究采用基于样本内基因表达水平的相对高低秩序关系的方法构建转录组定性标志。首先,利用Illumina平台检测的膀胱癌样本的基因表达谱数据,识别与患者总体生存时间显著相关的基因。其次,把这些基因两两组合,根据单因素Cox比例风险回归模型,识别其表达相对高低秩序关系与患者总体生存时间显著相关的基因对。然后,利用前向序列搜索算法,从候选的预后相关基因对中识别出达到C-index最大的基因对组合,以该组合作为最终的预后标志。在2套独立的数据集中,验证该标志。进一步,利用标志分别对3套独立数据集进行高、低风险分类,识别不同风险组之间与膀胱癌复发相关的可重复的差异表达基因。最后利用膀胱癌样本的甲基化数据识别不同预后组之间的差异甲基化基因,进而与整合之后的差异表达基因进行关联分析。此外,功能富集分析显示这些差异表达基因显著地富集到一些典型的与肿瘤转移相关的通路(超几何分布模型,FDR<0.01),表明利用标志识别的与疾病进展相关的转录特征的可靠性。
本研究最终构建出由12对基因对(12-GPS)组成的膀胱癌术后复发风险预测标志。在一套包含114个样本的验证集中,由标志判别为复发低风险的54例患者的总体生存时间显著长于判别为复发高风险的60例患者(HR=3.59,95%CI:1.34~9.62,p=6.61×10–03)。类似的,该标志在另一套包含57个样本的验证集中得到验证(HR=2.75×108,95%CI:0~Inf,p=0.047)。除此之外,比较分析结果显示,当仅根据患者临床分期信息判别转移状态时,尚不能在独立数据集的转移样本和非转移样本间识别强烈且可重复的差异表达基因,但是利用标志对样本进行重新分类之后,复发低风险组和复发高风险组之间的差异表达基因具有高度可重复性,且差异表达基因与两组之间的DNA差异甲基化显著一致。
综上所述,12-GPS标志能稳健地预测Ⅰ-Ⅲ期膀胱癌患者的术后复发风险,同时帮助识别膀胱癌转移相关可重复的转录特征和表观组组学特征。
为了解决上述问题,本研究采用基于样本内基因表达水平的相对高低秩序关系的方法构建转录组定性标志。首先,利用Illumina平台检测的膀胱癌样本的基因表达谱数据,识别与患者总体生存时间显著相关的基因。其次,把这些基因两两组合,根据单因素Cox比例风险回归模型,识别其表达相对高低秩序关系与患者总体生存时间显著相关的基因对。然后,利用前向序列搜索算法,从候选的预后相关基因对中识别出达到C-index最大的基因对组合,以该组合作为最终的预后标志。在2套独立的数据集中,验证该标志。进一步,利用标志分别对3套独立数据集进行高、低风险分类,识别不同风险组之间与膀胱癌复发相关的可重复的差异表达基因。最后利用膀胱癌样本的甲基化数据识别不同预后组之间的差异甲基化基因,进而与整合之后的差异表达基因进行关联分析。此外,功能富集分析显示这些差异表达基因显著地富集到一些典型的与肿瘤转移相关的通路(超几何分布模型,FDR<0.01),表明利用标志识别的与疾病进展相关的转录特征的可靠性。
本研究最终构建出由12对基因对(12-GPS)组成的膀胱癌术后复发风险预测标志。在一套包含114个样本的验证集中,由标志判别为复发低风险的54例患者的总体生存时间显著长于判别为复发高风险的60例患者(HR=3.59,95%CI:1.34~9.62,p=6.61×10–03)。类似的,该标志在另一套包含57个样本的验证集中得到验证(HR=2.75×108,95%CI:0~Inf,p=0.047)。除此之外,比较分析结果显示,当仅根据患者临床分期信息判别转移状态时,尚不能在独立数据集的转移样本和非转移样本间识别强烈且可重复的差异表达基因,但是利用标志对样本进行重新分类之后,复发低风险组和复发高风险组之间的差异表达基因具有高度可重复性,且差异表达基因与两组之间的DNA差异甲基化显著一致。
综上所述,12-GPS标志能稳健地预测Ⅰ-Ⅲ期膀胱癌患者的术后复发风险,同时帮助识别膀胱癌转移相关可重复的转录特征和表观组组学特征。