论文部分内容阅读
识别癌症样本与正常对照之间的差异表达基因是研究癌的发生与发展机制的最常用的方式之一。然而,利用传统的T检验等统计方法,通过比较疾病与对照两组样本,识别了群体水平上的差异表达基因后,我们无法得知它在某一特定癌样本中是否差异表达以及它在该癌型的患者中的失调频率。由于胃癌具有高度的异质性,目前尚不知道是否存在胃癌的共性分子特征。从公共数据库基因表达综合库(Gene Expression Omnibus,GEO)和癌症基因组图谱(The Cancer Genome Atlas data portal,TCGA)中,我们收集了由10种平台检测的14套基因表达谱数据,共包括448对胃癌组织与癌旁正常组织配对样本。首先,利用配对T检验,识别了7556个在独立数据集中可重现的群体差异表达基因。然后,对在群体水平识别的每个上调表达的基因,利用448对配对样本计算该基因在胃癌组织的表达水平相对自身癌旁正常组织高表达的频率,识别了67个在至少90%以上的胃癌组织样本中相对其自身癌旁正常组织高表达的基因,定义为普遍高表达的基因,包括编码激酶、胶原蛋白、转录因子、分子伴侣等蛋白质的基因。类似地,从在群体水平识别的下调表达的基因中,识别了49个在至少90%以上的胃癌组织样本中相对其癌旁正常组织低表达的基因,定义为普遍低表达的基因,包括编码膜通道、激素受体等相关蛋白质的基因。然后,利用115对配对的胃癌与癌旁正常组织样本的DNA甲基化谱数据,分析了普遍差异低表达基因的启动子区域中CpG位点甲基化异常的频率。我们发现,有21个普遍差异低表达基因的甲基化水平在群体水平上存在显著差异(二项分布检验,FDR<0.01),其中20个基因的启动子区域呈现高甲基化,频率为64.35%-88.70%。例如,编码钾离子通道相关蛋白的基因KCNE2在94.57%的胃癌样本中差异下调,同时在86.09%的胃癌样本中高甲基化。此结果提示,一部分共性差异表达基因在胃癌中普遍下调很大程度上是由其基因启动子区域的CpG位点的高甲基化诱导的。差异共表达以及通路富集分析显示普遍差异表达的基因可能通过扰乱细胞外基质受体相互作用、胃酸分泌、MAPK信号通路以及其它与细胞增殖、侵袭相关通路来诱导癌变。综上,在胃癌组织中普遍差异表达的基因可能与胃癌的发生密切相关,为胃癌的诊断治疗提供了潜在的分子靶标。