论文部分内容阅读
食管鳞状细胞癌(Esophageal squamous cell carcinoma, ESCC)是我国常见的恶性肿瘤,其五年生存率不到25%,复发和转移是导致ESCC病人死亡和预后不良的主要原因。ESCC的发生发展是一个多基因参与、多因素作用、多阶段进展的复杂的生物学过程,它依赖于多种基因、转录本、蛋白质的相互作用及调控。深入研究ESCC的分子机制是提高ESCC诊治效果的基础。传统的生物学研究以单个基因、转录本和蛋白质的具体功能及特点为基础,尽管这种研究方法对在分子水平上揭示生命机制起着重要的作用,但不可否认其仅能对生物系统的局部作出解释,无法对生物系统的整体行为进行更为深入和全面的探索。生物网络可直观地展现生物系统中各个功能元件之间的相互关系,为研究生物体在系统水平的特征提供了重要的平台。加权基因共表达网络分析(Weighted gene co-expression network analysis, WGCNA)利用了系统生物学的思想寻找基因之间表达的相似性,并将表达高度相关的基因确定为一个基因模块。本研究将WGCNA用于ESCC表达谱数据的分析。我们使用ESCC肿瘤组织与癌旁正常组织中差异表达的基因作为WGCNA的数据源进行分析,共得到8个与上皮细胞分化、细胞外基质重构、细胞周期等GO分类密切相关的基因模块。接着,我们选择一个独立队列的ESCC表达谱数据来验证WGCNA分析得到的基因模块,发现大多数的模块在不同数据来源的ESCC队列中具有一致性,这结果表明我们的分析方法准确且具有可重复性。最后我们联合分析基因模块与临床信息,找到一系列与肿瘤分级、病人生存时间、肿瘤分期等相关的基因模块。加权通过进一步分析基因模块结构,我们得到一系列与肿瘤分级高度相关且在模块中具有高连接度的枢纽基因,这些基因对ESCC的发生发展具有潜在的重要作用。我们的结果表明WGCNA能够发现具有生物学意义的基因模块,且通过联合临床信息分析所发现的枢纽基因也与文献报道基本吻合,这也证明WGCNA分析基因芯片数据的准确性和有效性。这是WGCNA方法第一次被用于分析ESCC数据,对基因模块信息的进一步挖掘有助于我们更深入地研究关键基因、关键信号通路、基因之间的调控机制对于肿瘤发生发展的作用和意义。