论文部分内容阅读
目的 利用生物信息学方法探讨慢性阻塞性肺疾病(chronic obstructive pulmonary diseases, COPD)发病机制中的重要基因与信号通路。方法 从高通量基因表达(gene expression omnibus, GEO)数据库下载COPD组和正常组基因表达数据,采用加权基因共表达网络分析法(weighted gene co-expression network analysis, WGCNA)建立COPD的基因共表达网络和识别共表达模块,以共表达模块中高系数模块和差异基因中共同靶点作为COPD的作用靶点,用Genecards和DisGeNET疾病库来进行验证,得到COPD的关键基因。对关键基因进行蛋白互作网络分析(protein-protein interactions, PPI)、基因本体功能(gene ontology, GO)和京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes, KEGG)分析,并通过Cytoscape建立关键靶点、生物过程和通路的互作网络。再通过CytoHubba插件提取前10的Hub基因进一步筛选出COPD的潜在生物标志物,输入到全面医学文献检索与基因云分析系统(gene-cloud of biotechnology information, GCBI)进行转录因子的分析。结果 从GEO数据库得到COPD相关差异基因3138个,与WGCNA中的turquoise模块取交集,验证后得到37个COPD的关键基因,主要富集在磷酸磷脂酰肌醇-3羟基激酶和丝苏氨酸蛋白激酶(phosphatidylinositol 3-kinase and serthreonine protein kinase, PI3K/Akt)信号通路。CytoHubba筛选得到的前10的核心基因为:乳腺癌易感基因1(breast cancer susceptibility gene 1, BRCA1)、张力蛋白1(tension protein 1,TNS1)、FMS样酪氨酸激酶3 (FMS-like tyrosine kinase 3,FLT3)、整合素β3(integrin β3,ITGB3)、血管性血友病因子(von Willebrand factor, VWF)、转谷氨酰胺酶2(transglutaminase 2,TGM2)、富含半胱氨酸的酸性分泌蛋白(secreted protein acidic and rich in cysteine, SPARC)、磷脂酰肌醇-4,5-二磷酸3-激酶催化亚基α(phosphatidylinositol-4,5-bisphosphate 3-kinase catalytic subunit alpha, PIK3CA)、半乳糖凝集素-3 (lectin galactoside-binding soluble 3,LgALS3)、B-细胞淋巴瘤因子2样蛋白1基因(B-cell lymphoma factor 2-like protein 1,BCL2L1),其中PIK3CA、BRCA1、ITGB3、VWF、FLT3、BCL2L1均富集在PI3K-Akt信号通路。转录因子分析结果中Sp1、Sp3可同时调控多个COPD关键基因的表达,而核心基因BRCA1、SPARC可被Sp1等多个转录因子调控。结论 BRCA1、TNS1、FLT3、LGALS3、ITGB3、VWF、BCL2L1、TGM2、SPARC、PIK3CA与COPD发展密切相关,这些核心基因通过调控PI3K-Akt等信号通路,参与到细胞迁移、细胞基质、粘附斑以及抗氧化能等生物过程中进而调节COPD的发展。