论文部分内容阅读
第一部分探索LncRNA介导的ceRNA网络揭示肺鳞癌LncRNA诊断标志物研究目的:长链非编码RNA(Long non-coding RNA,lncRNA)作为竞争性的内源RNA(ceRNA)的一员,在肿瘤的发生发展中具有重要作用。本研究通过生物信息学的方法对lncRNA介导的ceRNA网络进行全面分析,确定潜在的lncRNA生物标记物,以预测肺鳞状细胞癌(LUSC)的预后。方法:1.差异表达的RNA数据集的筛选:通过生物信息学方法运用edge R包从TCGA数据库中的LUSC组织和非LUSC组织中获得差异表达的lncRNA,miRNA,mRNA数据集。2.LncRNA相关的差异表达的mRNA的功能富集分析:通过DAVID数据库进行GO功能分析和KEGG通路分析,预测lncRNA相关的差异表达mRNA的相关功能。3.预测lncRNAs在LUSC中的机制:我们使用miRCode数据库(http://www.mircode.org/)来预测lncRNA与miRNA之间的关系。通过miRTarBase(http://mirtarbase.mbc.nctu.edu.tw/),miRDB(http://www.mirdb.org/)和 TargetScan(http://www.targetscan.org/)数据库来预测 miRNA 的靶基因 mRNA,得到miRNA与mRNA的关系对,最终通过Cytoscape构建(lncRNA-miRNA-mRNA)ceRNA网络。4.单因素和多因素Cox回归模型的构建:对差异表达的lncRNAs进行单因素和多因素Cox回归模型的构建,确定潜在的lncRNA是否能作为独立的预后因子。5.预测Cox模型中的lncRNA的机制:构建以Cox模型中lncRNA为中心的ceRNA子网络,来预测lncRNA的机制。结果:1.使用edge R分析TCGA的LUSC和非LUSC数据,得到差异表达的LncRNAs 共 2185 个,miRNAs 共 170 个,mRNAs 共 2053 个(P<0.01,|logFC|>2),其中在LUSC中表达上调lncRNAs的有1777个,表达下调的有408个;表达上调的miRNAs有143个,表达下调的有27个;表达上调的mRNAs有1263个,表达下调的有790个。2.构建的LUSC的ceRNA网络中包括184个lncRNA,18个miRNA和49个mRNA。184个差异表达的lncRNA中的11个,18个差异表达的miRNA中的1个和49个差异表达的mRNA中的5个与肺鳞癌的总体生存率显着相关(P<0.05)。3.单因素和多因素Cox回归分析显示六个lncRNA构建的Cox模型可以作为独立的预后因子来预测肺鳞癌患者的预后。结论:1.竞争性内源RNA(ceRNA)参与LUSC的发生发展。2.六个lncRNA组成的Cox模型可能是预测LUSC预后的潜在生物标志物。第二部分DNA甲基化和转录组联合分析揭示肺腺癌特异性的诊断标志物的研究目的:DNA甲基化可以调节长链非编码RNA(long non-coding RNAs(lncRNAs))在肺腺癌发生发展过程中的作用。本研究旨在通过生物信息学分析,将甲基化驱动的lncRNA和mRNA鉴定为肺腺癌(LUAD)预后的生物标志物。方法:1.差异表达的RNAs的筛选:通过生物信息学方法运用edge R从TCGA数据库的535例LUAD和邻近的59例非LUAD组织获得差异表达的lncRNA,mRNA.2.差异甲基化基因的筛选:通过Limma R从TCGA数据库的475例LUAD和邻近的32例非LUAD组织获得差异的甲基化基因。3.甲基化驱动基因的筛选:使用MethylMix R软件包从465个具有匹配的DNA甲基化和RNA表达的LUAD组织和32个具有DNA甲基化的非LUAD组织中获得甲基化驱动的mRNA和lncRNA。5.甲基化驱动基因的功能预测:GO功能分析和ConsensusPathDB通路富集分析以鉴定甲基化驱动基因的功能富集。6.预测LUAD的预后:单因素和多因素Cox回归分析识别每个变量对预测LUAD预后的独立作用。7.DNA甲基化和基因表达的Kaplan-Meier曲线分析可能为LUAD患者提供潜在的预后生物标志物。结果:1.通过生物信息学分析得到了 99个差异甲基化驱动的mRNA和17个差异甲基化驱动的lncRNA.2.单因素和多因素Cox回归分析显示6个lncRNA(FOXE1,HOXB13-AS12,VMO1,HIST1H3F,AJ003147.8,ASXL3)以构建与 LUAD 患者总体生存率相关的预测模型。3.DNA甲基化和基因表达联合生存分析表明,4 个 lncRNA(AC023824.1,AF186192.1,LINC01354 和 WASIR2)和 8 个 mRNA(S1PR1,CCDC181,F2RL1,EFS,KLHDC9,MPV17L,GKN2,ITPRIPL1)可能是独立的生物标志物可以用来预测LUAD的预后。结论:1.甲基化驱动基因参与了肺腺癌的发生发展。2.4个lncRNA和8个mRNA可以作为潜在的生物标志物来预测LUAD的预后。第三部分下调的LncRNA BBOX1-AS1对肺腺癌增殖,侵袭和迁移能力的影响目的:本研究通过生物信息学方法分析鉴定长链非编码RNA(Long non-coding RNAs,LncRNAs)具有生物标志物的潜能并研究长链非编码RNA BBOX1-AS1的可能的生物学性能。方法:1.根据癌症基因组图谱(TCGA)和基因表达综合(GEO)数据库评估了 LncRNA BBOX1-AS1的表达与肺癌之间的关联,并进一步利用edge R分析获得差异表达的lncRNA。2.使用Kaplan-Meier数据库对差异表达的lncRNA进行生存分析。3.使用TCGA数据集进行基因集GSEA富集分析。4.细胞增殖,划痕,侵袭迁移实验分别验证了 LncRNA BBOX1-AS1在非小细胞肺癌中的增殖,侵袭和迁移的功能。结果:1.LncRNA BBOX1-AS1 在 LUAD 和 LUSC 中均高表达。2.Kaplan-Meier 数据库显示,lncRNA BBOX1-AS1的高表达在肺腺癌中预后较差(P=0.011)。3.LncRNA BBOX1-AS1的下调显著抑制了对A549,H1299细胞的增殖,迁移和侵袭能力。4.GSEA分析表明,Wnt信号通路,糖基磷脂酰肌醇-Gpi锚定-生物合成,细胞周期在lncRNA BBOX1-AS1高表达表型中差异富集较多,JAK-STAT信号通路,造血细胞系,移植物抗宿主病在lncRNA BBOX1-AS1低表达表型中差异富集较多。结论:1.LncRNA BBOX1-AS1可以作为一种新型的长链非编码RNA来预测肺腺癌的预后。2.LncRNA BBOX1-AS1可以作为癌基因来促进肺腺癌的发生和发展。3.Wnt信号通路,糖基磷脂酰肌醇-Gpi-锚-生物合成,细胞周期,JAK-STAT信号通路,造血细胞谱系,移植物抗宿主疾病可能成为lncRNA BBOX1-AS1调控的关键通路。