论文部分内容阅读
近些年来,lncRNA及circRNA在疾病的发生发展的作用及机制随着高通量测序的发展逐渐成为研究新热点。越来越多的研究者发现许多lncRNAs和circRNAs能够直接或者间接的调控疾病基因的表达,提示他们作为疾病诊断和治疗的手段具有非常广阔的前景。CAG是常见的胃炎类型,但其临床症状相对不明显,且通常是不可逆转的,故作为GC的癌前病变,早期诊断及治疗对减少GC的发生具有重大意义。目前关于CAG与mRNA、lncRNA、circRNA的研究较少。本研究旨在应用高通量测序技术分析CAG和CNAG中mRNA、lncRNA及circRNA的表达谱差异,寻找CAG中差异表达的mRNA、lncRNA和circRNA,分析CAG中差异表达基因的生物学功能,为今后寻找CAG诊断生物标志物及潜在的治疗靶点提供研究基础。第一部分CAG中lncRNA-mRNA相互作用的转录组分析目的:利用高通量测序技术研究lncRNA和mRNA在CAG组织表达谱的差异,对差异表达基因进行GO/KEGG富集分析,进行lncRNA-mRNA网络分析及蛋白质-蛋白质相互作用(protein–protein interaction,PPI)分析,预测并验证筛选的lncRNAs,为CAG的诊断和治疗提供实验基础。方法:本研究通过胃镜检查采集CAG和CNAG患者胃组织标本。结合组织病理切片验证样本诊断的准确性。变性琼脂糖凝胶电泳检测RNA完整性和纯度。移除r RNA,构建测序文库,对主成分进行分析。利用高通量测序和生物信息学分析对CAG与CNAG差异表达的mRNA、lncRNA进行了对比分析,对lncRNA-mRNA进行共表达分析及PPI分析,实时定量聚合酶链式反应(quantitative reverse transcription polymerase chain reaction,qRT-PCR)验证差异表达的lncRNAs。结果:(1)本研究结合胃镜及病理诊断共计纳入CAG患者20名,其中男性12人,女性8人,纳入CNAG患者20名,其中男性11人,女性9人,CAG组与CNAG组之间性别、吸烟和饮酒的比例无显著差异。CAG组患者平均年龄59,CNAG组患者平均年龄43,有统计学差异。(2)本研究共获得97,286个lncRNAs,20,308个mRNAs。lncRNAs长度基本分布在2003000 nt之间,mRNAs长度基本分布在6000 nt以上。lncRNAs类型主要为外显子正义重叠、内含子反义和基因间。相较于CNAG,在CAG组中共鉴定出50个上调的lncRNAs和66个下调的lncRNAs、376个上调的mRNAs和763个下调的mRNAs。(3)GO分析显示,上调的lncRNAs分别在positive regulation of MAP kinase activity、cell surface和death receptor activity这三方面富集程度最高。下调的lncRNAs分别在lung epithelial cell differentiation、lateral element和identical protein binding这三方面富集程度最高。上调的mRNAs分别在digestion、apical plasma membrane和transporter activity这三方面富集程度最高。下调的mRNAs分别在extracellular matrix organization、proteinaceous extracellular matrix和extracellular matrix structural constituent这三方面富集程度最高。(4)KEGG通路分析显示,上调的lncRNAs在prolactin signaling pathway富集程度最高。下调的lncRNAs在homologous recombination富集程度最高。上调的mRNAs在mineral absorption富集程度最高。下调的mRNAs在cell adhesion molecules(CAMs)富集程度最高。(5)通过计算得到的皮尔逊相关系数(pearson correlation coefficient,PCC),选取24个CAG与CNAG差异表达的lncRNAs和101个差异表达的mRNAs构建lncRNA-mRNA共表达网络,结果分析表明,ENST00000488188、ENST00000583490和NR121662是相互作用相对频繁的3个lncRNAs。(6)PPI结果表明,上调的mRNAs主要集中在digestion、epithelial cell differentiation和response to extracellular stimulus等生物学过程中。应用MCODE对PPI网络进行聚类分析,确定4个重要模块,对这4个模块进行GO分析,发现其主要与cytochrome P450-arranged by substrate type、class A/1(rhodopsin-like receptors)、sulfation、cornification等相关。通过Venn分析,筛选出在共表达网络和PPI网络中共同存在的8个mRNAs,包括DGKA、EIF6、HKDC1、DHRS11、CPS1、KRT15、TESPA1和CDHR2。(7)通过qRT-PCR验证差异表达的lncRNAs NR117090、ENST00000422847、ENST00000583490、ENST00000488188和ENST0000 0459255在CAG中的表达水平均与高通量测序及生物信息学分析的结果一致。小结:筛选出CAG和CNAG组织中差异表达的lncRNAs和mRNAs,并对测序结果进行生物信息学分析,建立lncRNA-mRNA共表达网络,qRT-PCR验证差异表达的lncRNAs在CAG中的表达水平均与高通量测序及生物信息学分析的结果一致。第二部分CAG中与免疫相关的mRNA及circRNA的分析目的:应用流式分析CAG免疫细胞水平,利用高通量测序技术研究circRNA在CAG组织的表达差异,对差异表达基因进行GO/KEGG富集分析,进行circRNA-mRNA网络分析,筛选并验证与CAG免疫相关的mRNA及circRNA,寻找与CAG炎症反应相关的差异表达基因,为CAG的潜在治疗靶点提供新的理论基础。方法:本研究利用高通量测序和生物信息学分析对CAG与CNAG差异表达的circRNA进行了对比分析,通过流式细胞术对CAG与CNAG胃炎局部组织中的免疫细胞浸润情况进行了分析,并对与CAG免疫相关的mRNA进行了权重基因共表达网络(weighted gene co-expression network,WGCNA)分析,通过计算PCC构建circRNA-mRNA网络,筛选出与CAG免疫相关的mRNAs和circRNAs。应用qRT-PCR对与CAG免疫相关的mRNAs和circRNAs进行验证。结果:(1)活检胃炎局部组织,制备单细胞悬液并染色,流式分析免疫细胞水平,发现CAG患者组织的中性粒细胞的百分比明显高于CNAG组,而NK细胞、Th细胞及Tc细胞的百分比在CNAG组和CAG组之间无统计学差异。应用Immu Cell AI分析CAG与CNAG中免疫细胞的浸润情况,发现CAG与CNAG对比CAG局部Tcm、NKT、CD8 T细胞浸润减少,中性粒细胞浸润增多。(2)GO分析显示,与免疫相关的差异表达上调mRNAs主要在antimicrobial humoral response上富集。与免疫相关的差异表达下调mRNAs主要在regulation of natural killer cell mediated cytotoxicity上富集。(3)本研究共获得6,245个circRNAs。circRNAs长度基本分布在2003000 nt之间。CircRNAs类型主要为外显子、正义重叠和内含子。相较于CNAG,在CAG组中共鉴定出19个上调的circRNAs和23个下调的circRNAs。(4)GO分析显示,上调的circRNAs分别在carnitine metabolic process、clathrin coat of coated pit和protein domain specific binding这三方面富集程度最高。下调的circRNAs分别在negative regulation of intrinsic apoptotic signaling pathway、actin cytoskeleton和calmodulin binding这三方面富集程度最高。(5)KEGG通路分析显示,上调的circRNAs在lysine degradation富集程度最高。下调的circRNAs在regulation of autophagy富集程度最高。(6)通过WGCNA分析及维恩图筛选出与免疫相关的50个关键mRNAs,通过计算PCC值筛选出与mRNA关联最多的5个circRNAs,分别是chr M:13298-13449+、hsacirc0005320、hsacirc0000339、chr7:100678797-100678973+、hsacirc0003664。(7)qRT-PCR验证与CAG免疫相关的8个mRNAs(AGPAT2、SLC7A9、OLFM4、EPCAM、ANXA2、PRSS3、MUC12、CD55)和5个circRNAs(chr M:13298-13449+、hsacirc0005320、hsacirc0000339、hsacirc0003664、chr7:100678797-100678973+)在CAG中的表达水平均与高通量测序及生物信息学分析的结果一致。小结:筛选出与CAG免疫相关的mRNAs和circRNAs,并对测序结果进行生物信息学分析,建立circRNA-mRNA共表达网络,qRT-PCR验证与CAG免疫相关的mRNAs和circRNAs在CAG中的表达水平均与高通量测序及生物信息学分析的结果一致。结论:本研究通过高通量测序技术对CAG和CNAG中mRNA、lncRNA及circRNA的表达谱进行分析,筛选出与CAG相关的差异表达基因,并对筛选的差异表达基因进行验证,找出在CAG发生发展中可能发挥重要作用的关键基因,为CAG的内镜早期精准诊断提供了新思路,为寻找CAG诊断生物标志物及潜在的治疗靶点提供了理论依据。