论文部分内容阅读
microRNAs(miRNAs)是一类内源性非编码RNA分子,长度为19~23nt。近年来发现它与多种生命活动密切相关,并且在疾病的发生发展过程中起着重要的作用。miRNA本身并不编码蛋白质,它是通过与转录后的mRNA结合,抑制翻译或直接降解mRNA来调控基因表达。研究miRNA及其靶基因,对于理解miRNA的作用机制以及认识miRNA在疾病发生和发展过程中的作用具有重要意义。miRNA靶基因的识别主要包括两种途径,其中分子生物学实验是确定miRNA靶基因的基本途径,但它存在识别靶基因数量有限、操作过程复杂且耗时久等缺点,不能满足对mi RNA及其靶基因的整体认识。因此生物信息学家利用计算机技术,基于miRNA与靶基因的结合特点开发了一系列预测miRNA靶基因的工具,例如:Targetscan、microT、miRanda、miRTarget、Pictar和PITA等。这些方法大多基于种子位点的序列匹配、结合位点的自由能以及位点保守性等特征,然而这些特征还不足以对靶基因进行准确识别和预测,所得结果往往具有较高的假阳性。近年来,随着已证实靶基因数量的不断积累,以及对miRNA靶基因结合特点的不断认识,使得我们可以对mi RNA的靶基因进行进一步地分析和筛选。在本研究中,我们开发了一种对miRNA靶基因进行优选的方法TarpriGO。TarpriGO由三部分构成:第一部分,基于被同一个miRNA调控的靶基因具有功能注释相似性原理,计算候选基因与已证实靶基因间的功能相似性,对候选靶基因进行排序;第二部分,针对现有预测工具都具有一定准确性但预测结果重合率低的特点,为多来源数据分配权重,计算候选靶基因的综合得分并排序;最后,综合两部分的结果得出TarpriGO的最终靶基因排序。为验证该方法的可靠性,我们用留一交叉验证法检测该方法对已知靶基因的优选性能,得到AUC值为0.93,说明TarpriGO对已知靶基因具有较好的优选效果。另外,将高通量靶基因数据比对到优选列表中得AUC值为0.70,说明TarpriGO对潜在的靶基因有一定的识别能力。与其它优选算法比较,发现本算法对标准靶基因集有更好的识别能力。并且与原有预测工具的靶基因列表比较,发现优选后的已证实的靶基因排名显著提高。另外,对六个原有靶基因预测工具最优权重分析发现,Pictar和Targetscan算法的权重65%以上的大于平均权重1/6,说明这两种预测工具更为可靠。一种miRNA分子可调控多种基因的表达,同一个基因也可能被多种miRNA调控,这种复杂而精确的调控关系构成了miRNA-靶基因调控网络。而对miRNA调控网络的分析,有助于进一步理解miRNA作用的分子机制及miRNA在疾病中的作用机理。本文以与药物成瘾相关的基因及其靶基因为例,构建并分析miRNA-疾病调控网络与miRNA-靶基因调控网络。结果显示,一种miRNA能够调控多种致病基因,所以在复杂疾病中miRNA起到了中心调控作用。一种疾病伴随多种miRNA差异表达,表明同一种疾病中多种miRNA具有协同作用。在调控网络基础上,我们筛选出四种可能与尼古丁成瘾相关的miRNA,分别是hsa-miR-124-3p、hsa-miR-16-5p、hsa-miR-155-5p和hsa-mi R-222-3p。通过对它们的靶基因进行功能注释和通路富集分析,发现许多与尼古丁成瘾相关的生物过程、细胞组成以及生化通路在这些靶基因中显著富集,进一步验证了这些miRNA与尼古丁成瘾相关。综上所述,本文在分析mi RNA及其靶基因对应关系的基础上,开发了一种对miRNA靶基因进行优选的工具TarpriGO,构建并分析了与尼古丁成瘾相关的miRNA-靶基因调控网络。