论文部分内容阅读
人类基因组计划的完成和高通量测序技术的发展,为生物信息学研究带来了丰富的信息。同时,海量数据的处理也为生物信息学带来了巨大的挑战和机遇。表达型数量性状位点(expression quantitative trait locus,eQTL)分析是全基因组关联分析的一个重要方面,其整合基因型数据和基因表达数据,找出控制表达型数量性状的基因在基因组中的位置,这对于进一步认识和研究基因调控的分子机制和调控网络十分重要。本论文就是针对人类基因组的表达型数量性状位点进行分析,开发基于eQTL的调控路径分析平台。
我们将GO注释信息和语义相似度分析应用到eQTL后续分析上来,总结出一套适用于人类基因组的eQTL后续分析技术。在分析eQTL算法的基础上,设计开发了基于eQTL的调控路径分析平台,综合运用eQTL定位、eQTL调控判别、人类全基因组扫描、GO语义相似度分析等技术,对目标基因及其候选基因进行深度分析,发现基因功能、基因与疾病关系、生物分子相互作用网络。该平台收集了当前主流的人类基因数据库(USCS hg19)和GO注释信息数据库,实现了基于eQTL位点直接搜索目标基因及其表达相关的原因基因,可以向用户提供在线服务。
我们利用平台分析了与27个肥胖基因的表达相关基因,并与GoSurfer和DAVID工具的分析结果进行了比较,结果表明我们的分析技术不仅可以找出影响目标基因表达的候选基因,还可以预测这些候选基因是否为原因基因,推测原因基因对目标基因的调控作用。利用KEGG验证发现,利用我们的技术能够对疾病的发病基因进行深度挖掘,实现基因功能、基因与疾病关系、生物分子相互作用网络相关知识的发现。