论文部分内容阅读
随着基因组研究的深入和生物信息学的发展,对基因调控信息的分析和研究引起人们越来越多的重视。以建立一个完善、系统的基因调控信息平台为目标,我们实验室建立了基因表达调控信息数据库系统(GRI)。在先前的工作中,GRI主要收集了与基因调控相关的数据,而未包含基因表达数据。目前,国内外数据库中包含大量的基因表达实验数据,这些数据蕴含着丰富的生物学信息,研究某一特定的基因,就不能抛开其基因表达数据及调控信息。
现有的研究已经证实,人类疾病或健康状态,都直接或间接地与基因相关。通过分析基因表达数据研究疾病的分子机制和寻找药物靶点,目前已经成为医学研究领域的热点。
本课题以疾病的基因表达数据为研究对象,找出了一系列与疾病显著相关的基因,并结合GRI系统中的调控信息进行深入分析,研究与基因在疾病中的差异表达相关的调控因素,分析疾病产生的可能机制,为疾病分子机制的研究以及药物靶点的筛选提供了重要的理论依据。我们研究了多个与疾病相关的基因表达数据集,得到了一批与疾病显著相关的基因,并结合调控信息进行了综合分析,分析结果与国际文献报道一致。针对基因表达数据和与疾病显著相关的基因数据,我们开发了Web界面提供信息查询。为了让用户更直观地了解表达数据,我们实现了表达数据的可视化。在可视化方面,我们根据实际情况,并没有采用。NCBI等国际知名信息学网站的可视化方法,也没有沿用GRI的可视化方法,而是创新地采用JSP动态生成图像文件的方式。
在本课题中,我们发展了一套分析基因表达数据的方法,能够快速高效地进行一致性分析和差异表达分析。对于基因的差异表达分析我们使用自己提出的t检验算法,并进行了算法优化,大大提高了运算速度。我们还在该方法的基础上开发了使用方便的在线t检验工具。
研究基因表达和调控是一项复杂的工作,我们需要许多生物信息学方面的软件。而R和 Bioconductor正是面向基因组信息分析的应用软件集合,将R和Biocoductor整合到GRI平台中,利用R和Biocoductor强大的功能分析GRI中丰富的信息,无疑会对将来的工作带来极大的便利。本课题在GRI中构建了一个基于R和Bioconductor的在线分析平台,该平台基于模块化设计,能够简单快速地开发基于R和Bioconductor的在线分析工具。
GRI系统是一个自主开发研制的基因表达调控信息数据库系统,它不是单纯的国外数据库的镜像,而是一个能够兼容不同数据,它有机地将基因调控信息和表达信息融合在一起,而且不断地完善和扩展,为科研人员提供了一个很好研究的平台。