论文部分内容阅读
围绕基因的表达数据,本文对模式植物与重要作物的基因表达做了深入的分析,尤其是针对各物种中miRNA的靶基因的表达分析,并且构建了包含分析功能的基于Web的数据库平台。首先,基于12种作物的基因芯片数据,本文构建了植物miRNA靶基因表达数据库PMTED,提供miRNA靶基因在不同的状态下、不同的细胞类型与组织内以及在不同的胁迫条件下的所有表达信息的查询和统合分析功能,进而进行miRNA以及靶基因的功能预测与挖掘。据我们所知,目前还没有这样专门针对多物种中所有miRNA的靶基因的统合分析的研究,也没有这样专门的数据库平台,使得利用它提供的相关分析和可视化工具,用户可以通过浏览miRNA靶基因的表达模式来挖掘其生物学功能。所以,PMTED将成为生物学研究者们进行植物miRNA与功能基因组研究的一个有力工具,其统合分析的结果也将成为生物学家实验设计的有价值的参考。它不仅通过提供大量的靶基因表达来促进植物miRNA的研究,并协助一般性的生物研究,而且还提供了方便将拟南芥和水稻等模式植物资源转向小麦和玉米等研究较少的作物的门户,使得使用者可以利用物种间的同源性与保守性,直接将模式作物中的丰富资源用于辅助其他植物的研究。其次,针对小麦的基因表达数据,本文构建了小麦基因表达与分析数据库WhED,数据库中既包含小麦基因表达芯片数据又包含small RNA的高通量测序数据,除了实现数据的查询与基因的差异表达分析及功能富集分析等功能之外,还通过不同数据间的协同注释实现了数据间的交叉查询。这也是据我们所知第一个专门针对小麦基因表达的数据库。由于小麦功能基因组研究的相对滞后,小麦的表达数据大多是在公共数据库里作为所有物种表达数据的一部分进行传播的,而像WhED这样专门致力于小麦表达数据的收集、整合和分析功能的数据库的出现必将大大方便生物学家们对小麦进行基于高通量技术或下一代测序(NGS)技术的基因表达数据的分析,并且有力地促进小麦功能基因组的研究。第三,针对拟南芥的基因表达芯片数据,本文提出了基于芯片数据的拟南芥miRNA靶基因的共表达分析(CoMT)策略,对拟南芥中所有miRNA的靶基因进行了系统的共表达分析,构建共表达网络,通过图聚类算法抽取其中的共表达模块,并对共表达模块进行功能富集分析,进而通过其靶基因间的共表达关联来推断miRNA间的功能关联。虽然在过去的5年间,共表达分析已经成为诸如人类、酵母、水稻与蕃茄等物种中基因功能预测的一个有力工具,但是到目前为止,未见拟南芥中通过这种方式对miRNA功能进行分析的报道。实验数据分析与文献对比结果表明,我们的分析结果是合理可靠的。随着基因芯片与高通量测序等基因表达数据的迅速增长与累积,该分析策略的提出不仅可以为miRNA的功能分析与预测开辟一条新的途径,而且还可以在有效利用现有数据的基础上更加充分地挖掘出数据中的有用信息。