论文部分内容阅读
生物信息学中,研究miRNA与人类疾病的关系是一个非常热门的研究课题。越来越多的研究显示,miRNA在人类疾病的产生与发展的过程中有着极其重要的作用。因此,系统的识别人类miRNA与疾病的关系对理解疾病的发病机理十分重要。然而,受到实验技术的限制,例如耗时和高昂的试验费用,只有很少的一部分miRNA得到了深入研究确定了其与疾病的关联。随着大量的miRNA被发现,有关miRNA的生物学数据库正迅速增多。本文的主要工作如下:1.为解决单一数据库不全面和噪声的限制,提出一种基于网络的整合多个数据库资源的自加权(self-weighting)计算方法。受到原有的疾病表型相似性网络、miRNA功能相似性网络以及已知的疾病-miRNA对应关系的启发,改进了在疾病表型-miRNA异构网络上的重启型随机游走算法,对潜在的疾病-miRNA关联关系进行预测。依据miRNA与疾病数据库HMDD中已知的miRNA和疾病关联关系,采用留一法交叉验证与感应性曲线衡量预测性能显示了我们预测模型的有效性,该算法的感应性曲线下面积达到了0.801,高于另外两种传统的随机游走算法。此外,本文在算法设计的基础上,完成了11种常见疾病和直肠癌相关miRNA的预测工作,结果显示本文提出的算法可以有效的预测候选致病miRNA。2.考虑到miRNA功能相似性得分和疾病表型相似性得分并不能覆盖网络中所有的miRNA和疾病,并且精确计算miRNA和疾病网络拓扑相似性是构造网络模型来预测疾病与miRNA关联关系的的关键,提出利用高斯核函数即径向基函数来计算网络拓扑相似性。然后两种相似性进行平均加权,最后在构建的疾病-miRNA异构网络上应用重启型随机游走算法,排序候选的疾病-miRNA关联关系,根据排序结果挖掘潜在的人类疾病-miRNA关联关系。在已知的3644对疾病与miRNA关联关系上采用交叉验证,这种预测方法取得的感应性曲线下面积为0.894,在乳腺癌相关miRNA的预测结果中也显示该方法可以有效的预测候选致病miRNA。