论文部分内容阅读
随着高通量测序技术和现代生物信息学的迅速发展,微生物学的研究越来越受到科学界和医学界的重视。多年来的研究证明,微生物与人类疾病密切相关。深入了解微生物和疾病之间的关联关系,不仅能揭露更多人类疾病的发病机制,还可以对疾病的预防和治疗提供新的见解,从而促进全球人类健康。然而,传统的生物验证实验耗时长、成本高。因此,采用计算方法预测潜在的微生物-疾病关联正在成为热点研究课题。本文主要利用已知的微生物-疾病关联数据,分别利用网络算法和机器学习方法设计生物网络并提出新的微生物-疾病关联预测模型,主要工作如下:(1)对模型所需要的生物数据进行收集与处理。手动搜集了大量已被验证的微生物-疾病关联数据,构建了新的微生物-疾病关联数据库MDADP,其包含了51种疾病和473种微生物之间的1172条关联关系。在此基础上,对数据库进行筛选和处理,构建全新的微生物-疾病关联数据集。MDADP数据库不仅为微生物-疾病关联预测领域提供了新的数据集,而且在之后的研究中有望挖掘更多新颖且关键的生物医学信息。(2)提出基于双向权重生物网络的微生物-疾病关联预测模型BWNMHMDA。首先,基于微生物-疾病关联数据和高斯交互作用谱核相似性构建三种关联网络,并通过整合这三种关联网络,得到一个微生物-疾病异构生物网络。其次,对生物网络中的所有节点赋权值,同时对网络中所有边的权值进行规范化,在引入独特的双向推荐算法后,得到双向权重的微生物-疾病异构生物网络。最后,基于该双向权重异构生物网络,提出一种结合局部特征的矩阵计算方法来推断潜在的微生物-疾病关联。(3)提出基于反向传播生物网络的微生物-疾病关联预测模型BPNNHMDA。在BPNNHMDA中,首先设计了一种独特的反向传播生物网络,其输入信号为已知微生物-疾病关联的矩阵,输出信号为微生物-疾病的潜在关联概率矩阵。其次,基于双曲正切函数设计了一种改良的激活函数用于BPNNHMDA中不同网络层的激活,并通过高斯交互作用谱核相似性对网络的初始边权值进行优化,有效地提高BPNNHMDA的训练速度。为了评估模型的预测性能,本文采用留一交叉验证,K折交叉验证,结合案例研究等方法对预测结果进行评估与分析。结果表明,BWNMHMDA和BPNNHMDA相较于先前的先进预测方法具有更优异且可靠的预测性能。这表明以上两种预测模型可以为未来的生物实验提供有价值的潜在微生物-疾病关联。本文在最后对上述工作进行了总结,并对未来的研究进行了展望。