基于超图的MiRNA与疾病关联预测

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:lujunjun_1204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MicroRNAs(miRNAs)是一类具有调控功能的小分子非编码RNA。大量的研究证据表明,miRNAs的变异和失调是疾病发生的重要原因,因此识别与疾病相关的miRNAs成为近年来生物学研究领域的一个重要课题。然而,传统的生物实验方法成本高昂、验证周期长,且具有一定的盲目性,限制了miRNA与疾病关联研究的快速发展。随着miRNA-疾病相关性数据的逐渐积累,研究人员建立了一些高可信度的公开数据库,这些数据库提供了实验验证的miRNA-疾病关联和相关的生物学信息。研究者充分利用数据库数据,通过设计高效而精确的计算方法预测潜在的miRNA-疾病关联,弥补了生物实验方法的不足,降低了研究成本并缩短研究周期,为疾病研究提供了新的思路,为疾病诊疗提供了新的理论依据。目前大多数计算方法存在预测准确率不高、不能预测新的疾病、特征集质量不高、挖掘非线性高阶关联的深层特征比较困难等问题。针对这些不足,本文综合利用多种生物学数据构建高质量的相似性网络,提出了三种miRNA-疾病关联预测的计算模型,主要工作如下:(1)基于归纳超图学习的预测模型(HyperGraph for Predicting MiRNA-disease Association,HGMDA)。HGMDA将疾病相似性信息、miRNA相似性信息以及miRNA与疾病已知关联信息作为输入数据,并基于统计理论、图论及矩阵分解设计了表示miRNA-疾病关联的特征向量。为充分发挥超图结构更强的数据样本间非线性高阶关联的刻画和挖掘能力,HGMDA利用k-means算法,在构建miRNA-疾病关联超图结构基础上,基于归纳超图学习获得样本特征到关联得分的映射矩阵,继而利用此矩阵计算未知miRNA-疾病对的关联得分。(2)基于高维特征的超图预测模型(MiRNA-disease association prediction via hypergraph learning based on high-dimensionality features,HFHLMDA)。HFHLMDA针对相似性信息的稀疏性,首先利用高斯核相互作用谱补全数据,然后采用相似性信息作为特征向量并结合改进的超图学习模型学习映射矩阵。(3)基于多相似性的组合超图学习的预测模型(Multi-Similarity based Combinative Hypergraph Learning for Predicting MiRNA-disease Association,MSCHLMDA)。针对部分疾病或miRNA经重构后仍无相似性信息,MSCHLMDA采用最近邻的关联数据评估未知关联来增加高斯核相似性数据,继而整合多个miRNA、疾病的相似性数据,并在精简、有效的特征组成基础上设计组合超图学习算法,训练出更加全面的组合映射矩阵,从而使得预测结果更加准确。三种模型均通过留一交叉验证和5折交叉验证评估其有效性,并通过案例分析得到进一步证实,实验结果表明HGMDA等三种算法均可作为预测miRNA-疾病关联的有效工具。
其他文献
本文采用环糊精主体与多氟烷基取代硅(Ⅳ)酞菁通过主客体相互作用,自组装多氟烷基硅(Ⅳ)酞菁-环糊精(CD)纳米超分子光敏剂。研究其光物理性质以及药物控制竞争释放和光控制释
沉默信息调控因子2样蛋白3(silent information regulator 3,SIRT3或Sirtuin3)是线粒体内的主要去乙酰化酶,在调节人类及啮齿类动物脂代谢方面发挥关键作用,但对反刍类动物脂
野生大豆(Glycine soja L.)是栽培大豆(Glycine max L.)的祖先,原产于东亚,从俄罗斯东部到中国南部都有广泛分布,这使得野生大豆具有丰富的遗传多样性;野生大豆在人类驯化和
近年来全球气候变化显著,自然地质灾害频发,越来越多的人开始意识到加强灾害预防、应急响应、重建与恢复等问题的重要性。灾后重建作为城市规划学者重点参与的部分,其发展的
随着科技的进步和信息存储的发展,对功能器件的低成本、高效率和低功耗的要求也越来越高。传统的用作信息处理和传递的材料均集中在金属磁性材料,但是金属材料在进行信息处理的过程中不可避免的会产生焦耳热,这将增大了器件的功耗并使得器件的寿命降低。因此,寻找一种可以降低器件功耗和提高工作效率的材料是至关重要的。微波铁氧体由于其高电阻率、低的涡流损耗等优异性能而引起科研工作者的广泛研究兴趣,并被广泛用于高频和自
青藏高原是地球上最高、最大的高原,它的隆起深刻影响了亚洲地质地貌格局以及全球气候变化。高原周缘山系是响应青藏高原新生代构造过程最敏感的部位,因此对高原周缘山地隆升过程和机制的研究成为近十年来地学界关注的重点问题。祁连山地处青藏高原东北缘,被认为是最晚卷入高原的山体。晚新生代以来祁连山构造变形活跃,是高原东北向生长的最前缘,是研究高原隆升扩展机制的理想区域。祁连山地区的河流地貌、沉积学、磁性地层学和
为了解决经济发展与环境污染及能源短缺之间日益加剧的矛盾,发展绿色、高效、可持续发展的新型能源动力技术已成为相当迫切的任务。在诸多新兴的能源技术中,基于电催化反应体
随着新能源系统的大规模应用,电化学储能技术作为辅助新能源发电的关键手段也得到了发展,其运行状态分析和故障预测的相关研究逐渐受到重视。电池储能系运行过程中,储能单元
草地是西北地区主要的植被类型,在碳循环中占据重要的地位。西北地区属于干旱半干旱地区,生态环境脆弱,对气候变化异常敏感。近几十年来,西北地区气候由暖干向暖湿化转型,人
绵羊痒螨(Psoroptes ovis)寄生于羊、牛、兔等家养动物和麋鹿等野生动物皮肤表面导致以皮肤炎症、结痂、剧痒、消瘦和脱毛为主要临床特征的一种慢性、传染性外寄生虫病,给动