基于矩阵填充的药物-靶标相互作用预测

来源 :湖南大学 | 被引量 : 0次 | 上传用户:eaglecmk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在药物-疾病靶标相互作用关系预测问题中,由于传统方法的局限性,如:训练样本量不足、已知蛋白质靶标的3D晶体结构较少、计算效率不高,导致其效果往往不尽如人意。随着人类基因组计划的完成,可以获得更多有关于药物或疾病的化学结构或者基因组的数据。这就意味着对于预测任务,数据源不仅仅只有相互作用关系数据,还有大量的辅助信息,因此如何高效地整合获取的辅助信息显得尤为重要。随意整合多个数据来源的辅助信息,可能会因为引入大量的异源噪声和偏差,反而适得其反,降低药物-靶标相互作用预测的精度。现有的异源数据之间存在以下几个问题:(1)数据信息通常存在噪声、缺失值等,且信息与信息之间也存在大量的冗余信息;(2)数据整体的规模较大,维度高,难以高效地表示其特征,但是已知数据却往往较为稀疏。如此可见,如何有效的融合多个数据来源的多相似性信息是值得这里研究和思考的。本文主要针对以上问题深入研究,总结如下:第一,提出了基于多相似性选择的机器学习方法,构造药物-疾病异构图,该图包含有关已知相互作用关系的信息,以及药物之间的相似性以及从不同数据源获得的疾病靶蛋白之间的相似性。首先,针对多个相似性数据,利用熵值和相互关系系数衡量每个相似性数据的信息冗余度,从中挑选出冗余信息少的相似性数据子集。其次,应用非线性相似性融合方法——SNF将药物和靶蛋白的不同相似性进行融合。利用融合的相似性数据以及基于异构图的图特征信息,运用机器学习分类方法——随机森林模型进行未知关系的预测。实验结果表明提出的改进方法在一定程度上改进了预测精度。第二,考虑到多个相似性数据集中到一个相似性矩阵中容易造成信息过载,从而导致效率的下降;基于此,提出基于多相似性的矩阵分解模型。在前面选取的最佳相似性数据子集中,对多个相似性矩阵和相互作用关系矩阵进行联合分解,利用每个相似性的潜在因子特征进行预测任务。进行的交叉验证实验说明在对相互作用关系预测问题上,该模型是合理有效的。
其他文献
学位
近年来,与心脏相关的各类疾病已经成为全球人类的主要死亡原因之一,所以对于患有心脏疾病患者的心电的监护便显得格外重要,但是医疗设备和医护人员的数量有限,医疗质量难以维持。目前临床上对心脏相关疾病的诊断主要是通过查看心电图,所以过去也存在不少研究提出能够自动提取心电图特征并辨识心律失常的系统。然而,大多数文献研究是基于心电数值数据进行心电的滤波、切割以及分类诊断,鲜有以心电图图像的形式进行研究,除了网
近几年来,随着淘宝、京东以及拼多多等电子商务平台的飞速发展,网络购物已经成为人们生活中不可缺少的一部分。这些电子商务平台通过数据库存储和保留着数亿条消费者的购买记录,如何利用机器学习技术从这些数据中去预测消费者未来的购买意图,是整个电子商务平台利用人工智能和大数据技术向消费者提供个性化服务的关键。因此,本文使用机器学习算法去构建用户行为预测模型。本研究以银行APP数据为基础,前期本文对数据集中存在
学位
随着社会的不断发展、科学技术的不断进步,计算机核心硬件设备逐步更新换代,使得计算机的性能得到了极大的提升,为深度学习的运行提供了较好的运行环境,从而使得深度学习也得到了飞跃般的发展。深度学习在计算机视觉、机器翻译等领域都有了重大突破。然而在科研和实际应用中,都需要较合适的超参数配置以提高模型性能和较快的训练推理运行速度以减少等待时间。因此,本文提出了模型的部分超参数的自动化配置方法,并对数据回归预
随着国民经济的稳定发展和人民生活水平的不断提升,人们对房价的关注越来越高。不仅如此,房价作为国内外广大学者普遍关注的话题,也一直是一个热门的研究领域。了解和把握房价未来的走势至关重要,不仅在很大程度上可以帮助购房者进行房产配置,也可以帮助房地产开发商进行开发决策以及辅助政府相关部门进行政策的实施。为解决传统预测方法参数设置固定而造成精度损失的问题,本文引入了动态模型方法,即动态模型平均(DMA)和
随着科学技术的不断发展,人们生活水平提高,日常生活的用电需求也一直在增长。为满足这些需求,同时提高输电效率,采取的措施是扩大电网规模,提高输电电压的等级,随之而来的安全隐患也成为了业内关心的重点对象。保护电网安全稳定运行的一个重要设备就是消弧线圈。消弧线圈的工作原理就是通过提供电感电流,对整个电力系统中的电容电流进行补偿。目前我国配电网的中性点接地方式多为消弧线圈接地,其中很多地方的消弧线圈成套装
随着科学技术的迅速发展,光调控技术已经应用在生产生活的方方面面,受到了越来越多研究者的关注。液晶凭借其优异的光学各向异性在光场调控方面具有重要的应用。利用液晶取向技术或改变外部条件来控制液晶分子的排列方向,能够实现对入射光束的偏振态、光强、波前的控制。在各类液晶中,胆甾相液晶因其独特的空间螺旋结构、选择性反射和热色效应等优异的光学性质,在光场调控方面具有重要的应用。基于此,本论文完成了胆甾相液晶光
河流中的污染物通过水体的运输,经沉淀、吸附等物理化学作用会沉积在河床底泥中。当底泥环境发生变化时污染物极易释放出来,成为水体的污染源。底泥中的重金属具有不可降解性和生物累积性,对生态环境和生物体造成严重的危害而受到广泛的关注。湘江是湖南省最大的河流,由于工业快速发展,大量废水的排放,导致湘江水体重金属污染非常严重,湘江底泥中镉(Cd)、铬(Cr)、铜(Cu)和铅(Pb)等重金属浓度很高。在本研究中
随着科技的火热发展,图像数据在现实生活中与日俱增,但现实环境复杂,在某些特殊情况下光照条件不佳,导致图像的亮度无法令人满意。因此,需要利用低光照图像增强技术,对图像进行进一步的处理,以得到更好的特征和视觉效果。现有的低光照图像增强技术一般是采用传统图像处理方法,这些传统方法很多是针对特定方面增强,容易增强过度,导致色偏严重和细节丢失。近年来基于深度学习的方法可以学习到图像处理很多细节信息,从而解决