【摘 要】
:
药物-靶标相互作用预测作为药物发现领域中药物重定位方法的关键步骤,可以为新药的开发提供分子层面的关联探测,加快开发效率、节省投入成本、缩短研发周期。当前药物-靶标相互作用预测存在的突出问题包括数据类别不平衡、数据维度高和模型通用性差。本文将利用LINCS和DrugBank数据集中七个细胞系的基因表达谱数据和作用标识,将药物-靶标相互作用预测建模成二分类问题。针对上述问题,本文开展下列工作:1.针对
论文部分内容阅读
药物-靶标相互作用预测作为药物发现领域中药物重定位方法的关键步骤,可以为新药的开发提供分子层面的关联探测,加快开发效率、节省投入成本、缩短研发周期。当前药物-靶标相互作用预测存在的突出问题包括数据类别不平衡、数据维度高和模型通用性差。本文将利用LINCS和DrugBank数据集中七个细胞系的基因表达谱数据和作用标识,将药物-靶标相互作用预测建模成二分类问题。针对上述问题,本文开展下列工作:1.针对样本数据维度高、类别不平衡的问题,首先借助基于条件的生成对抗网络框架进行数据分布的学习,然后利用训练好的框架模型生成少数类样本以缓解类别不平衡问题,接着将生成样本与原始样本混合进行分类模型学习,最终使用学习好的分类器预测药物-靶标相互作用。2.针对现有预测模型所携带的“灾难性遗忘”问题,利用持续学习中基于“重放”的相关理论,结合上述的基于条件的生成对抗框架,使得基于已有样本数据训练所得的模型在学习新的样本数据时仍能够较好地掌握已学到的数据特征,最终提供一个可扩展的药物靶标相互作用预测模型。实验结果表明:本文基于条件的生成对抗网络框架的上采样方法能有效缓解药物-靶标相互作用预测的类别不平衡问题,有利于后续分类器的学习;基于生成对抗框架的持续学习方法能通过单个模型的持续更新完成对多细胞系数据的持续学习,增强了模型的可扩展性。以上研究工作为药物-靶标相互作用预测的研究工作提供了新的、有益的思路。
其他文献
随着大数据时代的到来,低成本保存超大规模的冷数据成为了重要挑战。光存储成本低、寿命长、绿色节能且易于保存,非常适合大规模冷数据长期存储。同轴全息光存储利用全息复用的方式存储数据,能够大幅度提升存储密度,而且使用二维数据页方式存取数据,为了使主机能够达到1GB/s级别的数据读写吞吐率,因此需要设计高速的全息存储数据通道。针对全息存储高速存取需求,设计全息存储数据通道框架,目前采用服务器主机作为同轴全
随着人工智能技术的飞速发展,无人驾驶技术作为一种社会生活智能化的重要应用,正在逐步从理论走向现实。其中,三维目标检测为无人驾驶提供了基础的环境感知与三维场景理解,为后续的机器行为决策与路径规划奠定了基础。作为二维目标检测的衍生任务,三维目标检测需要为每一个对象在相机坐标系下的最小外接立方体进行推测,其属性包括中心位置定位、立方体尺寸以及偏航角。尽管基于视觉的三维目标检测已经取得了巨大的进展,对昂贵
大数据时代,互联网上的信息与日俱增,人们对于信息的获取也提出了更高要求。在军事指挥数字化,军事装备现代化进程不断推进的背景之下,如何对军事信息进行有效的提炼、管理和利用,对于提高军事知识的应用以及军事资源的利用效率研究具有重大意义。因此,本课题以军事装备领域作为研究切入点,基于知识图谱技术构建了一个军事装备智能问答系统。本课题的主要工作包括:(1)采集并解析军事武器网站的半结构化数据,构建军事装备
建模篇章连贯性是自然语言处理中的基础问题,对很多下游任务有着重要的作用,比如自动摘要,问答和文本规划。句子排序为篇章连贯性建模中的一个有挑战性的子任务,它的目的是将输入的句子集合重新组成一段更连贯的篇章。通过学习如何为输入的句子排序,模型能够学习构成文本连贯性的元素如逻辑连贯性,主题相关性和因果效应等。近期随着深度学习的发展,基于神经网络的句子排序模型取得了更优异的性能,尤其是基于编码器解码器的端
实例检索是指基于给定的具体查询实例,在大规模数据库中检索出包含这一查询实例的图像,并提供实例位置坐标。实例检索被广泛应用于在线购物,视频编辑等现实场景中。当前基于深度特征的实例检索方法面对的主要挑战是:深度神经网络的训练对强监督信息过于依赖,限制了检索任务无法向大规模数据集拓展,同时难以检测未知实例。另一方面,基于弱监督的目标检测算法仅依靠图像类别标签训练网络,实现了目标定位和特征表达。这与实例检
目的:乙型肝炎病毒(Hepatitis B virus,HBV)的病毒中间体前基因组RNA(pregenomic RNA,pg RNA)在逆转录形成共价闭合环状DNA(covalently closed circular DNA,ccc DNA)的过程中,会形成双链线性DNA(double-stranded linear DNA,dsl DNA),部分dsl DNA可整合到宿主基因组上。病毒等染色
在激烈的市场竞争中,赊销是企业降低库存压力、增加销售收入、提高销售毛利的常用策略之一。企业普遍采用的营销手段之一是信用销售,这种销售方式往往使企业经营过程应收账款余额不断提高,应收账款的坏账风险也不断增加。巨额的应收账款占用着企业资金,降低企业现金周转率,影响企业快速发展。因此,如何加强应收账款管理是我国企业现阶段急需解决的问题。本文通过梳理国内外研究文献,运用案例研究法、访谈法及文献分析法先掌握
现金流管理对财险公司的持续经营和转型升级有着重要作用。加强现金流管理可以为财险公司管理层提供决策依据,既是中国银保监会偿付能力流动性管理的重要环节,也是保险公司稳健发展和持续经营的内在要求。A保险公司是我国最具代表性和增长速度最快的财险公司。本文以A保险公司为研究对象,通过对国内外现金流管理相关文献和理论的梳理,根据A保险公司财务数据和现金流管理现状分析A保险公司现金流管理面临的问题,探究其原因并
随着消费信贷需求的不断增加,目前我国开展普惠金融业务的组织机构早已不再局限于银行,还出现了非常多的大型金融公司。普惠金融业务的大力发展已成为必然趋势,同样也是普惠金融体系理念在我国消费金融市场中的具体体现。基于此,普惠金融机构业务发展的研究具有一定的理论和现实意义。论文主要从惠普金融的相关概念以及普惠金融的相关理论基础出发,介绍了普惠金融的特征以及构建体系,对金融发展理论、协同理论、信息经济学理论
人力资源已成为经济发展的第一资源,人力资源的开发对促进社会经济发展尤为重要。广州市作为拥有1400万人口的超大型城市,在全国政治、经济、文化、科技等领域中都处于重要地位,并对珠三角具有主导作用和辐射带动作用。城市优势之间的竞争是人力资源的竞争,近年来高层次人才竞争成为国家和地区间竞争的焦点之一,广州市面临着国内外激烈人才竞争的严峻形势。近年来,广州市颁布了一系列高层次人才引进政策,但同时人才政策仍