基于深度学习的类药性分子生成模型优化研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:xia226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计表明,一款新药从设计到上市的研发周期平均需要十三年的时间和多达几十亿美元的研发成本。其中,生成类药性分子候选库是药物合成的关键步骤。通过有效的算法快速得到准确的类药性分子候选库是加速新药研发的重要手段,因此尝试使用深度学习方法生成分子候选库具有实际价值。基于深度学习的类药性分子生成模型优化研究中,提出了一个基于改进型变分自编码器的分子生成模型。首先,在变分自编码器架构中使用Dilated CNN算法作为解码器网络进行泛化分子生成。制药行业中真正有价值的分子集是具有特定生物活性的分子,本文通过迁移学习和强化学习两种方法来进行分子生成模型的优化工作。第一种方法是使用迁移学习优化生成模型,迁移学习中选用常用的金黄色葡萄球菌和恶性疟原虫作为研究靶点,使用EOR作为再训练后模型的评价指标,分别验证生成集中是否能够重现测试集出现过的分子。第二种方法是将上述的改进变分自编码器作为生成模型,将随机森林作为预测模型,并使用策略梯度下降算法将二者整合到一个系统中。该系统将生成模型视为智能体,将判别模型视为环境,构成了一个基于马尔可夫决策过程框架的优化算法。系统使用JAK2为靶点研究最大化和最小化指标。经实验验证,所提出的改进型变分自编码器在生成分子的有效性指标上达到0.981,超过了基于变分自编码器模型和循环神经网络模型的效果。基于策略梯度下降的优化算法使用了新的奖励函数,减缓了模型更新过后的生成模型有效性指标下降迅速的问题。
其他文献
CD47(Cluster of Differentiation 47)是一种具有多种信号功能的抗噬细胞受体。CD47在多种细胞上表达,向巨噬细胞传递“don’t eat me”的信号,阻止巨噬细胞的吞噬作用。细胞如果因生理或病理原因导致CD47受体下调,则更容易被巨噬细胞吞噬去除。SIRPα(Signal regulatory proteinα)是信号调节蛋白家族的一种调节性糖蛋白,主要表达于髓系
钛合金密度低,比强度高,耐腐蚀性好,是良好的耐热材料和低温材料。20世纪以来,我国航空航天事业发展与日俱进,与之相关的钛合金的研制和应用也获得了快速发展,钛加工零件大量地应用于交通、医疗、航空、航天、海洋、建筑等领域。然而,钛合金强度较高,在常温下变形困难,需要较大应力。而热成形中加热装置、耐热模具、高温下的润滑等问题难以解决。振动辅助成形是降低金属成形过程中流动应力、提高表面质量的有效方法,包括
回音壁模式(Whispering gallery mode,WGM)微腔具有Q值高和模式体积小的特点,使得其在传感具有很好的应用潜力。目前由于低阶模只能带来有限的光与物质作用,微腔还无法实现大尺寸(>1μm)微粒探测。然而,由于液芯微腔的高阶共振模式具备液芯能量占比更大、渗透深度更深、光与物质作用更强等优点,更适合作为光与物质相互作用的平台。为此,我们将研究此液芯微腔在微粒计数和传感等方面的应用。
Cu-Cr-Zr合金具有优良的导电、导热性,高的抗软化温度、耐磨等性能而被广泛应用于引线框架、结晶器内衬、电阻焊电极、航空航天等方面。目前,对于Cu-Cr-Zr合金的研究主要是通过合金化、热处理及变形相结合的方法来提高合金的电学及力学性能。本文通过显微组织分析(金相、SEM及EBSD)以及硬度和电导率测试等方法研究了固溶-时效、固溶-冷轧-时效以及固溶-时效-冷轧-退火工艺对高强高导Cu-Cr-Z
古气候的定量重建一直是全球气候研究中的重中之重,中国季风区中的多种地质记录为人们认识亚洲季风的演化及其影响区域的古气候做出了重要的贡献。中国季风区的石笋δ18O记录表明亚洲季风强度变化受北半球夏季日射的影响,呈现出典型的岁差周期(2.3万年)。然而,利用中国北方黄土沉积记录重建的夏季风强度变化在中更新世转换后始终呈现出10万年周期的信号。前者表明亚洲季风受低纬水汽循环的控制,而后者则表明亚洲季风受
无线电能传输技术具有无需布线、无接触和可靠性高等优点,可以为无线可充电传感器网络中的传感器节点提供持续的能量供给,保障了传感器节点的正常工作,延长了整个网络的生存周期,使得节点有望彻底摆脱对电池的依赖,受到了来自学术界和工业界的广泛关注。经过近几年的快速发展,无线可充电传感器网络已广泛应用于数据中心监测、智能电网、智能家居和环境监测等诸多领域。无线可充电传感器网络充电效用优化问题主要关注如何通过部
图像中目标分辨率的缺乏对传统目标识别算法的性能造成了严重的影响,特别是在远距离的广角监控视频、无人机远程、航空影像等场景下。超分辨率技术作为计算机视觉领域的核心技术之一,已经成为解决此类小目标识别问题的一种流行又极具挑战性的方案。但在传统的超分辨率动机和小目标识别所需要的动机之间存在着本质的区别。前者旨在提高目标的视觉清晰度,而后者则是通过增强特定特征来提高分类器的识别精度。近期的工作在超分辨率的
逆向设计是近年发展起来的一种基于不同算法实现高密度、高性能集成硅基器件的方法。对于片上光互连领域,逆向设计能有效降低集成硅基器件的尺寸,同时保持硅基器件高水平的性能,用于硅基器件的逆向设计算法一直在朝着高效的方向发展。最近,将多种算法融合以实现高效率的逆向设计成为了热门的研究方向,通过发挥出不同算法的优势可以最大程度提升逆向设计的效率。本论文中采用了两种新型的高效率逆向设计算法:第一种算法将伴随法
随着新型Ga N功率器件的应用,开关电源在高频化和高功率密度化方面取得了突破性的发展,将Ga N功率器件作为电源变换器软开关的开关管,开关电源整体功率密度将大幅提高。本文以高频和高功率密度为目标,结合Ga N功率器件的应用,针对AC/DC变换器进行研究。为满足对电能质量的要求,本文AC/DC变换器采用两级式结构设计,前级为PFC电路完成功率因数校正,后级为DC/DC变换器,应用软开关和同步整流技术
点云数据配准任务的目的是对两帧点云数据做空间点级的匹配工作,在无人驾驶、家用机器人、无人机的飞行、地理信息系统的研发等领域有着良好的应用前景。随着深度神经网络广泛应用于点云数据的分类,分割等工作,并取得了很不错的成果,点云的配准工作也引入了深度学习方法,并取得了明显的进步。在此背景下,本文运用卷积神经网络对点云的配准任务进行了深入研究。对于两帧高度重叠的点云配准,传统的方法通过自定义的方法来寻找最