【摘 要】
:
药物研发管线漫长复杂且费用昂贵取决于众多因素。化学分子属性预测一直是药物发现领域早期阶段的一项最基本的且富有挑战性的重要任务,高效准确地预测分子属性,对于化学和制药行业设计合理的化合物是非常可取的。近年来,机器学习和深度学习在化学领域展现出了巨大的应用潜力,随着时间的推移准确性越来越高,为药物发现研究和开发提供了重要机会。本文提出了一种利用数据驱动的端到端的深度学习算法BCSA模型分别对分子的物理
【机 构】
:
中国科学院大学(中国科学院深圳先进技术研究院)
【出 处】
:
中国科学院大学(中国科学院深圳先进技术研究院
论文部分内容阅读
药物研发管线漫长复杂且费用昂贵取决于众多因素。化学分子属性预测一直是药物发现领域早期阶段的一项最基本的且富有挑战性的重要任务,高效准确地预测分子属性,对于化学和制药行业设计合理的化合物是非常可取的。近年来,机器学习和深度学习在化学领域展现出了巨大的应用潜力,随着时间的推移准确性越来越高,为药物发现研究和开发提供了重要机会。本文提出了一种利用数据驱动的端到端的深度学习算法BCSA模型分别对分子的物理属性水溶性logS,油-水分配系数logP/logD进行了预测研究。首先,我们利用分子线性输入规范(Simplified Molecular Input Line Entry System,SMILES)序列表征的优势,搭建了基于双向长短期记忆网络(Bi-directional Long Short-Term Memory,BILSTM)的深度学习模型来预测分子结构的溶解度。此外,引入了通道注意力(Channel Attention)以及空间注意力(Spatial Attention)模块进行优化,在分子内空间角度上,分别探索分子特征向量的全局和局部特性,使模型能够专注于输入中最相关的部分。训练结果表明,引入的注意模块使得模型的拟合性能提升了5%左右,其中在训练过程时我们采用了贝叶斯参数优化来获得模型的最佳表现。同时,引入了SMILES增强技术来改善模型的泛化能力和鲁棒性,与每个分子仅使用一个规范SMILES字符串构建的模型相比,使用增强数据集训练的网络在验证集和测试集上都显示出更好的性能,并且增强倍数越大性能越好,扩增40倍后的测试集拟合效果达到了88%的准确度。其次,探索了当前倍受科学界关注的图神经网络模型对水溶性预测的效果。基于分子图表征构建了图卷积神经网络(Graph Convoluted Neural network,GCN),消息传递神经网络(Message Passing Neural Network,MPNN),基于图注意力机制的神经网络模型(Attentive FingerPrints,AttentiveFP)三种预测架构。在依赖原始分子图结构信息的三个模型中,发现GCN模型的性能最高,与BCSA模型性能相当。这表明GCN有能力仅用相对较少的原子属性,就可以学习几乎所有嵌入分子特征的信息。并且实验结果显示对于不同模型而言,易于预测和难以预测水溶性的分子很大程度上是相同的。然后,利用相关属性油-水分配系数logP/logD(pH=7.4)的预测对模型泛化能力进行了探索。令人鼓舞的是,BCSA模型在针对logP和logD的预测过程中不需要额外的辅助数据就可以获得更高的性能。其中,logP的拟合效果达到了99%,logD也实现了93%的准确率。在与三种图模型(GCN,MPNN,AttentiveFP)进行对比实验后,BCSA模型仍然表现出了最好的性能,其次是AttentiveFP,充分展现出了BCSA模型具有强泛化能力和健壮性。最后,为了化学专家以及相关研究人员能够快速方便使用BCSA模型,我们搭建了一个预测的可视化平台,可在以下位置免费访问http://cadd.siat.ac.cn/molpre/。
其他文献
拉赫玛尼诺夫是19世纪末、20世纪初著名的钢琴演奏家、作曲家、指挥家,是浪漫主义后期杰出代表人物,也是俄罗斯浪漫主义传统的最后一位伟大倡导者。《g小调前奏曲》是拉赫玛尼诺夫《二十四首前奏曲》中较为著名的一首,创作于二十世纪初,反映了当时社会形势及个人生活色彩。本文分别从技术难点、速度力度、节奏的变化、踏板的运用等四方面进行分析。以这几个方面为切入点,希望能帮助我们提高对音乐风格的理解,清楚演奏技巧
超精密光学元件面形检测和系统波像差在投影物镜光刻、引力波探测、惯性约束激光核聚变等重要工程项目和前沿科学研究中有着举足轻重的作用,为突破国外技术封锁,需要开展这方面的技术研究。以针孔(亚微米量级)衍射产生的近乎理想的球面波为参考波面的相移点衍射干涉(Phase-shifting point diffraction interferometer,PSPDI)技术消除了常规干涉仪参考波面误差的影响,能
为解决时域相移小孔点衍射干涉仪中移相依赖昂贵压电陶瓷相移器,且长时间采集易受环境干扰影响的问题,提出一种基于偏振同步相移的小孔点衍射瞬态干涉检测方法。构建反射式结构的小孔点衍射干涉测量光路得到两束正交的圆偏振光,利用棋盘位相光栅分光与偏振片阵列移相,在CCD上同时获得4幅不同相移量的干涉图像,对单次采集的4幅瞬时干涉图像进行处理即可直接获得被测面形信息。搭建实际测量系统,通过基于琼斯矩阵的偏振态分
为分析排渗管和坝高对尾矿坝浸润线的影响程度,采用数值模拟方法对尾矿库不同工况下浸润线位置进行研究。采用Midas-GTS软件渗流分析模块对尾矿坝在增设排渗管前后、不同坝高、不同运行水位工况下渗流场分布进行数值模拟,计算得出不同工况下浸润线位置。结果表明:增设排渗管后,浸润线与实测浸润线耦合较好,相对误差在合理范围内;坝高100 m时,每隔7 m高程差布设排渗管的方案可有效控制坝体内浸润线的埋深和分
<正>施秉县委组织部从思想、行为、观念、行动、理论5个方面着手,通过常态化推进"五抓"行动,不断提升组工队伍自身建设。抓常思想建设。成立思想建设工作小组,围绕平时工作状态,精准了解组工干部思想动态,当好干部的心理咨询师和思想开导者。抓细行为规范。建立干部管理台账,做好做实作风建设,对存在不良之风的干部进行早干预、早提醒、早约谈。抓实观念转变。把观念教育列为每周例会的议题之一,教育干部革除个人主义,
小说在初中语文阅读教学中占有举足轻重的地位,但当下初中小说教学存在许多问题,比如:小说文本解读的粗糙化、教师教学理念的陈旧化、教师教学方式的单一化等等。因此,将文本细读引入小说教学,不仅为中学语文阅读教学增添活力,而且也可以使小说教学更加的有新意,激发学生对小说的阅读兴趣,培养学生良好的阅读习惯。论文将文本细读理论与小说阅读教学紧密结合,探讨在小说阅读教学中如何运用文本细读的方法,提高教学效率的问
<正> 自《伤寒论》问世以降,后代医家用白虎汤及其类方着,枚不胜举。近代名医张锡纯氏变通应用此类方剂,堪称高手,启迪后学。现作初略探讨。一、白虎汤变通应用1.石膏粳米汤(生石膏、粳米):用于温病初得,其脉浮而有力,身不恶寒而反发热者。亦可代白虎汤直清阳明里热。尝治一妇,于秋季得温病甚剧,以冰束作枕,合目昏昏似睡,呼之不应。其脉洪大,按之甚实。此阳明胃热极盛,遂拟本方,约历10小时,将药服尽,豁然顿
<正> 笔者在临床中探究出一套以川芎茶调散类方治疗各种头痛的方法,分述于后。祛风散寒茶调散主治风寒头痛,组成:川芎茶调散加葛根;清热茶调散主治风热头痛,组成:川芎茶调散加桑菊、石膏;祛风胜湿茶调散主治风湿头痛,组成:川芎茶调散加苡仁、葛根、茯苓;益气茶调散主治气虚头痛,组成:川芎茶调散加人参、黄芪;补血茶调散主治血虚头痛,组成:川芎茶调散加白芍、当归;滋肾茶调散主治肾
<正>技术的快速迭代、产业的转型发展、新一代信息技术和先进制造技术的高度融合、智能商业模式的快速推广,均要求技术技能人才具有新的技术技能体系、认知能力和思维范式,这促使着职业教育进行育人模式改革。“灯塔工厂”被制造业视为第四次工业革命成功转型的表率,湖南三一工业职业技术学院(以下简称“三一职院”)迅速回应“灯塔工厂”人才新需求,与三一集团、湖南大学组建“校企校”合作定向班,
溶液析出型Ziegler-Natta催化剂在聚丙烯工业生产上应用广泛。综述了溶液析出型聚丙烯催化剂的制备技术进展,包括MgCl2-环氧化合物、MgCl2-醇类化合物、烷基镁-醇类化合物等不同体系。重点介绍了国内外各公司基于这些体系所开发催化剂的制备方法及主要性能。讨论了反应物的组成及用量、固体颗粒的结晶析出工艺及后处理等方面对催化剂和聚合物性能的影响。