论文部分内容阅读
基于“一个基因、一种药物、一种疾病”的传统药物发现模式,一直以追求单靶标高活性和高选择性配体为目标。但是,近年来这种设计理念受到临床试验结果高失败率的巨大冲击和挑战。许多高活性、高选择性药物分子在体外试验中表现出非常理想的生物活性,但是这些药物真正应用到人体时,往往表现出不理想的疗效或严重毒副作用,其原因主要是由于生物系统和药物体内行为及作用模式的复杂性。化合物作为药物,在体内行为包括吸收、分布、代谢和清除,而作用模式则包括与人体内各种蛋白质的相互作用、毒性等,简称药物ADMET性质和药物-靶标相互作用谱。在上述因素驱动下,近年出现了系统药物设计概念,即以系统(整合)方法论研究药物设计问题,整合化学、生物学、数学、信息学、计算机科学等多学科技术,利用各种试验数据,建立计算机模型或数学方程,用于识别药物分子在整体细胞或有机体中复杂行为、作用网络和通路,以期发现高效、低毒的药物分子,造福人类健康。本论文旨在发展几种系统药物设计相关的方法和工具,包括两个主要部分。论文第一部分围绕药物-靶标网络和药物临床副作用理论预测展开研究,发展新算法和工具,推动系统药物设计发展和应用。第二章,我们发展了药物相似性推理、靶标相似性推理、网络推理和加权网络推理方法,用于药物-靶标相互作用预测和药物重定位研究。结合计算预测和体外试验,成功发现人类雌激素受体和二肽基肽酶-IV是五个老药孟鲁司特、双氯芬酸钠、辛伐他汀、酮康唑和伊曲康唑新的潜在靶标,他们之间的半数最大抑制浓度或有效浓度达到微摩尔或亚摩尔水平。另外,通过对基于边加权网络推理方法模拟研究,首次发现药物-靶标网络中的“弱相互作用假设”。第三章使用数据库整合和文本挖掘技术,发展了目前较大的免费药物副作用数据库MetaADEDB。为了证实MetaADEDB应用价值,开发了基于药物表型网络推理和药物副作用推理方法用于药物副作用和药物体内作用谱预测,获得了较好预测准确度并成功解释了数个老药未知临床副作用的分子机制。第四章,我们系统性地发展和评价了多靶标QSAR和计算化学基因组学方法在化合物-蛋白质相互作用网络预测中的应用。结果发现基于蛋白质一级序列的计算化学基因组学方法虽然在内部交叉验证中获得较高预测准确度,但是在外部测试集中却出现较高的假阳性率。基于多个高准确度的多靶标QSAR模型,发展了软件和相应的基于网页工具CPI-Predictor,用于全新化合物的靶标识别。论文第二部分,我们围绕小分子ADMET性质理论预测算法、数据库和软件发展开展研究。第五章,首先利用模式识别技术,发展一种新的组合分类器算法用于细胞色素P450抑制剂的分类预测研究。通过系统建模研究,证实我们发展的组合分类器算法优于几种传统方法,如最大值法、最小值法和乘积法。发展了基于信息熵指数用于小分子化合物细胞色素P450酶抑制杂泛性定量表征和预测研究。结果显示分子芳香性与其P450抑制杂泛性存在中等相关性,而分子亲脂性、分子复杂度、氢键结合能力和拓扑极性表面积与其P450抑制杂泛性没有或低相关性。基于目前最大的化合物生物降解性数据库,系统地发展了化合物生物降解性概率预测方法和模型,试验结果表明我们方法和模型具有较好泛化能力。第六章,针对几种常见模式生物,包括梨形四膜虫、黑头呆鱼和蜜蜂毒性的理论预测开展研究,发展和构建了多个高质量定性分类和定量回归模型用于毒性的理论预测。同时,又探索发展基于计算系统毒理学框架用于化合物毒性评价。与传统的QSAR方法相比,计算系统毒理学的计算框架不仅可以预测化合物毒性,还可以预测化合物与人体毒性相关基因或蛋白作用网络,这对化学物毒性分子机制阐明和环境风险评估更有指导和应用价值。论文第七章,通过文本挖掘方法构建了一个免费的化合物ADMET相关数据库admetSAR (www.admetexp.org).该数据库包含近10万个不重复小分子的22万条ADMET相关的试验数据。用户可以使用admetSAR中的文本搜索、分子相似性搜索等功能免费评价化合物的ADMET性质。另外27个高准确度的计算模型,包括22个定性分类和5个定量回归模型被安转至admetSAR数据库,供用户进行全新分子的ADMET性质计算预测。数剧库admetSAR不仅可以用于药物设计和药物发现,还可以用于环境风险评估研究,并在化合物生物降解性预测方面表现出较好的应用价值。目前该数据库访问量超过5000余次,并且被国内外30多家大型制药公司和学术机构广泛使用。