基于化学键的中药代谢产物预测模型构建方法的建立及其应用研究

来源 :北京中医药大学 | 被引量 : 1次 | 上传用户:chen95127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景:目前,多数中药化学成分体内代谢过程尚不清楚,这在一定程度上阻碍了中药直接作用物质基础和作用机制的阐明。中药化学成分体内代谢产物的研究有助于揭示中药体内变化过程,从而为中药直接作用物质基础和作用机制的阐明提供线索与指导。利用传统实验的方法进行中药化学成分代谢产物研究费时而又耗力,同时高成本、高消耗。而通过计算机模拟构建代谢产物预测模型的方法因其安全、高效、低成本、低消耗等特点有效弥补了传统实验的不足,被认为是辅助药物代谢产物研究的另一有效手段。近年来,越来越多基于计算机模拟的药物代谢预测研究先后被报道,但主要是围绕着代谢位点的预测展开的,少数模型能够给出具体的代谢产物却又无法提供代谢酶的信息,同时模型的可靠性有待提高。因此建立具有较高可靠性的代谢产物预测模型是目前中药代谢预测研究领域亟待解决的问题。目的:本论文旨在构建快速、有效的中药化学成分代谢产物预测模型,弥补当前代谢产物预测模型对于代谢产物和代谢酶二者不可兼得的不足,并将其应用于中药代谢网络的构建。方法:(1)代谢反应数据的考察。从数据的准确性、完备性、适用性和可获得性四个方面对目前已有代谢反应数据进行考察。准确性主要考察数据的原始出处。完备性主要考察数据库对于当前已知代谢反应数据的覆盖度。适用性主要考察数据信息是否完善,考虑到本论文使用的代谢反应数据需催化代谢反应的代谢酶已知,因此对于催化酶未知的代谢反应数据不予考虑。可获得性主要考察数据获得的难易程度。最终,基于准确性高、完备性好、适用性高、易于获得的原则确定本论文的最佳数据源。(2)中药化学成分代谢产物预测模型构建方法。立足于收集的代谢反应数据,根据每个代谢位点发生代谢反应的实际情况,进行阳性代谢位点和未标记代谢位点的划分。利用简单投票的方法进行阴性代谢位点的筛选。将参数化的阳性代谢位点和阴性代谢位点作为输入,基于CHI、IG、GR、Relief四种特征属性选择方法进行特征属性的筛选。立足于筛选所得的特征属性,分别通过 Bayes、LibSVM、KStar、IBK、AdaBoost、Boosting、J48、RandomForest八种分类建模方法进行代谢产物预测模型的构建,结果形成32种不同的建模组合。通过对模型预测性能的比较,获得最优代谢产物预测模型。最终,通过以下三个方面对模型的可靠性进行考察:第一,利用独立测试集,从代谢位点水平上考察模型的可靠性。第二,基于文献报道的经典外部测试集,从化合物分子水平上考察模型的可靠性,并通过与既往文献报道的代谢产物预测模型进行比较,考察模型的预测性能。第三,基于文献报道的中药化学成分代谢数据,考察本论文所构建的代谢产物预测模型在中药化学成分代谢产物预测中的表现。(3)中药化学成分代谢网络预测模型构建方法。基于本论文构建的两套代谢产物预测模型构建中药化学成分代谢网络预测模型,并基于文献报道的中药化学成分代谢网络数据和药物代谢网络数据考察所建中药化学成分代谢网络预测模型的可靠性。结果:(1)CYP450 3A4,2D6和2C9介导代谢反应代谢产物预测模型的构建。基于文献报道的CYP450酶相关代谢反应数据,构建了 CYP450 3A4,2D6和2C9介导的5类代谢反应代谢产物预测模型。涉及的代谢反应类型包括N-脱烷基反应、O-脱烷基反应、脂肪族羟基化反应、芳香族羟基化反应和S-氧化反应。所有模型的10折交叉验证测试的准确性均介于0.940-0.987之间,灵敏度和特异性分别大于0.856和0.968,受试者工作特征曲线下面积均在0.953以上。所有模型独立测试集测试的准确性均介于0.947-0.994之间,灵敏度和特异性分别大于0.864和0.933,受试者工作特征曲线下面积均在0.977以上。对于文献报道的外部测试集,本论文给出的灵敏度和特异性值分别为0.821和0.956,与前人的研究(灵敏度:0.701,特异性:0.963)相比,本论文所建模型识别真阳性样本的能力较前人的研究提高了 12%,识别真阴性样本的能力与前人的研究相比无显著差异。从分子水平上来讲,外部测试集的34个分子中,本论文所建模型完全预测正确17个分子,优于SOMP 13个分子完全预测正确的结果。总的来说,本论文所建模型的预测性能要优于或至少与前人的工作一样好。(2)氧化还原酶介导代谢反应代谢产物预测模型的构建。通过对11个候选代谢反应数据库的考察,最终选定BKM数据库为最佳数据源。基于BKM数据库收录的代谢反应数据,建立了氧化还原酶介导的7类氧化代谢反应代谢产物预测模型。涉及的代谢反应类型包括C=C的形成反应、醇氧化成酮反应、脂肪族羟基化反应、醇氧化成醛反应、芳香族羟基化反应、氧化脱氨反应和N-脱烷基反应,共涉及代谢酶655个。所有模型10折交叉验证的准确性均介于0.901-0.995之间,除醇氧化成酮反应和芳香族羟基化反应的灵敏度分别为0.777和0.765之外,其他5类代谢反应的灵敏度均在0.875-0.988之间,所有模型的特异性和受试者工作特征曲线下面积分别大于0.944和0.915。对于独立测试集而言,所有模型的准确性均介于0.885-0.969之间,除芳香族羟基化反应之外,其他6类代谢反应的灵敏度均大于0.777,所有模型的特异性和受试者工作特征曲线下面积分别大于0.963和0.916。训练集和独立测试集的平衡精度分别大于0.858和0.813。对于文献报道的外部测试集,从代谢位点水平上来讲,34个阳性代谢位点中31个代谢位点完全预测正确,灵敏度为0.912。从分子水平上来讲,外部测试集31个化合物分子中23个分子完全预测正确。结果表明,当涉及的代谢酶更多、数据量更大、数据结构更加复杂时,笔者提出的代谢产物预测模型构建方法依然合理有效。(3)中药化学成分代谢网络预测模型的构建。基于(1)和(2)所建的两套代谢产物预测模型初步建立了中药化学成分代谢网络预测模型。该中药化学成成分代谢网络预测模型的预测范围如下:CYP450 3A4,2D6和2C9介导的N-脱烷基反应、O-脱烷基反应、脂肪族羟基化反应、芳香族羟基化反应,S-氧化反应等5类代谢反应和氧化还原酶介导的C=C的形成反应、醇氧化成酮反应、脂肪族羟基化反应、醇氧化成醛反应、芳香族羟基化反应、氧化脱氨反应、N-脱烷基反应等7类代谢反应。最后,基于文献报道的西酞普兰代谢网络和乌头碱代谢网络考察了所建代谢网络预测模型的可靠性。结果发现,文献报道的西酞普兰代谢过程和乌头碱代谢过程在本论文预测的结果中均有一定程度的体现。结论:本论文首次提出了基于化学键的代谢产物预测模型构建方法。并成功构建了CYP450 3A4,2D6和2C9介导的5类代谢反应代谢产物预测模型和氧化还原酶介导的7类代谢反应代谢产物预测模型。测试结果表明本论文构建的代谢产物预测模型真实、可靠,其预测性能优于或至少与既往文献报道的代谢产物预测模型一样好。最终,在以上两套代谢产物预测模型的基础上,初步构建了中药化学成分代谢网络预测模型。测试结果表明本论文构建的代谢网络预测模型具有一定的可靠性,在一定程度上可以反应中药化学成分的体内代谢过程。总的来说,本论文所建的中药化学成分代谢产物预测模型和中药化学成分代谢网络预测模型将为中药直接作用物质基础的发现和中药作用机制的阐明提供线索,也将为新药开发过程中先导化合物的优化提供策略。
其他文献
当前中国研发投入不足、自主创新能力不强、科学技术落后以及人力资本缺乏等现状。若不改变这些状况,中国出口贸易的竞争力将难以持续下去。这就要求中国的经济发展方式必须从
目的:比较内镜全层切除术(endoscopic full-thickness resection,EFR)和开腹手术、腹腔镜手术治疗胃固有肌层肿瘤的效果。方法:选择胃固有肌层肿瘤病人53例,其中31例行EFR治
一个集体的管理只有在科学的思想观念指导、支配下,才能收到良好的成效。班主任工作亦是如此。
企业的公关形象=贡献+媒体的评价指数,企业不仅营业额要做大,公关体系也不能落后。目前,家具行业的危机不断出现,严重影响到企业的经营活动。鉴于家具行业危机公关的现状,本文通过
病人男,45岁,因"呕血6 h"入院。入院前6 h因大量饮酒后出现剧烈恶心、呕吐,继而出现呕血,总量约100 m L,入院前后有持续性恶心、呕吐及排柏油样便,从一开始条状到后面糊状,总量