论文部分内容阅读
【目的】旨在发现潜在的抗肿瘤药物作用靶点,为日后临床工作及实验验证提供参考。【方法】从DrugBank数据库获取抗肿瘤药物靶点,结合HPRD数据库中蛋白质相互作用信息,使用Cytoscape建立药物靶点PPI网络并计算网络节点的拓扑属性,使用SPSS单因素分析和Weka信息增益原理筛选拓扑属性变量,采用SMOTE算法处理不平衡数据集问题,利用决策树方法构建抗肿瘤药物靶点预测模型,并与其他三种常见的机器学习分类算法模型进行性能比较。【结果】应用决策树算法构建的抗肿瘤药物靶点预测模型的预测准确率达73.18%,在CBioPortal中验证发现,结果中预测分数大于等于0.9的16个靶点在多种肿瘤中存在突变和扩增,并以NR5A1为例进行具体分析。【局限】仅使用抗肿瘤药物靶点的PPI网络属性构建预测模型,未加入靶点的功能、序列属性等特征。【结论】基于PPI网络的拓扑属性,采用机器学习方法对潜在的抗肿瘤药物靶点进行预测是有效的,可以为抗肿瘤药物的研发及临床工作提供一定参考。