论文部分内容阅读
医药产业关乎全人类的健康,而新药研发是医药产业发展的最重要的驱动力,同时也是推动人类社会发展的强大力量。近年来,随着系统生物学、生物信息学、网络药理学、高通量筛选技术、组学技术等学科和技术的发展,新药研发已由传统药理学研发模式转变为的反向药理学(基于靶点的药物研发)模式。经过十多年发展,通过高通量筛选化合物库与蛋白库,大量药物尤其是靶向药已经成功上市。然而随着大量药物上市,耐药性问题逐渐出现,各大制药公司针对靶向药耐药开发了不同研究策略,如药物组合,多靶点药物等。收集整理药物、靶点、靶点在疾病组织的分布、耐药性突变、药物组合、靶点组合等信息不仅有助于发现新的药物靶点,还能针对有特定突变的靶点筛选出克服耐药突变的化合物。基于以上问题,本课题首先对药物、靶点、耐药性突变、靶点组织分布图谱、药物组合、靶点组合等进行了全面的收集整理,为TTD数据库增加了相应的功能模块。升级内容包括:1)增加了83个药物靶点及104个靶点/药物相关调控基因的共2 000个耐药性突变,这些耐药性突变对63种疾病的228种药物具有耐药性;2)758个靶点在70种疾病相关的药物靶向组织中的差异表达谱;3)629个靶点在2 565个健康个体的非疾病组织中的表达谱;4)1764种药物组合组成的1 008个靶点组合及664个多靶点药物组成的1 604的靶点组合;5)增加了47个靶点,2450个药物。蛋白质的功能确定对发现新的药物靶点及筛选活性化合物至关重要,通过实验方法确定蛋白质功能费时又费钱,大量预测蛋白质功能的算法(如BLAST,机器学习)被开发及应用。多种计算机预测方法及产生的海量数据促进了蛋白质功能预测的研究,然而尽管如此,还是有大量蛋白质既不能被实验方法确证也不能被计算机预测方法注释出来。其中一部分原因就是各种计算机预测算法的假阳性及预测准确率问题,因此对各种算法进行全面评估是非常有必要的。