人类蛋白质亚细胞定位预测方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:xs0405010154
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质亚细胞定位是计算生物领域一个重要的研究方向,目的是确定正常情况下蛋白质在细胞中的位置。人类蛋白质亚细胞定位预测时其中一个重要的研究分支。结合其在特定位置才能正确发挥作用的特性,该研究可以帮助我们理解蛋白质的功能,在药物设计等多个领域都有重要的应用。随着蛋白质数量的指数增长,传统的湿实验验证的方式已经不能满足需求,出现了各种各样的高精度、低消耗的基于计算的预测方法,大大提升了蛋白质定位判断的效率。基于计算的方法的核心是分类模型,合理的模型的构建又是通过对大量数据的训练得到。本文中介绍了两种预测蛋白质亚细胞位置的方法,分别利用了蛋白质不同方面的信息。第二章提出了基于多核SVM的预测方法,利用了蛋白质序列的理化属性和进化信息,分别提取了三种不同的特征矩阵,对序列整体和局部特征进行了整合。并对不同的特征选择了效果最好的核函数,之后通过核融合的方式组合成新的核矩阵用来构建SVM分类模型。这个方法主要用了核融合的思想,将多个不同的特征组合到了一起,结果比较发现核融合的方法可以提高预测的准确性,提取的特征要尽可能的涉及多个方面。第三章首先对近些年针对多标签人类蛋白质亚细胞定位的预测方法进行了总结,介绍了九个典型的、使用序列信息或者基因本体论(Gene Ontology,GO)信息的,并且提供了可供外部访问网站的预测方法;之后在这些方法的基础上做了改进,提出了新的基于GO的集成预测方法。统计了已有的针对多标签人类蛋白质亚细胞定位的数据集,选择使用次数最多的还有3106个样本的数据集作为标准数据集,并且从2018年8月版本的SWISS-PROT数据库中构建了新的数据集,在这两个数据集上对第三章中提到的预测方法进行了验证。新提出的方法中,使用了GO以及它们之间的层次关系,实验时考虑了不同种类GO以及同源蛋白可能对结果造成的影响,比较了不同情况下的预测结果;另外,也尝试了使用GO语义相似度构建特征矩阵的做法,比较了四种构建语义相似度矩阵方法的结果。虽然该方向的研究现如今取得了一定的进展,但是仍有可改进的地方。在特征提取方面,GO信息的利用仍需要做进一步的探究,语义相似度矩阵是可以尝试的方向。其次,在分类算法上,要构建直接作用于多标签分类的算法,虽然使用二分类器也可以得到满意的预测效果,但忽视了不同标签之间的联系,可能造成预测信息的缺失,预测精度的提升需要综合各方面的影响。
其他文献
大学生群体作为未来社会建设的中坚力量,其具备的能力、素养在一定程度上影响着社会的发展质量。大学生领导力作为一种复合型的能力或素养,主要是指大学生在团体活动中与同伴进行互动、实现团体目标的过程中展现出来的素养和能力。这种复合型的能力涵盖了动机态度、交际能力和实操能力,对于大学生在发展其他能力时也有一定的促进作用。此外,面对信息时代人工智能的迅速发展,大学生培养目标理应顺应时代发展,从培养人类技能转变
随着我国社会老龄化程度加深,基础家庭结构演变,传统养老模式难以延续,亟需政府、社会、家庭共同参与,重构养老设施体系,优化养老设施空间布局。我国相对于日本等发达国家养老设施发展起步较晚,深入研究日本养老设施体系与空间布局方法,对于我国养老设施科学发展具有重要意义。然而我国对日本养老设施体系的解读相对简单,缺少构成逻辑层面的深入探讨;对城市层面养老设施总体空间布局的深入研究更是存在缺环。故本文以养老设
钦天监,是清代中央机构之一,下设有天文科、时宪科、漏刻科等部门。其中漏刻科主要承担的是为皇家相阴阳、候时辰、辨宜忌等职能,这在清代皇家园林营建中,是必不可少的一部分。本研究通过查阅《大清五朝会典》等清代官修典章制度史来梳理钦天监漏刻科的机构设置,并通过对奏折的分析验证来还原漏刻科参与的皇家园林营建工作。研究目的是为了总结漏刻科为皇家园林相度的方法,从而探究皇家园林中的堪舆文化。漏刻科参与到皇家园林
烟草暴露是绝大多数肺癌发生的原因,然而很多从未吸过烟的人也会患有肺癌,而且环境中的烟草烟雾诱发的分子突变很难评估,因此准确获得由烟草诱导引起的分子变异程度至关重要。肿瘤突变负荷(TMB)和肿瘤分子突变替代模式是两个与吸烟最为相关的分子特征,我们结合二者开发并验证了一种定量方法来评估与烟草相关的分子损伤程度,把最大熵算法分类建模获得的分类器预测值定义为F分数。F分数值大于零表明样本有明显的与烟草相关
人眼角膜,控制了视觉系统70%的屈光能力,呈现出透明、连续非均匀、各向异性和多级复合的软薄壳结构。人眼角膜解剖微结构和生物力学行为,直接影响视觉质量。随着角膜屈光手术日益普及,角膜胶原交联术治疗、角膜损伤缝合、角膜移植术等,都需要对角膜组织生物力学性能的精确表征。本文以青年近视患者飞秒激光小切口角膜基质透镜取出术(SMILE)后的角膜基质透镜为试样,探究角膜前中央基质层的超弹性力学模型及其性能分布
恶性肿瘤是人类健康的杀手之一,目前恶性肿瘤的死亡率仍旧很高。三阴性乳腺癌、结肠腺癌、卵巢癌和多形性胶质母细胞瘤是四种常见的恶性肿瘤。这四种恶性肿瘤都存在难治愈,易复发等特点,它们在早期诊断、治疗和预后中面临重大挑战。目前这四种恶性肿瘤发生的相关基因和分子机制仍存在大量未知,因此,对这些恶性肿瘤相关基因的研究对于肿瘤的治疗具有重要意义。本研究中的基因表达谱数据来源于NCBI的数据库GEO。使用最大相
镁合金力学性能与人体骨相近,具有良好的生物降解性和生物相容性,是医用植入材料的理想选择。但是镁合金容易在人体环境中被腐蚀,极易与氯离子发生反应很快失去机械完整性,不能在损伤组织愈合期间提供有效的力学支撑作用。因此,本课题对AZ31镁合金进行表面改性,使其在保持优异力学性能的基础上提高长期耐腐蚀性能,进而满足生物植入材料的要求。本文采用水热法在碱处理的镁合金上制备均匀致密的羟基磷灰石涂层。研究水热温
在人体无创血糖测量中,被测皮肤的状态可能发生随机变化,这会造成皮肤光学参数的改变,并最终导致血糖测量结果出现偏差。皮肤的这些随机变化往往是不可控的、难以避免的,因此实际测量中会造成较大的测量误差。本文拟发展一种自适应的血糖测量校正方法,它可以监测皮肤的漫反射光谱及其变化,并据此获得血糖测量值的校正系数,修正测量结果。该研究对于无创血糖测量的技术的实际应用与发展具有重要的意义。本文的主要研究内容如下
主动脉夹层是一种发病急、进展快、死亡率极高的心血管疾病。近年来胸主动脉腔内修复术以其微创、恢复快、高效、安全性高等优点成为治疗的首选。当夹层破口邻近重要分支动脉时,传统覆膜支架的使用严重受限。多层叠放裸支架是一种新型治疗方法,其治疗原理为:在封堵夹层破口的同时,保持分支动脉的畅通。通过促进假腔血栓形成,降低主动脉假腔破裂的风险。然而,临床研究表明术后假腔完全血栓化率不高,治疗效果并不理想。其背后是