基于深度学习的蛋白质Khib修饰位点预测研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:luwei0415
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质翻译后修饰是指蛋白质合成后发生的化学变化。它可以影响蛋白质的结构、亲电性,控制蛋白质稳定性、定位等关键机制,并调节众多生物学功能。近年来,在不同物种中发现了赖氨酸2-羟基异丁酰化修饰(Lysine 2-hydroxyisobutyrylation,Khib)。进一步研究发现,Khib修饰具有多种生物学功能,参与不同的信号或代谢等通路,包括氨基酸的生物合成、碳代谢、糖酵解和转录等。为系统地了解其调控机制,识别Khib修饰位点是关键步骤。目前在五个不同物种(即人类(Homo sapiens)、水稻(Oryza sativa)、弓形虫(Toxoplasma gondii)、小立碗藓(Physcomitrella patens)和酿酒酵母(Saccharomyces cerevisiae))上,通过Khib特异性抗体结合质谱检测技术发现了成千上万个Khib修饰位点。例如,在小立碗藓上发现了11,976个位点,在水稻中发现了9,916个位点。但是,目前已经开发出两个传统的机器学习预测器(预测器i Lys-Khib针对人类数据集、Khibpred针对除弓形虫外其他四个物种数据集)。为了进一步提高预测算法准确性、覆盖更多的物种,本文分析并开发了一种高效且通用的Khib修饰位点预测模型,涉及的探讨与分析包括以下四点:(1)构建Khib修饰数据集。检索并收集生化实验数据,通过一系列数据清洗构建标准非冗余数据集。(2)Khib修饰序列的特征提取与选择。基于不同的特征编码构建了9个分类器来识别Khib修饰位点。实验结果表明,在传统机器学习中,EAAC编码、EGAAC编码以及ZSCALE三种特征组合后的编码,有效提高了传统的机器学习算法的预测性能。在深度学习算法中,基于独热编码的卷积神经网络算法展示出对Khib修饰位点预测的最优性能和鲁棒性,并且深度学习算法性能均优于传统的机器学习算法。(3)构建第一个基于深度学习的跨物种Khib修饰位点预测模型,命名为DeepKhib。首先分析不同物种的序列特点,比较基于特定物种数据训练所构建的模型和基于全部物种数据训练所构建的模型间的差异,保留了四个特定物种预测模型和一个多物种通用预测模型。其次,将DeepKhib与已发表的模型(i Lys-Khib和Khibpred)进行比较,探讨DeepKhib的优势。(4)把DeepKhib开发成在线预测网站。
其他文献
目的:研究核糖体蛋白L29(Ribosomal Protein L29,RPL29)在人舌鳞状细胞癌(简称舌鳞癌)中的表达及意义。方法:从青岛市市立医院的口腔颌面外科收集52例舌鳞癌患者的肿瘤与癌旁组织标本。利用免疫组化SP技术对组织标本中的RPL29蛋白表达量进行检测,并分析其表达与病理分级、T分期、淋巴结转移情况、性别、年龄、饮酒和吸烟史之间的关系。用特异性RPL29-siRNA干扰舌鳞癌CA
目的:探究程序性细胞死亡配体1(programmed cell death-ligand 1,PD-L1)在甲状腺髓样癌(medullary thyroid carcinoma,MTC)中的临床意义及其异常表达对甲状腺髓样癌TT细胞迁移、侵袭和增殖能力的影响,并探究PD-L1与信号转导与转录激活因子3(signal transducer and activator of transcription
目的:非小细胞肺癌是我国最常见的恶性肿瘤之一,早期诊断对于非小细胞肺癌患者的治疗及预后有着极其重要的意义。液体活检重要组成部分的CTC(circulating tumor cell,循环肿瘤细胞)检测在NSCLC(non-small cell lung cancer,非小细胞肺癌)患者的预后评估和治疗干预方面具有重要价值。2010年,CTC分析被写入美国癌症联合委员会(AJCC,American
背景:膀胱癌是一种常见的对人类健康造成严重威胁的泌尿生殖系统的恶性肿瘤,而且,近年来发病率有增高的趋势。膀胱癌作为全球排名第9常见的癌症,同时也在男性肿瘤的发病率中排名第7,发病率约占所有癌症的4.7%。据统计,全年约有43万余粒新发病例,同时因膀胱癌而死亡的病人每年约16.5万,在所有新发病例中男性患者占75%,但是据统计,女性患者的死亡率更高。分子生物学技术正在高速发展,许多种与膀胱癌发病和进
目的:分析因宫颈高级别上皮内病变(High-grade squamous intraepithelial lesion,HSIL)行冷刀锥切术(Cold knife conization,CKC)或环形电切术(Loop electrosurgical excision procedure,LEEP)后切缘阳性患者采用不同临床处理措施后疾病的预后及转归情况,探讨切缘阳性患者的分层管理方式。方法:回顾
目的探讨激活转录因子3(Activating Transcription Factor 3,ATF3)与弥漫性大B细胞淋巴瘤(Diffuse Large B-cell Lymphoma,DLBCL)患者临床病理学特征及预后之间的关系;探讨ATF3对DLBCL细胞增殖能力的影响以及不同ATF3表达水平对DLBCL细胞药物敏感性的影响,及其可能的分子机制。方法应用免疫组织化学染色方法检测119例DLB
目的:乳腺癌内乳淋巴结的复发转移与原发肿瘤的部位联系密切,多项研究发现内乳淋巴结的放疗增加了患者的生存获益,同时也不可避免的带来了心脏毒性和肺的损伤。位于内象限或中央区的乳腺癌患者是否更加需要内乳淋巴结放疗是目前研究的热点。本研究通过分析Ⅰ-Ⅲ期位于内侧象限或中央区的乳腺癌内乳淋巴结复发转移的风险因素,以期对内乳淋巴结高复发转移风险的乳腺癌患者进行提前干预,最终延长患者的无病生存期、提高患者的生存
目的分析Ph+慢性髓性白血病(CML)患者不同时期骨髓细胞染色体核型的分布特点,并探讨不同类型的染色体核型与疾病预后的相关性。方法采用回顾性研究方法,选取2009年1月~2019年1月在青大附院诊断为Ph+的慢性髓性白血病患者351例作为研究对象,其中慢性期317例、加速期12例、急变期22例。所有研究对象均多次进行骨髓染色体培养,并采用R显带技术进行染色体核型检测分析,采用Kaplan-Meie
空压站是公用工程中常见的动力系统,耗费了大量的电能,同时也存在一定程度的电能浪费。空压站的常规节能方式主要是安装变频器。即使在常规节能方式实施后,空压站仍有较大的节能空间——也就是本文优化节能技术的实施空间。优化节能是继管理节能、设备节能与工艺节能之后的新一代节能技术,即利用人工智能算法对多设备在负载可变的条件下进行能耗优化的技术。在优化节能的方法中,有多种因素可影响节能效果,如工艺、设备、控制系
目的:探讨细胞周期蛋白A1(CyclinA1)、三磷酸腺苷酶家族蛋白2(ATPase family AAA domain containing 2,ATAD2)在胃不同上皮性病变中的表达情况,尤其是探讨两者单独或联合表达在辅助鉴别胃粘膜高级别上皮内瘤变与高分化胃腺癌中的临床应用价值;同时探讨两者在进展期胃腺癌患者中的表达与临床病理特征和预后的关系。方法:运用免疫组织化学(immunohistoch