外膜蛋白序列和结构辨识相关问题研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:lingqiuyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质组学是生物信息学的主要研究领域之一。膜蛋白作为被广泛利用的药物靶,是蛋白质组学的重要研究对象。膜蛋白家族中的外膜蛋白,定位于革兰氏阴性细菌、叶绿体和线粒体的外膜,折叠成桶状的跨膜结构,是两类主要的跨膜蛋白之一。外膜蛋白与革兰氏阴性细菌致病性和免疫功能密切相关,是极具研究价值的药物靶,并且参与非特异性调控、物质运输和选择性离子通道形成等物理化学过程。本文以外膜蛋白生物信息学研究为主题,通过对蛋白质序列编码方法、分类算法、结构预测模型的改进和创新,来提高外膜蛋白序列、结构辨识水平,并解决与此相关的部分问题。论文主要研究内容和创新点如下:(1)外膜蛋白序列辨识和基因组挖掘方法研究研究从其它蛋白质折叠类型中辨识外膜蛋白的方法,主要目的是:应用于基因组内挖掘新的外膜蛋白及其对应的编码基因;为序列分析和结构预测积累新的数据。本文利用分散量理论,提出了基于最小分散增量的外膜蛋白序列辨识方法,并进一步改进为多分散增量预测结果加权投票预测方法。该方法为蛋白质序列辨识提供了易实现和易推广到多类问题的新手段。此外,为满足基因组挖掘外膜蛋白的需要,提出了蛋白质序列多种联合特征编码方法,在联合特征中引入加权的氨基酸指数相关系数特征,并将优选的特征编码方法和支持向量机分类算法结合来建立分类器。无论是数据集上测试还是基因组内挖掘,该方法都达到了目前最好的预测水平,成为有效的外膜蛋白挖掘工具。此外,文章还利用特征选择技术分析了高维联合特征的优化问题,采用过滤方法筛选有效的特征子集,提高了计算速度乃至预测效果。(2)多类蛋白质分类算法研究支持向量机是具备优异泛化性能的机器学习技术,但是没有很好地解决多类分类问题,存在诸如分类盲区、误差累积等缺点。模糊支持向量机的出现为改进这些缺点提供了新手段。本文采用基于样本紧密度的模糊隶属度计算方法,并同时计算样本作为正例和作为反例的双份误差,重构了支持向量机的最优分类面,建立了“一对一”方式和有向图方式的双向模糊分类器。在解决膜蛋白分类问题时,该分类算法降低了对孤立点和噪声点的敏感性,一定程度上改善了分类效果,是模糊多类支持向量机的新发展。(3)外膜蛋白信号肽和拓扑结构联合预测方法研究跨膜蛋白拓扑结构预测的意义在于:一是提供从二级结构推测其三级结构的模型框架;二是有利于对二级和三级结构进行修正。现有的外膜蛋白拓扑预测方法,在应用于前体序列预测时,没有提供预测信号肽的功能,并且由于信号肽的影响,拓扑预测性能会下降。本文应用隐Markov模型理论,建立了外膜蛋白前体序列信号肽和拓扑结构联合预测模型,使得在模型中信号肽成为拓扑结构的一部分,并利用最新的知识优化模型结构。该预测模型具备了目前最好的外膜蛋白拓扑预测性能,并成为集信号肽剪切位点预测、拓扑预测和序列辨识功能于一体的便利工具。(4)跨膜蛋白亚细胞定位预测方法研究现有的大部分蛋白质亚细胞定位预测方法,针对水溶性蛋白的特性而设计,不能有效预测跨膜蛋白的亚细胞位置。而基于隐Markov模型的拓扑结构预测方法,虽然利用了跨膜拓扑信息,但是没有提供亚细胞定位预测功能。本文对跨膜蛋白拓扑预测模型进行改造,使之成为亚细胞定位预测工具,在预测细胞分泌路径上跨膜蛋白的亚细胞位置时,具有显著高于普通预测方法的性能,填补了跨膜蛋白亚细胞定位预测的空白,并且为拓扑预测器开辟了新的应用方向。(5)调控外膜蛋白的非编码小RNA预测方法研究非编码小RNA预测是具有重大生物学价值的难点问题。目前还没有专门预测调控某一类蛋白质的非编码小RNA的方法。本文提出了主成分分析-神经网络预测模型。该模型通过主成分分析去除特征相关、降低特征维数,改善了神经网络预测器的性能,成为辨识细菌非编码小RNA的有效工具;此外,考虑到碱基配对是非编码小RNA与外膜蛋白mRNA作用的主要方式,设计了两级筛选系统预测调控外膜蛋白的非编码小RNA。该系统通过碱基配对打分函数来搜索基因组内与已知外膜蛋白mRNA以高分值进行配对的非编码区域,然后利用主成分分析-神经网络预测模型过滤搜索结果中的大部分冗余。其优点是可以降低实验筛选的成本,并提供少冗余的实验对象。
其他文献
目的:本文基于对现代中医药治疗痰瘀互结证的病案总结与归纳,利用软件挖掘用药规律,并结合主要药物的性味归经总结痰瘀互结证的特点,从而为临床用药及科研工作提供依据。研究
本文首先梳理语文朗读教学的历史沿革和相关概念,通过实习和问卷调查等形式了解目前高中语文朗读教学的实施状况。在此基础上,针对目前朗读教学的不足之处,提出实行高中语文朗读教学的总体性策略,并根据不同文体类型,提出了相应的实施策略。高中语文朗读教学的基本策略。首先在导入部分,运用“知人论世”或多媒体等各种方式引导学生快速走进文本。其次,在朗读教学的主体部分,以朗读为线,串联课堂教学的各个环节,在多次朗读
运输毒品罪作为我国毒品类犯罪的一种,我国《刑法》并未对其单独定罪,而是将其与走私、贩卖、制造毒品罪一起规定为选择性罪名,并适用同一幅度法定刑,且最高刑罚为死刑。从主
激光诱导击穿光谱(Laser-induced Breakdown Spectroscopy,LIBS)技术作为一种新兴的原子发射光谱技术,是近年来光谱分析领域的研究热点之一。LIBS具有原位检测、准无损检测、
<正>11月17日,备受市场关注的"大资管"管理办法面世。中国人民银行、银监会、证监会、保监会、外管局联合发布的《关于规范金融机构资产管理业务的指导意见(征求意见稿)》,主
各个国家、各个民族都有各自不同的文化,也存在着各不相同的文化资源。文化资源对于一个国家和民族来说不仅是文化生产的重要来源,同时也是记载这个国家和民族历史的活字典,
目的分析耳穴疗法研究领域的经典文献、重要作者和期刊分布,挖掘该领域的研究热点。方法基于Web of Science数据库,应用Hist Cite分析工具及文献计量学方法,检索自数据库建库
近些年来通过电化学方法转化CO2(CO2ER)为可利用能源越来越受到人们的关注。通过电化学方法将CO2转化为CO、甲醇、甲酸等可利用的化学品,在提供了较清洁能源的同时也缓解了 C
根据市场对花卉和花苗制钵机的需求,在分析营养钵装料机工作原理的基础上,结合花卉育苗的农艺要求和新式营养钵装料机工序,通过设计营养土的填入机构,使其可以定时、定容、准
将碳纤维增强复合材料(carbon fiber reinforced polymer,CFRP)编织成正交网格,并经环氧树脂胶固化形成受力骨架,代替钢筋混凝土梁中的钢筋,以解决普通钢筋混凝土中钢筋易锈