基于新型表达模式的序列特征获取方法及应用研究

来源 :湖南大学 | 被引量 : 4次 | 上传用户:Taosnowball
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来由于高通量基因组和蛋白质组技术的飞速进步,数量巨大的核苷酸和蛋白质序列数据被收集整理,并通过信息技术储存在多个相关的生物信息数据库中,通过何种方式从这些数据中挖掘与核苷酸和蛋白质相关的结构、功能等相关信息是当下生物信息学将要突破的重点和热点。核苷酸序列和蛋白质序列蕴含着生物密码中最根源的信息,通过比较不同物种的核苷酸序列,我们可以得到它们的相似性,进而可以推断物种之间的系统发育关系。亚细胞的位置直接关系到蛋白质的功能,蛋白质也只有在特定亚细胞定位下才能发挥作用,作为研究蛋白质功能的基础,亚细胞定位是研究蛋白质功能的重要信息源。蛋白翻译后修饰能发生在蛋白生命周期中的任何一个关键步骤,基于序列来分析蛋白质以及他们的翻译后修饰对于人类现在常见的心脏病、癌症、神经性退行性疾病和糖尿病的研究有重要作用。随着生物数据数量的激增,相关的研究完全依靠生物实验方法验证几乎不可能实现,只有结合分子生物学、免疫学、细胞生物学等传统生物学科,进而发展信息科学方法来进行相关领域的研究势在必行。本文中,以真实的DNA序列和蛋白质序列数据作为研究对象,针对序列的特征提取方法展开讨论,并结合机器学习方法展开DNA序列的相似性分析和基于蛋白质序列的翻译后修饰和亚细胞定位相关分析和研究。主要研究工作如下:(1)基于基因的四个分类将DNA一级序列转化为“结构图”,文中通过考虑三组分类的性质,并改进距离矩阵的分子拓扑指数,提出了 DNA序列的图形编码。然后我们将DNA序列转化为六种图形结构的六个分子拓扑指数。通过欧氏距离计算相似度,我们对11种物种进行了相似性分析。从这些相似性可以揭示同源性总体上与进化关系一致,其实验结果也符合生物物种的进化规律。我们的方法优势在于序列的图形不变量很容易计算,并可以应用于比较DNA序列,而不是字符串序列本身。(2)文中通过提出一种基于费马螺旋曲线的DNA序列新型图形表达方法,准确地进行了各物种基因之间的相似度分析。首先,该方法在保留序列原始位置信息的前提下,利用费马螺旋线将基因序列图形化。然后,利用原始基因序列中相邻碱基间的局部位置关系,按照特定的方法计算出其对应的质量,再分别将其赋予每个费马螺旋线中的点,由此便组成包含各个质点的费马螺旋线。随后计算费马螺旋线的归一化惯性矩作为DNA序列的数值化表示,并将其应用于不同物种的β-球蛋白基因上的相似度分析之中。(3)本文基于遗传密码子的分布提出了一种蛋白质序列3D图形表达方法,该方法从核苷酸三联体中寻求20种氨基酸在三维空间中的分布特征,以此构建蛋白质序列的3D图形,并将其应用在生物序列的进化树构建上。接着文中给出了一种新的循环距离计算方法,这种方法可用于计算不同长度序列间的距离而不用借助特征矩阵,省去了构建矩阵的过程,随后将其应用于凋亡蛋白质亚细胞定位中。实验结果表明了该方法与某些机器学习方法相比都具有一定优势。而且,该方法并不需要计算矩阵,也不需要机器学习过程,计算简单,易于实现。(4)蛋白质丙二酰化是一种新发现的蛋白质翻译后修饰,由于实验技术的局限性,如何快速准确地鉴定丙二酰化位点是一个巨大挑战。本文提出了一种基于伪氨基酸组成的赖氨酸丙二酰化位点预测方法。首先,提出一种提取蛋白质片段的计算方法,该方法使得赖氨酸位于每个片段的中心。接着,对这些片段使用基于伪氨基酸组成的方法提取序列特征。然后通过使用支持向量机来识别非丙二酰化位点与丙二酰化位点。实验中我们成功确定了给定的160个丙二酰化位点中的144个位点。此外,本文中关于丙二酰化和非丙二酰化片段之间的差异分析说明了赖氨酸丙二酰化遵循着特定模式,因此,本文所提出的方法将有望发展为鉴定丙二酰化位点的工具。
其他文献
政策落实情况跟踪审计作为国家审计最重要的任务之一,对充分发挥审计在党和国家监督体系中的作用、实现国家良好治理至关重要。然而,由于执行偏差,目前我国政策措施落实情况跟踪审计仍有很多问题亟待解决。本文在分析梳理审计署政策跟踪审计结果公告的基础上,结合政策落实情况跟踪审计现状,分析问题并尝试提出改善政策落实情况跟踪审计的对策,以期达到审计目标,促进经济增长,改善民生,实现国家良治。
为解决重载停车时采用普通制动器制动容易产生飞车或滚料、胶带打滑甚至发生胶带断带、减速机齿轮损坏以及断轴等恶性机械事故,通过对煤矿下运带式输送机特殊运行工况及各种软制动方式进行分析,提出采用盘式制动装置解决下运带式输送机安全软制动方案。应用表明该方案能解决下运带式输送机安全软制动的技术难题。
党的十九届六中全会审议通过的《中共中央关于党的百年奋斗重大成就和历史经验的决议》,在评价习近平新时代中国特色社会主义思想的历史地位时,提出“实现了马克思主义中国化新的飞跃”的重要判断。马克思主义中国化新飞跃是如何实现的?概而言之,理论形成机制的突破、理论主题的拓展、理论内涵的扩充、独立理论形态的形成、理论地位的提升,是新时代马克思主义中国化实现新飞跃的内在逻辑。
非线性现象是自然与社会的本质状态之一。而混沌作为非线性动力学的分支之一,其揭示了自然与社会的普遍存在的确定性与随机性、不可预测性的统一。研究非线性动力学有助于我们更深刻认识其本质,加以控制及应用。近年来,混沌系统在保密通信、信号处理、物理学、生物学等学科中广泛应用。同时,分数阶混沌系统有着比整数阶混沌系统更加符合工程实际,而引起了更多关注。本文从非线性动力学角度入手,探讨了几个新的混沌模型的构成机
评审专家点评《鄂温克的驼鹿》是一本儿童文学作品,一般来说,儿童文学的审读报告较难出彩。这篇审读报告之所以能在众多审读报告中入选,除了该审读报告的要素比较齐全外,不仅对读者定位、本书内容、作者情况作了较为清晰的介绍,还从该书出版的文化价值、艺术价值、应用价值和市场价值等四个方面做了详细而具有充分说服力的论证,对后续环节了解该书的整体面貌和出版价值具有很好的参考意义,也为宣传推广提供了可供借鉴的
期刊
我国经济进入新常态,各企业的发展环境也在发生巨大的变化,在这个过程中,企业要不断地进行自我提升,从而提高竞争力。人力资源管理是现代企业管理的核心内容,在提升企业生产效率和市场竞争力的过程中发挥重要的作用。但是,当前阶段的企业人力资源管理仍存在一定的问题,本文针对企业人力资源管理中存在的问题提出了相应的改进措施,以供参考。
扶贫工作的主要问题就是政策和执行上出现了很大的偏差,政策落实不到位,无法达到理想效果。本文从农村镇域精准扶贫政策执行的执行主体、目标群体和执行策略三方面入手,结合精准扶贫政策实施过程中存在的不足之处进行深入探究,厘清了我国农村精准扶贫政策执行的影响因素,最后针对性地提出了精准扶贫政策执行的对策建议。
党的十八大以来,习近平总书记坚持以大历史观来审视和定义中共党史,形成了其独具理论特色的"大党史观"。习近平党史观有其内在的理论渊源、文化底蕴与现实指向。从理论渊源上看,马克思主义大历史观是其最深厚的理论基石,中共历届领导人党史观是其直接理论来源。从历史文化底蕴上看,它传承发展了中华民族五千年来"求真""通变""经世致用"的优秀史学文化。从现实指向上看,它是立足世情国情党情的大变化回答新时代坚持和发
在我国,可持续发展是一项基本国策,各个行业、各个企业都在朝着这个目标不懈努力、积极转型,面对经济结构与产业结构的调整升级现状,企业间的竞争已经更倾向人力资源竞争,开展有效的人力资源管理不仅是各个企业的重要任务,更是国家的宏观任务,且人力资源管理直接与经济可持续发展挂钩,所以,从经济可持续发展视角对人力资源管理加强关注、提高要求,可谓十分必要。本文就以"人力资源管理与经济可持续发展"为题展开深入探索