人类基因剪接供体位点识别的研究

来源 :北京工业大学 | 被引量 : 5次 | 上传用户:newcat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真核基因剪接位点识别问题是生物信息学中的重要问题之一。基因剪接尤其是前体 mRNA 的剪接是基因表达的一个重要途径,它影响着基因的构成,直接决定着蛋白质的选择与合成,也因此间接决定了生物体的性状和机体的功能。本文基于计算机技术和智能计算方法对人类基因供体位点序列特征及其位点识别问题进行了尝试性的研究,取得的主要研究成果如下: 1)本文建立了人类基因供体剪接位点数据库,并对其中的数据进行词频统计,分析了供体位点序列的特征及其特征碱基之间的互动关系。研究发现供体位点两侧的特征碱基的出现具有一定的规律性,当一侧的特征碱基缺失时,另一侧的特征碱基的出现概率则会大幅增加,反之亦然; 2)本文研究基因剪接位点识别的生物信息学方法,选用 BP 神经网络建模,对外显子和内含子与基因供体剪接的关系进行了分析。研究发现剪接位点区别于伪剪接位点的特征信息同时存在于剪接位点两侧一定范围内的外显子和内含子中,这可以大致的定量为 50 个碱基,且内含子相对于外显子包含了更多的特征信息; 3)本文提出了一种仅依靠特征碱基 motif 来识别供体剪接位点的算法,这种方法对正样本的识别率达到 83%以上,对负样本的识别率达到 90%以上,有力的证明了特征碱基对于基因剪接位点识别的作用。但所参考的考虑所有真实位点邻近碱基的 motif 方法对正样本的识别率可以达到90%以上,这也说明非特征碱基对于基因剪接具有一定的影响; 4)本文建立了基于学习矢量量化(LVQ)神经网络的供体剪接位点的识别模型,研究其用于剪接位点识别的效果及可行性,并对 LVQ 的两种训练算法LVQ1 和 LVQ2.1 下的识别效果进行了比较。实验证明这种方法能够用于基因剪接位点的识别。其中,LVQ1 对正样本的识别优于 BP 神经网络,LVQ2.1 对负样本的识别优于 BP 网络。 本课题得到了国家自然科学基金的支持。项目名称为-复杂系统意义下的生物信息学中若干问题研究。
其他文献
现场总线(Field Bus)是当今自动化领域技术发展的热点之一,被誉为自动化领域的计算机局域网.其作为工业数字通信网络的基础,沟通了生产过程现场级控制设备之间及其与更高控制
可穿戴计算是一种全新的计算技术,与传统的计算技术存在着很大的差别。它打破了传统的人机交互模式,使人和计算机更加紧密地结合在一起,提高了人的整体感知和计算能力。它提
该文结合青岛海信网络科技股份有限公司的研究与开发工作--国家"十五"科技攻关项目:智能交通系统关键技术开发和示范工程,研究了遗传算法在公交调度问题中的应用.随着经济的
近年来,随着高科技的发展和企业竞争压力的增加,企业信息化建设越来越受到人们的重视。为了更便捷地沟通企业与客户之间的联系,提高企业的工作效率,客户关系管理(CRM)和统一消息(UM
本文基于自动语音识别(ASR)的原理和过程,结合人工神经网络(ANN)的建模理论及特点,主要研究了隐含马尔可夫模型(HMM)与自组织神经网络(SONN)相结合的混合模型-HMMNN的原理及在语音识
近年来,随着电子、通讯和网络技术的迅猛发展,低压大电流输出的功率变换器日益成为一个重要的研究方向.变换器中采用传统的普通二极管或肖特基二级管整流方式,由于整流二极管
分布式计算机控制系统(DCS)已经广泛应用于各种工业领域的自动控制系统。DCS系统应用于教学将对自动化实验教学水平的提高具有非常现实的意义,本课题基于SUPCON JX-300X DCS系
世界范围内的电力改革正在逐步进行,解除管制后的独立发电商可通过采用竞价策略来取得最大利润.这样,研究发电商的市场竞价策略就成为发电商关注的课题.论文主要是基于供给函
随着生物技术的发展,生化发酵过程在国民经济中的地位越来越重要,但是由于发酵过程的复杂性,使得发酵过程优化控制存在着不少难题。本文以克拉维酸发酵过程为研究对象,对发酵过程
本文是围绕水蒸气蒸馏连续法生产松香和松节油过程中实现对蒸馏塔的控制问题而展开的。蒸馏塔是生产的核心,具有非线性、强耦合、多变量等特点,它的控制直接影响到产品的质量、