基于统计的基因识别问题及其算法研究

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:ken_200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因识别的主要手段是基于活的细胞或生物的实验。通过对若干种不同基因的同源重组的速率的统计分析,我们能够获知它们在染色体上的顺序。若进行大量类似的分析,我们可以确定各个基因的大致位置。然而,由于人类已经获得了巨大数量的基因组信息,依靠较慢的实验分析已不能满足基因识别的需要。随着计算机技术的发展,利用计算机算法识别基因逐渐成为基因识别的主要手段。  在面对大量复杂的基因序列数据时,怎样更好更快捷地获取准确的基因遗传信息,怎样在大量的基因序列数据中成功计算功率谱和信噪比,如何快速实现基因识别,具有重要的现实意义和应用价值。本文将通过多元统计分析的相关方法研究基因特征提取和基因识别,建立基因特征提取、基因识别的数学模型,并通过计算机手段进行实现。  本文首先通过信号处理方法,采用Voss映射、Z-curve映射,把抽象的符号序列映射成数值序列,并绘制出频谱图,建立了功率谱和信噪比的快速计算方法;通过推导,得到了“Z-curve映射和Voss映射所获得的基因数据的功率谱和信噪比之间”均有倍数关系的结论,且其功率谱P的比例系数是4,信噪比R之间的比例系数是43;本文还建立了频谱和信噪比基因识别模型,并将其应用于基因突变数据研究,获得了相应的结论。
其他文献
关于图的特征值和图的结构之间的关系的研究是谱图理论的核心问题.给定一个阶数很大的图,能很快的准确得到这个图的信息将是很有必要的.一个最有效的方法是研究与图相关的不同
地震波的传播速度不仅是处理、解释地震数据的主要依据,而且其本身就是反映地下介质构造和岩性的重要数据。因此,求取地震波在地下传播的精确速度显得尤为重要。井间地震层析成
该文我们主要研究局部α(αεR)-次积分算子族及它对抽象Cauchy问题的应用.全文共分四个主要部分.第一章我们首先研究了局部α-次积分半群,并证明了它的一些基本性质.第二章
该文在因子分析和聚类分析这两种方法的基础上将它们结合起来,互相取长补短,得到一种新的多元统计分析方法_因子聚类法,解决它们各自存在的不足.并把这种方法应用到综合评价