论文部分内容阅读
基因识别的主要手段是基于活的细胞或生物的实验。通过对若干种不同基因的同源重组的速率的统计分析,我们能够获知它们在染色体上的顺序。若进行大量类似的分析,我们可以确定各个基因的大致位置。然而,由于人类已经获得了巨大数量的基因组信息,依靠较慢的实验分析已不能满足基因识别的需要。随着计算机技术的发展,利用计算机算法识别基因逐渐成为基因识别的主要手段。 在面对大量复杂的基因序列数据时,怎样更好更快捷地获取准确的基因遗传信息,怎样在大量的基因序列数据中成功计算功率谱和信噪比,如何快速实现基因识别,具有重要的现实意义和应用价值。本文将通过多元统计分析的相关方法研究基因特征提取和基因识别,建立基因特征提取、基因识别的数学模型,并通过计算机手段进行实现。 本文首先通过信号处理方法,采用Voss映射、Z-curve映射,把抽象的符号序列映射成数值序列,并绘制出频谱图,建立了功率谱和信噪比的快速计算方法;通过推导,得到了“Z-curve映射和Voss映射所获得的基因数据的功率谱和信噪比之间”均有倍数关系的结论,且其功率谱P的比例系数是4,信噪比R之间的比例系数是43;本文还建立了频谱和信噪比基因识别模型,并将其应用于基因突变数据研究,获得了相应的结论。