最大期望算法在家系单体型频率估计中的应用

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:jqk1981fjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
精确的单体型频率可为疾病基因的定位、影响标记间相关性因素的发现以及人类进化、复杂疾病中两个或更多基因间的顺式相互作用提供重要信息和依据。本文将核心家庭中用最大期望(Expectation Maximization,EM)算法估计单体型频率的方法推广到一般家系结构中。具体内容如下:  家系中的每个非始祖个体都是一个确定的三元家庭的后代,以该成员所在三元家庭为单位,根据孩子在每个位点上的两个等位基因一个来自父亲,一个来自母亲,推断家系中每个个体的缺失等位基因和有序基因型。  基于每个核心家庭中始祖个数的多少,将家系中的核心家庭分为三类:始祖家庭、半始祖家庭和非始祖家庭。家系中的非始祖家庭仅用于推断家系成员的单体型结构。本文对家系中的始祖家庭和半始祖家庭用EM算法得到家系中估计单体型频率的迭代公式,给出了在缺失未定相的家系数据中估计家系单体型频率的EM算法。  为了评估家系中估计单体型频率的EM算法的准确性,我们基于真实的Hutterite家系结构和随机家系结构分别产生了1000个仿真家系数据。针对这些仿真家系数据,分别比较了Naive方法、Merlin方法、仅在核心家庭使用EM算法和本文的家系数据中EM算法估计单体型频率的标准差和均方误差。大量仿真结果表明:我们在家系中估计单体型频率的EM算法准确性要优于Naive方法、Merlin方法和核心家庭中EM算法估计单体型频率的准确性。
其他文献
本文主要从事两方面的研究工作:一类新混沌系统的控制及其同步问题;推广Liénard系统的混沌控制问题。具体内容如下: 第一章简要介绍了混沌理论的发展历史与现状,重点介绍了混
在这篇论文里,我们研究了几类最优控制问题并且给出了求其最优解的一般算法。在第一章里,我们给出了本文所要讨论的问题。同时,简要回顾了最优控制问题研究现状,以及本文所要讨论
融资结构和控制权安排是现代企业制度的重要组成部分,对现代企业的经营有着及其重要的作用。本文借助企业契约理论和数学模型来研究现代企业最优融资结构和最优控制权安排。
t-设计的构造是组合设计理论中的重要问题,有着重要的理论意义和实际应用背景. t-设计的理论与方法在数理统计、运筹学、信息论和计算机科学中都有着重要的地位.目前有关 2-
在旋转微平行管道内,本文研究了两不相容流体的电渗流问题.通过使用线性泊松玻尔兹曼(Poisson-Boltzmann)方程考虑了双电层(EDL)的电势分布.根据电荷密度分布和在旋转框架内
无线Ad hoc网络是由一组带有无线收发器的移动终端相互协作形成的一种新型网络,在无线通信领域中占有极其重要的地位。因其容易构建、支持用户移动性的特点,使得它在实际生活中
聚类分析是研究在没有训练集的情况下对样品进行分类的多元统计和数据分析方法。利用聚类分析方法对给定数据进行分类时,所采用的样品并不知道其所属类型,而根据样品间的“相似