二维二分表现型变量基因关联分析中若干统计方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:a13058002542
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基因与疾病的关联分析中,一个较普遍的做法是讨论单个疾病与基因的关系,实际上由于代表疾病的各种性状之间具有一些相关性以及基因本身的基因多效性,使得同时检验一些性状的基因关联性变得有意义,并且与考察单个性状相比具有更好的检验功效.在这个领域的研究中,不少学者研究的都是具有相关关系的定量性状或者定量性状与定性性状与基因的同时关联分析.本文单单讨论二元的二分表现型的基因关联分析,在三种模型下研究多个疾病与基因的关系.第一种模型是传统的logistic回归模型,在考虑单个定性性状和基因的关系基础上,通过联立得分函数构造检验统计量完成多个性状与单个基因的关联检测;第二种模型假定存在与定性性状相关的潜在的连续型变量,使得定性变量的取值由连续型变量决定,通过讨论该连续型变量与基因的关系来研究定性变量与基因的关系,由于这些连续型变量的相关性使得同时关联检测比单个关联检测有意义的多.第三种模型基于条件分布的概念,假设多个定性性状的某一个性状与其余性状和基因一起具有logistic线性关系,这样多个性状的概率分布可以方便给出,从而大大简化模型,提高检验功效.  文章的第一部分介绍基因关联检测的研究背景和研究意义,并给出已有的参考文献中关于基因关联检测的检验方法,分别从基因位点和性状两个方面出发介绍;文章的第二部分考察两个二分变量和单个基因的同时关联分析,提出了三种模型,并在每种模型下都给出检验方法,理论上证明了这些方法的合理性并给出检验统计量;文章的第三部分通过计算机模拟分别验证三种检验方法是否能控制第一类错误,并比较在不同的数值模拟参数下三种检验方法的检验功效,给出三种检验方法的优劣;文章的第四部分对模拟结果进行分析,给出结论:三种检验模型中潜在正态模型的检验功效最高但可操作性不大,条件线性模型功效次之,但当人群中只患某种疾病的概率远小于同时患两种疾病的概率时条件线性模型是最佳的选择.在解决一般的二维二分表现型变量是否与特定基因相关时我们可以用logistic回归模型,当两种疾病有较明显的相关性时可以用条件logistic回归模型进行假设检验.
其他文献
全息数据存储系统很久已有大存储容量、短存取时间和高数据传输率的希望。诸如铌酸锂(LiNbO3)之类光折变材料可在适中激光功率下用于全息图记录(图1)。图1 数字全息记录光装
基因芯片可以快速检测成千上万条基因,从而对生物细胞基因水平做出一个全面的认识。近年来,越来越多学者将基因芯片技术应用到肿瘤与癌症的研究中。针对维数高、样本数量少的微
对于整数r,如下定义pr(n):  ∞∑n=0pr(n)qn=∞Πn=1(1-qn)r.研究pr(n)是有意义的.例如,当r=-1时,我们得到经典的拆分恒等式  ∞∑n=0p-1(n)qn=∞Πn1/1-qn.当r=1时,我们得到Euler
自Stefan在十九世纪末对移动边界问题开始研究以来,经过了一百多年各国学者的共同努力,已经取得了许多成果,但是它的应用潜力还是无限的,例如对新型材料的开发和研究.在本篇论文
自从1832年法拉第第一次提出了磁流体动力学(Magnetohydro Dynamic,MHD)问题以来,磁流体动力学的理论研究被国内外诸多学者所研究[1-49]。作为流体力学一个重要的分支,磁流体动
系统发生学是一门研究生物进化规律和物种间遗传关系的学科,利用系统演化树来描述自然界中物种之间遗传关系,得到了较为广泛的关注和研究.用图论的方法研究系统发生学的问题,一
间断有限元方法集合了高分辨率有限差分方法和有限体积方法的优点,它是采用完全分片的多项式空间对近似解和试验函数进行空间离散,使用Runge-kutta方法进行时间分解的有限元方
本篇硕士毕业论文由五部分构成.第一章为预备知识,简要介绍了文中所讨论的Sobolev方程在数学物理问题中的实际应用,混合有限体积元的研究背景及其应用。第二章主要引入了扩展混
本文,我们考虑下面平均场倒向随机微分方程。Yt=ξ+∫TtE[f(s,Ys,Ys,Zs)]ds-∫TtZsdWs,0≤t≤T.  2009年,Buckdahn,Djehiche,Li和Peng引入一种新型的倒向随机微分方程,他们将之命名为
本文考虑了一类来自多元线性回归的维数减少和系数估计问题.经过转化,该问题可以变为一类带核范数约束的矩阵优化问题,然后利用非精确的部分迫近点算法对此问题进行求解.在算法