全基因组关联分析中荟萃回归方法的软件实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:mitsuaki
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全基因组关联分析(Genome-wide association study,GWAS)是遗传研究中的重要方法,旨在人类全基因组的范围内,寻找与疾病相关的变异。近些年来在对复杂疾病的研究中取得了广泛的进展,已经成为人类复杂疾病研究中的主要策略之一。荟萃分析是全基因组关联分析中重要的分析方法之一,它是通过收集多个研究的GWAS结果,将这些数据综合进行二次分析,从而实现更大的有效样本量,提高发现新关联的概率,可以解决单个研究样本量太小的问题。荟萃回归(Meta-regression,MR)方法是针对检验基因-环境交互作用的荟萃分析方法,是第一次将荟萃回归技术用于GWAS的基因-环境交互作用分析中。该方法通常分为两步。第一步:根据环境变量的统计分布将每个研究对象分成几组,在每组中估计单核苷酸多态性(Single nucleotide polymorphism,SNP)对复杂疾病或性状的主效应的点估计和对应的方差。第二步:把来自各研究以及各组的结果进行荟萃回归分析,计算出SNP以及SNP-环境交互作用的回归系数和协方差矩阵,从而进一步进行SNP-环境交互的统计检验。研究表明,该方法在存在交互作用时比仅对SNP的主效应进行荟萃分析具有更高的统计力,在存在线性交互作用时它与联合荟萃分析(joint meta-analysis,JMA)方法的统计力相当,在有混淆因素存在的情况下比JMA方法的稳健性更好。目前基于JMA算法的软件已被开发出来,并且应用在SNP-环境交互作用的分析中。但是MR方法尚没有软件实现,这阻碍了该方法在遗传研究中的推广普及以及应用。本课题在Linux操作系统下基于C++语言完成了对MR方法的软件实现。软件具备的基础功能如下:1.根据用户需求读取每个研究的分析结果文件以及每个研究的SNP量指标文件,2.根据缺失率,Hardy Weinberg平衡,最小等位基因频率,最小等位基因个数等质量控制指标对每个结果文件的SNP进行筛选,3.对SNP进行荟萃回归分析,包括交互作用检测,交互作用和主效应联合检测以及主效应检测,最终生成包含SNP基本信息、分析结果数据、样本量信息的分析结果文件。在实现基本功能的同时,该软件的内存损耗极低且具有较高的运行效率。本课题还对所实现的荟萃回归软件进行了广泛的功能测试和性能测试。功能测试主要通过使用测试数据和错误数据、使用不同选项和参数对软件的基本功能模块的中间结果和最终结果进行比对和验证,测试该软件的可靠性,鲁棒性以及可扩展性。性能测试采用了三个研究中的12组共有三千万个左右SNP的GWAS结果数据,对软件的所有功能进行了全面的测试。分析结果进一步与在通用统计计算软件SAS上的计算结果进行了对比验证,测试结果表明了我们的实现是一款高效精准的高性能软件。
其他文献
高动态图像和视频的获取及显示是近几年多媒体处理领域的热点问题。随着计算和显示技术的快速升级,人们对视频逼真度和细节还原质量的要求逐步提升,而高动态技术是还原自然场景的关键技术,因此受到了越来越多研究者的关注。基于多曝光图像融合的高动态成像技术,是在摄像设备和显示设备物理特性受限的条件下呈现高动态场景图像的有效方法。但目前的融合算法需要以多幅递增曝光时长的图像为输入源,通过融合不同图像在同一区域的像
城市道路交通作为城市化进程快速推进的结构化产物,机动车保有量的过度饱和发展及其引起的一系列交通拥堵问题已经对城市的进一步发展造成了不可忽视的影响。为了更好的解决交通拥堵问题,我国多个城市采取的主要方式是进行干线信号协调控制。然而干线信号协调控制的效果在运行中会受到交通流量、行驶速度、自然因素及人为因素等诸多因素的影响,上述因素的存在会不同程度地影响干线信号协调控制效果实现的可能性,即影响干线信号协
近些年来,国家加大力度发展农村地区,历年中央一号文件都把“三农”问题作为国家发展的重中之重,从党的十六届五中全会开始提出建设社会主义新农村,到十七大提出城乡社区共同体建设,再到十八大的美丽乡村建设,最后到现今的乡村振兴战略的提出,无不体现着国家对农村地区发展的重视。农村社区是农村社会治理的基本单元,农民社区作为农村最基本的单元,是每个农民日常生活和劳作的场所,是农民社区居民利益诉求和情感交流的主阵
经历近二十年的理论研究与实践探索,我国数字档案馆建设逐渐成熟。虽然建设时基本以开放档案信息系统(OAIS)为参考模型,但在技术实现、资源共享、互连互通等方面依然存在不协调、不相融的情形。究其原因,主要在于相关标准规范不健全或缺乏可操作性。我国数字档案馆标准规范的研究,对于数字档案馆建设加快进度,提高档案馆工作效率,保障数字档案馆信息资源的数量和质量,实现资源共享,推动电子档案单套制管理具有实践指导
高温合金作为高端的材料,在许多领域都有广泛的应用,特别是航空航天和能源电力领域。而NiAl材料有着高熔点、高温抗氧化性、抗腐蚀性和低密度等优秀的物理性能和化学性能,有着成为新高温材料的潜力,但是其室温韧性和塑性较差,成为该合金实用化的制约。本课题组在NiAl基础上加入V发现,其高温压缩、室温压缩和断裂韧性均有很大提高,所以在此基础上加入Dy来探究其微观组织演化和力学性能。本文拟对不同Dy含量的Ni
研究背景:非小细胞肺癌(non-small cell lung cancer,NSCLC)作为世界上发病率最高、死亡率最高的恶性肿瘤性疾病,尽管目前诊断、治疗的手段不断发展,但是5年生存率仅19.8%。非小细胞肺癌的发病过程中涉及了多种分子机制及多种环境等的危险因素。通过研究其相关分子通路的作用机制,有助于明确发病机制及发病过程,并且能为寻找新的诊断及治疗靶点和治疗途径提供一定的理论依据。有研究提
太平天国运动是中国历史上规模最大的一次农民起义,对于近代中国产生了深远的影响。1860年5月,太平军一举击破清江南大营。天王洪秀全命令忠王李秀成率军乘胜东征,开拓苏南,在此次行动中,隶属于苏州的常熟便成为了太平军的进攻目标。太平军一路势如破竹,连克丹阳、常州、无锡、苏州,继而略定苏南,建立了以苏州为中心的根据地苏福省。常熟是太平军在苏州地区最后攻克的一个城市,当他的近邻州县都已经被占领之时,常熟的
沙葱(Allium mongolicum Regel)是生长在荒漠、砂地和干旱山坡且深受内蒙古、新疆和宁夏等地人民喜爱的叶类蔬菜。由于含水量高、质地易受机械损伤等特点,沙葱采后容易出现干枯、萎蔫和腐烂等问题,导致其货架期较短,市场发展受到限制。故本研究以沙葱为研究对象,探究其采后生理特性和品质的变化,之后进一步研究了真空预冷、不同温度贮藏和气调包装对沙葱生理特性和品质变化的影响。其中,生理特性变化
我国正处在特高压电网的高速发展期,电网规模不断扩大,大停电事故给国民经济造成了极大的损失,严重威胁着现代社会的运行秩序。鉴于以往仿真模型都是单一沙堆模型,而电力系统
随着我国进入老龄化社会,独居老人数量不断增加,其孤独感问题十分普遍。但我国社会未对此给与充分关注,缺少缓解独居老人孤独感的应对措施。因此,寻找一种途径缓解独居老人孤