次要等位基因频率筛选阈值对人类单体型图精度的影响:基于中国汉族与藏族人群测序数据的比较

来源 :科学通报 | 被引量 : 0次 | 上传用户:gny637259
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因组变异是个体间疾病易感性和药物反应等表型多样性的遗传基础.国际人类单体型图(International HapMap)旨在为复杂疾病相关遗传变异的研究提供路线图.单核苷酸多态性(SNPs)是HapMap的基本要素.SNPs等位基因频率影响连锁不平衡结构、单体型的构建、标签SNPs的筛选,是影响HapMap精度的主要因素之一.因此,次要等位基因频率筛选阈值的选择对图谱精度有深远影响.迄今大多数研究者选用自定的阈值,且鲜有针对次要等位基因频率筛选阈值对HapMap精度影响的研究.为探讨次要等位基因频率筛选阈值对相应HapMap精度的影响,本研究用中国汉、藏族人群15号染色体中心粒区域基因的测序结果按不同次要等位基因频率筛选阈值(≥0.01,≥0.05,≥0.10)将以往的数据分成了3组,即0.01组、0.05组以及0.10组,分别构建了3组数据的HapMap,并比较了各组HapMap精度、关联分析的研究效能及节约/总成本比值.结果显示,0.01组有最高的关联分析研究效能(相比0.05组:汉族,P=0.019;藏族,P=0.029),并捕获了最多的人群特异性单体型(相比0.05组,P=0.012).在所检区域内,与0.10阈值相比,0.05阈值并没有显著提高关联分析的研究效能(汉族,P=0.191;藏族,P=1.000)及人群特异性单体型的捕获(P=0.592).同时,在藏族人群中,0.05与0.10组产生了相同数据的标签SNPs效率、连锁不平衡结构域的数目和平均长度、关联分析研究效能及节约/总成本比值.结果提示,较低的次要等位基因频率筛选阈值更适合着重于人群特异性单体型的研究;不同人群最佳次要等位基因频率筛选阈值可能不尽相同.由于本研究检测基因数目有限,这一重要议题仍需更多深入的探讨. Genome variation is the genetic basis for phenotypic diversity among individuals such as disease susceptibility and drug response etc. International HapMap is intended to provide a roadmap for the study of genetic variation associated with complex diseases Single nucleotide polymorphisms (SNPs) are the basic elements of HapMap.The allele frequencies of SNPs affect the structure of linkage disequilibrium, the construction of haplotypes and the screening of SNPs.This is one of the main factors affecting the accuracy of HapMap.Therefore, the frequency of minor alleles The selection of screening threshold has a far-reaching impact on the accuracy of the map.Most of the researchers so far choose to use custom thresholds, and there is little research on the impact of the secondary allele frequency screening threshold on the accuracy of HapMap.To explore the secondary allele frequency screening Threshold on the accuracy of the corresponding HapMap, the Chinese Han and Tibetan population chromosome 15 centriole gene sequencing results according to different minor allele frequency screening threshold (≥0.01, ≥0.05, ≥0.10) the past data Divided into three groups, namely 0.01 group, 0.05 group and 0.10 group, respectively, constructed three sets of data HapMap, and compared the accuracy of each group HapMap, correlation analysis of the research performance and section / Total cost ratio The results showed that the 0.01 group had the highest correlation between study efficacy (compared to 0.05 group: Han, P = 0.019; Tibetan, P = 0.029) and captured the most population-specific haplotypes 0.05 group, P = 0.012). In the examined area, the 0.05 threshold did not significantly improve the efficacy of the association analysis (Han Chinese, P = 0.191; Tibetan, P = 1.000) and population-specific monomer (P = 0.592) .In the same time, the efficiency of labeling SNPs, the number of linkage disequilibrium domains, the average length of linkage disequilibrium and the ratio of cost / total cost . The results suggest that the lower threshold frequency of minor allele frequencies is more suitable for population-specific haplotype research; the screening threshold for the optimal minor allele frequency may vary from population to population. A limited number of this important issue still need more in-depth discussion.
其他文献
你们为我感到恐怖——我却在为你们, 可我们对恐怖抱有不同的理解。尽管我们都怀有相似的幻梦, 我们却以不同的恻隐之心为其抱憾。 You are terrified for me - I’m here
期刊
四足移动机器人作为一种腿足式移动机器人形式,不仅具备腿足式移动机器人相对于轮式和履带式移动机器人的相应优点,同时在稳定性和控制难易程度及制造成本等方面,又比双足机
公共阅读空间是开展全民阅读推广的阵地、平台和载体。本文对公共阅读空间概念进行界定,将空间类型总结为设施整合型、交流体验型、活动推动型、网络共享型四种类型,并从创新
我国的中小企业目前正面临进一步发展的困境。这有外部环境因素的影响,也有企业本身的原因。本文分析了我国中小企业面临的问题,提出了帮助中小企业走出困境、促进其进一步发
学习型党组织建设的基础和重点在于抓好组织学习,关键在于推进组织学习制度化、长效化。杭州市江干区坚持学用结合,突出组织与个人互动,强化学习内容针对性、平台建设指向性
宫室建筑是古代政治、礼仪重要内容。邺城的宫城分东西两部分,总体由太极殿、尚书省、朝堂、内省等构成。
知识管理是提升国防科技工业核心竞争力的有效手段,知识的有效整合、学习、共享和创新是国防科技工业提升自身核心竞争力的关键。构建国防科技工业核心竞争力的作用模型,并对
现在,VR技术已经发展为一个体系,融合多项信息技术,包括计算机视觉、人机交互等,而自然博物馆是自然环境的浓缩,向人们展示不同的自然景观。VR技术与自然博物馆的融合,是在博
运用"四种形态"监督执纪是全面从严治党的重要举措,也是纪委履职的具体抓手。本文通过分析监督执纪"四种形态"的内涵,结合本行近年来运用"四种形态"监督执纪的实践经验发现不
在恐怖电影的发展过程中,随着视听语言的不断变化,恐怖电影已经从单一恐惧元素向多元素、多角度、多叙事手段进行转变,恐怖电影的核心是制造恐怖气氛,使观众感受到巨大的恐惧