【摘 要】
:
复杂疾病又称为常见疾病,是目前困扰人类的主要疾病。跟单纯由基因决定的孟德尔遗传病不同,复杂疾病涉及到了环境因素、基因因素以及它们之间的相互作用等多种因素,病因十分
论文部分内容阅读
复杂疾病又称为常见疾病,是目前困扰人类的主要疾病。跟单纯由基因决定的孟德尔遗传病不同,复杂疾病涉及到了环境因素、基因因素以及它们之间的相互作用等多种因素,病因十分复杂。而在这些因素之中,研究基因与基因之间的相互作用(上位性)成为探索复杂疾病致病原理的重要手段,基因与基因之间的相互作用主要体现在SNPs之间的相互作用上,全基因组关联研究中的上位性检测问题就是以SNPs作为遗传标记来进行检测的。近年来,在全基因组关联分析领域已经提出了大量用于检测上位性的方法,但是它们仍然存在效率低、假阳性率高和不适用于高维数据集等问题。针对以上问题,本文提出了一个新的基于蚁群优化的两阶段上位性检测算法——NTSACO(A New Two Stage epistasis detection algorithm based on Ant Colony Optimization)。第一阶段是基于蚁群优化算法的筛选阶段,在原有算法的基础上提出了两个评分函数,去对各个可行解(蚂蚁根据信息素浓度选择生成的SNP位点组合)进行评分,分值越低跟疾病的关联强度越强,从而将筛选候选SNP子集问题转化成寻找两个评分函数最优解的问题,根据1986年Pareto提出的非支配解的概念,又进一步将寻找两个评分函数最优解的问题转化成寻找非支配解的问题,通过一个分类算法来筛选得到一个非支配解集;第二阶段是检测阶段,利用G~2检验来对第一阶段筛选出来的所有非支配解进行穷尽检验,最终返回p-value小于显著性水平?的SNP子集。在生成的一系列模拟数据集上的实验结果表明,NTSACO算法具有较高的上位性检测效率和较低的假阳性率;在AMD真实数据集上的实验结果表明,NTSACO算法在检测上位效应上是可行的。
其他文献
有效挖掘给定数据集中频繁出现的模式是数据挖掘领域中的重要问题,对数据进行频繁模式挖掘能够揭示隐藏在数据集后面的有效信息。非易失性存储器(NVM)的发展为持久性内存频繁
针对单片机技术在家电、数码产品、医疗设备、汽车工业、航天航空等领域日益广泛的应用与该技术学习周期长、不易掌握的矛盾,设计一款以面向高中学生为主的新型单片机教学平
多源信息融合是一种多层次、多方面的处理过程,包括对多源数据进行检测、相关、组合和估计,从而提高状态和身份估计的精度。因其具有探测精度高、扩展性好、可信度高、获取信
近年来,我国电子商务和零售业的运作模式不断推陈出新,网购平台与线下实体店相互结合模式脱颖而出。由于日益激烈的市场竞争和客户需求的不确定性,企业和商家为了提高库存周转率和资金流动率,纷纷采取了线下实体零售与网购平台的相互结合模式,实施双渠道整合策略。因此,线上交易和线下零售的相辅相成是大势所趋。同时,日趋激烈且不确定的市场环境可能会引发供应链决策者的不同风险规避行为。本文以由供应商、经销商、线上零售
“常州三杰”之一,被叶剑英元帅赞誉为“青年模范,人民英雄”的恽代英,是中国早期进步知识分子的代表,恽代英倾其一生为中华民族独立富强而英勇奋斗,这与其较早树立正确的世
云计算技术是最近十年兴起的计算机热点之一,在普通消费者的日常使用中越来越广泛,但在大型企业中的应用确是相对的迟缓。本论文以S公司内部的IT架构变革作为研究背景,以S公
电阻抗层析成像技术(Electrical Impedance Tomography,简称EIT)是一种新型的医学成像技术,通过向人体表面的阵列电极注入极其微小的安全激励电流,测量人体体表的电压,并将测
针对传统光谱和距离感知传感器存在的空间视野小、距离感知分辨率低和光谱范围窄等缺点,本研究提出了大视场多光谱折反射成像系统的实现机理,并设计实现了系统原型。它在保持
北部湾经济区是我国新兴发展起来的西部沿海沿边的国家级经济区,涵盖广西壮族自治区首府南宁和三个沿海城市钦州、北海、防城港全部区域,并将与越南接壤的崇左及与广东相邻的
随着云计算的快速发展,云上的存储服务变得更加经济和便捷,人们能以十分低廉的成本将自己的数据上传至云存储。个人和企业考虑到效率和成本问题,越来越多的选择将数据外包给