论文部分内容阅读
随着世界人口的老龄化不断加剧,阿尔茨海默症(Alzheimer’s disease,AD)即老年痴呆症,发病率不断升高。AD作为老年期大脑皮质神经系统退行性疾病,其病理不可逆,病程较长,发病原因及其发病机制迄今尚未阐明。当患者出现明显的AD临床症状时,疾病多数已经进入晚期,完全无法治疗。而且,AD比其它非神经退行性疾病的医疗开销要多4-5倍,还要承担着长达十几年至几十年的护理费用,给患者家庭带来巨大的经济压力和沉重的情感负担。目前,阿尔茨海默症已成为严重的公共卫生问题,也是公认的世界性医学难题,AD的早期诊断和干预成为大多数研究关注的焦点。AD的神经病理学主要特征是β-淀粉样蛋白(Amyloid β-protein,Aβ)斑块和Tau蛋白相关的神经原纤维缠结(Neurofibrillary Tangles,NFTs)。双生子实验证明了AD病症的高遗传性,推动了基于AD特征的基因组学研究,但距离完全揭开AD的遗传密码相差甚远。目前的研究成果表明,已发现的AD风险基因联合主效应只能解释35%的AD遗传性,“遗传性丢失”仍然很严重。本文沿着“先选择典型病例,后进行方法学推广”的思路,以AD为研究对象,利用ADNI数据集,针对AD“遗传性丢失”的问题,开展基于定量表型的全基因组关联研究,旨在探索和发现AD早期风险基因、敏感表型,开发用于检测AD早期风险基因和敏感表型的实用算法和工具软件,为AD的早期干预做贡献。首先,对ADNI基因型数据和定量表型数据进行预处理和质量控制,开展全基因组SNP主效应与PET-AV45和CSF两大类8个实测定量表型间的关联研究(Genome-wide association studies,GWAS),识别并重现了APOC1、APOE、TOMM40和PVRL2四个AD高相关风险基因,证明了本文所采用的数据、质量控制方法和GWAS实验的合理性和有效性。其次,针对AD“遗传性丢失”问题,使用线性回归方法,基于GWAS结果进行了SNP-SNP交互作用与AD定量表型间的关联研究(Genome-wide interaction studies,GWIS),检测了线性条件下的SNP-SNP交互作用与PET-AV45和CSF两大类8个实测定量表型关联性,发现了微小主效应SNP间存在较强的交互作用,识别出40个AD定量表型相关的基因,证明了当GWAS不能检测到AD风险基因时,GWIS方法可作为有效补充。再次,本文提出了定量表型遗传敏感性分析方法和敏感表型的合成方法,综合分析了 PET-AV45、CSF和FreeSurfer三大类20个实测表型的敏感性,发现Aβ、Tau相关表型对SNP-SNP交互作用更敏感,FreeSurfer表型对SNP主效应更敏感。基于T-tau/Aβ342合成表型的全基因组主效应关联研究(GWAS)和全基因组交互作用关联研究(GWIS),共识别出212个基因,重现了包括APOC1、APOE、TOMM40三个基因在内的39个AD相关风险基因,发现了 21个精神类疾病相关基因以及152个未明确疾病相关性的基因。其中,GWAS所识别的17个基因联合主效应可达到11.3%的解释度(R2),在加入APOE、年龄、性别和临床诊断状态主效应后,解释度达到惊人的41.6%,这是之前ADNI研究结果在主效应解释度上均未达到的高度。而GWIS所识别的SNP-SNP交互对解释度也高达3.1%~5.1%。这些结果的发现充分证明了T-tau/Aβ42表型的超高敏感优势和潜在的预测能力,对“AD遗传性丢失”给予了有效补充,为发掘AD遗传病理开辟了新的道路。最后,本文针对基因-基因交互作用检测方法的研究现状,提出了基于多因素融合的基因-基因交互作用检测方法,分别解决了基因-基因交互相关系数矩阵的计算问题、高维度交互作用检测方法设计问题和多因素的融合问题,开发了IGENE软件,实现了2种相关系数矩阵计算方法和6种基因-基因交互作用计算方法,分析了算法间的差异性。其实验结果的显著性与GWIS检测的一致,文献和组织特异性分析表明,本文针对T-tau/Aβ42敏感表型进行的全基因组关联研究意义重大,所发现的结果在生物学意义的表达上具有高度的一致性,既重现了已知AD风险基因,又有新的发现,值得进行深入研究。综上所述,本文针对阿尔茨海默症的21个定量表型,分别进行了全基因组主效应关联研究和全基因组交互作用关联研究,研究结果表明,定量表型的连变特性比疾病的二维状态更接近其遗传机理,表现出更高的遗传信噪比,用于检测AD相关的风险基因,可增加潜在的统计学效力。此外,SNP-SNP交互作用研究,定量表型遗传敏感性分析,以及基因-基因交互作用检测算法设计和检测工具开发,为AD等复杂疾病的风险基因挖掘和病理学探究提供了系统化的研究思路、研究方案和良好的实验平台,具有一定的推广和应用价值。