论文部分内容阅读
结核分支杆菌(M.tuberculosis)引起的肺结核(p TB)是世界上最致命的传染性疾病之一。近年来,由于耐药菌株的出现,结核病(TB)的发病率和死亡率一直保持很高,其中死亡率高于其他任何单一传染病。根据世界卫生组织(WHO)的2014年年度调查,在2012年,结核病患者总数约有860万人,其中约66%(570万)为新发病例,而同年死于结核病的人数约为130万病,其中32万人死亡时艾滋病病毒(HIV)呈阳性。中国是22个高负担肺结核病国家之一,结核病患者数量仅次于印度,居世界第二位。虽然约1/3的世界人口感染了结核分枝杆菌,但其中只有10%发展为活动性肺结核,这说明个体对于肺结核具有不同的易感性。在这些患者中,除去有明显危险因素(比如HIV感染、糖尿病和其他免疫缺陷状态)的患者,剩下则是由于其他因素的影响,包括遗传因素、环境因素以及相应的相互作用等。人类中宿主遗传因素在导致结核分枝杆菌感染和引起肺结核方面起到关键作用已经得到国际公认。从1983年开始,研究者为在人的基因组中筛选出肺结核病的易感基因而做出了大量的努力。众多基于候选基因的结核病关联研究对预测可能的功能性位点进行了检验,包括SLC11A1(NRAMP1)、HLA家族、Toll样受体(TLR)家族的基因和属于IFN-γ和IL-12信号通路的基因等。但是与其他疾病相比,结核病易感性的遗传研究由于环境因素的复杂影响未能取得较大的成功。大多数报道出来的结核病相关位点不能在其他人群中得到验证。全基因组关联研究(GWA研究,或GWAS),也被称为全基因组关联研究(WGA研究,或WGAS)或共变体关联研究(CVAS),是一种可以同时对大量个体检测整个基因组的变异,以查看是否有变异与一个性状相关联。GWAS研究通常应用在SNP位点与重大疾病之间的关联。目前,针对非洲人群的两个大型GWAS研究已经发现了两个全基因组水平上的SNP位点。这个发现一定程度上3提供了结核病的早期干预和治疗线索。中国的结核病患者在世界占第二位,然而到现在为止,没有研究关注于中国汉族人群的结核病GWAS。另一方面,大量数据表明,在接触结核分枝杆菌并发展成为结核病的人群中,约70%是男性,全世界范围内结核病患者的男女比例高达1.9±0.6,部分国家男性患者甚至达到女性患者的三倍以上。证据还表明,相对于女性患者,男性患者的结核病更加严重。虽然这个现象可能有一定的社会经济和文化因素,比如在发展中国家妇女由于不受重视而被忽略了部分病情,但是这种悬殊比例的性别特异性更多被认为是由生物异质性导致。这类生物因素可能包括性别偏倚、性荷尔蒙、与性别有关的遗传因素和新陈代谢特点。因此我们可以做出一个合理的假设:宿主的遗传变异,特别是在X染色体上免疫相关基因的某些变异可能有助于解释结核病发病率的性别特异性。第一部分肺结核全基因组关联研究目的:人类中宿主遗传因素在导致结核分枝杆菌感染和引起肺结核方面起到关键作用已经得到国际公认。目前为止,基于病例对照的肺结核GWAS研究已经在2个非洲人群(加纳和冈比亚)发现了全基因组水平上的关联SNP位点,并且在另一个人群中得到了一定程度的验证。本课题的目标是在中国汉族人群中用GWAS研究来全面评估遗传位点和肺结核的关联性。对象和方法:为了在中国汉族人群中鉴定遗传标记,我们对500例肺结核病例和600例健康对照进行全基因组基因分型。经过了对每个样本和位点的严格的质量控制后,共有483例肺结核病例和587例健康对照的650,939个SNP保留并进行下一步的统计分析。我们应用多维尺度模型(MDS)校正人群分层,并且使用前3个MDS向量作为协变量用于之后的logistic回归分析。接下来,我们使用千人基因组计划(1000 Genomes Project)的数据对我们的分型结果实施基因填补,经过标准的质量控制后,共获得了5,692,315个填补的SNP位点。为验证是否存在中国汉族人群和非洲人群的共同肺结核病易感位点,我们对本研究的中国汉族数据集与已经发表的加纳肺结核GWAS数据集(1359例病例,1952对照;793,694个分型的SNP位点;5,426,380填补的SNP位点)实施了meta分析。总计共有1537个SNP位点进行验证阶段的基因分型,验证阶段的受试对象包括中国汉族1272例病例和1733例对照以及蒙古族121例病例和231例对照。结果和结论:合并分析中国汉族人群的GWAS第一阶段结果和两个验证人群的结果后,SNP位点rs932347达到了全基因组水平的关联(Padditive=1.45 10-9;OR=0.69;95%CI=0.61-0.78)。由于SNP位点rs932347在中国汉族人群的次等位基因频率为17%,而在加纳人群中仅有1.5%,属于罕见变异位点,因此未发现其在加纳人群中表现出与肺结核病的关联性。然而,由于部分加纳人群的肺结核病例是由一种只发生在非洲的结核分枝杆菌(M.africanum)所感染,当我们去除这一部分病例后,发现在SNP位点rs932347对于加纳人群的同样起到保护效果,OR值为0.84,这与在中国汉族人群和蒙古人群观察到的结果方向一致。rs4331426和rs2057178这两个在加纳人群中被确认的肺结核易感性位点未在中国汉族人群中表现出任何关联。同样,我们认为这个结果可部分归结为不同人群中等位基因频率的差别。rs4331426G和rs2057178A的等位基因频率在中国汉族人群中仅为4%和5%,而在加纳人群中分别为45%和32%。总之,我们通过一个三阶段的全基因组关联研究在中国汉族人群中发现了一个对肺结核病起保护作用的新的SNP位点。第二部分肺结核X染色体易感基因病例对照研究目的:在接触结核分枝杆菌并发展成为结核病的人群中,约70%是男性,因此,宿主的遗传变异,特别是X染色体上的免疫相关基因可能与结核病性别特异性相关联。为了鉴定这个假设,我们选取X染色体的三个SNP位点(TLR8基因的rs3764880、CD40LG基因的rs3092923和IRAK1基因的rs3027898),应用病例对照研究设计,以确定在中国汉族人群中上述位点多态性与肺结核病发病间的联系。对象和方法:我们共纳入符合纳入标准的1011例肺结核病例和1105例正常对照,其中923例病例和1033例对照的样本最终通过了测序平台的样本质量检测。肺结核病住院病例于2007年3月至2009年8月从河北省胸科医院和石家庄市第五医院收集。健康对照是从北京电力医院进行年度体检的人群中选取。本研究方案已经经过河北省胸科医院、石家庄市第五医院和北京电力医院伦理委员会的审核。在获得所有病例组和对照组受试者的书面知情同意后,我们才进行5ml全静脉EDTA抗凝血液样本的收集工作。应用三种多重logistic回归分析(男性和女性的合并分析、男性单独分析和女性单独分析)分别对三个SNP位点的两种遗传模型(共显性和隐性模型)进行建模,并对年龄,性别,吸烟状况和接种卡介苗等因素进行校正。除此之外,应用隐性遗传模型的多重logistic回归分析对男性和女性的合并数据进行性别和SNP位点的交互作用分析。结果和结论:在对三个位点分别进行的含有位点与性别交互作用项隐性遗传模型的多重Logistic回归分析结果中,只有CD40LG rs3092923的交互作用项(CT+CC或C/(-)与性别)有统计学意义,多重检验校正后Pcorr=0.0213,OR男性[95%CI男性]=0.47[0.32-0.70]。由于该交互作用经过了年龄、吸烟和卡介苗接种状况因素的校正,消弱了这些非试验因素的影响,说明CD40LG rs3092923可能对肺结核病的性别特异性产生作用。而对于TLR8 rs3764880和IRAK1 rs3027898位点与性别的交互作用项无统计学意义(P值分别为0.5008和0.9213)。CD40LG rs3092923以及它与另外两个位点的联合作用均只在男性中表现,在男性中,当以野生型T/(-)作为参考时,C/(-)基因型对肺结核病表现出较强的保护作用(OR=0.52,95%CI=0.35-0.78,Pcorr.=0.0045)。若以没有风险等位基因的作为参照,随着三个SNP位点推定的风险等位基因累计数的增加,受试者中患肺结核病的风险越来越大,呈逐级递增的趋势。其效果从有一个累计风险等位基因时的OR=2.58,到有两个累计风险等位基因时的OR=2.83,再到有三个累计风险等位基因时的OR=2.96。对剩余的两个SNP位点,仅在女性单独分析和联合分析模型的IRAK1rs3027898AA基因型上发现较弱的差异。我们的研究结果表明男性中,CD40LG基因的变异以及它和另外两个基因的联合作用与肺结核易感性相关联。