论文部分内容阅读
目的:血脂异常(Dyslipidemia)是心血管疾病的重要危险因素,而心血管疾病是全球范围内死亡的首要原因。我国血脂异常的患病率高达40.40%且呈逐年增长趋势。血清胆固醇,如总胆固醇(TC)、低密度脂蛋白胆固醇(LDL-C)和高密度脂蛋白胆固醇(HDL-C)是诊断血脂异常的常用指标。血清胆固醇水平受遗传因素和环境因素的双重影响。本研究旨在探讨遗传因素对血清TC、HDL-C、LDL-C水平变异的影响程度,并利用全基因组关联分析(Genome-wide association study,GWAS)进一步寻找它们的遗传易感位点。方法:研究对象选自2012-2013年青岛市双生子登记系统,根据纳入标准与排除标准选择合格的双生子对。所有纳入的双生子对均进行问卷调查、体格检查和实验室检测。根据标准程序使用自动生化分析仪检测受试者的空腹血清胆固醇水平。采用性别、ABO血型及微卫星DNA基因扫描与分型技术逐步鉴定双生子的卵型。利用Illumina公司的Infinium Omni2.5Exome-8v1.2芯片平台对全基因组SNPs进行基因分型,并对测序的SNPs实施了严格的基因型质量控制。基于1000 Genomes Project Phase 3参考面板的连锁不平衡信息,使用IMPUTE2软件来填补(Imputation)未被基因分型的SNPs,同时用严格的质量控制标准来筛检填补的SNPs数据。使用Mx软件包构建结构方程模型(Structural equation models,SEM),校正年龄、性别、教育程度后,采用最佳拟合模型的加性遗传方差与总性状方差之比计算遗传度(h2)。采用GEMMA(Genome-wide efficient mixed-model association)来分析血清胆固醇水平与SNPs基因型之间的关联,并调整性别、年龄和教育程度。采用分位数图(Q-Q plots)和曼哈顿图(Manhattan plots)来展示有意义的SNPs位点。利用HaploReg v4.1软件分析细胞型增强子的富集情况。在VEGAS2(VersatileGene-based Association Study-2)软件中完成基因分析。使用PASCAL(Pathway scoring algorithm)软件来计算相关通路评分。结果:本研究共纳入382对双生子进行遗传度分析,其中的139对异卵双生子进行GWAS分析。研究对象的平均年龄为51.6±7.7岁。血清TC、HDL-C、LDL-C水平的平均值±标准差分别为4.9±1.2 umol/L、1.5±0.5 umol/L、2.8±0.9 umol/L。由于血清TC、HDL-C、LDL-C水平的同卵双生子的组内相关系数(TC:rMZ=0.61,HDL-C:rMZ=0.74,LDL-C:rMZ=0.65)均小于2倍的异卵双生子的组内相关系数(TC:rDZ=0.35,HDL-C:rDZ=0.61,LDL-C:rDZ=0.35),采用ACE模型。然后通过似然比χ2检验和最小信息准则选择其嵌套模型。最终,对于血清HDL-C水平,ACE模型为最佳拟合模型,加性遗传参数(Additive genetic parameter,A)占26.6%,共同或共享环境参数(Common or shared environmental parameter,C)占47.8%,独特或非共享环境参数(Unique or non-shared environmental parameter,E)占25.6%。对于血清TC水平,AE模型为最佳拟合模型,A参数占61.4%,E参数占38.6%。对于血清LDL-C水平,AE模型为最佳拟合模型,A参数占65.5%,E参数占34.5%。应用Mx软件包计算遗传度分析的把握度在90%以上。139对异卵双生子包含1,365,181个合格的SNPs被纳入到目前的GWAS研究中。尽管没有SNPs位点在全基因组范围内超过显著性水平(P<5×10-8),但是血清TC、HDL-C、LDL-C水平分别有8、14、9个SNPs超过有建议意义关联水平(P<1×10-5)。血清TC、HDL-C、LDL-C的潜在有意义的遗传区域分别位于第11号染色体rs7107698、第5号染色体rs12518218和第2号染色体rs10490120附近。细胞类型特定的增强子结果表明:外周血中性粒细胞和卵巢与血清TC水平有关,HUES6细胞、HUES64细胞和iPS-18细胞与血清LDL-C水平有关。尽管所有填补后的曼哈顿图显示没有SNPs位点在全基因组范围内超过显著性水平,但填补仍增加了有建议意义关联水平的SNPs数目,TC、HDL-C和LDL-C分别有39、55和59个SNPs超过有建议意义关联水平。填补后TC、HDL-C、LDL-C的潜在有意义的遗传区域分别位于第2号染色体rs77348447、第5号染色体rs79775842和第1号染色体rs56047090上。将填补后的SNPs结果与34,421名东亚人的脂类GWAS meta分析的SNPs结果进行比对,TC、HDL-C、LDL-C水平上分别有32、50、39个SNPs可以被重复。基因水平的分析发现与血清TC、HDL-C和LDL-C水平名义上相关的基因数分别为1038、1033和1090个(P<0.05),特别是FAF1、KLKB1等基因与TC水平有关,KLKB1等基因与HDL-C水平有关和NTRK1、FAF1、SNTB2等基因与LDL-C水平有关。TC、HDL-C和LDL-C的共同相关基因数为71,包括FAF1、KLKB1等。PASCAL通路富集分析发现了已知的相关通路:锌转运体通路、金属离子SLC转运体通路等与血清TC水平有关;细胞粘附分子CAMs通路、IL-6信号通路等与血清HDL-C水平有关;肥大细胞信号通路、NFAT通路等与血清LDL-C水平有关。结论:青岛市双生子人群血清TC(h2=61.4%)和LDL-C(h2=65.5%)水平为中度遗传,HDL-C(h2=26.6%)水平为低度遗传。相关的SNPs位点如rs7107698、rs12518218、rs10490120等,功能基因如FAF1、KLKB1、NTRK1、SNTB2等,和生物学通路如锌转运体通路、金属离子SLC转运体通路、细胞粘附分子CAMs通路、IL-6信号通路、肥大细胞信号通路、NFAT通路等都被证实与血清胆固醇水平有关。本研究为东亚人群血清TC、HDL-C、LDL-C水平的GWAS研究提供有用的参考,并为今后的分子生物学研究提供依据。