论文部分内容阅读
研究背景年龄属于个体的表型特征信息。法医现场生物检材的个体年龄推断可极大缩小案件的侦查范围,对犯罪调查具有重要意义。传统法医学主要采用人类学方法,根据骨骼、牙齿等组织形态学指标的随龄变化特征推断个体的年龄。尽管该方法已比较成熟,但仍存在误差较大、经验性较强以及当骨骼、牙齿等组织缺失时应用受限等问题。通常,法医现场遗留的生物检材大多为各种类型的体液斑、脱落细胞、组织碎片等,如何有效通过这些生物检材推断个体的年龄是法医学所关注的重点问题。随着分子生物学的发展以及对发育和衰老过程认识的不断深入,一系列衰老相关的生物标记物相继被发现,主要包括线粒体DNA氧化损伤及片段缺失、AGEs含量、端粒长度、蛋白质中D-天冬氨酸比例、sjTRECs丰度、mRNA表达水平、microRNA以及DNA甲基化水平。在法医学领域,对这些衰老相关的生物标记在个体年龄推断方面的应用价值也进行了深入研究。总体而言,相较于其他年龄相关的生物标记,利用DNA甲基化标记推断个体年龄具有适用范围广、推断精度较高的优势。目前,国内这方面的研究相对较少,而不同地域人群间DNA甲基化标记与年龄的相关性存在较明显的差异,因此有必要对目前报道的年龄相关DNA甲基化标记在中国人群中进行进一步分析和验证,评估其针对中国人群的适用性。目的分析7个已报道的AR-CpGs在中国人群血液样本中的年龄相关性,探索其在中国人个体年龄推断中的应用价值。方法⑴查阅相关文献资料,筛选出7个AR-CpGs位点。⑵查阅序列,利用MethPrimer软件设计7个AR-CpGs位点的PCR引物和SBE引物。⑶采用聚丙烯酰胺凝胶电泳及单位点SNaPshot反应,检验所设计引物的可靠性。⑷根据延伸引物方向的不同,将7个标记分为两组,通过调整引物浓度和扩增退火温度,分别构建两个复合PCR扩增体系和两个复合SBE单碱基延伸体系。⑸采集230名健康汉族无关个体的血液样本作为训练样本,提取DNA、定量,经亚硫酸氢盐转化后,采用所构建的复合检测体系进行检测。⑹分析训练样本中每个AR-CpG位点的年龄相关性和性别差异,采用逐步回归模型分别构建针对男性、女性和不分性别的个体年龄推断模型。⑺随机采集80名健康汉族无关个体的血液样本作为验证样本,采用本文所建立的复合检测体系及年龄推断模型对其年龄进行推断,并与真实年龄进行比较,评估个体年龄推断的准确性。结果⑴根据文献,筛选出7个AR-CpGs位点用于本次研究,分别为cg02228185(ASPA1)、cg09809672(EDARADD)、cg19283806(CCDC102B)、cg04208403(ZNF423)、chr17:44390358(GRCh38,ITGA2B1)、cg14361627(KLF14)和cg06639320(FHL2)。⑵成功构建两组复合PCR扩增体系和两组复合SBE单碱基延伸体系,其中组合1包括cg02228185、cg09809672、cg19283806和cg04208403四个CpG位点,组合2包括chr17:44390358(GRCh38)、cg14361627和cg06639320三个CpG位点。⑶训练样本中,cg19283806位点在男性、女性和总样本中的年龄相关性均为最高,相关系数分别为0.9001、0.8151和0.8706;cg04208403位点在男性、女性和总样本组中的年龄相关性均为最低,相关系统分别为0.5686、0.4498和0.5303。⑷针对训练样本运用逐步回归模型构建的年龄推断模型为:72.61045-39.17263×chr17:44390358(GRCh38)+131.78740×cg14361627+43.74092×cg06639320+9.93087×cg04208403-15.51575×cg02228185-69.32841×cg19283806,其训练样本和验证样本的MAD值分别为4.20和4.83。⑸针对三个年龄段的分析,训练样本2040岁年龄段的预测偏差最低,MAD为3.82年,且在5年误差内的预测正确率最高,可达73.2%。验证样本020岁年龄段的预测偏差最低,MAD为4.24年,2040岁年龄段,在5年误差内的预测正确率最高,可达到74.1%。结论⑴汉族人群血液样本中,除了cg04208403位点的年龄相关性较低外,其余6个AR-CpGs均有较好的年龄相关性;⑵本文所构建的个体年龄推断模型在中国汉族人群中具有较高的年龄推断准确性。