论文部分内容阅读
检测阿尔兹海默症(alzheimers disease,AD)的生物标记物对于AD的预测、诊断和监控是至关重要的。在影像基因组学研究中,许多方法已经被提出用来检测包括图像表型数据和基因型数据的潜在的AD生物标记物,基于体素点的全基因组关联分析(voxel-wise genome-wide association analysis,vGWAS)方法就是其中一种常见的研究方法。然而,由于较大的数据量,在执行vGWAS方法时需要花费大量的时间,具有极大的挑战性。此外,由于vGWAS方法是基于体素点来进行研究分析的,即将每个体素点看作是一个独立的单元来计算基因-体素点对的显著性,因而忽略了图像表型数据的空间结构信息,故而,vGWAS方法可能会检测到错误的结果或遗漏一些重要的生物标记物。因此,传统的vGWAS方法存在着极大的问题。 为了解决上述问题,本论文提出了一种新的分析方法,将图像空间信息引入到vGWAS方法中,并采用一种加速算法--快速基于体素点的全基因组关联分析(fast voxel-wise genome-wide association analysis,FVGWAS)进行加速,不但解决了计算速度问题,还提高了检测AD的重要生物标记物的能力。为了在vGWAS方法里整合图像的空间信息,本论文尝试了三种不同的权重方法,高斯权重(gaussian weight,GS),非局部均值权重(non-local means,NLM)以及三维块匹配滤波和/或四维块匹配滤波(block-matching with3dimensional filtering,BM3D/block-matching with4dimensional filtering,BM4D)权重,随后,我们将整合了空间信息后的图像表型数据与基因型数据一起用到FVGWAS过程,来检测脑图像表型数据与基因型数据的重要的潜在生物标记物。 本论文所提出的方法在仿真数据上以及在ADNI真实数据上进行了实验来评估所提方法的检测能力。对于仿真数据,实验表明整合图像空间信息可以提高估计的准确性。此外,高斯权重方法在三种权重方法中取得最好的结果。对于ADNI真实数据分析过程,我们的方法检测到了三个基因型数据,包括ANK3,MEIS2,和TLR4,这些基因被证明与智力障碍和学习障碍有关,以及与年龄等有显著相关性,表明这些基因在影响AD和/或其他神经退行性疾病上发挥着着重要作用。此外,我们的方法还检测到了一些像素的显著团,包括海马体,额下回,脑岛,以及楔前叶等,这些显著团已被证明是与记忆,语言表达,认知等是有关联的,因此极有可能与AD或其他神经退行性疾病等是有关联的。我们的实验结果表明,本论文所提出的方法可能是一个在图像表型数据和基因型数据中检测AD潜在生物标记物的有效和有价值的工具。