论文部分内容阅读
第一部分 基于TCGA数据库的乳腺癌DNA甲基化分析目的近年来,DNA甲基化已成为生物医学研究领域的热点之一,尤其是其与肿瘤的关系,DNA甲基化或许可以作为一种检测手段来诊断肿瘤甚至是预测肿瘤的发生。本研究利用公共数据库TCGA上乳腺癌患者及健康对照者的甲基化数据进行差异性分析,尝试解读乳腺癌患者的DNA甲基化谱与正常人的差异所在,并通过进一步的分析和筛选,甄选出有利于乳腺癌诊断、监测的甲基化基因。方法从TCGA下载乳腺癌样本和乳腺癌旁组织样本的Illumina Human Methyla-tion 450芯片甲基化数据,使用R语言筛选乳腺癌组织样本与癌旁组织样本中差异甲基化位点,并参考Illumina Human Methylation 450 hg19的芯片注释文件进行基因注释。然后使用DAVID在线工具进行GO(Gene Ontology)功能富集分析和 KEGG(Kyoto Encyclopedia of Genes and Genomes)通路分析。最后结合下载数据的临床信息对部分选择的基因进行cox回归分析,筛选出与生存相关的甲基化基因。结果于TCGA下载共得到791个乳腺癌组织样本和96个癌旁样本甲基化测序数据以及相应的临床资料。通过R语言对其进行差异性分析,可以得到共28710个差异甲基化位点(Differentially Methylated Site,DMS)。之后,通过基因注释,我们得到与这28710个DMS相关的共有6623个基因。我们对位点及基因进行了结构注释和功能注释,结果我们可以看到,大部分的DMS都落在CpG岛,并且以高甲基化为主;而gene body则以低甲基化为主。同样,我们利用DAVID工具对前面得到的6623个乳腺癌甲基化相关基因进行了 KEGG通路分析,DMS所在的基因统共涉及到61个通路,我们将其中常见的肿瘤通路中的基因提取出来,并取其与包含10个DMS以上的基因的交集,得到22个基因,根据β平均值进一步过滤后,通过Cox回归分析显示,其中和生存时间相关的基因有7个,包括 CTNNA2、APC、RASSF1、SOX17、TNXB、EDNRB、CREB5。结论1.基于TCGA等生物信息数据库的数据资源,能够进行疾病的基因差异性分析、生存分析等。2.乳腺癌组织与癌旁组织的DNA甲基化谱具有明显差异;乳腺癌组织的DNA高甲基化主要发生在CpG岛,而低甲基化主要发生在gene body。3.乳腺癌组织DNA甲基化涉及各种各种生物过程,我们结合常见的肿瘤分子通路和TCGA下载的临床信息文件,筛选出CTNNA2、APC、RASSF1、SOX17、EDNRB、TNXB、CREB5 7个基因,其有潜力作为乳腺癌诊断、监测的甲基化标志物。第二部分利用高通量甲基化测序对乳腺癌患者循环游离DNA进行检测分析我们的研究通过采集、提取乳腺癌患者外周血中的循环游离DNA,并利用高精确性的全基因组甲基化测序大范围地来描绘乳腺癌患者cfDNA甲基化图谱,探索其潜在的甲基化特征。本部分研究是第一部分研究的延伸、拓展和验证,在二代测序的基础上,比较乳腺癌患者身上组织DNA与cfDNA的甲基化差异。并检验cfDNA甲基化对辅助乳腺癌早期诊断的价值,借此寻找外周血中可用于乳腺癌筛查的潜在甲基化标志物。方法选择于2017年3月至2017年7月间在南方医科大学南方医院乳腺中心住院10例早期乳腺癌女性患者入组本研究,另外纳入10例健康女性作为对照组。术前采取约10ml静脉血并分离血清,采用磁珠法提取cfDNA后,先进行全基因组甲基化建库,再使用Illumina测序平台对捕获的cfDNA进行高通量测序。结果在提取cfDNA的过程中,我们发现乳腺癌组的cfDNA浓度与健康对照组无统计学差异(乳腺癌组0.908 ng/ul,健康对照组0.883 ng/ul,p=0.399);此外,在乳腺癌组内,cfDNA浓度与患者的年龄、肿瘤大小、分期以及淋巴结转移与否无明显相关性。通过构建全基因组甲基化高通量测序文库,并有效、充分地应用高通量测序技术,能准确地获得全基因组甲基化位点信息,我们发现了乳腺癌组cfDNA与对照组cfDNA中的4052个差异甲基化位点,并且通过与第一部分的组织DNA甲基化数据的横向比较,显示乳腺癌患者cfDNA的甲基化情况与乳腺癌组织DNA存在差异性。在临床相关性分析中,我们发现DUSP5P1包含11个与肿瘤分期相关的甲基化位点,其中包括有3个高甲基化位点和8个低甲基化位点。结论1.乳腺癌女性患者与健康女性的cfDNA浓度并无统计学差异,此外,乳腺癌患者的cfDNA浓度与患者的年龄、肿瘤大小、分期以及淋巴结转移与否无明显相关性。2.乳腺癌患者cfDNA甲基化情况有异于乳腺癌组织DNA甲基化情况。3.乳腺癌患者cfDNA甲基化异常主要集中在gene body上,除CpG岛外的基因区域,甲基化上调和甲基化下调的频率基本是相当的,而CpG岛上则以高甲基化为主。