基于TCGA数据库及二代测序的乳腺癌DNA甲基化分析

来源 :南方医科大学 | 被引量 : 0次 | 上传用户:wenjie033
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
第一部分 基于TCGA数据库的乳腺癌DNA甲基化分析目的近年来,DNA甲基化已成为生物医学研究领域的热点之一,尤其是其与肿瘤的关系,DNA甲基化或许可以作为一种检测手段来诊断肿瘤甚至是预测肿瘤的发生。本研究利用公共数据库TCGA上乳腺癌患者及健康对照者的甲基化数据进行差异性分析,尝试解读乳腺癌患者的DNA甲基化谱与正常人的差异所在,并通过进一步的分析和筛选,甄选出有利于乳腺癌诊断、监测的甲基化基因。方法从TCGA下载乳腺癌样本和乳腺癌旁组织样本的Illumina Human Methyla-tion 450芯片甲基化数据,使用R语言筛选乳腺癌组织样本与癌旁组织样本中差异甲基化位点,并参考Illumina Human Methylation 450 hg19的芯片注释文件进行基因注释。然后使用DAVID在线工具进行GO(Gene Ontology)功能富集分析和 KEGG(Kyoto Encyclopedia of Genes and Genomes)通路分析。最后结合下载数据的临床信息对部分选择的基因进行cox回归分析,筛选出与生存相关的甲基化基因。结果于TCGA下载共得到791个乳腺癌组织样本和96个癌旁样本甲基化测序数据以及相应的临床资料。通过R语言对其进行差异性分析,可以得到共28710个差异甲基化位点(Differentially Methylated Site,DMS)。之后,通过基因注释,我们得到与这28710个DMS相关的共有6623个基因。我们对位点及基因进行了结构注释和功能注释,结果我们可以看到,大部分的DMS都落在CpG岛,并且以高甲基化为主;而gene body则以低甲基化为主。同样,我们利用DAVID工具对前面得到的6623个乳腺癌甲基化相关基因进行了 KEGG通路分析,DMS所在的基因统共涉及到61个通路,我们将其中常见的肿瘤通路中的基因提取出来,并取其与包含10个DMS以上的基因的交集,得到22个基因,根据β平均值进一步过滤后,通过Cox回归分析显示,其中和生存时间相关的基因有7个,包括 CTNNA2、APC、RASSF1、SOX17、TNXB、EDNRB、CREB5。结论1.基于TCGA等生物信息数据库的数据资源,能够进行疾病的基因差异性分析、生存分析等。2.乳腺癌组织与癌旁组织的DNA甲基化谱具有明显差异;乳腺癌组织的DNA高甲基化主要发生在CpG岛,而低甲基化主要发生在gene body。3.乳腺癌组织DNA甲基化涉及各种各种生物过程,我们结合常见的肿瘤分子通路和TCGA下载的临床信息文件,筛选出CTNNA2、APC、RASSF1、SOX17、EDNRB、TNXB、CREB5 7个基因,其有潜力作为乳腺癌诊断、监测的甲基化标志物。第二部分利用高通量甲基化测序对乳腺癌患者循环游离DNA进行检测分析我们的研究通过采集、提取乳腺癌患者外周血中的循环游离DNA,并利用高精确性的全基因组甲基化测序大范围地来描绘乳腺癌患者cfDNA甲基化图谱,探索其潜在的甲基化特征。本部分研究是第一部分研究的延伸、拓展和验证,在二代测序的基础上,比较乳腺癌患者身上组织DNA与cfDNA的甲基化差异。并检验cfDNA甲基化对辅助乳腺癌早期诊断的价值,借此寻找外周血中可用于乳腺癌筛查的潜在甲基化标志物。方法选择于2017年3月至2017年7月间在南方医科大学南方医院乳腺中心住院10例早期乳腺癌女性患者入组本研究,另外纳入10例健康女性作为对照组。术前采取约10ml静脉血并分离血清,采用磁珠法提取cfDNA后,先进行全基因组甲基化建库,再使用Illumina测序平台对捕获的cfDNA进行高通量测序。结果在提取cfDNA的过程中,我们发现乳腺癌组的cfDNA浓度与健康对照组无统计学差异(乳腺癌组0.908 ng/ul,健康对照组0.883 ng/ul,p=0.399);此外,在乳腺癌组内,cfDNA浓度与患者的年龄、肿瘤大小、分期以及淋巴结转移与否无明显相关性。通过构建全基因组甲基化高通量测序文库,并有效、充分地应用高通量测序技术,能准确地获得全基因组甲基化位点信息,我们发现了乳腺癌组cfDNA与对照组cfDNA中的4052个差异甲基化位点,并且通过与第一部分的组织DNA甲基化数据的横向比较,显示乳腺癌患者cfDNA的甲基化情况与乳腺癌组织DNA存在差异性。在临床相关性分析中,我们发现DUSP5P1包含11个与肿瘤分期相关的甲基化位点,其中包括有3个高甲基化位点和8个低甲基化位点。结论1.乳腺癌女性患者与健康女性的cfDNA浓度并无统计学差异,此外,乳腺癌患者的cfDNA浓度与患者的年龄、肿瘤大小、分期以及淋巴结转移与否无明显相关性。2.乳腺癌患者cfDNA甲基化情况有异于乳腺癌组织DNA甲基化情况。3.乳腺癌患者cfDNA甲基化异常主要集中在gene body上,除CpG岛外的基因区域,甲基化上调和甲基化下调的频率基本是相当的,而CpG岛上则以高甲基化为主。
其他文献
锡伯族是一个有着悠久历史的古老民族,在发展中不断和其它民族错居杂处,其服装样式也发生了深刻的变化。在吸收了满、蒙、汉、维吾尔和哈萨克等族的服饰优点后,形成了锡伯族
加快城镇化的进程,走可持续发展的新型城镇化道路,是我国经济新常态背景下的内容。新型城镇化成为我国区域研究的热点,区域经济发展促进城镇化的进程,金融是现代经济的核心,研究金融发展与城镇化的关系以及相互影响路径,对于推动新型城镇化进程具有重要意义。“十三五”以后,安徽省新型城镇化与金融发展进入新时期,要加快转变经济发展方式,因此,如何利用现有的基础,实现新型城镇化与金融协调发展,是安徽省经济社会发展面
[目的]探讨深海鱼油对高脂血症大鼠血脂的调节作用,为护理人员对高脂血症病人进行健康教育提供理论依据。[方法]应用Wistar雄性大鼠(n=36)饲喂高脂饲料4周造模成功,随机分成4
<正>江苏省淮安市实施初中升学体育考试制度以来,学生增加了体育锻炼的时间,自觉参加体育锻炼的积极性有所提高,学生体质健康状况得到了一定程度的改善。与此同时,提升了体育
目的探讨基于云平台的远程监测及综合管理对门诊高血压患者知识、信念、依从性及血压控制的影响。方法将172例门诊高血压患者按门诊ID号分为两组:奇数分为观察组(84例)采用基
提出一种基于DNA随机编码与随机运算结合混沌映射的图像加密算法。由图像的SHA-256的哈希值来生成算法所需要的密钥,将Lorenz和Logistic混沌映射作为密钥发生器,产生所有的初始
贵州省普定县穿洞出土的骨器是穿洞文化的重要标志。1979年首次试掘出土的骨器基本为磨制者,类型主要有骨锥、骨铲、骨叉、骨棒及骨针等,多采用较厚的动物骨骼的碎片为原料加
利用奇异值分解 (SVD)方法和山东省 2 6个代表站 195 1~ 2 0 0 0年 6~ 8月降水量、NCEP/NCAR再分析195 8~ 1998年 1~ 12月 92 5~ 30 0hPa 5层月平均比湿和风场资料 ,分析了山东夏
热塑性硫化橡胶(Thermoplastic Vulcanizate,TPV)性能优异,正在逐渐替代传统硫化橡胶,但TPV原料基本来源于石油基材料,不可再生且难以降解,因此生物基TPV受到越来越多的关注
文化负载词(Culture-loadedwords)也被称作文化词汇、文化词语、文化内涵词,是一个民族文化积淀(包括风俗习惯、价值观念、宗教信仰和审美情趣等)的体现。跨文化交际与文化负