论文部分内容阅读
近年来,下一代测序技术(Next generation sequencing, NGS)迅猛发展,加速了肿瘤基因组学研究,帮助科学家找到了许多肿瘤特有的突变模式和驱动因子。生物信息技术对转录组测序、外显子测序和全基因组测序得到海量数据的快速而精准的分析促进了NGS的发展。NGS应用于肿瘤基因组学的研究揭示了许多不同类型癌症的基因组和转录组的突变图谱;帮助了科学家认识到肿瘤的异质性,还有肿瘤发生、发展以及对药物抵抗的分子机制。此外,这些研究有助于癌症的分子亚型的鉴定和划分。本研究以肝细胞癌和前列腺癌为例,证明了下一代测序技术在癌症分子机制研究和分子分型的个性化治疗中的应用的可行性。本文的第一部分第一章,我们对三例长期感染HBV肝癌患者的癌组织、癌旁组织和其正常血液样本进行全基因组测序。通过借助Complete Genomics全基因组测序平台,我们鉴定了体细胞单核苷酸突变(Somatic single-Nucleotide Variation, SNV)包括单核苷酸多态性(Single Nucleotide Polymorphism, SNP)、小片段插入或缺失(Insertion or Deletion, Indel),染色体结构变异(Structural Variation),还有基因拷贝数变化(Copy Number Variation,CNV)。我们分析比较了癌组织、癌旁组织和血液样本的所有的突变类型并划分了三个组别进行具体分析:癌特有的突变、癌旁特有的突变以及癌和癌旁共有的突变(血液样本没有)。据我们所知,这是目前首次针对HBV感染肝癌患者的癌、癌旁和血液样本同时进行全基因组测序和比较分析。我们鉴定得到癌特有的突变、癌旁特有突变以及癌和癌旁共有(血液没有)的突变位点以及重要生物学信号通路,对肝细胞癌发生和发展的分子机制的研究具有重要意义。在针对第一章的高通量测序的结果基础上,本文的第一部分第二章在测序鉴定的突变结果中筛选了多个在以往文献报道的肿瘤相关的单核苷酸多态性位点(SNP)和新发现的SNP以及结构变异(SVs)在大量肝细胞病人的癌、癌旁和血液样本中验证。在验证的结果中,我们发现抑癌基因—组蛋白H3K4三甲基化转移酶KMT2C (Lysine-Specific Methyltransferase 2C),又称MLL3 (mixed-lineage leukemia 3, MLL3) (C1114R)突变在肝细胞癌中非常普遍(癌、癌旁和血液的突变频率分别是97.8%,96.2%和76.9%)。致癌基因VCX(L104P)是癌和癌旁共有,血液中没有的突变频率最高(癌和癌旁中突变频率分别是14.6%和11.1%)的SNP位点。抑癌基因TP53 (R249S)位点在7.7%的癌组织中发生特异性突变,且该突变和不良预后显著相关。我们还发现巨型蛋白AHNAK核蛋白2CAHNAK2)基因M1761I突变在100%的癌和癌旁中发生突变,在10%的HCC患者血液中发生突变。锌指蛋白ZNF717的L689H突变在癌、癌旁和HCC患者血液里都发生突变(突变率分别是34%、23%和10%)多聚腺苷酸结合蛋白PABPC3 Y377H位点和人类白细胞Ⅱ型抗原HLA-DQB1的S233G位点在验证的HCC的在癌、癌旁和血液中100%检测到。染色体结构变异方面,我们发现17号染色体TK1胸苷激酶1 (Tyrosine Kinase 1)基因和8号染色体的非基因片段在癌和癌旁发生高频融合(融合频率分别是29%和16%)。整合分析癌和癌旁样本外显子和剪切位点的SNV对生物学信号通路的影响,我们发现以下2条信号通路在癌中发生特异性的显著变化:胞外基质受体互作(ECM-receptor interaction)和细胞粘附分子CAMs (Cell adhesion molecules)表明这些肿瘤微环境相关通路的改变可能是HCC发展的主要驱动力。然而,嗅觉诱导(Olfactory transduction)是在癌旁中发生特异变化的信号通路,预示着它可能与HBV介导的HCC的启动相关。我们的研究表明,HBV介导的HCC的发生和发展过程共性和个性并存。我们找到的癌组织和癌旁组织发生的重要突变位点和生物学信号通路,可能是HCC发生和发展的关键驱动因子,对HCC的早期诊断和治疗具有重要意义。本文的第二部分,我们对74例(50例FFPE样本,24例新鲜组织样本)接受前列腺根治术的低级别原位前列腺癌(Gleason<=7)的样本(44例未生化复发和30例生化复发)进行全外显子组测序。针对外显子测序找到的复发和未复发组的体细胞突变,我们用随机森林机器学习算法鉴定能够区分复发和未复发的标志物。同时,鉴定了PCa复发相关的显著突变位点、突变基因以及关键生物学过程。通过着重比较了复发组和未复发组的前列腺癌病人的外显子组突变图谱差异,我们找到了33个和复发特异相关的体细胞显著突变基因,排前6位的是STK31、ALMS1、PCSK5、 AHRR和NCOR2。33个显著突变基因绝大部分都是首次被报道。在复发前列腺癌样本显著突变的基因中,ALMS1 (p.E15delinsEE)和NCOR2 (p.Q78delinsQQ)各自存在高频的非移码插入(分别为46%和43%)。MAP3K9的第一个外显子的113位发生CCT碱基非移码缺失(p.3839del),缺失频率为37%; KDM6B基因的第9个外显子的796位发生ACC缺失(p.252253del),缺失频率为17%。此外,20%的复发样本中IDI2基因的第5个外显子402位发生终止获得突变(p.Y134X)。这些突变都很大程度上可能对蛋白质的表达产生影响,可能参与重要的肿瘤发展、转移相关的生物学通路。使用随机森林机器学习算法,鉴定到22个突变集,用于高效区分发展缓慢和发展快速的前列腺癌样本,是复发预测的潜在标志物。METS影响巨噬细胞分化(METS affect on Macrophage Differentiation)是复发组特有的显著变化信号通路。在复发的PCa中,该通路的关键基因:NCOR2、HDAC2和METS发生显著突变,可能进一步抑制TAMs的增殖,促进其分化为M2型,从而促进肿瘤细胞的侵袭和周围炎症反应。第二部分研究揭示了PCa复发组和未复发组的基因突变图谱,鉴定到复发相关的重要突变、基因和生物学通路。此外,研究还找到了能够区分发展缓慢和发展快速的突变集,作为复发预测的候选标志物。该研究对前列腺癌的分子分型和个性化治疗具有重要意义。