论文部分内容阅读
目的:多形性胶质母细胞瘤简称为胶质母细胞瘤(GBM,Glioblastoma)。胶质母细胞瘤是最常见的脑胶质瘤之一,占胶质瘤的25%以上,也是最恶性的一种。胶质母细胞瘤呈浸润性生长,病程进展迅速,手术切除后常很快复发,具有高度异质性并且预后极差。目前,胶质母细胞瘤的异质性特征已经被多种科学手段证实。越来越多的证据显示,胶质母细胞瘤内细胞的异质性是其重要特征之一,也对我们有效治疗胶质母细胞瘤提出了巨大挑战。最初,胶质母细胞瘤瘤内异质性是通过发现瘤体不同区域基因拷贝数(EGFR、PDGFRA和PTEN),体细胞突变(TP53)以及基因表达水平(MGMT)的不同而证实的。而直接观察到从同一肿瘤样本中取下的不同部分瘤体分别对应着不同的肿瘤分子亚型,则为胶质母细胞瘤异质性提供了进一步的证据。虽然这些发现在肿瘤异质性的研究中迈出了重要的一步,但是肿瘤异质性的研究值得我们在更加精细的层面下进一步探究,因为在一个瘤体中,任何一个单一的细胞都可能由于特定的生长环境而表现出特定的基因表达谱。长链非编码RNA(lnc RNA)是一类转录本长度超过200nt的RNA分子,它们并不编码蛋白,而是以RNA的形式在多种层面上(表观遗传调控、转录调控以及转录后调控等)调控基因的表达水平。lnc RNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。然而,近年来的研究表明,lnc RNA参与了X染色体沉默,基因组印记以及染色质修饰,转录激活,转录干扰,核内运输等多种重要的调控过程,lnc RNA的这些调控作用也开始引起人们广泛的关注。虽然近年来关于lnc RNA的研究进展迅猛,但是绝大部分的lnc RNA的功能仍然是不清楚的。目前,越来越多的证据显示,有一些lnc RNAs在胶质母细胞瘤中异常表达,并且与胶质母细胞瘤的分子亚型和恶性表型密切相关。因此,这些lnc RNAs有可能作为诊断、判断预后的分子标志物以及治疗的靶点。而近年来开发成熟的单细胞测序技术为我们研究肿瘤单细胞之间长链非编码RNA表达谱的异质性提供了空前有效地的手段。本文的目的在于系统分析胶质母细胞瘤中长链非编码RNA在单细胞水平的表达异质性,为未来进一步揭示长链非编码RNA在肿瘤中的作用,发现重要的肿瘤生物标志物,选择新的治疗靶点打下坚实的基础。方法:(1)从大量公共数据中选取可用的胶质母细胞瘤单细胞RNA测序数据;(2)运用(bowtie、RSEM)等软件对测序原始数据进行拼接、与LNCipedia 3.0以及Ensembl(version 74)数据库比对、注释等处理。将比对结果进行质控,筛选出可信度和丰度较高的研究对象(包括单细胞样本、lnc RNA以及蛋白编码基因),分析它们的表达方式。(3)对lnc RNA进行主成分分析观察比较其在各个单细胞中表达的异质性。构建自组织映射图(SOM,self-organizing maps)观察比较其在各个单细胞中表达的异质性以及与协同表达的蛋白编码基因的聚类情况。(4)干性分级分析:通过比较胶质瘤干细胞与胶质瘤高分化细胞中lnc RNA的表达水平筛选出胶质瘤干性相关的lnc RNA。(5)胶质母细胞瘤亚型分析:从参考文献[16]中获得了肿瘤亚型特异性lnc RNA列表,挑选其中31条表达差异最大的lnc RNA进行肿瘤亚型分析。将得到的结果与TCGA(The Cancer Genome Atlas)根据蛋白编码基因的肿瘤亚型分型结果比较,观察其是否存在一致性。结果:我们通过对5份胶质母细胞瘤样本和2株胶质瘤干细胞系中的380个单细胞测序数据进行分析,绘制了其中2003个长链非编码RNA的表达谱。通过进行自组织映射分析,我们呈现了长链非编码RNA在单细胞中表达的动态变化。经过进一步分析,我们还揭示了长链非编码RNA在单细胞中不同的丰度和剪接方式。此外,在本应该由相同细胞组成的胶质瘤干细胞系中也同样表现出了长链非编码RNA的表达异质性。通过比较分析GSC和分化程度较高的细胞系(DGC),我们发现了一个由31条lnc RNA组成的集合。这些lnc RNA的表达与胶质瘤干性分级相关,并且可以通过这些lnc RNA的表达划分5份胶质瘤样本的干性程度。此外,根据在已知肿瘤亚型特异性表达的lnc RNA来看,每份肿瘤样本中都包含了代表所有4种肿瘤亚型的单细胞。结论:本文系统分析胶质母细胞瘤中长链非编码RNA在单细胞水平的表达异质性:包括表达水平、剪接方式等,并鉴定了一系列与胶质母细胞瘤干性和亚型分型显著相关的lnc RNA,为未来进一步揭示长链非编码RNA在胶质母细胞瘤中的作用,发现重要的肿瘤生物标志物,选择新的治疗靶点打下了坚实的基础。