论文部分内容阅读
据世界卫生组织(World Health Organization,WHO)最新发布的全球癌症统计数据显示,结直肠癌已成为全球发病率和死亡率第三的恶性肿瘤,特别是在很多发展中国家和地区,结直肠癌的发病率和死亡率仍呈现出快速增长的形势,且结直肠癌患者的临床病理特征正逐步向西方国家的模式转变。大多数患者的预后不良,而他们常常被诊断为中晚期。虽然有多种方法来筛查结直肠癌中的生物标志物,但常常缺乏灵敏度或特异性。miRNA属于一类小的非编码RNA,其可以在转录后期调节靶基因的表达水平。越来越多的证据表明,miRNA可以作为癌症检测和准确预测预后的理想生物标志物以及治疗靶标。miRNA的数量从2002年到2014年大大增加,最新的miRBase版本(版本21,2014)包含2588个成熟的人miRNA条目。有一些研究通过分析在结直肠癌(colorectal cancer,CRC)组织和配对的相邻非癌性结直肠组织之间的miRNA表达谱来筛选生物标志物,但是在每个研究中鉴定显著性表达的miRNA的结果是不一致的。有几个原因导致不一致的结果:如不同的技术检测平台、各种数据处理方法、不断发现新的miRNA和不同背景的样品。随着结直肠癌(colorectal cancer,CRC)miRNA表达谱数据的广泛出现,不一致结果也越来越多。为了克服这些缺点,我们需要整合结直肠癌miRNA表达谱的结果以消除各个研究之间的偏倚。生物学研究中的“实验室前”整合分析步骤是至关重要的,可以加速精确医学和转化医学研究。我们针对芯片原始数据,应用优化的MetaQC(meta quality control)软件包,优化纳入/排除标准进行miRNA芯片的荟萃分析。MetaDE(meta differential expression)软件包和 MetaPath(meta pathway enrichment analysis)软件包被开发用于候选标记物和信号通路,提供标记物检测、荟萃分析和信号通路分析的方法。在鉴定、提取和注释微阵列研究后,应用MetaQC来确定研究的纳入/排除标准。然后MetaDE和MetaPath可以单独使用来检测与疾病结果相关的候选标记或信号通路。我们使用MetaDE包中的Fisher方法和t检验来执行7张miRNA芯片整合分析,以识别不同表达谱数据集表达一致的差异miRNAs。此外,在TCGA(The Cancer Genome Atlas,TCGA)的CRC组织临床数据集中进一步验证了一致上调和下调miRNA,减少假阳性的发生,筛选出公共的差异miRNAs。MiR-195位于17号染色体短臂13.1区带,高度保守。miR-195是microRNA-15/16/195/424/497家族的关键成员,在胃癌、肝癌、乳腺癌、膀胱癌等多种肿瘤中下调,这进一步提示miR-195可能是一个重要的抑癌基因。已经报道了在各种类型的癌症中miR-195作为肿瘤抑制剂。它与miR-15/107家族具有旁系同源性、且进化保守,已被认为具有相当大的预后预测潜能。MiR-195-5p是miR-195产生的一条成熟miRNA,尚需进一步探讨其在结直肠癌中的生物学功能。本课题主要包括以下三部分:第一部分:结直肠癌miRNA表达谱芯片整合分析及诊断预后价值目的:结直肠癌是全球最常见的恶性肿瘤之一。有一些研究通过分析在CRC组织和配对的相邻非癌性结直肠组织之间的miRNA表达谱来筛选生物标志物,但是在每个研究中鉴定显著性表达的miRNA的结果是不一致的。为了克服这些限制,我们需要整合结直肠癌miRNA表达谱的结果以消除各个研究之间的偏倚。随着结直肠癌(colorectal cancer,CRC)miRNA表达谱数据的广泛出现,不一致结果也越来越多。提出和改进miRNA多芯片整合分析的流程,一方面用于miRNA芯片的质量控制,鉴定差异表达基因和检测丰富的通路而圆满完成微阵列芯片荟萃分析。另一方面,miRNAs表达数据集的综合分析的差异表达结果在TCGA数据集中进行进一步验证。进一步研究的筛选出的一致性的miRNAs是否与CRC患者的早期诊断、总生存相关,并探索其诊断价值和预后价值。方法:检索并收集 Medline、GEO Databases、ArrayExpress Databases 结直肠癌患者的miRNA芯片资料,所有的芯片数据进行归一化处理,应用Robust Multi-Array Average(RMA)和 linear models for microarray and RNA-seq data(LIMMA)软件包,同时对基因探针不同的IDs进行注释转换。所有的miRNA的名字是根据miRBase数据库版本(version 17)和通过miRBase Tracker网站验证后组成。同时我们应用python软件提取GSE芯片上的临床信息、样本信息、平台信息和分组信息。我们使用R语言MetaOmics软件中MetaQC、MetaDE和MetaPath软件包行芯片meta分析差异的miRNA分析。考虑到芯片平台的不一致性,我们首次采用了 4种不同的统计方式(Fisher,AW,maxP,rOP)进行预实验。最后选择Fisher’s方法进行显著性检验,使用校正T检验(modified t test)和置换检验(permutation method)拟合数据300次,产生最终的P值。单侧检验用于分析上调或下调的差异miRNA。对于差异miRNA。用t检验分析结直肠癌组和正常组织组表达差异,受试者工作曲线(Receiver operating characteristic curve,ROC)测试miRNA早期诊断CRC的能力;用Kaplan-Meier生存曲线和Log-rank检验分析CRC患者总生存时间与miRNA表达的关系;用Cox多因素风险比例模型筛选独立预后因子;双侧P<0.05定义为差异有统计学意义。结果:初步纳入的23个完整的数据集,最终纳入的定量合成和整合分析的7个完整的数据集,合并数据集后,我们用4种不同的统计方法(Fisher,AW,maxP,rOP)寻找差异基因,最多鉴定出32个差异miRNA。通过均值和标准差(10%)过滤低表达强度和小变异基因后保留了 24个miRNAs。我们应用了校正t检验和Fisher检验计算研究间-log(p)值,同时应用300次置换检验来拟合模型,以消除不同批次样本的影响。在合并效应量大小之后,用Fisher’s检验合并P值,我们鉴定了总共21个差异的miRNA(P<1E-19)。CRC组与PANT组相比,单侧检验筛选出在CRC中的上调的(高度表达的)10种miRNA,在CRC中下调的11种(低表达的)miRNA。我们将11个下调的miRNA作为研究对象,在七个数据集中同时进行无监督层次聚类,可以良好区分CRC与PANT样本。本研究进一步在TCGA-COAD数据库中验证在训练集中挑选出来的11个在 CRC 中低表达的 miRNA(HSA-LET-7A,HSA-LET-7F,HSA-MIR-125B,HSA-MIR-192,HSA-MIR-145,HSA-MIR-143,HSA-MIR-195,HSA-LET-7G,HSA-MIR-155,HSA-MIR-148A,HSA-MIR-130A)。在 TCGA-COAD 患者中仅有has-let-7a,has-miR-125b,has-miR-145 和 has-miR-195 这 4 个 miRNA 显著性下调,并且每一个miRNA的都可以良好地区分CRC组织和正常组织,受试者工作特征曲线下面积(AUC)达到0.887至0.989。我们可以通过建立联合多种miRNA的的线性回归模型获得最佳分类诊断模型,准确度达到100%(AUC = 1):CRC风险评分=5.091×miR-125b-57.423×miR-145-86.136×let-7a + 25.798×miR-195 + 1712.826。为 了进一步研究 miRNA是否与CRC患者的总生存相关,我们绘制了 Kaplan-Meier生存曲线发现:低miR-195水平预示着CRC患者的总生存率差。在TCGACRC组织中低水平的let-7、miR-125b或miR-145却可以改善总生存率。总之,在TCGACRC患者中观察到miR-195的下调可能导致患者总生存率差,与7张miRNA芯片整合分析的结果一致,筛选出miR-195作为抑癌基因,可能对了解CRC发病机制和预测预后有重要意义。结论:与单个研究的miRNA芯片分析相比,本研究整合了大样本多中心的结直肠癌miRNA芯片,同时应用了公共的TCGA-COAD数据进行了测试。在CRC肿瘤中仅有 has-let-7a,has-miR-125b,has-miR-145 和 has-miR-195 这 4 个 miRNA 显著性下调,并且每一个miRNA的都可以良好地区分CRC组织和正常组织,通过受试者工作特征(ROC)曲线分析的分类准确性较高,曲线下面积(AUC)达到0.887至0.989。通过建立联合多种miRNA的的线性回归模型获得最佳分类诊断模型,准确度达到100%。同时提示多miRNA和多平台间存在明显的差异,需重视差异miRNA的表达和质控,筛选出来的4个miRNA组成的联合诊断芯片具有极高的早期诊断和预后价值。miR-195的表达变化与7个芯片meta分析结果一致。同时,在测试集样本运用cox回归模型证实miR-195可作为独立的预后因子。第二部分:体外miR-195-5p对结直肠癌细胞生物学行为的影响和抑制裸鼠成瘤的体内研究目的:在前期实验中,我们已经通过7张芯片的整合分析和TCGA-COAD芯片的初步验证,筛选出诊断效能高且在结直肠癌组织中低表达的miR-195-5p,并且低表达miR-195-5p的结直肠患者预后差,这提示miR-195-5p可能在结直肠癌的发生和发展过程中扮演抑癌基因的角色。由此,我们旨在探讨miR-195-5p的具体生物学功能及可能存在的分子机制。我们采用瞬时转染的方法,分别上调和下调结肠癌细胞系DLD1和HCT116中miR-195-5p的表达,在体外水平观察miR-195-5p对结肠癌细胞的增殖、克隆、侵袭和迁移等生物学行为的影响。然而肿瘤在体内的发生发展是细胞与机体之间相互作用、微环境稳定被打破的一个复杂的生物学过程。单纯的体外细胞水平实验,尚不足以证明miR-195-5p在体内也同样能够抑制结直肠癌的发展。为了进一步验证miR-195-5p的体内效应,我们应用miR-195-5p agomir转染结直肠癌细胞后,通过裸鼠成瘤实验观察其对肿瘤生长的影响。方法:筛选出与正常肠粘膜上皮细胞相比,miR-195-5p表达下降的DLD1和HCT116细胞系。对结肠癌细胞株瞬时转染,分为空白对照组、miR-195-5p模拟剂阴性对照组、miR-195-5p模拟剂组、miR-195-5p抑制剂阴性对照组、miR-195-5p抑制剂组五组。倒置相差显微镜下观察转染前后细胞株形态学变化,BrdU免疫荧光染色、克隆形成实验、MTT法检测细胞增殖能力,划痕实验检测细胞运动能力,采用Transwell小室模型检测细胞侵袭及迁移能力。应用R语言(version 3.2.3;http://www.r-project.org)进行数据统计分析,两组间均数比较采用t检验,多组间均数比较采用单因素方差分析,以P<0.05为差异有统计学意义,P<0.01为显著差异。从湖北实验动物研究中心购买BALB/c无胸腺裸鼠(雌性,4-6周龄,16~20g)。选用4周龄的BALB/C裸鼠,体重约为14-18克,随机原则分2组,每组6只。分别为实验组(miR-195-5p agomir组)、对照组(miR-195-5p agomir NC组);用一次性注射器将DLD1细胞悬液注射到裸鼠胸侧皮下右侧腋窝处,注射细胞量为2-4X106细胞;观察裸鼠肿瘤生长情况并于接种后隔天测瘤体大小1次,记录裸鼠重量,肿瘤的长径(L)和横径(W),计算肿瘤体积,记录肿瘤重量,比较组间差异。结果:BrdU免疫荧光染色实验显示,miR-195-5p抑制DLD1和HCT116细胞中的DNA合成。相比之下,miR-195-5p抑制剂处理可以提高这种抑制作用。细胞平板克隆形成实验表明,在两株细胞中,转染miR-195-5p mimics组细胞较mimics NC组相比,集落数明显下降(P<0.01);而转染miR-195-5p inhibitor组细胞较inhibitor NC组相比,细胞克隆形成能力有所增强(P<0.01)。此外,克隆形成检测显示,与空白对照相比,miR-195-5p处理降低了 DLD1和HCT116细胞的克隆形成,而miR-195-5p抑制剂处理的DLD1和HCT116细胞显示逆转表型,表明miR-195-5p负调节CRC细胞增殖。MTT法检测各转染组的细胞增殖情况。过表达miR-195-5p的细胞OD值在72h、96h明显下降(P<0.05),相反,抑制miR-195-5p的细胞OD值在72h、96h明显升高(P<0.05)。MiR-195-5p模拟剂组对比对照组或miR-195抑制剂处理的细胞慢得多的速率向划痕迁移。转染miR-195-5p mimics后,细胞的迁移和侵袭能力降低了 40-60%;下调miR-195-5p的表达后,细胞的侵袭和迁移能力较miR-195-5p抑制剂对照组增加,而DLD1和HCT116迁移能力和侵袭能力较miR-195-5p抑制剂对照组明显增强。在transwell侵袭和迁移测定中,我们发现miR-195-5p表达细胞的侵袭和迁移减少,这种作用可以被miR-195-5p抑制剂逆转。综上所述,miR-195-5p负调节结肠癌细胞的侵袭和迁移。为了确认miR-195-5p在体内的肿瘤抑制作用,我们使用DLD1和HCT116细胞建立了 BALB/c裸鼠异种移植瘤模型。用miR-195-5pagomir处理的肿瘤的体积和重量都相对于用miRagomirNC处理的肿瘤显著性降低。Western blot和免疫组化证实miR-195-5p抑制Hippo通路和下游的EMT相关蛋白。结论:本研究显示,miR-195-5p在DLD1和HCT116细胞中的过表达抑制细胞生长、增殖、克隆形成、侵袭和迁移。miR-195-5p抑制剂可能有助于结直肠癌细胞增殖、侵袭、迁移。miR-195-5p可抑制结肠癌细胞体内生长,证实了 miR-195-5p在结直肠癌的成瘤中表现为抑癌作用。第三部分:miR-195-5p靶基因的预测和验证目的:miR-195-5p在结直肠癌组织及结肠癌细胞株中表达明显下调。体外功能实验发现,上调结肠癌细胞株DLD1及HCT116中miR-195-5p的表达能显著抑制细胞的增殖、侵袭和迁移;而抑制miR-195-5p的表达,得到相反的结果。因此,miR-195-5p在结直肠癌的肿瘤发生中可能起到抑癌基因的作用。本部分研究中,我们综合运用GO、KEGG、PPI等生物信息学手段来预测miR-195-5p的靶基因,同时用双荧光素酶报告基因实验来验证,深层次探讨其作用机制和结合靶点。方法:通过四种不同的靶预测算法筛选公共靶基因。GO(GeneOntology)分析根据GO数据库解释miR-195-5p的靶基因的主要功能。Fisher精确检验用于计算每个GO项的显著性水平(P值),以筛选出miR-195-5p的共同靶基因富集的显著性GO项。同时对分子功能、生物过程、细胞定位进行了分别的总结。我们应用R语言进行了 KEGG分析。我们应用蛋白质交互作用网络(protein-proteininteractionNetwork,PPI)进一步筛选可能的靶蛋白。qRT-PCR和western blot、荧光素酶报告实验进一步验证miR-195-5p直接结合到YAP1 3’-UTR中的预测的结合位点。结果:富集miR-195靶基因的最顶端的10个KEGG途径主要与癌症特异性途径相关,包括Hippo信号通路、癌症中的蛋白聚糖、病毒癌发生、癌症和前列腺癌中的信号通路。综合软件预测结果,最重要的中枢蛋白是CCND1和YAP1,我们挑选YAP1基因(蛋白)为miR-195-5p可能的靶基因。我们还检测了包含60例CRC和PANT的患者的YAP1表达,qRT-PCR和western印迹结果显示,与PANT相比,YAP1在CRC中显著性上调。Kaplan-Meier和Cox的比例风险回归模型还显示,高水平的YAP1患者具有较短的总生存期。将YAP1 3’-UTR克隆到荧光素酶报告质粒中,并定量相邻hRluc编码区的表达,显示了 miR-195-5p的潜在靶标YAP1,含有两个保守的miR-195-5p同源位点,即 YAP1 3’-UTR 的 162-168 和 1857-1862,是 miR-195-5p 的预测靶点。miR-195-5p抑制荧光素酶活性,而miR-195-5p抑制剂可以促进带有野生型YAP1 3’-UTR的报告质粒的荧光素酶活性,miR-195-5p直接结合到YAP13’-UTR中的预测的结合位点,并负调节YAP1表达。qRT-PCR和Western印迹显示miR-195-5p表达细胞中YAP1水平降低,而miR-195-5p抑制剂处理的细胞中YAP1水平恢复。此外,TAZ、Vimentin、ZEB2和SMAD3蛋白的表达也受miR-195-5p负调控,而E-钙粘蛋白受miR-195-5p正调控,表明miR-195-5p在HIPPO/YAP/EMT信号通路中表现为抑制作用。结论:miR-195-5p可以通过靶向其YAP1 mRNA 3’-UTR直接调节YAP1的表达。miR-195-5p的异位表达可以减少细胞迁移和侵袭并促进EMT标记物E-钙粘蛋白的表达。