论文部分内容阅读
本项研究采用第二代超高通量DNA测序技术结合生物信息学的方法,对来源于内蒙古阿尔巴斯型白绒山羊的绒毛生长期与静息期三个皮肤部位的样本进行了深度的转录组测序,并运用de novo的方法对其皮肤转录组进行从头组装,随后对这两个时期所出现的差异表达基因进行了深入系统的分析,以便更加深入地了解绒山羊绒毛生长的分子机理,找出潜在的可能与绒毛生长相关的基因,为今后进一步进行功能验证提供理论依据。1.绒山羊皮肤转录组的高通量测序及de novo组装及组装效果评估在绒山羊绒毛生长期和静息期分别取两只雌性阿尔巴斯绒山羊个体的腹部、体侧和背部皮肤共计6个样本,进行RNA-Seq文库的构建和Illumina/Solexa高通量测序。共得到2亿8千多万条100bp的读段,从头组装得到57,568条长度大于300bp的转录本序列。这些转录本序列长度总和达到53Megabase,平均长度928bp,N50长度1,397bp。将57,568条转录组序列与NCBI的非冗余蛋白数据库进行比对,其中有24,640条为阳性。随后对转录组序列的蛋白质编码区进行从头预测,共发现24,058个蛋白质编码序列。从头预测的蛋白质编码序列数量与比对到数据库中已知功能蛋白的转录本数量非常接近。对随机挑选的10条预测出具有全长蛋白质编码区但在数据库中没有同源物的转录本序列进行RT-PCR和Sanger测序以验证转录组的组装效果,发现有9条序列的PCR结果为阳性,并且Sanger测序结果与de novo组装后的序列比对后均存在98%以上的相似度。此外,将用于de novo组装的短序列重新定位回57,568条转录组序列,发现88.1%的序列可以发生单一定位,而其中的92.4%又属于配对定位。以上结果表明组装得到了较长、质量可靠且较全面的绒山羊皮肤转录组序列。2.基于从头组装转录组序列的绒山羊不同绒毛生长时期皮肤转录组差异表达基因分析基于从头组装的转录组序列,我们对相同部位不同绒毛生长时期的文库进行配对,并构建了每个文库的基因表达谱。随后的差异基因表达分析共获得5,501条具有生物学重复的、一致性较好的差异表达基因。以绒山羊皮肤转录组为背景分别进行差异表达基因的KEGG、 KOG和GO的富集性分析,结果发现大量的胞外基质组分和细胞骨架蛋白编码基因出现在差异表达基因里,这些基因主要涉及胞外基质-受体相互作用、黏着斑连接、间隙连接等通路中,揭示在绒毛生长过程中细胞与细胞以及细胞与胞外基质的相互作用对绒毛生长是必须的。此外,很多信号通路中的生长因子以及受体都被鉴定为差异表达基因,并且在绒毛生长期相对于静息期是高表达基因。这些基因中很多都被证明是小鼠的毛囊建成以及发育所必须的。此外,对8个差异表达基因进行qPCR验证,结果显示qPCR与高通量测序结果存在很高一致性,表明转录组测序得到的差异表达基因是可靠的。3.基于山羊基因组的不同绒毛生长时期皮肤基因差异表达分析及与前者的比较基于最新测序的云南黑山羊基因组序列,我们对绒毛生长期和静息期的皮肤样本进行了基因差异表达分析。经过文库配比对对及进一步的数据交叉,共发现2,339个在绒毛生长期与静息期一致性的差异表达基因。与基于从头组装转录组序列的差显模型得出的结果相同,这些基因在功能上富集在了信号转导相关分子、细胞外基质、细胞骨架、粘着因子等相关的功能簇和pathway上,表明了两种基因差异鉴定模型存在高度的一致性。