三代RNA测序序列的比对和分析工具

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:kzyzf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了理解人类的遗传机制,以便用于人类疾病的治疗和预防,对于生物序列的研究成为了研究分析遗传的基础。最基本和最关键的研究就是对于人类遗传物质的序列研究。随着测序技术的发展,第二代测序技术和第三代测序技术先后引领了一段生物信息学的发展前沿。随着测序技术的进步,为了适应发展需求,大量的序列比对算法开始逐渐产生和发展。二代的DNA序列比对技术相比于传统的DNA序列比对技术来讲速度更快,节省更多空间。二代测序技术同样带动了RNA序列比对技术的发展,为了满足二代测序数据产生的RNA序列数据的比对需要,开发出了很多类型的二代RNA序列比对工具。对于RNA序列比对的研究,首先要研究RNA的生物学特性,在了解清楚RNA的生物学背景后,我们才能研究出适应发展需求的RNA序列比对工具。而三代测序技术的发展则带动了RNA测序技术的更进一步发展,但适用于三代RNA测序序列的算法工具目前几乎没有,目前的RNA序列比对软件在三代RNA序列的比对方面还急需加强。本文设计了一个针对三代RNA测序序列的比对分析算法,实现了对三代RNA测序数据的比对和外显子组分析,其主要工作是对三代RNA测序数据进行比对,根据其长读长的特点将其进行分割,对得到的短序列使用BWA方法进行比对,比对到参考基因组上得到比对结果。根据比对得到的结果对匹配上的位置区域做合并得到全基因组上的外显子岛区域信息,通过构造连通图,使用动态规划等计算最优路径等找出外显子岛的比对信息。之后则利用三代RNA长序列来进行序列的外显子组成分析,使用上一步得到的外显子岛序列,来对序列的外显子岛组成进行分解,根据各个长序列的组成分析。对于同一基因的不同剪接,体现为相似序列的外显子岛的组成不同,主要是依据序列的外显子岛是否有重复,得到可变剪接的对比结果。
其他文献
目的探讨胃癌组织中树突状细胞和记忆T淋巴细胞浸润与患者预后的关系。方法采用免疫组化方法检测102例胃癌组织中树突状细胞(DC)、记忆T淋巴细胞的浸润数量及分布,将实验结果
随着下一代基因测序技术的发展,测序成本以超过摩尔定律的速度急剧下降,与此同时测序速度也大幅提升。这一系列进步导致了测序数据爆炸性的增长,从而使得测序数据的分析成为
所谓的人文素养是指一个人自身具有的基本品格和对待人生与世界最基本的态度,以及可以正确处理自身在社会中和他人关系的一种能力,人文素养是学生综合素质教育中最为重要的内
南京市北京东路小学是江苏省首批省级实验小学、全国首批青少年科技教育示范基地、国家教育部首批命名的“全国现代教育技术实验学校”。我们在开展“情智教育”的实践与探索
化学课程是中学生的一项重要学科,化学实验是化学教学过程中必不可少的一部分,这个时候是体现中学生动手能力的关键时候。中小学在实验中的动手能力是教师教学任务的重要组成
本文通过对某中学的16个班的在校学生1280人进行实验测试(其中男生880人,女生400人)和走访调查了解他们在足球运动中体育兴趣的提高度。分别从兴趣的定义和引发兴趣的原因入
从城市公共交通系统的投入产出角度出发建立基于数据包络模型(DEA)的效率评价模型,给出城市交通系统"输入"和"输出"有效度的评价方法与指标,进而得到城市公共交通系统效率的
为分析花岗岩颗粒流模型循环作用下的能量特征,基于花岗岩单轴压缩试验得到的应力应变曲线,完成了PFC3D数值试验的参数标定,探讨了不同循环次数下数值试件内部总能量、弹性应
海南疍家饮食文化作为海南海洋文化的载体和符号,是海岛文化与大陆农业文化交汇融合的产物。海南疍家饮食文化在物化特征和观念特征上具有明显的海洋化特质,因而在旅游开发方
<正> 血淋案(乳糜血尿) 叶某某,女,62岁。患者因尿血二日病情凶险而住院,诊为乳糜血尿。经泌尿外科治疗20天,肌注安络血,静滴ATP、辅酶A、细胞色素C、输血、口服潘生丁、消心