耐药菌全基因组测序数据的质量控制可视化

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:morenedu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
耐药菌的大量存在和传播,日益威胁公众健康和卫生安全,给临床、实验室检测和监测细菌耐药性方面的工作带来严峻挑战,亟需对病原菌进行快速的药物敏感性测试和细菌耐药机理分析。单细胞全基因组测序在发现新的耐药基因上有着快速免培养、可揭示异质性等优势,但是由于单细胞测序数据易污染、测序偏好性大,需要对单细胞测序数据进行全面的质量控制和深层次分析。目前,针对耐药菌基因组数据分析的工具和集成化系统有待完善,其分析方法也需改进。本文一方面进行耐药菌测序数据的全面质量控制。首先,收集公开数据并进行基本分析,发现公开系统中数据来源较单一,选取部分数据作为基因注释的对比参考。然后,对高通量处理结果进行一系列的可视化分析设计,对单核苷酸多态性、基因组污染进行统计分析与可视化;使用t-SNE算法对序列所属科系类别进行可视化,发现B3样本中含大量肠杆菌科、棒杆菌科细菌和棒状杆菌等信息。最后,选取单个、多个样本的基因组序列数据分别进行了潜在类别分析和潜在类别回归分析,分析耐药菌的基因序列特点,有助于耐药菌性能的基因分析。另一方面构建集成化、可视化的分析系统。使用R的shiny技术构建了单细胞全基因组测序数据统计分析可视化平台,该平台主为一个系统性、流程化可视化平台,主要用于集成高通量数据分析结果,并进行深入分析和可视化。本平台与高通量分析平台联合形成完整的可视化系统,该分析系统性能优、操作便捷、实用性强,可进行任意个数样本的同步分析;平台经Docker部署后可实现多端口同时使用;用户仅需读入数据、轻松点击即可实现复杂的数据分析可视化功能。将一组耐药菌全基因组测序数据导入平台进行测评,验证了平台性能良好。本系统能够有效提高科研效率和分析效果,可在耐药菌的全基因组测序数据的研究中发挥重要作用。
其他文献
随着工业互联网的迅速发展,IPv4协议已经无法满足工业现场海量设备接入对地址的需求。IPv6(Internet Protocol Version 6)作为下一代IP协议,为IP网络与工业网络的无缝连接提
手势识别是人机交互(Human-Computer Interaction,HCI)的热点研究问题之一,在虚拟现实、机器人遥控、智能驾驶、办公辅助、游戏娱乐和手语识别等领域应用前景十分广阔。随着
Inconel 718(IN718)是一种Ni-Cr-Fe型高温合金,主要应用于航空、航天发动机中涡轮叶片的制作。目前,该合金主要采用铸造、锻造和粉末冶金法制备,这些方法制备温度高,存在合金晶粒粗大的问题。相比于铸造、锻造法,粉末冶金法制备的高温合金力学性能更为优异。但是采用粉末冶金法制备IN718合金烧结时间长,且都需要固溶处理后再进行时效处理。本论文针对传统烧结方法中制备周期长的问题,提出了采
理解历史森林数据并从中学习以便避免过去的错误是迈向成功管理森林的重要一步。森林经营中缺乏有关历史数据的信息,会导致森林经营者做出不当的管理决定。能够保留历史森林
在解决视觉分析问题时,一般的深度学习方法从训练数据中学习输入空间到解空间的函数映射,忽视了和任务相关的先验知识,因此深度学习方法大多受限于训练数据,易出现泛化能力不
双支持向量机(TSVM)是基于支持向量机(SVM)上提出的一种新型机器学习方法,具有良好的学习性能,目前已成为机器学习领域的研究热点。TSVM常用于解决分类和回归问题。对分类问题而言,双支持向量分类机(TSVC)目的是寻找一对非平行的分类超平面;对回归问题而言,双支持向量回归机(TSVR)旨在训练样本点的两侧产生一对非平行的回归超平面,用于分别确定回归函数的不敏感上下界函数。为了简化TSVR的计算
近年来,大规模图数据管理与挖掘已经成为了当前学术界和工业界的研究热点。在大规模图数据中,通常都包含连接紧密的社区结构。从大图数据中搜索连接紧密的社区结构具有重要的科学价值和广泛的实际应用。当前主流的社区搜索技术主要包括基于极大团的社区搜索和基于k-核等稠密子图模型的社区搜索。这些算法的效率通常都依赖于图的退化度(Degeneracy)度量。退化度是一个用于度量网络稀疏性的一个重要指标,设计一个快速
理工科院校是高校群体中的一部分,是未来高科技人才的聚集地,是未来高素质公民的“孵化池”,是培养高尖端人才的主阵地,担负起培养健全人格各方面综合发展的人才重任。而作为
由于众多工程领域的实际需求,近三十年来,反问题已成为应用数学中发展和成长最快的领域之一。反问题是多种多样的,且在经典意义下往往都是不适定的,反问题的不适定性成为了研究的重点及难点。其中,热传导方程的反演问题便是反问题的一支重要分支,已有众多的数学家对其进行了研究。本文从变系数抛物型方程的源项重构问题出发,用不同的方法进行研究,再到退化型抛物型方程的研究。论文中运用新的方法对不同的模型分别进行了研究
胰岛素受体(Insulin Receptor,IR)在胰岛素发挥其降血糖生理功能的过程中扮演着重要的角色。胰岛素与位于细胞上的胰岛素受体结合时,会引起胰岛素受体构象的转变以及引起胰岛素受体酪氨酸磷酸化修饰,进而激发一系列下游信号通路,最终使胰岛素可以发挥其功能。胰岛素受体β亚基上的1158,1162和1163位酪氨酸(Tyr1158/1162/1163)磷酸化修饰决定其酪氨酸激酶的活性;当此部位的