质谱数据分析与N-糖链结构鉴定算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:chhy6266746
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质的糖基化是一种生物体内普遍存在且十分重要的蛋白质翻译后修饰,所有表达的蛋白质中,大约有50%是被糖基化的。糖基化后的蛋白质参与了生物组织的发育以及多种生命活动的调节,异常的糖基化还会导致疾病的发生,因此糖链结构鉴定对于认识生命活动和疾病致病机理,具有重要意义。通过质谱数据鉴定糖链结构,是目前糖链结构鉴定的主要方向。但是存在如下问题:1)人工解析谱图需要耗费大量的人力物力;2)糖链结构本身极其复杂,增加鉴定的复杂度;3)糖数据库不完整,导致鉴定结果不准确。这些问题导致了N-糖链结构鉴定研究工作面临着巨大的挑战。现有主流的鉴定算法在数据集较为复杂的情况下性能表现不足,无法高效可行地解决这类问题。基于上述问题,本文提出了一种在大规模质谱数据集上对糖链碎片信息进行解析从而有效鉴定N-糖链结构的(Glyco BCNovo)算法,主要内容如下:1.提出了一种基于从头测序技术的N-糖链结构鉴定算法,通过引入单糖矩阵、基础峰和交叉峰等概念,以及对输入谱图的分析和预测,输出所有可能的糖链候选结构:将谱图信息转化为单糖邻接矩阵,用识别谱峰是基础峰或交叉峰的方式一步一步生长矩阵中对应的单糖从而重构出糖链结构,并对其打分,选择得分较高的前三种作为最终预测结果。2.引入广义原子字典,通过补全缺失谱峰以提升谱图的质量,提高了算法对噪声的鲁棒性;在N-糖链的鉴定过程中会产生大量冗余的同构结构,提出了基于哈希编码的去冗余算法,缩减了每生长一个单糖后产生的结构搜索空间,提高了算法的运行效率;3.设计糖链结构的可视化算法,通过分配给每个单糖合适的占用空间的方式计算结点的物理坐标信息,对鉴定过程中的中间结构以及鉴定结束时的完整结构进行直观展示;并提出了一种新的基于诱饵策略的FDR估计方法,通过P值估计鉴定结果的FDR来衡量鉴定结果的可信度。本文将Glyco BCNovo算法应用于不同种类的仿真数据上,90%以上的数据鉴定得到的前三名结构中都包含有目标结构。再基于小鼠脑组织的真实质谱数据,使用Glyco BCNovo算法与已有的p Glyco2.0方法进行对比实验,实验结果表明,本方法具有更高的准确率且鉴定结果的FDR小于0.05,并能够鉴定出糖数据库中未收录的1683个糖结构,可以看出Glyco BCNovo算法在N-糖链鉴定问题上是有效的。
其他文献
学位
随着电子科学的进步和电子终端市场的不断发展,各种电子设备的数字信号传输速率不断提高,并行总线已经不能满足处理器的发展速度。想要有效提高总线的传输速度,一般有两种途径,一种是提升频率,另一种是提升处理器位宽。如果一味的提升频率,则可能会导致并行总线信号间的串扰增多,从而使得时序难以收敛;如果提高位宽,则会使信号线的数量增多,又会带来其他许多不必要的问题。基于以上问题,高速串行总线开始登上历史舞台,逐
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)船舶检测是SAR图像解译任务的重要组成部分,可在军事侦察、民事探测等任务中提供信息支持。SAR图像船舶检测的结果可作为其他解译任务的前置条件,检测结果影响整个SAR图像自动识别系统的性能。针对SAR图像船舶检测遇到的问题和深度学习模型的优点,本文提出了基于深度学习的SAR图像船舶检测。神经网络从图像数据中学习船舶目标的抽象特征
我国洪水灾害频发,严重威胁着我国人民的生命财产安全,每年造成巨大的经济损失和人口伤亡,如果可以在洪峰峰值和洪水到达时间上实现高精度的预报,提前指导灾区人民紧急避险,就可以将损失大大减少。传统的洪水预报模型涉及洪水产生的物理过程,面临着计算复杂,后期维护成本高,开发周期长等困境。即使是专业人士,在传统模型迁移到新流域后,其内部主要的十几个参数也需要较长时间的推断以及实地测量才能确定。随着计算机技术的
随着确定性网络技术的进步与发展,其应用场景不再局限于固网系统,向着动态协同工作领域不断延伸。例如在卫星节点之间搭建分布式协作系统,利用确定性网络在高速星间链路上传输实时性信息。由于卫星之间位置不断变化并且易受到外界因素的干扰,传统确定性网络技术标准TSN(Time Sensitive Networking,TSN)并不适用于新的链路场景。因此,本文以TSN关键调度技术为背景,结合实际卫星链路特性,
在无线通信领域中,携带不同模态轨道角动量(OAM)的电磁(EM)波具有特殊的模式正交性,可以显著提高数据传输效率,涡旋电磁波的这个特性使得其在大容量无线通信领域的应用具有极大的开发价值。然而,涡旋波螺旋形状的相位分布使得涡旋波具有一定的发散特性,且随着涡旋波模式的增加,涡旋波的发散角也随之增大。发散角的影响使得涡旋波在远距离传播时波前直径变大,使得接收天线的尺寸被迫增大,不利于涡旋波的接收。不仅如
近年来,以GPS和北斗为代表的卫星定位导航技术得到迅速发展,在工业、商业和日常生活等领域发挥了重要作用。然而,由于信号遮挡和衰减等原因,在建筑物内部和地下等室内环境或密集的楼宇之间,卫星定位技术并不能有效工作,定位结果不再准确和可靠。而同时,物联网、智慧城市和移动互联网等领域都对高精度的室内定位服务提出了多样化的需求,在室内环境下获取高精度的位置信息,成为连接网络空间与实际环境,紧密融合人与环境、
随着无线通信技术和互联网技术的快速发展,万物互联成为了可能,无线终端设备上运行的生活服务、智能办公、信息推送等类型的应用程序为终端用户提供了丰富便捷的服务,但同时也加重了无线终端设备的计算负载和能源负载。受限于无线终端设备的计算能力、缓存能力和电池容量,用户在实际使用这些终端应用程序时,经常会遇到业务处理延迟大的问题。当处理延迟大于业务最大可容忍延迟时,服务就会中断,降低了用户服务质量(Quali
学位