基于位置权重矩阵的TAL效应物靶标挖掘算法的研究与评估

来源 :广西大学 | 被引量 : 0次 | 上传用户:zhangfei0960
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
TAL效应物(Transcription activator-like effectors)是黄单胞菌属植物病原菌分泌的一种特殊的三型效应物,在病原菌与寄主相互作用过程中起着重要的作用。TAL效应物的靶标直接反映了病原菌的致病性或无毒性,因而寻找TAL效应物的靶标直接影响到对寄主植物感病基因、抗病基因的鉴定,并有助于揭示病原菌和寄主长时间相互作用、共同进化的过程。而生物信息研究,特别是这些效应物的靶标预测能给靶标的鉴定提供极大的便利。因此,从生物信息学的角度提出有效的TAL效应物靶标预测算法是一项非常必要而有价值的工作。本文深入研究TAL效应物的相关知识,提出了两个TAL效应物靶标预测算法,分别是TargetMinerA算法和TargetMinerB算法。其中,TargetMinerA算法只对RVD (repeat variable diresidue)结合特异性进行建模,通过构建RVD特异性概率矩阵为特定RVD序列生成RVD结合特异性位置权重矩阵,设计了一个用于给可能靶点打分的新的打分函数,并提出基于RVD结合特异性位置权重矩阵的TAL效应物靶标预测算法。TargetMinerB算法同时对RVD结合特异性和RVD效率进行建模,根据RVD效率强弱对RVD效率进行了量化,同样设计了一个给可能靶点序列打分的新的打分函数,提出基于RVD结合特异性和RVD效率位置权重矩阵的TAL效应物靶标预测算法。为评估TargetMinerA算法和TargetMinerB算法的预测性能,本文使用MATLAB并行实现了这两个算法。为了测试算法的有效性,首先把已知的TAL效应物靶点数据分为初始训练集和测试集,使用初始训练集来估计算法的参数用于对测试集中TAL效应物进行靶标预测。结果表明,提出的算法都可以预测出测试集中的已知TAL效应物靶点。同时,本文通过对已知TAL效应物-DNA互作打分的方式讨论了算法扫描阂值的确定方法,并且通过本文方法确定出来的扫描阈值可以使得靶标预测算法对已知TAL效应物-DNA互作的预测性能达到较好水平。对基因组中已知靶点的打分排名发现,本文提出的算法对已知靶点打分排名总体上略优于已有算法。为预测出可靠的候选靶标,本文将基因表达数据与算法扫描基因组输出的可能靶标结合起来进行候选靶标的预测。实验表明,本文提出的算法不仅可以预测出已知靶标,而且可以预测出新的候选靶标。此外,本文还分析讨论了候选靶点相对于转录起始位点的位置偏好。结果表明,在转录起始位点上游25bp处是候选靶点比较多的地方。
其他文献
注册表是微软开发的一个庞大的树状分层数据库,用来保存操作系统上的软件配置信息、硬件信息、以及一些系统内核的具体调优参数。在Linux和Free BSD下并没有类似注册表这种原
无线体域网是无线传感器网络在生物医疗等领域的一个重要的分支,是由植入人体体内或是可穿戴的分布在人体体表的各类传感器组成的无线网络,可用于监测、采集和管理人体的不同
近年来,3D电影在商业上获得了巨大的成功,为3D影视行业带来了巨大的发展。随着互联网的不断发展和计算机性能的不断提高,互联网能够提供越来越高质量的多媒体服务,其中以YouT
随着移动终端的快速发展以及android系统的推出,NFC(Near Field Communication)技术在全球得到蓬勃发展,支持NFC业务的应用也得到相应的发展。如何将NFC技术和上下文相关技术
迄今为止,计算机软件系统虽然仅仅只有短短的几十年历史,但是已经成为最广泛、最重要的应用系统之一。从而软件的质量成为人们目前广泛关注、高度重视的热点问题之一。众所周
图像分割就是把图像分成若干个特定的、具有独特性质的区域并提取出感兴趣目标的过程。它作为图像处理的底层部分,其分割后的结果大量应用在图像理解、语义识别、图像搜索等
雾天条件下,由于大气粒子的散射作用,户外视觉系统获取的图像出现对比度降低、颜色失真、模糊不清等质量退化问题,造成特征提取、目标判别、目标跟踪等工作无法正常进行。因
在计算机视觉领域中,运动目标的检测是一门非常重要的技术,也是对运动目标作后续处理的基础。随着计算机技术与图像处理技术的发展,视频中的运动目标检测技术广泛运用到军事与民
无线自组织网络(Wireless ad hoc network,ad hoc)是由一组带有无线收发装置的移动终端节点组成的一个多跳临时性自组织网络。它可以在任何时刻、任何地点快速构建起一个移动
无线传感器节点随机散布,由电池供电,能量有限是其最主要的特点,数据的发送,接收以及处理都需要消耗能量,而发送数据消耗的能量最多,为节省能量,需为节点寻找一条消耗能量最少的传输