一种限定性模体发现问题的算法研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:xt23z
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模体(Motif)是指一组序列中局部的保守区域,或者是一组序列中共有的一小段序列模式。更多的时候是指有可能具有与分子功能、结构性质或家族成员相关的任何序列模式,其主要存在于蛋白质、DNA、RNA等序列中。模体的发现对研究基因表达意义重大,是后基因时代生物信息学中的一个主要研究方向。目前模体发现问题研究主要集中于转录因子结合位点,即在DNA序列中具有特定功能并且保守的序列片段。而对限制性内切酶结合位点的发现问题同样是模体发现研究领域中的一个重要研究点。与前者不同,后者则是加入了一些限定条件。限制性内切酶结合位点挖掘问题是指给定正例和反例核苷酸序列集合,并指定模式P,要求找到符合模式P的模体m只在正例序列集合中有模体实例存在,而在反例序列集合中不能出现模体m的实例。在这个过程中核苷酸序列的反向互补序列也要考虑进去,因此这类问题可以看作是一种限定性的模体发现问题。此类具有限定性的模体的发现可以推断出新的限制性内切酶,进而可以针对不同外源DNA使用相应的内切酶破坏其DNA结构以限制其侵入,从而起到了保护细胞原有的遗传信息的作用。虽然目前在转录因子结合位点研究领域已经出现了很多算法和相应的软件,如MEME、AlignACE、Gibbs Sampler、PMS系列等。这些算法中,多数算法及其改进算法可以很好地解决多数模体挖掘问题,但这些算法并不能直接用于寻找带有限定性的模体发现问题。因此本文针对该类模体发现问题提出了两种有效的算法——倒排索引算法和L-PMS算法。倒排索引算法(Inverted Index Algorithm)首先以字典顺序列出给定模式P的所有实例I={I1...N},然后对每个实例Ii进行比较验证,若该实例满足只出现在正例序列集合中,而在反例序列集合中不出现的要求,则该实例作为最终模体输出;L-PMS算法基于PMS8算法,PMS8算法是植入模体发现问题(Planted Motif Search,PMS)中的一种比较高效的算法。L-PMS算法对PMS8算法进行了改进,将PMS8算法中的植入(l,d)实例问题和指定模式P问题相结合,很好地解决了限定性模体发现问题。
其他文献
近些年来,随着移动互联网技术的发展以及移动网络的提速降费,移动视频业务逐渐受到人们的欢迎。DASH(Dynamic Adaptive Streaming over HTTP)作为一种新型的视频流媒体技术,
随着互联网信息的爆炸式增长,用户在数据严重过载的情况下获取信息的成本越来越高,为了帮助用户更加便利而且精准的获取数据,推荐服务应运而生。然而传统的推荐算法却面临着
多标签文本分类因为其类别标签个数不确定的特点一直是自然语言处理领域的研究难点,更是文本分类任务最大的难题。现阶段的多标签文本分类算法更多集中在多标签分类器输出空
肿瘤作为机体的新生物,它的生长、分化、转移不仅受某些特定基因的影响,同时其所处的生存环境也影响其某些生物行为。我们称肿瘤直接生存的环境为”肿瘤微环境”,它一方面为肿瘤提供源源不断的营养和生长环境,另一方面配合肿瘤逃逸免疫抵抗,协助肿瘤细胞转移侵袭。除了间质细胞、上皮细胞外,主要还包含各种免疫淋巴细胞及其分泌的炎症因子等。免疫微环境中的各种免疫淋巴细胞群中T淋巴细胞、自然杀伤细胞等是肿瘤杀伤效应主要
十八大报告明确提出要“加快改革户籍制度,有序推进农业转移人口市民化”;十八届三中全会也强调“推进农业转移人口市民化”;十九大报告再次提出“加快农业转移人口市民化”
海洋拥有丰富的生物和矿产资源,使用深海设备跟踪水下生物、监测与跟踪深海采矿过程等对人类探索海洋资源具有重要意义。如何对水下单目标物体进行快速、准确、稳定的跟踪成为近些年学者们研究的热门课题。水下单目标跟踪存在一定的特殊性和难点,例如水下图像的清晰度和对比度差、背景环境复杂多变、物体自身的运动以及被遮挡等。近几年机器视觉和深度学习快速发展,以深度学习为核心的单目标跟踪算法在处理复杂环境下的自然图像时
毛细管电色谱是指在填充或涂覆了色谱固定相的毛细管中实现电泳分离的一种分离分析技术。在一定程度上,毛细管电色谱兼具毛细管电泳和高效液相色谱两种分离机理,既可以分离带
车载网(Vehicular Network)与信息中心网络(Information Centric Network,ICN)有着天然本质的联系与相似性,在车载网中引入ICN技术后能有效的改善信息传输效率。但ICN技术引
筒体结构是目前高层建筑中应用最为广泛的结构形式之一,分为框架-核心筒、框筒、筒中筒、束筒四种结构。其中框架-核心筒结构兼具有框架与剪力墙结构的优点,是一种性能优良的
本文证明了偏序超半群理论在模糊偏序超半群理论中也可以找到一套相似的理论,给出偏序超半群上几类模糊理想等价刻画、几类正则偏序超半群的等价刻画和半单偏序超半群的等价