生物网络中的模体发现算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:fcgmqty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大量的高通量实验产生了PB级的生物组学数据,这些组学数据包含了海量的生物分子作用信息。如何从这些组学数据中挖掘出有价值的信息是计算生物学的一个重大挑战。为了研究生物分子间的调控机制,常用的研究方法是将生物分子间的作用关系抽象为一个网络图,然后通过基于图论的数据挖掘方法,从生物分子作用网络中挖掘出生物分子间的调控机制。模体结构是一种被认为包含潜在生物分子调控机制的子图结构,在共调控网络中挖掘共调控网络模体,对研究共调控网络中的生物分子调控机制有重大的意义。相比于蛋白质作用网络、基因调控网络等单一分子类型的调控网络,共调控网络规模更大、节点类型更多。现有的模体发现算法难以高效的处理该类型网络图,所以需要设计一种更加高效的共调控网络模体发现算法。本文的主要研究工作如下:1)为了提升共调控网络模体发现算法的效率,本文将G-trie结构应用于共调控网络模体发现算法,把多种共调控网络模体类型存储于一棵前缀树结构中,通过重用查找过程,提升了子图统计的效率。并通过多线程技术,实现了该算法的并行,进一步提升了共调控网络模体发现算法的效率。为了发现更大规模的共调控网络模体类型,本文设计了一种采样生成候选子图的方法,通过该方法本文最多能发现8个节点的共调控网络模体类型。另外,本文根据共调控网络模体结构在共调控网络中的实例,发现了共调控网络模体的团簇性特征。2)通过采样生成候选子图的方法虽然能查找较大规模的模体类型,但难以查找共调控网络中全部的模体类型。查找共调控网络中全部的模体类型是一个NP难问题,计算量会随着模体规模的增加呈指数增长。为此,本文设计一个基于MapReduce计算模型的共调控网络模体发现算法。该算法解决了以往模体发现算法中迭代依赖问题,以及难以通过MapReduce计算模型精确统计网络图中每个子图出现频率的问题,并且通过多线程并行的方法解决了MapReduce计算模型CPU利用率不足的问题。基于MapReduce计算模型的共调控网络模体发现算法实现了对计算机资源的融合与高效利用,并极大限度的缩短了在共调控网络中查找全部模体类型的时间。
其他文献
铀矿开采和铀的生产及应用中产生了大量的铀废渣、尾矿及含铀废水,对人类与生态环境构成了严重威胁,微生物修复水中铀(Ⅵ)污染是环保有效的方法之一。本研究运用植物乳杆菌去
本文主要研究了大地电磁一维、二维电各向异性正演问题。本文的目的在于解决大地电磁一维、二维电各向异性正演问题,并将大地电磁二维电各向异性的正演用于页岩储层的压裂动
本论文利用单色共振双光子电离(1C-R2PI)、慢电子速度成像(SEVI)方法和高精度理论计算研究了间溴氟苯分子激发态光电离。针对SEVI实验过程中的紫外电子噪音问题,我们介绍了一种图
脉冲微分方程能描述具有瞬时突变现象的实际问题,在航空航天、控制系统、信息科学、生命科学、医学、经济学等众多科技领域有广泛应用,对其理论及数值方法的研究具有非常重要
本文研究了在Neumann边界条件下,具有比率依赖型反应功能函数的捕食-食饵反应扩散系统。为了研究系统在正平衡点的稳定性和局部Hopf分支,分析系统在正平衡点处线性化部分的特
本文改进了 Jackson刻画前列腺肿瘤生长的数学模型,考虑到了“雄激素依赖的细胞”和“雄激素独立的细胞”具有不同的扩散系数。这个模型本质上是一个自由边界问题,描述了前列
随着掺气减蚀设施在工程上的大量应用,掺气水流对空蚀破坏现象的防止及减弱效应已得到普遍认可。但是高速水流掺气以后水体的紊动情况将变得更加复杂。水流的掺气量在掺气减
自然界中的天然河道和水利输水建筑中常以弯曲的形状存在,而水流运动在弯道作用下又呈现出特殊的水力特性:弯道水面存在横向比降、弯道环流、水流动力轴线偏移等,这些水力特
航磁补偿是航空磁探测过程中的必备技术,目前的航磁补偿方法主要依赖于Tolles-Lawson模型。该模型将载具干扰场分为恒定场、感应场、涡流场三类干扰源,结合载具姿态信息,以线
松辽盆地位于华北板块和西伯利亚板块之间,由于该区域发生过多期次构造运动,所以一直以来都是学术研究的热点区域,在基底性质,断裂分布,莫霍面深度等问题上学者们并未达成共