基于特征选择和拓扑分析的基因调控网络重构研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:w6832793xym
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物网络推理借助有效量测数据对生物系统进行计算建模,既能辅助人们理解细胞活动和基因调控机制,也能对工程化构建合成基因网络具有指导作用,因此网络推理始终是系统生物学的研究热点和难点。在后基因组时代,得益于组学数据量测技术的高速发展,生物网络的重构成为了可能。仅凭先验信息和经验不足以建立准确数学模型,需要精度和效率均符合要求的重构方法,机器学习的特征选择方法在基因网络重构中逐步体现出优势。对于基因调控网络而言,建模重构主要包括结构推理和参数估计,本文对基因网络重构的研究工作,主要包括:1)线性模型由于其简单易求解的特性,在处理小规模的基因表达数据集上仍然是一个较好的选择。在线性模型的.假设下,.使用支持向量机回归的方法进行特.征选择,重构出整个基因调控网络,相较于基于奇异值分解的方法提高了准确率。针对基因网络对象,使用对应的时序数据集进行回归建模分析,结果验证了算法的有效性和优势。2)考虑到基因调控网络的非线性,基于树回归的特征选择算法在处理非线性问题具有优势,并且也已经取得了较好的效果。不同的基于树回归的特征选择算法有着不同的偏倚,本文在使用梯度提升树进行GRN推理的基础上,进一步的运用加权融合机制整合基于随机森林的特征选择算法,得到最终的基因调控网络结构。鉴于无监督问题中权重选择需要考虑到推理结果的可信度,本文提出了结合先验知识的加权投票策略,在DREAM4数据集上对比单个模型所得结果和平均权重融合策略所得结果,验证了提出方案的有效性。3)基于拓扑分析按照基因网络调控边的方向将基因网络分为多个层次,为解决微分方程模型中参数规模大的问题提供了很好的思路。对网络进行分层后,本章采取的层次化估计策略是首先对高优先层次节点的调控参数进行估计,下一层次估计是以上层调控参数为已知信息,逐步拓展到外围节点。采取差异化的估计策略有助于将原问题分解为多个层次的子问题进行求解,减少了计算规模,计算结果表明,层次化估计策略能够有效降低参数估计的误差指标,计算时间也显著降低。
其他文献
母羊同期发情技术是一项基础且重要的发情控制技术,畜牧生产中应用同期发情技术便于开展组织生产和管理,提高畜群发情率和繁殖率,降低生产成本,明显增加其经济效益。同时同期
本文叙述国内外煤制烯烃(乙烯+丙烯)技术和工业化进展。指出在国际石油大起大落之际,采用先进而成熟的煤制烯烃技术生产乙烯、丙烯,减少我国原油进口,谋求石油供求平衡是可控
<正>很多学者在研究狼性文化,狼并不是上帝的恩宠,上帝没有赋予它猎豹的速度、狮子的凶悍、大象的体魄,但狼在自然界没有天敌,即使有一些大型肉食动物能够捕杀它们,但由于狼
随着人们对海洋环境保护的日益重视,如何实现生产污水零排放成为各个油田污水处理的重点和难点。浮式储油装置明珠号积极推进生产污水和海水混注试验,对处理合格的生产污水与
影片《西藏天空》通过西藏贵族少爷丹增与其奴仆普布在社会变迁之中的情感叙事以及女性叙事,史诗般展现了半个多世纪西藏社会的沧桑巨变,堪称新时期以来又一部藏族题材电影的
<正>党中央、国务院对农行股改提出了“坚持面向‘三农’、整体改制、商业运作、择机上市”的改革原则,明确了农业银行的市场定位是“面向‘三农’,服务县域,城乡联动,农工商
<正> 在当今银行业竞争异常激烈的形势下,开拓县域城乡的个人金融业务,有利于充分发挥农业银行拥有的经营区位、网点布局、客户构成等经营优势,体现自身经营特色,增创优势经
本文考察作为广西电影1980年代主导的工业题材电影,探讨《真是烦死人》、《顾此失彼》、《春兰秋菊》、《太阳的女儿》、《白杨树下》、《508疑案》、《一对冒牌货》等一系列
自电影诞生以来,悠久深厚的传统文化便成为滋养中国电影不断成长的重要资源。其中,木兰从军的故事就一再被改编。笔者以《木兰从军》《花木兰》和《木兰》作为剖析文本,分别
随着经营业务的不断拓展,输油企业的经营范围由单纯的管道输油拓展为管道、油库、码头为一体的综合输油工程。输油企业的油库是储存油料的基地,油料具有易燃、易爆、易挥发和