基于小波的基因差异表达建模分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:nimakule119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因差异表达是构成生物多样性的主要原因,相同基因在不同组织中、不同环境或不同时间点,基因的表达随外界条件的变化而变化。因此,差异表达基因的识别是人们了解生物过程,构建调控网络的基础。差异表达的基因能够帮助人们缩小研究范围,提高构建网络的效率,为下一步生物分析提供准确的数据并且可以用于分析癌症和药物靶向的研究。基于时间的差异表达的基因因其是动态变化的过程,这些基因之间的动态变化规律对基因调控网络构建至关重要。因此,基于时序的差异表达基因的研究是一项能够促进生物信息学和系统生物学研究的一项重要工作。本文根据目前的差异表达基因的识别方法,分析各种方法存在的缺点和需要解决的问题。针对基于傅里叶变换研究方法存在的不能同时解决时频分析的问题,提出了基于小波分析的差异建模分析,根据不同尺度的波形来挖掘出基因之间的潜在关系。在模型中,本文提出一种自动快速聚类算法,通过将识别出的差异表达基因进行聚类分析,将不同功能的基因划分到不同的类中。最后通过将类中的基因进行GO术语分析,揭示每个类中差异表达基因的功能。本文提出基于小波分析的基因差异表达识别的模型,根据小波能很好的分析信号局部的功能,本文将小波分析融合入回归模型中。该模型通过将小波分析应用于时序数据,将基因数据进行多尺度分解进行去噪分析。而后采用复杂的小波树分解每个基因得到该基因对应的小波系数,用小波系数来代替每个基因,再利用小波系数计算不同基因之间的相似性。聚类分析是将差异表达的基因划分到不同的类中,然后根据类中已知基因的功能,推测其他未知基因的功能。本文基于快速聚类算法的思想,采用粒子群算法解决其手动选择类中心问题,提出一种基于粒子群算法自动快速聚类算法。该算法采用高斯核函数基因之间的距离,计算每个基因的密度,然后通过粒子群算法自动识别出该数据集的类中心。本文通过聚类算法中常用的5组数据集对本算法进行验证,通过和原算法在相同数据集上比较结果,说明了算法的可行性。另外,本文设计和开发了基于该算法的工具,用来分析聚类数据,并将结果可视化。
其他文献
路径规划就是指按照先验知识,在满足一定约束条件下,从有障碍物的环境中规划出一条从起点到终点的无碰撞路径。它在机器人学,地理信息系统,G IS等众多领域有广泛的运用,对它的研究
科学计算可视化是20世纪80年代发展起来的一个新的研究领域。它运用计算机图形学和图像处理技术,将科学计算过程中产生的数据及计算结果数据转化为图形及图像在屏幕上显示出来
随着社会信息化进程的不断发展,人们对信息的需求和依赖程度越来越高,如何从海量信息中快速有效的获取有用信息,已经成为人们研究的焦点。信息检索的研究可以帮助人们有效的
随着科学技术的迅速发展和工业化进程的持续深入,我国的航空航天事业有了长足的进步和举世瞩目的成就。作为空间探索的关键设备,航天器的性能很大程度上受到其回旋机构上的轴
随着世界经济的高速发展,商业活动中越来越注重追求高效率和自动化。特别是在一些零售行业、银行业,对货币自动识别的要求已经成为新的研究热点。如何快速、有效而又低成本地对
情感倾向性分析是通过研究文本中人们的情感,观点,看法等内容,来确定文本中所包含的情感与态度等主观信息。情感倾向性分析经历了最近10年的快速迅猛发展,现在已经成为一个热
多输入多输出(Multiple-Input Multiple-Out-put,简称MIMO)系统的信道容量近似地与收发天线数目的最小值成正比,相对于传统的通信系统能够成倍地提高系统容量,而正交频分复用
数据挖掘技术自20世纪90年代初期开始崛起,并迅速的成为计算机理论及应用界研究的热点。如今数据挖掘是一个多学科交叉研究领域,它融合了数据库技术、人工智能、机器学习、统
以计算机技术、通讯技术相结合的信息时代快速发展和互联网广泛应用形势下,嵌入式系统正在兴起又一场技术革命,各大高校、研究所和企业都纷纷加入嵌入式系统的应用研究。在嵌入
近些年来随着互联网的迅速发展,信息负载对用户的决策产生了巨大的挑战。推荐系统已经成为一种有效的工具用来帮助人们在复杂的信息空间中找到他可能感兴趣的物品。但是由于