基于聚类结果的基因集差异表达分析

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zhm4150175
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首先介绍了基因芯片的背景知识,作为众多学者关注的研究方向,基因表达差异分析可以分为单基因分析和基因集分析。通过介绍基因表达差异分析的相关方法,同时分析各种方法的优劣点,本文提出基于聚类结果的基因集表达差异分析方法:GSCL。该方法考虑了以下三方面:生物性状往往与多个基因表达有关;基因表达之间一般存在相互作用;基因集数据经常呈现样本量远远小于基因数的现象。GSCL方法的基本思路是:首先通过聚类将基因集分成若干个基因子类;其次定义基因子类信息量,并以此作为该类对表现型影响的度量,得到对应各子类的权重;然后通过权重向量的迅速降维;最后利用t检验得到检验结果。在方法的应用上,本文首先对模拟数据进行应用,共考虑了四种不同协方差结构和六种不同均值结构,然后对AML/ALL和p53两个实验数据集进行应用,得出了以下结论:当标准差水平与两种表现型下的均值之间的相差程度接近或较小时,GSCL能较为准确地检验出数据之间的差异性;当标准差较大时,本文方法会有一定的假阳性存在;对AML/ALL实验数据的检验结果,本文和之前的众多学者结论一致,认为该数据集涉及到的基因集在两种表现型下表达是有差异的;p53数据集中310个pathway,在显著性水平为0.01的情况下,检验出26个pathway表达有差异,而与之前学者考虑的19个pathway相比较,本文得出一致性的结论外也提出了一些与之前方法有差异的pathway,值得生物学方面的进一步讨论。  
其他文献
图的染色理论在离散数学的研究领域中处于中心地位。它还经常出现在看上去没有或者仅有一点联系的研究领域中。图的染色理论非常有用。时间表的编制,排序问题,调度问题,以及
度量空间(E,dE)到度量空间(F,dF)的映射T是1-Lipschitz的,如果dF(T(x),T(y))≤dE(x,y),)()x,y∈E.(0.1)如果将上式中的“≤”更换成为“≥”,我们就称该映射T是反1-Lipschitz
本文是在X1空间上研究具增生的种群细菌在一般边界条件下的迁移方程,获得的主要结果是:1.证明了迁移算子 pAα,产生不可约正C0半群;2.讨论了迁移算子 pAα,的谱分析,即:证明了
本文研究连续与离散的Rosochatius型有限维可积系统的构造,拉直与求解,并揭示它们与孤子方程的关系.主要利用代数曲线的工具以及母函数的技术.   对于连续情形,具体研究了
学位
设(X, f)是一个紧致系统,即(X,d)是一个紧致度量空间,(f:X→X)是一个连续映射.本论文主要对一个紧致系统的敏感依赖性进行研究.全文共分四章.  第1章是绪论,主要对紧致系统及
现代科学与工程问题中的许多问题都可用偏微分方程来描述,而与时间相关的问题则通常用线性或者非线性的发展方程来描述。由于现实问题一般都很复杂,所以由这些问题抽象得到的
在自然界生态系统中,随处可见各种随机干扰.在确定性传染病模型中加入随机干扰的影响,能够更贴近实际的传染病系统.本文主要讨论了传染病模型受到白噪声的干扰以及带Lévy跳干