基因芯片数据分析

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:jackywang1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片(DNAMicroarray)是20世纪末生物技术发展的最主要的技术之一。近年来,基因芯片以其强大的大规模并行提取DNA或RNA分子信息的能力,受到全世界科学界和工业界越来越多的重视,在基因发现、疾病诊断以及药物发现等领域得到了越来越多的应用。基因芯片的重要性可以与20世纪50年代把单个晶体管组装成集成电路芯片相比,基因芯片技术将会对21世纪生命科学和医学的发展产生无法估计的影响。 一个基因芯片实验的流程主要包括:生物学问题的提出、实验设计、样本制备、基因芯片杂交实验、基因芯片检测、检测结果数据分析与建模以及数据分析结果的生物学验证等。可见基因芯片数据分析是基因芯片整个实验中的极其重要的一环,一个最大限度描述现象本质的数据分析模型对于实验的成败至关重要。因此,随着越来越多的针对不同生物学问题的基因芯片实验的完成,基因芯片数据呈爆炸性增长,各种各样的分析方法也随之出现。综合来看,基因芯片数据分析大概可以分为三大类:基因芯片数据预处理,包括去噪、标准化、特征基因选择以及缺失值估计等;基因芯片数据模式分类,包括各种模式识别、机器学习方法在基因芯片实验中的应用;基因芯片数据模式发现,包括功能基因聚类、疾病相关基因发现、基因共表达模式检测以及基因相互作用网络反求工程等。 由于基因芯片数据具有大数据量、高维数、多参数、非线性、高噪声、数据冗余、数据分布不均衡等特点,这就对数据分析算法提出了很高的要求。从当前研究状况来看,相对于模式发现,由于基因芯片数据预处理部分以及模式分类问题相对确定,因此这两部分内容相对比较成熟,现成的算法也比较多。因此,模式发现将是下一步研究的重点。本论文基于此基调,主要在基因芯片数据模式发现做了以下几个方面的研究工作。首先,在刻画基因间相互作用时,当前方法的结果都是一个静态的量,即基因间是一种恒定的相互作用。然而,实际情况并非如此,实际上,某种基因对其他基因的作用是一种动态的作用,这种作用是随着时间变化的。本文针对这种情况提出了一种基于时间基因芯片序列数据以及变参量回归和卡尔曼滤波的方法,用于刻划基因之间相互作用的动态变化,较之当前方法,该方法更接近于客观事实。其次,本文还提出一种基于replicatordynamics模型的方法,用于基因功能网络的检测。该方法主要是针对当前聚类方法的缺陷而提出的,结果表明该方法能比较好的用于基因功能网络的检测。最后,本文讨论了Isomap非线性降维技术的特点,并分析了其在基因芯片数据分析上的应用,同时给出了初步结果。
其他文献
该文分析了流量工程的含义;从IP网络的历史背景,指出了当前的Internet网络实施流量工程的必要性;对比了几种不同的流量工程方案,重叠模型由于其固有的局限,不适合于流量工程;在传输层上,该文分析了AIMD(加性增加乘性减少)算法在保持数据流稳定性上的缺点,这和当前迅速发展的媒流文件传输不相适应.对此,我们提出了一种新的算法—PMIMD(比例乘性增加乘性减少).该文还论述了MPLS(多协议标签交换
学位
IP
近年来,资源与环境问题成为各国亟待解决的问题之一,而电动汽车的出现可在一定程度上解决上述问题。电池相关技术是目前限制电动汽车发展的最大障碍。与电动汽车发展速度相比,电池管理系统的发展速度相对滞后。在新的电池生产技术出现以前,通过电池管理系统的研发提高电池的工作效率,延长其使用寿命不失为明智之举。论文分析了现有电池管理系统在设计过程中遇到的问题及不足,基于飞思卡尔单片机对电池管理系统进行了研究与设计
学位
随着我国公路建设里程的增加,道路维修和养护产生的废弃沥青混合料也越来越多,大量废弃的老化沥青混合料会产生严重的环境危害。此外,人们生活中产生的废弃油脂也越来越多,如何安全有效地处理废食用油(WCO)也成为了一个难题。本研究采用废食用油作为再生剂,同时结合泡沫沥青温拌技术,制备废食用油热再生/温再生沥青混合料并研究其路用性能。本课题一方面可以有效回收资源废弃物,另一方面能降低再生沥青混合料的拌和及成
随着互联网金融的快速发展,给医疗产业发展带来了新动力。本文先是对互联网金融与医疗金融定义进行分析,然后在分析我国传统医疗诸多弊端的基础上,对互联网金融与医疗服务有效融合的策略进行分析,以供相关人员参考。
期刊
落实"双减"政策、采取五项管理、提供课后服务活动,这样既减轻了家长的压力,又丰富了学生的课后生活,注重了学生的精神文化和德育培养。
基于2013—2019年30个省级行政区的相关数据构建绿色金融和产业结构变化的指标体系,运用熵值法得出评分,采用灰色关联度、耦合协调度和空间关联网络,对我国30个省份的绿色金融与产业结构变化进行了实证研究。结果表明:绿色金融发展较快省份的第三产业发展更能体现绿色金融的正向促进作用,其与产业结构变化的耦合协调程度也更高,对周边地区的正外部溢出效应更显著。建议政府和金融机构等应在推进绿色政策发行、相关
学位
在军事斗争领域,通信辐射源个体识别对提高通信对抗作战能力具有极其重要的意义。通过提取敌方通信辐射源信号的细微特征,并利用先验信息确定信号来自哪个通信辐射源,为准确预测敌方的战略、战术意图等情报提供了重要依据。同时,在军转民应用领域中,该技术在无线通信网络安全、认知无线电和机械故障诊断等方面也具有重要的应用前景和价值。本文立足于通信对抗领域,在对现有通信辐射源个体识别方法的现状进行深入剖析的基础上,