癌症分期特征基因筛选方法研究与应用

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:dx3386136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因测序技术的快速发展,从基因层面对癌症进行研究已经成为了热门课题。本文主要研究关于筛选结肠癌T、N、M分期特征基因的数据挖掘方法,包括将统计学知识应用于癌症分期特征基因筛选以及从两个不同的角度对现有筛选方法进行改进,主要内容如下:1.首先利用Kruskal-Wallis检验对T、N、M分期数据集基因分别进行初步筛选,然后利用多分类支持向量机特征递归消除(KSVM-RFE)算法并结合Fisher比准则对初筛的基因进行综合筛选,最后利用筛选的特征基因对样本进行分类。实证结果表明,与仅仅使用KruskalWallis检验初步筛选相比,采用本文算法筛选出的特征基因能够达到较好的分类效果。2.针对基因之间的冗余性问题,将最小冗余最大相关(MRMR)算法原理引入到KSVMRFE的排序评分准则中。在Kruskal-Wallis检验初步筛选基因之后,利用改进的KSVM-RFE以及Fisher比准则综合筛选T、N、M分期特征基因,并对样本进行分类。实证结果表明,改进KSVM-RFE之后能够筛选出更少的特征基因并且达到更高的分类效果。3.针对基因之间的冗余性问题,利用K均值聚类算法对Kruskal-Wallis检验初筛的基因进行聚类,从每一类簇中选取基因进行融合,利用KSVM-RFE以及Fisher比准则对融合后的基因进行进一步筛选,并利用筛选的特征基因对样本进行分类。实证结果表明,与不考虑基因冗余性的筛选方法相比,加入特征聚类思想的筛选流程能够选取较少的特征基因并取得较好的分类效果。
其他文献
桐城派是清朝统治者所认可的文学流派,但在清朝末期,随着清政府的日益衰败,桐城派及桐城派文论也逐渐没落,作为桐城派的末代宗师,姚永朴力图发展桐城派的文学理论,使之适应社
目的:探讨钆塞酸二钠(Gd-EOB-DTPA)增强MRI检查中肝脏、竖脊肌信号比增加百分率(IS%)在肝泡型包虫病(HAE)术前肝功能评价中的可行性。方法:收集青海大学附属医院2017年6月至2
近年来,在军事领域、工业领域以及智能系统等科技飞速发展,单传感器的观测系统已经远远不能满足目标跟踪或状态估计的需要了,因而多传感器信息融合的研究得到了广泛的关注。在多传感器系统中由于传感器和其他各种元器件的老化以及系统本身存在的不可避免的因素使得系统存在时滞。在控制系统中时滞会恶化系统性能使得观测到的信息不能及时送达,从而破坏了系统的稳定性,进而对系统的控制能力产生不利的影响。除此之外,由于时滞的
在大数据时代,如何从庞大的数据中进行有效的数据挖掘成为人类面临的难题。粒计算作为数据挖掘中的一个重要科学工具,它模拟人类思考的方式,以粒为基本计算单位,以建立大规模复杂数据信息处理的有效计算模型为目标,通过信息粒化,用“粒”来替代“样本”解决问题,展现出它特有的计算优势。粒计算已引起智能信息领域研究人员的广泛关注。粗糙集对推动粒计算研究的发展发挥了重要的作用。粗糙集数据分析中所用到的数据描述结构称
近些年来,随着放射性核束探测装置在原子核实验中的广泛应用,使得人们对远离β稳定线的丰中子核结构的研究变得可能。目前,实验上已经观测到了一些稀土区丰中子核的转动带。实验数据显示这个核区的原子核都具有稳定的形变,研究这些核的低激发转动谱可以揭示其组态结构、壳层结构以及稳定性等诸多信息,一方面对现有的理论模型进行检验,另一方面有助于深入认识稀土区丰中子核的性质。本文使用推转壳模型下处理对力的粒子数守恒方
极值搜索控制作为一种不基于模型的自适应控制方法,其结构简单,计算量小,所需的被控对象信息也较少。在现有的极值搜索控制方法中,滑模法以其强鲁棒性和收敛速度可控的优点受到了广泛关注。然而,由于经典滑模极值搜索控制建立在传统一阶滑模的思想上,滑模控制本身带来的滑动抖振和稳态振荡问题将在一定程度上影响方法性能,并限制其在实际系统的应用。引入二阶滑模是解决抖振问题的有效方法,但是二阶滑模控制与极值搜索问题的
目前,从动力学角度研究细胞间病毒感染是生物数学的热点,是数学与医学的交叉.建立合适的数学模型,并对模型进行有效的动力学分析,可以得到一些疾病的控制阈值,有利于病毒性疾
对微型化、低功耗及快速响应电子器件的迫切需求使得电场调控多铁异质结磁特性的研究不断引起人们的关注。为系统地研究其中所涉及的耦合机制并进一步增强多铁异质结的磁电耦合,本文从不同构型的多铁异质结入手,分析不同耦合机制作用下磁性能随电场的变化规律,从而揭示这些耦合效应间的相互作用及其潜在的微观机理。首先,本文设计了由SrTiO3/Fe3O4/Au/PbZr0.52Ti0.48O3(STO/Fe3O4/A
背景 多发性骨髓瘤(multiple myeloma,MM)是由于具有合成和分泌免疫球蛋白的浆细胞发生恶变,产生大量单克隆免疫球蛋白(M蛋白)导致体内多器官或组织受损的血液恶性肿瘤。MM好
边界单元法(boundary element method,BEM),对于求解弹性半空间、弹性板等具无限延伸边界结构内弹性波的散射问题,具有建模速度快,计算效率高的优势。然而,使用BEM方法对此类结构建模时,由于边界截断而产生虚假反射波,使散射波场的计算结果出现误差。为消除该误差,本文提出了一种用于求解具有无限延伸边界结构中弹性波散射问题的BEM方法。该方法在不改变基本BEM矩阵的同时,引入散射波