基于肿瘤基因表达数据的加权聚类算法研究

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:jeego
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,通过对肿瘤基因表达数据聚类来区别不同肿瘤类型一直是生物信息学领域当中研究的重点。面对不断增加的癌症基因,探索癌症之间的相关性是研究的问题之一,精准医学尝试通过聚类算法起到辅助作用,为具有相似特征的癌症亚型患者制定更加针对性的诊治方案、靶向治疗等,准确的分类对于医学上调整治疗方案起到非常重要的作用。随着研究聚类算法中的模糊聚类的人越来越多,推动其发展越来越快,这是因为它有一个较为突出的特点:不会把每一个对象进行严格划分,是以一定的隶属度去划分每一个类。而对于肿瘤来说可能受到多种基因的影响,并且受到的影响程度是不同的,因此模糊C均值聚类算法(Fuzzy c mean clustering algorithm,FCM)在动态生命系统中更能表达肿瘤基因表达数据的特征。本文针对FCM算法在数据集下存在的问题进行改进,并在普通数据集、基因表达数据集、肿瘤基因表达数据集下进行研究与应用,主要的研究内容如下:(1)为了解决FCM算法在数据集下聚类效果不好、且基于欧氏距离的相似性度量中,只考虑数据点之间的局部一致性问题,将Jeffery散度相似性度量与FCM算法进行结合并改进,本文提出了基于Jeffery散度相似性度量加权FCM聚类算法(Weighted FCM clustering algorithm based on Jeffrey divergence similarity measure,JW-FCM)。通过定理、推论得出改进的目标函数。在实验部分,通过该算法与经典算法K-means、DPC、FCM算法在人工数据集下进行对比,证明该算法可以提高聚类效果,并对此做了准确率的对比,为了更好地体现该算法在实际应用中的作用,在三种癌症数据集下进行收敛性分析,最后证明所提出算法在聚类效果、准确率、收敛性上表现较好。(2)为了改进FCM算法存在着在高维基因表达数据集下,不能把基因表达数据所拥有的不同属性特点对聚类贡献不同的问题进行区别,本文提出基于预处理结果属性约减的特征加权FCM算法(Feature Weighted FCM Algorithm Based on Preprocessing Result Property Reduction,RW-FCM),通过数据预处理、特征加权获取特征权重,将Relief F技术与FCM算法结合,在数据集下进行收敛性、鲁棒性、聚类效果准确率的对比,验证算法对于聚类效果可以进行更好的区分。综上所述,本文提出两种改进的算法JW-FCM、RW-FCM并在不同数据集下进行聚类实验,依据肿瘤基因表达数据的差异性进行特征加权,并且使用评价指标去反应算法在数据集下的聚类质量。在应用部分,将本文提出的算法应用在肿瘤基因表达数据集,验证了对于肿瘤基因表达数据集本文提出的方法具有合理、可行性,也表现了JW-FCM、RW-FCM算法的优点,在实际生物学范畴里具有重要意义。
其他文献
学位
根据国家铁路发展战略规划要求,高速铁路占据了铁路运输的重要组成部分,其高速、高效的运输要求对铁路设备质量提出了严峻的挑战,特别是铁路设备中薄弱环节且构造复杂的道岔。这就需要铁路养护维修工作人员加强对岔区的检查、监控,并依据检测数据及时对道岔进行维修。本文针对结构、受力均较为复杂的道岔区,结合道岔区不平顺实际检测数据统计分析结果和对道岔的有限元仿真动力学响应计算结果综合分析的基础上探寻道岔区病害发生
学位
随着我国“一带一路”发展战略的实施,高等级公路建设逐渐由平原转入山区,高填方路基应运而生。其填筑高度高、填方量大,使得路基沉降大、稳定慢、易发生不均匀沉降,从而产生纵横向开裂、滑动或坍塌等病害。路基填料性质复杂,特别是填料的蠕变特性对路基沉降特性影响显著。因此,在考虑填土蠕变特性的前提下研究高填方路基的沉降特性已成为当前公路工程领域研究的重点课题之一。本文在现有研究的基础上,以定西至临洮高速公路某
图论是数学的一个重要分支,它将现实生活中的事物映射成为图,通过对图的研究来解决现实问题。目前,图论已经应用到了众多领域,诸如交通运输,社交网络问题以及知识图谱问题等。图染色起源于世界近代三大数学难题之一的四色定理,它是图论研究的一个重要课题,其应用非常广泛,如考场排座、排课安排、交通运输、危险品仓储、网络通讯等。图染色概念种类繁多,从早期的点染色、边染色、全染色到后来的点可区别染色,点的和可区别染
学位
洋葱茎基腐病也叫洋葱根腐病,是由镰刀菌引起的一种土传病害,在洋葱生长的各个阶段和贮藏期间都会发病,严重影响了洋葱产量。为选择绿色有效的方法防治洋葱病害,本研究以洋葱层出镰刀菌为防治对象,分离筛选出对层出镰刀菌有较强拮抗作用的解淀粉芽孢杆菌和棘孢木霉;通过研究两菌株的最佳发酵条件,利用其代谢产物进行离体试验、盆栽试验等,进一步确定了两菌株及其复合菌对洋葱层出镰刀菌的防治效果,并对两菌株在洋葱根际的定
学位
随着高速动车组运行速度的不断提升,车辆运行环境逐渐复杂。车轴作为重要部件,它的可靠性直接关系到列车运行安全。车轴运行过程中容易造成刮擦、磕碰等而产生缺陷,为此,本文在轴身中部预制初始裂纹,研究其裂纹尖端的应力强度因子随裂纹深度的变化规律,计算车轴疲劳剩余寿命,确定损伤容限。首先,利用ANSYS有限元软件对轮对进行强度分析,在EN13104-2001加载标准和UIC510-5-1993标准规定的载荷
近年来,伴随着现代配位化学的迅速发展,金属配合物的合成及其性质研究也受到了十分广泛的关注。在现代配位化学领域中,Salen型配体及其衍生物占有举足轻重的地位,它们所形成的配合物单元可以构筑丰富多彩的多聚体结构、超分子结构以及配位聚合物,在催化、光学材料及生物学都得到了深入的研究。基于对Salen型配体及其衍生物的研究,研究人员对Salen型配体的[-C=N-]部分进行了一定的修饰,开发出了一类包含