基于子空间聚类的癌症亚型预测研究

来源 :西安工程大学 | 被引量 : 0次 | 上传用户:happig101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症具有侵略性强、死亡率高等特点,近年来针对癌症的预测研究已成为生物信息学领域的热点研究方向。一种癌症通常由多种子型组成,有效的癌症亚型预测对提高癌症整体的诊疗效果、提供具有针对性的精准医疗具有重要意义。高通量技术的发展为癌症亚型预测提供大量组学数据,有助于从生物学分子层面探索癌症的发病机理与演化过程并发现关键致病基因,为更好理解癌症组学数据与表型之间的关系提供可能。传统的癌症亚型的研究仅利用单级组学数据进行预测,存在一定局限性,若能整体分析多个组学数据的关联关系,可有效提升预测效果。对多级组学数据进行集成分析的前提是每级组学数据都完整且可用,这一前提条件限制了在临床实践中的适用性。针对这一问题,本文开展基于子空间学习的癌症亚型分析研究。本文提出基于深度子空间互学习的癌症亚型预测研究算法。该算法将稀疏表示与互学习理论相结合,并在自编码器结构中添加网络自表达层获得具有判别性的数据特征表示。该网络主要包含分支部分和主干部分,其中分支部分负责学习单级组学数据的特征表示与自表达关系;主干部分将多种组学特征进行融合并学习整体数据的相似关系,进而利用相似性矩阵与谱聚类实现癌症亚型预测。本文提出基于低秩表示的癌症亚型预测算法。该算法为低秩表示模型添加非负约束与秩约束并通过交替方向法进行迭代求解,从而获得样本数据的最低秩特征表示。首先为每个单级组学数据建立相应的低秩模型并进行迭代优化,接着对获得的多个低秩表示矩阵进行融合并构建相似性矩阵,最后执行归一化切割以实现癌症亚型预测。本文采用五种公开癌症数据集中的三级组学数据对算法性能进行评估,实验评估结果表明所提算法与同类型算法相比获较好聚类效果,为设计有效的癌症治疗方案提供参考价值。
其他文献
虚拟现实技术因其强可交互性、高沉浸感和多感知性,被广泛的应用在各类教学场景中。然而教育信息资源迅速增长容易引发知识内容过载,复杂、无序的碎片化知识容易导致学生在学习过程中产生知识负荷的问题,传统教学模式又存在交互性差、安全系数受限等问题。因此,本文提出构建知识树系统平台,通过虚拟现实技术实现知识树内容三维可视化,将原有教学知识内容多维度关联展示,辅助添加课程内容实验,有效加强学生知识感知能力,提升
随着大数据时代的进步与发展,数据量呈指数级增长。其中日志数据的研究对系统性能优化、用户行为分析、实时推荐等多个领域具有较高的价值,所以针对日志数据实时采集,挖掘内在数据信息并作出实时地响应具有较高的研究意义与价值。但目前在日志数据实时流处理的研究中,存在计算延迟高及资源调度时延较长等瓶颈问题。基于此,本文设计了面向海量日志数据实时流处理平台。本文的主要研究内容如下:(1)为了解决在Flink实时流
随着互联网和移动电子设备的普及,传统购物方式逐渐被网络购物所取代,从而成为新的潮流。其中服饰作为必需品,在网络购物中占有重要比例。目前大多数服饰购物平台的服饰检索技术是利用基于关键字的检索方法,但其存在无法全面地描述图像内容、人工标注服饰属性时主观性过大,影响服饰检索的精度等问题。而基于内容的服饰图像检索方法可以很好地解决上述问题。基于内容的服饰检索关键在于服饰图像的特征提取和特征的索引机制,现有
随着德国“工业4.0”、美国“工业互联网”、以及“中国制造2025”三大战略的相继提出,数据被作为推动传统制造业向智能化转型的核心。从海量数据中挖掘数据背后隐藏的知识,已经引起学术界和工业界的极大关注。但专业质量数据分析算法和分析工具应用难度大,易形成知识应用障碍,难以理解质量数据中蕴含的决策知识。因此,建立质量数据集成分析平台,采用数据可视化的手段辅助企业实现智能化管理已迫在眉睫。传统的数据分析
癫痫被定义为一种因大脑异常活动而引发的神经系统疾病。在非癫痫发作期间,癫痫患者的表现与常人无异。而在癫痫出现时,癫痫患者的直观表现为肢体痉挛、口吐白沫等。同时癫痫还可能会导致患者产生烦闷、抑郁的心情,更严重的话甚至会造成患者猝死。脑电图是用来检测和纪录大脑活动的重要手段,然而临床中对脑电信号的分析方法主要是依赖医生或专家的人工诊断。因此会存在诊断效率低下,诊断准确性有待提高等问题。为解决上述问题,
近年来,深度学习在计算机视觉领域的研究与应用越来越广泛。作为计算机视觉的研究课题之一,图像修复技术已应用到卫星图像处理、军事公安、视频和多媒体系统图像处理等多个领域。其目的是按照一定的规则修复已经受损的图像,从而得到和原图像相似的图像。目前研究者提出了许多图像修复方法,在一定程度上修复了受损图像,但是也存在修复后图像边界模糊、图像纹理不清晰、视觉效果差等问题,无法获得满意的修复效果。因此,本文针对
边缘计算就是将计算和存储下沉至边缘端的一种计算模式,而多集群边缘云是当今边缘计算架构的主流模式之一。能否实现多集群边缘云环境下的数据、计算资源的合理调度是决定边缘计算执行效率的核心要素。目前的调度方法存在集群调度负载不均衡、任务调度时延较大等问题。为此,本文结合边缘环境下任务需求不同,提出了一种多集群边缘云调度策略。具体如下:首先本文设计了一种新型的多集群边缘云框架,并在此框架上设计了部分功能模块
不同于以往人类可以借助自然界去分解处理垃圾,当前海量的垃圾已经超出自然界的承受能力,既影响人类生存又破坏自然环境,如何准确、高效、合理地处理这些垃圾是值得研究的现实问题。垃圾分类是将大量垃圾变废为宝的合理途径,但实际生活中许多人并不十分清楚每种垃圾的具体类别,从而造成垃圾乱投乱放,致使人工分类成本增加和资源浪费等诸多问题。“工欲善其事,必先利其器”,要想更好地推进垃圾分类工作必须善用科技的力量,技
图像文本描述算法是将图片中元素之间的关系用流畅的自然语言表述出来的交叉研究领域。通过模仿大脑神经系统接收信息后的处理流程,人类设计各种模型让机器模拟大脑将图片转化成描述语句,让机器能够探索并感知世界。图像文本描述算法在导盲、图像搜索和医学图像自动语义标注等领域有较大的应用前景。图像文本描述算法使用卷积神经网络(CNN)处理数据集图像,把图像的特征提取出来,经过循环神经网络之后最终生成对应的自然描述
随着互联网基础设施的快速发展和定位技术的提高,移动轨迹数据的获取成为了现实,基于位置服务(Location Based Service,LBS)的应用也越来越受到人们的关注。在如今的大数据时代背景下,轨迹数据的内容复杂多样,对轨迹数据中的潜在规律分析,不仅可以得到移动目标的运动模式和规律,还可以挖掘出目标的行为特征和兴趣爱好。由于移动轨迹数据具有离散性且数据规模较大,难以直接进行预测建模,而轨迹预