基于迹群Lasso的子空间聚类及其在单细胞RNA序列中的应用

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:bbtr12376
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物信息学领域,对已测序的细胞RNA序列实行聚簇以发现细胞功能的相似性,有助于研究潜在的生物机理,进而为药物的研发或者疾病的治疗提供新的依据。近年来,伴随着复杂且冗余的生物数据的不断涌入,划分的、层次的、基于密度的、基于模型的和基于网格的传统的聚类算法往往难以或者无法取得理想的聚类准确率。子空间聚类算法以其适用于处理大规模和高维度的数据集而迅速成为研究热点。该方法容噪性高、鲁棒性强、可扩展性优,已在人脸聚类、运动分割和手写字体识别等场合中展现出良好的应用前景。然而,当直接将其应用于生物信息挖掘时,由于其忽略了生物数据内在关联的结构特征,势必将造成可解释性差和聚类效果不佳等缺陷。为此,本文在低秩表示的子空间聚类框架中嵌入了Lasso方法,提出了具有双层面表达机制的子空间聚类算法,同时发展了相应的快速求解方法,并将其成功应用到小鼠体感皮层和海马CA1的单细胞RNA序列聚类分析中。本文主要的研究内容和创新工作归纳如下:(1)提出了一种新颖的迹群Lasso(TGL)方法,利用迹Lasso方法和群Lasso方法融合的策略,实现了兼具变量水平的稀疏性、预设组稀疏性和自动组稀疏性的降维过程。在UCI的分类数据集上执行分类实验,结果表明本文所提的方法在分类精度和基因选择能力上相对于其它两种Lasso变体方法均更加优越。(2)提出了一种基于TGL的子空间聚类(TGLSC)算法,采用了结合样本和特征双层面的线性表达机制,使得聚簇方案得以在样本和特征两者的子空间下协同进行。在人脸聚类和运动分割的聚类数据集上执行聚类实验,结果表明本文所提的算法在准确性和稳定性等多个方面与其它五种子空间聚类算法相比总体上性能最佳。(3)针对所提的TGLSC算法的目标函数,引入了最为常用的交替方向乘子法(ADMM)对其进行分布式求解,并对来源于小鼠的体感皮层和海马CA1区域的单细胞RNA序列实行聚类分析,探索和揭示了若干生物科学的信息和规律。
其他文献
<正>2017年12月5日,92岁的法国作家让·端木松(Jean d’Ormesson,1925—2017)仙逝。法国政府在荣军院为他举行了隆重的国葬。这样的哀荣,既来自于端木松的文学成就,也来自于
期刊
目的:观察京万红外敷联合电磁波照射在输液外渗中的应用效果。方法:将88例静脉输液外渗患者随机分为观察组(44例)和对照组(44例),观察组给予京万红软膏外敷联合电磁波照射治疗,对照组
中午休息时,邻班的小明神秘地向我报告:“王老师,你班的王义偷老师的钱了。”偷老师的钱!怎么回事?在我的再三要求下,小明向我详细地描述了事情的经过。原来,中午休息时,老师们都回
如何对公务员队伍进行有效管理是改革和优化政府组织结构的一项重要课题。我国的公务员职位聘任制度就是一项新的尝试。聘任制开放灵活,让优秀人才能脱颖而出。分析国内外机
开关磁阻电机的输出转矩存在着固有脉动,因此对于输出转矩的观测与调节是开关磁阻调速系统关注的重点。将直接转矩控制方法应用到开关磁阻电机驱动中能极大地提高电机输出转
第三方资助诉讼以其促进诉讼接近正义的价值合理性、预先为诉讼费用买单及转嫁诉讼风险的优势被市场和当事人接纳,但诉讼的公法属性使得该行业不能仅受市场监管而放任其自由
中小学教辅书市场时下的芜杂是不争的事实,且有愈演愈烈之势。随着新课程的实施,不仅有与新课程配套的《课程导学》、《同步训练》、《素质检测》之类的教辅书纷至沓来,更有五花八门的其他教辅书、专门网站及价格不菲IT产品,散兵游勇般一窝蜂地涌现教辅书市场,潜入学生的学习生活。  中小学课程学习要实施素质教育,实现知识与技能、过程与方法、情感态度与价值观的“三维”目标,要使学生形成以科学探究为主的多样化的学习
近年来,国际汉语教学蓬勃发展,随着教学对象的低龄化,国际少儿汉语教学逐渐受到学界的重视。由于少儿学习者的学习需求不同于成人,因此游戏教学法、全身反应法和歌谣教学法等