基于深度学习的聚类关键技术研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:klwxm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从2006年以来深度学习已经成为人工智能和机器学习领域的一大热点。并且在无监督特征学习领域展现出了巨大的潜力。深度学习是一系列深度学习算法的统称,其利用深度结构来学习数据中存在的深层模式和隐含特征。聚类技术是机器学习和数据挖掘领域的一大研究热点,是一种无监督学习方法。聚类是在不需要先验知识的情况下,自主地学习原始数据中的隐含簇结构。本论文提出一种基于深度学习的聚类模型,并利用深度信念网(DBN)和Fuzzy C-means (FCM)实现一种聚类算法。该模型分成两个部分:预训练部分和微调部分。预训练部分由深层结构和预聚类层组成。首先预训练部分为:使用多层限制性玻尔兹曼机进行网络预训练,以此得到深层结构预训练的深层特征表示,然后通过预聚类层使用一种简单的聚类算法对预训练得到的深层特征表示进行预聚类,并得到初步的聚类中心和类标签。接下来是微调部分,微调部分为:使用展开后的微调网络对预训练部分已经学习到的网络参数进行微调,同时进行聚类优化学习。微调部分的结构是将预训练深层结构展开并加上聚类层。微调部分采用交叉迭代的方法对目标公式进行优化,使得聚类结果和特征学习能够同时达到最优的效果。该模型充分利用了深度学习和聚类技术的无监督学习的共性,将深度学习的优势和聚类相结合,使得聚类效果更好和对高维数据聚类时更加便捷。在该模型的基础上,本文又采用深度信念网和FCM算法实现一种聚类算法(DBNOC)。该算法既有深度信念网的优点,同时又是一种软聚类方法。该算法在微调优化的过程中主要采用了BP反向传播的方法。最后,通过在高维度数据和低维度数据上实验验证本论文所提出模型的有效性。实验结果表明该模型具有很好泛化性,在低维数据和高维数据上都表现良好。相比于普通的聚类算法表现出更好的聚类效果。相对于较繁琐原始数据与处理过程,该模型则简单,适应性更好。
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
作文是书面表达的重要形式.作文能力要从小培养, 但是不少学生在写作文时, 或漫无目的、 夸夸其谈; 或无话说、 无事写, 或找不到可写的素材, 写出的作文枯燥无味.因此, 提高
随着社会的不断进步,全球人口的数量急剧增长,人类正以前所未有的规模和强度开发和利用各种资源,不可避免地带来诸多环境问题,其中重金属污染是最受人们关注的环境问题之一。
20世纪80年代以前,由于缺乏机械动力设备,许多工程大多靠体力协作完成。为了统一节奏、协调动作、激发劳动热情和缓解疲劳,常常吼出号子,诸如挑抬重物,推车拉磙,出海打鱼,森
“看看我们村现在就像花园一样,市民也不比俺们强,这得感谢咱区自然资源部门的驻村干部们!”谈起梁园区观堂镇梁楼村的变化,村民梁发忠高兴得合不拢嘴。梁园区观堂镇梁楼村是
“真是感谢自然资源局的帮助,对我们的事情这么上心!”近日,新安县青要山镇袁山村贫困户常光明,在帮扶人员和村干部的帮助下顺利外出务工了。今年是决战决胜脱贫攻坚收官之年