论文部分内容阅读
自从2006年以来深度学习已经成为人工智能和机器学习领域的一大热点。并且在无监督特征学习领域展现出了巨大的潜力。深度学习是一系列深度学习算法的统称,其利用深度结构来学习数据中存在的深层模式和隐含特征。聚类技术是机器学习和数据挖掘领域的一大研究热点,是一种无监督学习方法。聚类是在不需要先验知识的情况下,自主地学习原始数据中的隐含簇结构。本论文提出一种基于深度学习的聚类模型,并利用深度信念网(DBN)和Fuzzy C-means (FCM)实现一种聚类算法。该模型分成两个部分:预训练部分和微调部分。预训练部分由深层结构和预聚类层组成。首先预训练部分为:使用多层限制性玻尔兹曼机进行网络预训练,以此得到深层结构预训练的深层特征表示,然后通过预聚类层使用一种简单的聚类算法对预训练得到的深层特征表示进行预聚类,并得到初步的聚类中心和类标签。接下来是微调部分,微调部分为:使用展开后的微调网络对预训练部分已经学习到的网络参数进行微调,同时进行聚类优化学习。微调部分的结构是将预训练深层结构展开并加上聚类层。微调部分采用交叉迭代的方法对目标公式进行优化,使得聚类结果和特征学习能够同时达到最优的效果。该模型充分利用了深度学习和聚类技术的无监督学习的共性,将深度学习的优势和聚类相结合,使得聚类效果更好和对高维数据聚类时更加便捷。在该模型的基础上,本文又采用深度信念网和FCM算法实现一种聚类算法(DBNOC)。该算法既有深度信念网的优点,同时又是一种软聚类方法。该算法在微调优化的过程中主要采用了BP反向传播的方法。最后,通过在高维度数据和低维度数据上实验验证本论文所提出模型的有效性。实验结果表明该模型具有很好泛化性,在低维数据和高维数据上都表现良好。相比于普通的聚类算法表现出更好的聚类效果。相对于较繁琐原始数据与处理过程,该模型则简单,适应性更好。