基于降噪自编码器的K-Means算法研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:hjiejngd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能化的时代来临,在机器学习及数据挖掘领域所涉及的数据集中,数据量和数据维度呈爆炸式的增长,高维、分布稀疏的数据对现有的聚类方法提出了严峻的挑战。在面对高维、分布稀疏的数据时,训练模型常常会出现过拟合、训练时间长、训练效果极差等问题,这种现象在计算机领域被称为维度灾难。聚类分析以相似性为基础,根据某个方法或准则,将数据划分为具有相似特征的类或簇。其目标是使得同一个类或簇内的数据相似性尽可能大,不同类或簇内的数据差异性尽可能大,K-means正是其中一种使用广泛普遍的基于划分的聚类算法。K-means算法易于实现,聚类速度快,但是其也存在一定的局限性:对初始值敏感,易陷入局部最优解;数据的无关特征严重影响聚类的效果;算法迭代的过程中需要不断地更新簇心的位置。因此,在面对数据量比较大,维度比较高的数据集时,算法的效率将会大打折扣。针对高维、分布稀疏的数据导致K-means算法难以胜任的问题,提出一种基于降噪自编码器的K-means算法。该算法首先使用降噪自编码器对数据进行降维,突出重要的特征表示,然后对降维后的数据使用K-means算法聚类。在多个基准数据集上的对比实验结果表明,该算法对高维数据有较好的效果,能显著提高原始K-means算法的性能。该算法得主要创新点为:(1)利用降噪自编码器能有效的降低数据维度,突出重要的特征表示。(2)K-means算法对降噪后的数据进行聚类,有效的减少算法的计算量,提高算法效率,同时突出重要的特征表示使算法得聚类效果更佳。
其他文献
随着微电网中非线性负载等电气设备投入使用的愈加频繁,谐波成为了微网中常见的电能质量问题之一。三相并联型有源电力滤波器(Shunt Active Power Filter,SAPF)是目前谐波补偿最有效的装置之一,本文主要内容是在微电网复杂电源及负荷环境下对SAPF控制策略进行研究与设计。首先,本文针对微电网谐波治理问题,分析总结了目前常用的谐波检测与治理技术。建立了微电网模型,分别对微电网复杂源荷
控制图作为现代工业生产中重要的质量诊断工具,能够发现制造过程中的异常波动。控制图模式识别对利用控制图对加工过程进行有效监测和异常源诊断具有较为重要的作用。当企业需要保证制造系统的柔性从而使其正常运行时,就需要对质量过程加以实时监控,进而可以及时发现生产加工过程出现的异常,最终实现降低损失、减少成本的目的。首先,根据对相关文献的研究与总结,发现近年来控制图模式识别的研究主要以人工神经网络和支持向量机
给出了三元思维的概念,从三元思维角度介绍了三支决策的基本思想,即通过3个独立且相关的部分来解释和处理一个整体,将一个整体合理地分为3个部分,并采取有效的策略处理每个部分,从而获得所需要的效果。然后,综述了三支决策的几种相关模型及具体应用。最后,从模型与应用两方面回顾了三支决策的研究现状并展望了未来的研究方向。
诺氟沙星(NOR)是一种喹诺酮类抗菌药,被广泛应用于治疗人类和动物疾病,但是如果长期食用含有低剂量NOR的动物源性食品,会导致骨骼发育迟缓、头晕、厌食、抑郁等,因此我国农业部指出停止经营使用用于食品动物的NOR。所以开发一种高效、灵敏的方法快速检测动物性食品中的NOR极为重要。本文用金纳米粒子(Au NPs)和钴铁基-金属有机框架(Co Fe-MOFs)支撑聚吡咯(Ppy)基分子印迹聚合物(MIP
路径规划是智能驾驶技术研究领域的核心,是实现汽车智能化的关键环节。目前大多数路径规划研究中都将障碍物视为静止状态。本文考虑实际行车环境中前方障碍车辆的动态移动性,提出一种基于考虑环境车辆动态移动性的高速智能车轨迹规划方法。主要研究工作包括:(1)基于支持向量机(Suppport Vector Machine,SVM)算法识别前车驾驶意图。分析智能车面临的典型驾驶场景,利用Prescan软件搭建与之
特种印刷设备对于连续运行的要求较高,并且检修困难,一旦出现非正常性停机,会带来重大的经济损失。因此,一般采用固定周期来进行设备的计划运维。这种运维方式对企业而言,不但成本高,设备利用率低,而且在降低设备故障率方面收效甚微。为解决这一问题,采用设备故障在线监测和预警的方法,实现预防性运维,具有十分重要的理论与实用价值。基于特种印刷设备的结构及故障特点,本文以某印刷企业的凹印设备为研究对象,对其故障的
本文以逆变器控制参数整定为研究对象,将人工蜂群(ABC)算法应用于逆变器控制参数整定中,提出一种基于混沌改进人工蜂群(CIABC)算法的逆变器控制参数整定方法。主要工作有以下几个方面:1.针对ABC算法中存在的“早熟”现象,引入Tent混沌映射改进策略,提升了ABC算法的全局搜索能力,寻优精度和收敛速度,得到CIABC算法。多组测试函数验证了所提改进方法的有效性。再将CIABC算法应用到PID控制
2021年《民事诉讼法》修订主要涉及独任制、司法确认、小额诉讼的适用范围、以及在线诉讼及送达规则等,对作为基本制度和基本程序的合议制、普通程序、传统线下诉讼、送达等都构成冲击。需要明确民事诉讼法以公正为基本价值,以司法审判为基本功能,以合议制为基本制度,以普通程序为基本程序。其他制度和程序都服务于民事诉讼法的基本价值和基本功能。应当以"基本"与"其他"之间的关系衡平为核心线索,实现民事诉讼法律规范
随着能源问题的日益突出,新能源的开发和利用越来越重要,已成为当今社会要着力解决的一个重大问题。近年来,我国大力发展光伏发电和风力发电,因此,并网逆变器的研究也引起了学界业界的高度重视。然而,在实际运行中,由于受到接入负荷、故障、谐振等因素的影响,会出现不平衡电网电压的情况而影响逆变器运行,进而影响并网发电安全运行。因此,需要考虑不平衡电网电压下并网逆变器的控制策略问题。本文以不平衡电网电压情况下的
一般性人机交互的方式主要包括离线示教和专用工具在线示教,这些方式示教后的机械臂只能按照固定的轨迹进行重复运动。随着人机协作技术的发展,常常按照工况的需要,在线示教机械臂的运动轨迹,以便发挥人的智慧和机械臂的负重能力及运动的精确性。为此,本文设计了自主跟随人体手臂运动的六自由度机械臂系统,实现机械臂模仿人体手臂相似运动和机械臂末端精确跟随人体手臂末端运动两种控制算法,具体工作内容如下:(1)本文合理