【摘 要】
:
聚类集成是一个开放性的命题,旨在解决单个聚类算法对数据划分中数据结构多样性的限制。它通过集成多种聚类算法以获得共识聚类。与单聚类算法相比,它可以更准确,更稳定地处理数据,并且对数据的结构和多样性具有更好的容忍度。粒子群优化算法是一种良好的元启发式算法,被广泛应用于多个领域。由于它只需要调整较少的参数,所以运行效率十分高。其核心思想即是粒子通过与种群内其他粒子的信息交互,快速找到最佳的粒子完成优化问
论文部分内容阅读
聚类集成是一个开放性的命题,旨在解决单个聚类算法对数据划分中数据结构多样性的限制。它通过集成多种聚类算法以获得共识聚类。与单聚类算法相比,它可以更准确,更稳定地处理数据,并且对数据的结构和多样性具有更好的容忍度。粒子群优化算法是一种良好的元启发式算法,被广泛应用于多个领域。由于它只需要调整较少的参数,所以运行效率十分高。其核心思想即是粒子通过与种群内其他粒子的信息交互,快速找到最佳的粒子完成优化问题。本文提出了一种应用粒子群优化的聚类集成模型(Particle Swarm Optimization for Clustering Ensembles,PSOFCE),融合多种经典的聚类算法对原始数据集进行多维度的特征提取以获得丰富的聚类结果,形成初始聚类结果集,并将经过Hugarin标签统一处理后的初始聚类结果集设置为目标共识解集。粒子群的快速寻优能力与Jaccard相似系数相结合,搜索与当前共识解集最一致的目标聚类,在粒子群的不断优化移动中,运用Jaccard相似系作为粒子的适应度函数来指导粒子群的寻优过程,当适应度值不再变化或者到达最大迭代次数时,获得最优目标聚类。然后,基于所提出的无监督聚类集成模型PSOFCE,设计了通过在数据集中选取不同比例数据应用无监督聚类集成对其做聚类,获得带标记的数据,用这些数据构造必连和勿连约束,然后把这些约束信息加入到标准聚类结果集,作为监督信息指导共识融合的过程,获得应用粒子群优化的半监督聚类集成模型(semi-supervised Particle Swarm Optimization for Clustering Ensembles,semi-PSOFCE)。最后,本文再采用多种经典的聚类效果评估方法评估所提出模型的聚类效果,并且与其他优秀的聚类集成模型和单聚类算法进行多维度对比实验。基于公开数据集上的实验证明:所提出的基于粒子群优化的聚类集成模型(PSOFCE)能够获得较好的数据共识聚类效果。然后,对于半监督聚类集成semi-PSOFCE,通过不同比例的约束信息构造,形成不同比例的监督信息的聚类集成模型。在不同比例监督信息梯度对比,以及其与无监督聚类集成模型的聚类效果对比中,证明了加入成对约束的监督信息,能够有效的提升聚类集成模型的聚类性能。
其他文献
环境污染和能源危机使得诸如风电、光伏之类的可再生能源技术以及作为燃油汽车替代品的电动汽车等新能源技术在国家政策和人们逐渐苏醒的绿色环保意识下迅猛发展,可再生能源的装机容量以及电动汽车(Electric Vehicle,EV)的规模都不断扩大,系统运行问题也随着参与主体的增加变得更为复杂。本文分析了EV的入网影响,以含EV的交直流混合微电网为研究对象,考虑系统内的不确定性建立了鲁棒优化模型,并考虑电
随着空客A380商用飞机、波音B787商用飞机、以及F-35战斗机的出现,多电飞机(More-Electric-Aircraft,MEA)已成为未来飞机的发展趋势,多电飞机谐波污染问题同时也引起了航空界的广泛关注。三相变频交流发电机具有系统结构简单、发电效率高、体积重量小等优点,广泛应用于新型多电飞机,其输出电压频率在360Hz~800Hz范围内变化,最大频率变化可达400Hz/s。并且,在实际应
风力发电是目前发展最快的可再生能源行业之一,以其开发技术成熟,最具规模化,被广泛应用于发电领域。我国大部分地区风资源充足但风能密度低,因其地形为山地和丘陵,相较于可供集中连片开发的海上风电场与平原风电场,山地风电场的建设成为必然趋势。与普通风电场不同,山地风电场存在以下几个特征:1)风电机组分散、运行模式均不相同;2)集电电缆密集;3)集电网络复杂。一方面,集电网络与密集的集电电缆将导致系统中感性
弓网系统是牵引系统中的重要设备,对其进行智能检测有助于保证弓网系统运行的安全性及稳定性。弓网图像数据是弓网智能检测的基础条件,因此图像数据的生成与增强技术有着重要研究意义和研究价值。本文根据收集弓网图像不同特点设计了两种弓网背景转换思路,这些转换图像增加了弓网数据的完备性和多样性。根据黑夜中弓网图像信息单一、弓网轮廓清晰的特点,本文先使用U-net分割出原图像中的弓网,再使用泊松融合将分割出的弓网
近十年,我国高速铁路迅速发展,在高寒地区已接通并规划多条主干高铁,如哈大高速铁路、兰新高速铁路等。随着高寒地区高铁覆盖率提升,保障高铁运营安全至关重要,其中首要任务便是确保高铁牵引供电系统不间断供电。该系统作为高铁唯一动力能源,牵引变压器是其中的关键设备,而变压器附属高压套管负责将高低压引线从变压器内部引出并与外界电网进行联络,其正常运行是牵引供电系统可靠供电的重要保障。为了保障高寒环境下牵引供电
在电磁推进系统中,电机需要在较短时间内推动质量很大的物体达到目标速度,这就对电机有着输出大推力的应用需求。在实际应用中为达到大功率输出要求,常选用多相电机类型,同时还能提高系统的可靠性与容错能力。永磁同步直线电机具备推力密度大、内部结构简单、效率高等突出优势,考虑到大推力输出对电源及功率器件性能的高要求和电机制造的实现难度,电磁推进系统多选择采用具有各相独立式特点的多相永磁同步直线电机。本文以电磁
地铁作为现代化城市出行的重要交通工具,保障其运行安全至关重要。利用运维技术对地铁列车进行评估,掌握其当前性能并用于维护决策是目前常用的手段。随着信息技术的发展,地铁运维向数字化、智能化转型成为大势所趋,传统单一的评估模式也需要向全面、系统、智能转变。数字孪生(Digital Twin,DT)作为虚实融合的最佳途径,为数字化转型提供了新的思路和方法,得到了国内外学者及企业的广泛关注。本文将数字孪生理
无线电能传输技术是一种能在无接触情况下通过电磁效应或能量交换作用实现能量传输的方式,具有广泛的发展和应用前景。在人体植入式设备、传感器网络等领域,在实现无线供电的同时还需要同步传输信息,来传输控制信息或反馈检测到的信号。随着无线电能传输技术研究的进一步深入,能量与信号的同步传输已成为扩展无线电能传输技术应用领域的关键技术之一,成为该领域的又一研究热点。本文结合磁浮列车间隙传感器在供电和信号传输方面
随着能源紧缺和环境污染的问题日趋严重,碳中和、碳达峰要求愈来愈逼近,运输装备轻量化愈加为工程技术界所重视。在轻量化材料中,镁合金以低密度、高比强度/比刚度、高阻尼、较强电磁屏蔽性能以及丰富的矿产资源而备受关注,但绝对强度低和耐磨性较差限制了其进一步广泛应用。石墨烯纳米片(Graphene nanoplatelets,GNPs)由于其极高的强度和良好的润滑性能有望同时提高镁基体的力学性能和减磨耐磨性
频谱接入是认知无线电技术中非常重要的一环,要求在不干扰授权用户使用的前提下,根据频谱感知得到的结果接入空闲频谱并利用。动态多信道接入可以在时变的频谱占用状态情况下,实时动态地调整自身设备参数,自主选择接入空闲频谱资源。深度强化学习作为解决动态系统问题的有效方法在无线通信领域里被广泛采用,其区别于传统方法,不需要系统环境的先验信息,与系统环境不断交互获得相应的奖励与惩罚、不断学习环境的动态特征信息。