面向高维数据的自适应半监督聚类集成方法的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:masonchina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,数据的维度和数量呈爆炸式增长,高维数据的聚类分析问题显得愈发重要。传统的聚类分析方法不能有效地对高维数据聚类,因此研究者提出半监督聚类集成的方法来解决此类问题。半监督聚类集成将半监督学习和集成学习应用在聚类分析任务中,能够显著地提升高维数据聚类结果的准确性、稳定性和鲁棒性。然而,当前的半监督聚类集成方法存在一些缺点,例如:1)没有专门设计有效的方法处理高维数据问题;2)不能充分地利用先验知识,尤其是成对约束信息;3)在聚类集成生成过程中,随机性太强,没有采用自适应的方法来优化生成过程;4)在聚类集成一致性函数过程中,考虑了所有的聚类成员的结果,即使有些聚类成员的结果质量很差。为解决这些缺点,本文提出了一种双重自适应的半监督聚类集成方法(DASSCE)。DASSCE主要贡献有:1)提出了一种基于bagging约束的子空间生成方法,该方法使用bagging约束产生一组约束子集,并使用不同的约束子集指导子空间生成。2)设计了一种自适应的约束聚类集成选择方法,该方法能够有效地移除聚类结果中的冗余和噪音划分结果。3)采取自适应的子空间集合优化方法,从而获得了更好的聚类效果。为评测DASSCE的有效性,本文采用来自不同领域的、不同特点的、公开的高维数据集并设计了详尽的实验。实验结果表明:在高维数据聚类问题上,由于采取了本文提出的三个创新点,DASSCE获得了比其他半监督聚类方法更好的聚类效果。
其他文献
设计刻槽深度渐变的金属光栅,利用截止频率控制太赫兹表面波的传播距离.金属光栅刻槽深度在60μm时的截止频率为0.6THz,120μm时的截止频率为1.1THz.同时根据半导体材料InSb
介绍了山核桃常见害虫,如山核桃蚜虫、山核桃花蕾蛆、胡桃豹夜蛾、桑天牛、山核桃山社蛾、眼班钩蛾、梨园蚧的生活习性、危害特点,并提出了防治方法。
为了有效研究液晶环境对金属纳米结构表面等离子体的调制作用,基于时域有限差分方法,对液晶环境下金纳米柱结构进行了建模,上下边界采用完全吸收边界条件,四周为周期边界条件
本文在对数据仓库技术的发展及构建技术的研究的基础上讨论了数据仓库技术在教学管理工作中的应用的可能性及其潜在价值,并提出了一些高校数据仓库构建与应用的方法和建议,认为
互联网技术的普及,给人们带来便利的同时,网络的自由开放也产生了信息安全的问题.本文从网络信息安全的两个层面出发,结合当前网络信息安全的状况和发展趋势,提出了有效的防
随着高校招生规模不断扩招,大学生面临着各方面的心理问题,加强师生间的交流,不仅有助于教学质量的提高,也有助于营造一个良好的教学环境起到了很大的重要作用。所以本文将分析网