【摘 要】
:
随着互联网的飞速发展,数据的维度和数量呈爆炸式增长,高维数据的聚类分析问题显得愈发重要。传统的聚类分析方法不能有效地对高维数据聚类,因此研究者提出半监督聚类集成的方法来解决此类问题。半监督聚类集成将半监督学习和集成学习应用在聚类分析任务中,能够显著地提升高维数据聚类结果的准确性、稳定性和鲁棒性。然而,当前的半监督聚类集成方法存在一些缺点,例如:1)没有专门设计有效的方法处理高维数据问题;2)不能充
论文部分内容阅读
随着互联网的飞速发展,数据的维度和数量呈爆炸式增长,高维数据的聚类分析问题显得愈发重要。传统的聚类分析方法不能有效地对高维数据聚类,因此研究者提出半监督聚类集成的方法来解决此类问题。半监督聚类集成将半监督学习和集成学习应用在聚类分析任务中,能够显著地提升高维数据聚类结果的准确性、稳定性和鲁棒性。然而,当前的半监督聚类集成方法存在一些缺点,例如:1)没有专门设计有效的方法处理高维数据问题;2)不能充分地利用先验知识,尤其是成对约束信息;3)在聚类集成生成过程中,随机性太强,没有采用自适应的方法来优化生成过程;4)在聚类集成一致性函数过程中,考虑了所有的聚类成员的结果,即使有些聚类成员的结果质量很差。
为解决这些缺点,本文提出了一种双重自适应的半监督聚类集成方法(DASSCE)。DASSCE主要贡献有:1)提出了一种基于bagging约束的子空间生成方法,该方法使用bagging约束产生一组约束子集,并使用不同的约束子集指导子空间生成。2)设计了一种自适应的约束聚类集成选择方法,该方法能够有效地移除聚类结果中的冗余和噪音划分结果。3)采取自适应的子空间集合优化方法,从而获得了更好的聚类效果。为评测DASSCE的有效性,本文采用来自不同领域的、不同特点的、公开的高维数据集并设计了详尽的实验。实验结果表明:在高维数据聚类问题上,由于采取了本文提出的三个创新点,DASSCE获得了比其他半监督聚类方法更好的聚类效果。
其他文献
在日常生活中,图像信息是人们获取外界信息方式的重要组成部分,而图像的分辨率又极大的影响着图像质量的好坏,如何获取高分辨率的图像显得至关重要。但在实际应用场景中,由于采集图像的过程受成像系统与成像环境等诸多因素限制,获取理想高分辨率(HR,HighResolution)图像有时存在一些困难,而单方面提升图像采集设备的质量虽然能一定程度的缓解这类问题,但提升硬件不仅成本高昂,而且在一些特定的环境下能以
不论是工农业生产还是日常生活,库房都是人们工作生活以及物品存储的重要场所。关于库房环境事故带来的重大人员伤亡以及财产损失的报道屡见不鲜,库房环境问题给人们的工作和生活带来了极大的安全隐患。因此,库房环境的实时监控与智能化管理对于社会的发展显得极为重要。 基于此,本文提出了一套基于Modbus-RTU协议的库房环境实时监控系统。系统集环境参数采集、实时数据处理、实时报警控制以及友好界面等功能于一体
在非线性系统控制领域目前存在两种较为成熟的控制方法,分别为反馈线性化方法和反步控制法。本文的研究对象为一类不能通过这两种方法实现稳定性控制的非线性系统,具体又可分为仿射系统和非仿射系统两种情况。由于这一类系统的一般性和复杂性,相关研究在控制文献中较为少见,且主要研究的是最基本的针对精确模型的状态反馈控制问题。当所研究的被控系统为仿射形式时,现有的方法主要有:1)互联阻尼配置无源控制(Inter-c
当前,共享经济作为一种新的经济模式已经在许多行业得以实施,并有效提高了商品价值的最大化利用。承运者协同运输是共享经济模式在运输行业中的一种延伸和应用,通过相互独立的运输实体之间共享运输资源和任务信息,共同承担客户需求。在激烈竞争的运输市场中,相比传统的承运者独自运营的运输模式,协同运输能够使得承运者进一步降低成本,提高自身的利润收益和运输效率。同时,这种协同模式能够避免承运者之间恶意竞争,提高承运
随着人工智能技术的迅猛发展,机器已具有通过人脸图像,“理解”人类情感的能力。实现这种能力的方法就是基于机器学习的人脸表情识别,目前的主要应用有人机交互、安全安防、医疗健康等。人脸表情识别有7种基本类别,由愤怒(anger)、高兴(happiness)、悲伤(sadness)、惊讶(surprise)、厌恶(disgust)、恐惧(fear)和平静(neutrality)组成,因此人脸表情识别可用机
作为物联网产业结构的关键组成要素,物联网平台既要面对海量异构设备的接入需求,也要在设备、用户和云端之间搭建高效稳定的交互通道。因此,物联网平台既需要满足可扩展性,以支持新的异构协议设备的接入,也需要满足可用性,为大量设备和用户的交互提供良好的服务质量。结合微服务架构和Docker容器技术对物联网平台进行构建和部署,是实现平台可扩展性和可用性的可行方案。本文以笔者所在研究课题组的EMCloud物联网
移动互联网的飞速发展和移动设备的普及使得移动应用和网页的数量都在爆炸式增长,推动着服务器、后端Web应用的蓬勃发展,Web应用成为人们获取互联网信息服务的重要入口和支撑。伴随着互联网渐渐渗透人们的生活,人们对互联网应用的服务质量、用户体验、安全状态等要求也随之提高。应用开发商和网站运营者争先将互联网产品投入市场的同时,也非常注重产品优化以提高用户黏性,其中如何收集产品运行过程中的日志数据,分析产品
情感识别和分类在学术领域已经有很深入的研究,也取得了一些前沿的成果。但是,无论是在二维图像方面,三维人脸表情方面,还是语音识别领域,目前可以达到的情感识别率都偏低。为此,本论文采用近年来性能突出的深度学习模型,并加入本文进行的改进和创新,从视觉、语音以及脑电波三个方面进行了研究与探讨,并将改进的模型与NAO仿人机器人相结合进行实验研究,使得NAO仿人机器人具备识别人类情感的功能。 本文首先在视觉