基于多目标演化算法的动态聚类方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:z814521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类问题一直是数据挖掘领域的一个重要研究方向。虽然传统的划分聚类算法方法简单、执行速度快且效率高,但是由于其迭代法和爬山法的本质,使得算法容易陷入局部最优而得不到全局最优解。而且算法需要人为预先指定类别个数,同时对于不同属性的数据效果差异很大,即算法的通用性不高。近年来,随着演化计算的不断发展,聚类算法同演化计算的结合日益广泛。利用演化计算随机、最优化全局搜索特征,同传统的聚类算法形成有效的互补,很好的解决了传统聚类算法易陷入局部最优而得不到全局最优解的不足。但是对于传统算法的另外两个不足,现有的演化聚类算法仍然没有找到行之有效的解决方法。本文在现有的演化聚类算法的基础上,引入多目标优化策略,采用变长染色体编码方式,提出了一种新颖的聚类方法——基于多目标演化算法的动态聚类方法,较好的解决了现有算法的不足。本文的主要工作和特色如下: (1)采用变长染色体编码方式使得算法可以进行动态聚类。各个染色体长度的不同意味着各个染色体所包括的类别数目的不同,这样在编码的同时可以选择不同的类别数目而不相互干扰,并在演化过程中同时完成对类别个数以及每个类的优化,实现了不需要预设类别数目的动态聚类。 (2)将多目标优化策略引入聚类方法。算法采用多个适应度函数而不是传统的单个适应度函数,将聚类问题视为多目标优化问题。使用多个适应度函数使得算法对于不同属性的数据集都具有良好的聚类效果,提高了算法的通用性。 (3)基于GapStatistic理论,设计了一种从最优解集(ParetoOptimalSet)中挑选“最优解”的启发式选择策略。在选择过程中,首先寻求尽可能最完整的ParetoFront而不是缩减ParetoFront的大小,然后使用领域知识将集合逐步缩减到某个单一的解,即所要寻求的“最优解”。
其他文献
目前使用的人工抄表方式已日益不能满足管理自动化的需要,故本文提出了若干种实现自动化的方案,其中基于公共开关电话网络的调制解调器通信方式自动抄表是最能体现自动意义的。
人工免疫系统是继人工神经网络和进化计算之后又一种新型的智能计算方法,是生命科学和计算机科学的交叉学科研究领域。生物免疫系统是一个自适应、自组织、自学习的分布式并行
信息检索(Information Retrieval, IR)是研究信息的结构、分析方法、组织、存储、搜索和检索等方面的计算机科学。对检索模型的研究在信息检索领域处于核心地位。不同的检索
现实世界中存在着许多多目标优化问题(MOP),传统的规划算法不能很好求解这些问题。而多目标遗传算法(MOGA)擅长于求解高度复杂的多目标优化问题且通过一次运行可以搜索到一组
多机器人追捕问题是多机器人系统研究中的一个典型问题和重要平台。它研究在特定的环境下,设定怎样的规则,使得多个追捕机器人对资源进行合理的分配、协调与竞争,对一个或多
计算机领域的一个发展趋势是CPU运算速度的提升要大大快于磁盘的数据传输效率的改进,它们之间的差距不断扩大,逐渐成为分布式计算中不可忽视的一个因素。在这个背景下,对并行程
WebServices作为一种新的分布式计算技术,凭借其平台无关性、消息导向性和协议可组性等特点,从其一出现就迅速得到了工业界的青睐,并且形成了多个国际性组织研究和制定各种规范
该文基于作者在四川川大智胜软件股份有限公司实习期间参加的军航系统和其他民航系统的研发工作,主要介绍了空管自动化系统中系统监控模块中的若干关键技术.在以往成果的基础
该文在介绍了不同基因序列比对算法及其各自优缺点的基础上,针对Smith-Waterman算法着重分析了一些并行化方法,并结合集群式(Clustering)计算机系统提出了一种全新的并行优化