论文部分内容阅读
现如今,科技领域多学科交叉,学科间交互渗透已然成为众多学科的所共同具有的特征。由信息科学与生命科学共同结合而成的智能计算即是这类新的交叉学科。在已存在的智能计算领域中的所有群体智能算法,都是起源于科学家模拟、分析自然界中生物群体行为的群智能算法(Swarm Intelligence Algorithm)。该类算法在近几年中成为研究的热点,其中作为群体智能算法的典型代表,粒子群算法(Particle Swarm Optimization, PSO),由于其具有易于实现、高效等特点受到人们的重视,而孙军等人提出的量子粒子群算法(Quantum-Behaved Particle SwarmOptimization, QPSO),不但具有传统粒子群算法的优点,更克服了其非全局收敛的缺点。聚类(Clustering)这一概念,一直存在于人们生活之中,聚类方法也为解决实际问题而服务。多年来,聚类已成为数据挖掘领域的一个重点。然而,随着社会的发展,实际问题越来越复杂,以往那种需要预先确定类别数的算法已不能满足现代复杂的实际问题。而实现数据的自动聚类近年来引起学术界的广泛关注,成为当今科研的热点。核(Kernel)方法亦是模式识别方向的一种方法。当前核方法已在诸多方面如支持矢量积、高斯过程等方面获得应用,而其由低维向高维转变问题的特点决定了核方法在数据聚类领域能够使得原来的那些聚类方法性能有所提高。本论文综合上述三个方面,提出了基于量子粒子群算法的自动核聚类方法。不但能够很好地解决球形数据自动聚类问题,而且能够实现非球形数据的自动聚类。本文主要工作如下:1)提出了基于QPSO算法的自动聚类算法。该方法充分利用了QPSO算法的全局收敛性,能克服早收敛的特点,从而精确找寻到待分类数据集的准确分类个数。2)针对上一算法无法对非簇状数据进行处理的问题加以改进,加入核的思想。在保证对簇状数据集分类准确度不变的情况下,实现对非簇状数据集的分割。3)利用引入权重的量子粒子群算法(WQPSO算法)在原算法的基础上做进行进一步的改进。通过引入带权重值,使得算法更贴近实际应用,并使用UCI数据对有权重和无权中的两种自动聚类算法做了对比实验。本文得到如下基金资助:国家自然科学基金:61272279和61001202;中国博士后科学基金特别资助:200801426;中国博士后科学基金:20080431228以及中央高校基本科研业务费专项资金资助:JY10000902040。