模糊聚类算法在数据挖掘中的应用研究

被引量 : 21次 | 上传用户:huangxiaojuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模糊聚类分析是将模糊数学方法引入聚类分析,采用隶属度函数确定样本间亲疏关系的聚类方法,适合处理客观世界中大量存在的界限不分明的聚类问题。作为一种重要的数据挖掘方法,目前模糊聚类分析已经在数据挖掘领域得到广泛的应用,诸如网络入侵检测、故障诊断和图像分割等。在研究传统的模糊聚类算法和基于核函数的模糊聚类算法基础上,考虑到现有聚类算法忽略了待聚类样本各属性间的不平衡性,不能全面反映聚类样本的特点,本文给出一种改进的属性加权核模糊C-均值(Weighted Kernel-based Fuzzy C-Means, WKFCM)聚类算法,该算法在聚类过程中,根据不同类别的特性,动态调整各属性对不同类别的权重,体现了不同属性对聚类结果贡献度的差异性。将该聚类算法应用于数据挖掘领域的实际问题中,验证了WKFCM模糊聚类算法的优越性能。本文的主要研究内容包括以下几个方面:首先,在分析了数据挖掘领域中的聚类分析方法的基础上,研究了C-均值聚类算法、迭代自组织数据分析算法(Iterative Self-Organizing Data Analysis Technique Algorithm, ISODATA)、核C-均值算法和支持向量聚类(Support Vector Clustering, SVC)等硬聚类算法。结合模糊数学的方法,进一步研究了模糊C-均值(Fuzzy C-Means, FCM)算法及其改进算法GK(Gustafsson-Kessel)模糊聚类算法,以及基于核函数的核模糊C-均值(Kernel-based Fuzzy C-Means, KFCM)聚类算法。其次,针对所研究的上述模糊聚类算法未考虑待聚类样本属性间的不平衡性的缺陷,给出一种改进的属性加权WKFCM聚类算法,充分体现了各特征属性对聚类结果贡献程度的差异性,改进了现有模糊聚类算法的不足。最后,将所研究的上述模糊聚类算法应用在基准聚类数据集以及具有海量数据的网络入侵检测数据挖掘问题中,实验结果表明,在聚类正确率和算法平均耗时等方面,属性加权的WKFCM算法性能最好,体现了模糊聚类算法的优越性能。
其他文献
随着社会的不断发展,各种文化相互融合,新案件层出不穷,这就使得男性性权利的保护问题受到各方的关注和探讨,世界各国的刑事立法也对此作出相应的改变以应对新情况的出现。就我国
自《庄子试妻》开始,香港电影已走过了近一个世纪的风风雨雨。经过一代代电影人的探索尝试与不懈努力,上个世纪七十年代末,香港电影逐渐步入辉煌鼎盛。它以完善的产业模式以及独
有限责任公司具有人合性的特点。公司股东向股东以外的第三人转让股权会影响公司的人合性,故而公司法设置股东优先购买权。优先购买权理论上如何构造,实践中怎么操作等问题引起
“违法性”能否作为侵权责任一般构成要件是近年来各国民法理论界和实务界研究的热点问题。我国受前苏联民法的影响,传统以“四要件说”为通说,肯定违法性要件的独立地位。《侵
<正>据人民网舆情监测室发布的年度《中国互联网舆情分析报告》统计,在最受网民关注的舆情事件中,2007—2010年的涉警舆情事件就有"超女唐笑怒踢武警战士""广州警察开枪打死
乘坐舒适性和操纵稳定性是车辆的重要性能指标,主要取决于车辆悬架结构参数和安装形式。传统悬架无法同时实现对车辆垂向模态和俯仰模态的独立调节,也无法同时实现对侧倾模态
随着信息技术快速发展,越来越多的企业意识到了信息化建设的重要性,加大了在信息化建设上的投资,一系列主流的IT技术也应用到企业信息化建设中。特别是近几年来,我国铁路事业
人民教育出版社新版教科书《中国历史》(七年级上、下册)中的“动脑筋”栏目,具有较强的现实性、教育性、系统性,便教利学,是师生教学过程中不可忽视的一个部分。任课教师要
目前,国内大部分商业银行都希望通过转型的方式改变利润主要靠息差的局面,这就需要商业银行更加关注零售业务。受以前的体制和模式的影响,各大商业银行的部分网点存在严重的
随着计算机技术的快速发展,信息管理系统在企事业单位中的应用越来越广泛,很大程度地提高了管理效率。本人所在的工作单位为高校内部部门,以前的人事管理工作由高校统一管理,无需