数据挖掘技术中聚类算法的研究

被引量 : 0次 | 上传用户:shuangsssss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅速发展,需要分析和管理的数据日益增多。为了从数据中发现有价值的知识和规律,人们提出用数据挖掘来解决这一难题。数据挖掘及其应用已经渗透到多个学科,并在人工智能与机器学习、数据库、模式识别、生物信息学、神经计算等领域取得了丰硕的成果。作为数据挖掘的重要工具之一,聚类技术得到越来越多的关注,至今已提出了大量的理论和方法。随着数据挖掘技术的广泛应用,数据挖掘所面对的数据对象日趋复杂,聚类研究也面临更多新的内容和挑战。本文对数据挖掘技术,尤其是对聚类分析进行了较为系统的分析和研究,介绍了一些改进的算法,主要内容如下:(1)介绍了数据挖掘的产生与发展以及数据挖掘中聚类分析的发展方向,总结了划分方法、层次方法、基于网格和密度聚类方法以及其他聚类方法的国内外发展现状,最后介绍了本文的主要研究内容和章节安排。(2)简要介绍了聚类算法的定义、相似性度量,聚类算法的分类和聚类方法的评价。详细讨论了数据挖掘中常用的聚类算法及其基本原理,最后对聚类算法的评价进行了讨论。(3)详细讨论传统k-means算法的基本思想、算法流程和算法性能。传统的k-means算法要求用户事先给定k值,限制了很多应用,初始中心点随机选择,容易导致局部极值点,常用的评价函数对于求解最优的聚类数目也不是很理想。针对这些问题,研究了一种新的评价函数-均衡化函数,同时采用基于密度的初始化中心点选择算法,自动生成聚类数目,实验结果表明了改进算法的有效性。(4)详细讨论了常用的几个划分判据,介绍谱聚类算法的基本框架和代表性算法,同时给出谱聚类算法的理论解释。通过分析谱聚类初始化敏感的特点,引入对初值不敏感的KHM算法克服这一缺点,在此基础上研究了初始化独立的谱聚类算法。实验结果表明该算法的有效性和可行性。最后,对论文的工作进行回顾和总结,就进一步有待研究的问题进行讨论和展望。
其他文献
当今社会,轻量化已经成为汽车工业发展的一种必然趋势。由于镁合金具有优良性能,它在汽车轻量化方面具有很广阔的应用前景。但是,镁合金常温下可塑性较差,传统的机械连接和焊
盗窃罪是我国社会中发案率最高的罪名,该罪的预防是刑事领域热点问题,本文旨在从刑事一体化的视角对该问题进行思考,以寻找有效预防盗窃罪的刑事司法综合手段。
直辖市建立10年以来,重庆的对外贸易迅速发展,在经济增长中发挥着日益重要的作用。但客观地讲,重庆外贸发展中存在许多问题,主要表现在贸易总量偏小、资本技术密集型产品竞争
重金属污染土壤的植物修复技术是近年来发展起来的一种较新的生态技术 ,其中 ,寻找重金属超富集植物是目前世界范围的研究热点。本文简要评述了重金属污染土壤的植物修复法的
《巴比伦法》的人本观初探——兼与传统的“同态复仇”原始残余说商榷于殿利一、问题的由来古代美索不达米亚文明最显著的特征之一就是尊重法律,法律的发展构成了该文明的重要
<正> 桃江县地处湘中偏北、资水中下游,面积2063平方公里,人口82万,被誉为“鱼米之乡”、“茶叶之乡”、“楠竹之乡”,葛资源也十分丰富。在抓种植业结构调整、推进农业产业
目的探讨胸腔镜联合腹腔镜食管癌根治术的临床疗效及对机体应激反应的影响。方法回顾性分析82例食管癌患者的临床资料,根据手术方式分为腔镜组(41例,行胸腹腔镜下食管癌根治
本论文研究内容属于国家“十一五”规划重大科技专项课题。针对川东普光气田集输系统恶劣的腐蚀环境:PH2S>1.5MPa、PCO2>1.0MPa及平均矿化度159 000mg/l,合成了咪唑啉衍生物
目的:研究上颌前牙、前磨牙的唇(颊)面形态及冠根成角关系对转矩的影响,为临床上牙齿的转矩调整提供参考。方法:选用329颗上颌离体牙,其中中切牙77颗、侧切牙68颗、尖牙61颗