基于空间分布自适应权重度量的粗糙K-means聚类算法及其应用研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:m397760109
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘领域一种重要的技术手段,近些年迅速发展起来的粗糙K-means算法将数据对象客观地划分为具有明确归属关系的下近似区域以及含有不确定归属关系的边界区域,是一种新的有效软聚类分析方法。在粗糙K-means算法中,边界区域数据对象参与中心均值迭代时权重系数的设置对于聚类结果具有非常重要的影响。现有的粗糙K-means算法在度量下近似和边界区域的相对重要性权重以及边界对象个体的权重系数时,没有充分考虑类簇数据空间分布情况的影响。本文综合考虑下近似和边界区域对象的空间分布,探索下近似和边界区域的相对权重以及边界区域的数据对象参与类簇中心迭代的个体权值自适应度量的方法,并结合光伏功率发电预测系统的实际应用需求,将设计的粗糙K-means聚类算法用于光伏预测数据的预处理分析。主要研究内容包括:(1)基于空间距离自适应相对权重度量的粗糙K-means算法。传统的粗糙K-means算法大多根据经验选择固定的权重,忽视了簇内对象的空间分布情况和簇间的差异性。根据下近似和边界区域对象相对于簇心的空间分布情况,设计了基于空间距离的相对权值自适应度量的方法,用于动态自适应地计算下近似和边界区域的相对权重系数,并提出一种基于空间距离自适应相对权重度量的粗糙K-means算法。(2)基于邻近点空间分布自适应权重度量的粗糙K-means算法。传统的粗糙K-means算法中,大多基于边界对象与簇心的距离度量边界对象与类簇的相似度,忽视了边界对象邻近点的空间分布情况。根据边界对象所在交叉类簇的下近似区域邻近点的个数以及与邻近点的距离综合计算边界对象参与各类簇迭代计算的权值系数,并提出一种基于邻近点空间分布自适应权重度量的粗糙K-means算法。(3)基于粗糙K-means聚类算法的光伏发电功率预测数据预处理。神经网络是光伏发电功率预测最为常用的模型,但随着预测精度要求的提高、数据量的增大,用初始的数据样本训练神经网络预测模型,往往造成网络结构庞大、训练困难,难以达到要求的精度,而对原始数据先进行聚类预处理分析则有助于神经网络模型的构造、加快网络模型的训练过程。结合光伏发电功率预测系统的实际应用需求,将设计的粗糙K-means算法用于光伏训练数据的预处理,并结合光伏发电功率预测的结果与传统的聚类预处理方法进行对比分析。
其他文献
由于对装配式混凝土建筑推行的速度较快,很多新技术和实践经验还不成熟,随之而来的便是很多的质量通病逐一呈现,如露筋、裂缝、蜂窝麻面、端头疏松、锚筋松动等,对于预制构件
从普拉达(Prada)、新秀丽(Sam sonite)、蔻驰(Coach)之类海外奢侈品牌,到周大福这样的中高档珠宝连锁店,再到凡客诚品这样走价廉物美路线的服装网购企业,境外资本市场正在掀
模糊是语言的自然属性,广泛存在于言语交际中。本文以汉语文学语篇中的模糊语言现象为例,揭示了合作原则是控制模糊限定语产生、执行和理解的基本原则,模糊限定语在文学语篇
作者运用甲金文验古学的两种"存在的物证"的方法,全面考察了原初的"骨■"和"龜■"(龟)即甲骨文占卜的"原初史"遗迹,追溯甲骨文"占■、兆■、贞■、帝■、天■、示■、神■、
CPR1000压水堆实行专业化检修,辐射防护管理面临新的机遇和挑战。本文介绍了宁德核电站N101首次大修的辐射防护管理,并与大亚湾核电站(同类堆型)进行比较,指出不同之处,提出相
运用汽车动力学,考虑车辆在长大纵坡下坡路段加速性能,假设减速带减速效果已知,以车速不超过道路设计车速为前提,进行振动减速带设置间距的研究,得出了在不同的设计车速、不
全球环境问题受关注程度日益高涨,其中又以"全球变暖"问题位列受关注问题之首。不同于科技手段等实用主义路径,本研究拟从语言学角度入手,选取6份中美主流报纸,尝试总结两国
多导睡眠图(PSG)监测是睡眠呼吸紊乱最重要的诊断手段,而计算机化的多导睡眠图(cPSG)监测系统是集传感技术、计算机技术、数字技术及网络技术等多种高科技技术于一体的医疗诊治系
丹尼尔·笛福被公认为18世纪英国最伟大的作家之一,他一生著述颇丰多达560余部。作品以描写非上层阶级出身的资产阶级为主,多涉及个人的日常生活的状况,特别是婚姻中夫妻两人
0引言水泥厂预热器框架、生料库、原料磨、废气处理4个车间(简称窑尾)由于连接环节较多,是水泥厂的核心,也是工艺布置中的重点.以前的设计对管道重视不够,主要考虑厂房布置整