云计算下基于改进遗传算法的聚类融合算法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:sanmumuren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对无监督聚类缺少数据分类等先验信息、基聚类的准确性受聚类算法影响以及一般聚类融合算法空间复杂度高的问题,提出一种基于改进遗传算法的聚类融合算法(CEIGA);同时针对传统聚类融合算法已经不能满足大规模数据处理对于时间的要求的问题,提出一种云计算下使用Hadoop平台的基于改进遗传算法的并行聚类融合算法(PCEIGA)。首先,基聚类生成机制产生的基聚类划分在完成簇标签转化后进行基因编码作为遗传算法的初始种群。其次,通过改进遗传算法的选择算子,保证基聚类的多样性;再根据改进的选择算子对染色体进行交叉和变异操作并使用精英策略得到下一代种群,保证基聚类的准确性。如此循环,使聚类融合最终结果达到全局最优,提高算法准确度。通过设计两个Map Reduce过程并加入Combine过程减少节点通信,提高算法运行效率。最后,在UCI数据集上比较了CEIGA、PCEIGA和四个先进的聚类融合算法。实验结果表明,与先进的聚类融合算法相比,CEIGA性能最好;而PCEIGA能在不影响聚类结果准确度的前提下明显降低算法运行时间,提高算法效率。
其他文献
针对D-InSAR技术二轨法中先差分再解缠和先解缠再差分2种情况,以钱营孜矿区为例,采用ALOSPALSAR数据进行差分处理,并与地面水准观测结果进行比较,最终得出结论:两者所得沉降
我国建筑量巨大,单位面积建筑能耗较高,建筑节能技术的提高能有效的防止能源的浪费。箭镞节能是一项综合的技术,贯穿建筑物的整个生命周期,包括规划、设计、施工和管理等环节
目的观察维持性非卧床腹膜透析(CAPD)营养不良患者服用补肾祛毒丸的临床效果。方法选取2014年3月至2016年3月我院肾内科接受CAPD治疗且出现营养不良患者82例,按数字表法随机
由于部分油田清水硬度较高,加热炉、换热器运行结垢严重,造成换热器换热效果变差,加热炉效率降低,每年均需要组织清洗维修。为此,经调研、筛选,组织了吉一联超音频脉冲防垢除
目的探讨灯盏花素注射液对脂多糖致大鼠急性肺损伤的保护作用。方法健康雄性SD大鼠30只随机分为对照组、脂多糖组(LPS组)和灯盏花素干预组(Bre组)各10只。对照组静脉注射生理盐水
在数学学习中,运算能力是学生的一项基本能力,运算能力的培养主要集中在七年级阶段完成。因此,加强七年级学生运算能力的培养,对整个中学阶段乃至未来都是大有益处的。但是,
本文提出一种同调机群的识别方法,它通过安装在发电机的PMU,实测出系统受扰后发电机的功角曲线,利用其时域规则和慢同调性原理来确定同调机组,能够有效地对受扰后的多台机组
摘 要:高职院校的教学基本目标为培育职业型人才,因此在高职院校教学开展的过程中应当时刻以现实工作需求为导向。由此,相关教育者提出了以工作过程为导向的职业院校教学方法。翻译人才在当前社会生活领域的需求不断增加,对其专业技能的要求也越来越高,由此对高职院校翻译专业教学提出了新的挑战。本文对高职院校翻译专业有效开展以工作过程为导向的教学改革的有效策略进行分析。  关键词:高职教学;英语翻译教学;工作导向
为了解上海市大气细颗粒物(PM2.5)中含碳物质的浓度及其影响因素,于2007年12月~2008年12月间在上海市的市区(徐家汇)和工业区(宝山)采样点分别采集了130多个PM2.5样品,应用DRI
文章介绍了金保方教授的三个临床验案,突出金保方教授临床治疗男科疑难问题时,注重整体、辨病与辨证结合、衷中参西的诊疗思路,值得学习和借鉴。
会议