【摘 要】
:
随着计算机技术以及网络的普及程度越来越高,不可避免的会产生大量的数据,当产生的数据量规模越来大时,想要在庞大的数据海洋中获取有用的数据信息,成为一件备受关注的问题。
论文部分内容阅读
随着计算机技术以及网络的普及程度越来越高,不可避免的会产生大量的数据,当产生的数据量规模越来大时,想要在庞大的数据海洋中获取有用的数据信息,成为一件备受关注的问题。而依靠传统的数据库查询渐渐力不从心,查询出的数据往往不能让人满意。进而,出现了大数据,数据挖掘,云计算等越来越多需要进行数据计算的技术。有效的数据信息能够帮助管理者,决策者作出正确的决定措施,想要从海量的数据中挖据出有效的数据信息,找出数据之间千丝万缕的关系,就需要数据挖掘的帮助。而聚类分析是数据挖掘中的一个方法分支,有着广泛的应用,但传统的聚类算法往往存在着一些弊端,需要作出一定的优化,更好的用于实际的工作中。本文首先介绍数据挖掘的基本概念以及较为常用的聚类挖掘算法K-means算法,该算法是聚类分析中的一种经典算法。但是该算法容易受到初始聚类中心的影响而不一定能够获取到最优解,具有一定的局限性,是一种局部的搜索技术。针对聚类中存在的问题,进而引出遗传算法,遗传算法是一种生物类型的进化算法,根据达尔文进化论,孟德尔遗传学说而来,物竞天择,优胜劣汰是它的特点。遗传算法虽然具有天然的优势,但同样传统的遗传算法具有过早收敛,易陷入局部最优值的缺陷。提出并对现有的遗传算法进行改造,利用多种群机制、动态分配交叉变异概率、模拟退火算法中收敛速度较慢、可跳出局部最优解等优点,提出动态分配多种群模拟退火遗传算法。将该算法与聚类中的K-means算法结合在一起,用于聚类分析中,起到了良好的效果。将优化后的遗传算法与聚类算法结合在一起,通过实验数据进行试验后,实验数据表明,优化后的遗传算法与K-means算法,比只使用K-means算法和标准遗传K-means算法要有一定的优势。在实验结果表明,动态分配多种群模拟退火K-means算法在数据准确度上有了较为明显的提升。说明在使用优化后的遗传算法同K-means算法结合在一起,会使算法更加高效合理,聚类效果更加优秀,适用于聚类分析中。
其他文献
主题研究的相关性。在建设创新型经济、不断推进、现代化和升级的背景下,人力资源不仅是经济增长的动力,也是世界经济的竞争力和适当地位的决定因素。本文旨在探讨哈萨克斯坦
目的本课题主要研究清热祛湿法对湿热体质亚健康失眠患者的疗效,观察其治疗前后匹兹堡睡眠质量指数(PSQI)、湿热质积分、疲劳严重度量积分(FSS)的变化,客观评价以清热祛湿法对亚健康失眠的临床疗效,以期得到一种疗效更佳、临床可操作性较强的临床治疗方案,并为亚健康失眠患者的治疗提供循证医学(evidence-based medicine,EBM)依据。方法:采用随机对照的临床研究设计方法,临床研究的疗
近年来,开关电源不断向高效率、高功率密度的方向发展。提高功率密度的有效措施是提高变换器的开关频率,随着开关频率的提高,磁性元件的体积不断减小。然而,开关频率的提高又会导致开关损耗的增加,不利于提高变换器的效率。LLC谐振变换器通过变频控制,能实现原边开关管的零电压导通(zero voltage switch,ZVS),同时副边二极管也能实现零电流关断(zero current switch,ZCS
采用在第二步反应中引入阳离子单体3-氯-2-羟丙基三甲基氯化铵(CHPTAC)替代部分环氧氯丙烷(ECH)的方法合成了高固含量环保型的聚酰胺多胺环氧氯丙烷(PAE)树脂,探讨了各种反应
中外合作EPC项目作为工程总承包发展的“过渡模式”正发挥着积极的作用。然而,EPC项目成本超支已成为决定项目失败的关键因素。在此形势下,C公司面临项目成本超支,项目利润率被压缩的问题。C公司迫切需要提高成本管理水平,提高项目成功率。本文首先结合近十年国内外研究,阐述了工程项目成本管理和EPC总承包项目成本管理的概念和基本理论,通过项目成本绩效偏差现状分析,发现C公司EPC项目成本管理存在的问题。针
“雾霾”等空气污染问题不断困扰着人们的生产生活,且对人体健康造成一定危害,因此缓解空气污染问题刻不容缓。静电纺纳米纤维膜具有纤维直径小、比表面积大、网状结构、孔隙
团队创业可以分散创业带来的风险,提高创业团队抵御环境中不确定因素的能力,从而降低企业失败的风险。与此同时团队创业会涉及到股权配置的问题,一旦股权分配出现不合理之处,很有可能导致曾经的合伙人分道扬镳甚至反目成仇。在创业团队组建之初,依据创业团队的特性团队成员之间会采取不同的股权分配模式。然而团队成员人力资本并非一成不变的,如果企业的股权结构保持不变,则无法激发团队成员的积极性。股权结构变化使得创业团
我国山河湖泊众多,地质情况复杂多变,软土地质分布广泛。随着国民经济的发展,公路、铁路、桥梁等基础设施不断兴建,路基失稳事故频发,而深厚软土区域的路基不均匀沉降及破坏往往率先发生于路堤坡脚处。本文通过室内模型试验,研究路堤坡脚处均质砂土中斜直桩工程特性。试验研究结果表明:(1)3次加载过程中,斜直桩桩身水平位移随荷载增大而增大,其增长率先增大后减小。相同荷载条件下,斜直桩桩身水平位移随排距增大而减小
近几年,随着网络技术的飞速发展,互联网应用已经渗透到人们工作生活的方方面面。人们越来越关注网络中传输的数据内容;而现有的TCP/IP架构却是以地址为核心,在可扩展性、动态
高考语文改革正在改变语文教育的方方面面,阅读方面的变革要求学生具有更快的阅读速度及更高的阅读能力。离开教师的当堂指导,学生独立面对课外作品时的阅读情况并不理想,故需要更高的阅读水平以改观现状。现教材的容量远不能满足数量的需求,学生的阅读水平也处于低位,并且教师的指导尚还薄弱,故需教师开展课外阅读指导来辅助阅读教学,延伸、加深课堂知识,提高学生阅读水平。在此前提下,课外阅读指导的现状改进愈加重要。为