双MapReduce改进的Canopy-Kmeans算法

来源 :西安工业大学学报 | 被引量 : 0次 | 上传用户:qaz123_family
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于传统的Canopy-Kmeans算法在中心点的选取存在随机性,其迭代过程的冗余计算降低了算法的运行效率.文中基于"最小最大原则"和三角不等式原理,在Hadoop平台上提出了一种基于双MapReduce改进的Canopy-Kmeans算法.实验结果表明:设计的并行算法精确率在不同大小的数据集上平均提高了15.3%,加速比和扩展性随着数据规模和节点的不断增加也相应的提高了1.5~3倍,解决了Canopy中心点选中存在的问题和迭代过程中冗余的距离计算.
其他文献
目的:探讨内脏脂肪厚度与非酒精性脂肪性肝病(nonalcoholic fatty liver disease,NAFLD)的关系.方法:选择进行健康体检的人员共170例;分成两组:即非酒精性脂肪性肝病组110例(
随着教学改革的逐步深入,对学生创新教育和全面发展的要求也越来越强烈.要使学生全面发展,就必须关注每一名学生,要关注每一名学生就必须做好后进生的转化工作.教师要尽可能
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
以降低城市地铁车站深基坑开挖对周围环境影响,保障地铁工程施工安全为目的,该研究依托西安市地铁二号线运动公园车站深基坑施工,对施工过程中钢支撑轴力、桩身水平位移、基坑周
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着新课程改革的不断深入,古诗词在初中语文课本中所占的篇幅比重越来越大,语文教师关注的是如何让初中语文古诗词教学的效果越来越好,如何让古诗词的魅力穿越时空,引起学生