【摘 要】
:
云计算是一种商业计算模型,它将计算任务分布在大量计算机构成的资源池上,能为用户提供按需分配的计算能力、存储能力及应用服务能力;云计算为存储和分析海量数据提供了廉价
论文部分内容阅读
云计算是一种商业计算模型,它将计算任务分布在大量计算机构成的资源池上,能为用户提供按需分配的计算能力、存储能力及应用服务能力;云计算为存储和分析海量数据提供了廉价高效的解决方案。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐藏在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,对科学研究与商业决策等多个领域起到了指导作用,具有深远的社会和经济意义。云计算环境下的并行数据挖掘策略的研究具有重要的理论意义和应用价值。本文从数据集划分方法、数据集分配方法及基于MapReduce的并行数据挖掘算法等方面对云计算环境下的并行数据挖掘策略做了研究。论文介绍了云计算和数据挖掘的相关概念和技术,并行数据挖掘中已有的的数据集的划分方法、并行机制和并行策略,已有的并行的关联规则挖掘算法、并行的聚类算法和并行的分类算法。在此基础上,设计了改进的并行数据挖掘策略,包括适用于云计算环境的数据集划分方法、数据集分配方法和改进的Apriori算法;设计了改进的Apriori算法在Hadoop中的MapReduce编程模型上的实现流程。并且搭建了Hadoop平台,利用该平台进行了算法功能和性能测试,测试结果表明:基于本文设计的并行数据挖掘策略,改进算法在云计算环境下能获得更高的频繁项集挖掘效率。论文研究成果在云计算环境及海量数据挖掘领域具有较高的应用和参考价值。
其他文献
目前,随着我国现代化社会建设进程的不断深入及教育改革的不断完善,我国高等教育逐渐普及,迈入大众化阶段。作为新形势下社会发展的重要人为因素,大学生创新创业能力的培养及
目的:本课题旨在通过系统、严谨的临床观察与研究,以补肾调周法合内异止痛汤对子宫内膜异位症痛经患者临床疗效进行观察,力求能通过我国传统中医的辨证论治方法为此类患者提供
随着汽车工业的快速发展,废旧轮胎的处理问题引起人们的关注,将废旧轮胎加工成橡胶颗粒掺入砂土中,以形成的橡胶-砂混合土作为路基工程的填料,能够处置大量橡胶轮胎,同时利用
现代企业的业务发展决定了其对IT系统的高度依赖性,而随着企业规模的不断扩大,IT风险越来越不容忽视。这在充分体现IT支撑重要性的同时,对工T管理的稳定和高效也带来了巨大的
随着跨国公司大量的进入我国,跨国公司对于我国经济、社会、文化等方面的影响也越来越大,而跨国公司的一切行为,都与其伦理价值取向直接相关。跨国公司伦理价值取向是指跨国
目的探讨僵直膝全膝关节置换(TKA)术中采用股四头肌肌腱斜切技术改善膝关节活动度的有效性及安全性。方法回顾性分析自2015-01—2017-02采用TKA治疗8例(11膝)僵直膝,术中采用
工业是国民经济的主导行业,生产生活资料,制造生产工具。但是工业生产需要大量原料,消耗大量能源,造成大量的环境污染。要想保证我国的工业企业能够实现可持续发展,就必须要
本文首次基于OCO-2卫星观测数据,采用高精度曲面建模(High Accuracy Surface Modeling, HASM)的方法来模拟大范围高精度的二氧化碳柱浓度(XCO2)的空间分布。首先,探讨分析HASM方
改革开放以来,跨国公司大量进入我国,对我国经济、政治和社会等方面产生了很大影响。跨国公司的行为同其伦理价值观密切相关。在经济全球化进程中,跨国公司的伦理价值观发生
PID控制算法是最早发展起来的控制策略之一,因为它的简单性、可靠性和鲁棒性等特点而广泛运用于运动和过程控制中。可是按照常规的PID控制方法达不到理想的控制效果,况且在现