论文部分内容阅读
云计算技术的出现为数据挖掘技术的发展带来了新的机遇。云计算技术通过使存储和计算能力均匀的分布到集群中的多个存储和计算节点上,从而实现了对超大数据集的巨大的存储和计算能力。HADOOP是一个用于构建云平台的Apache开源项目。使HADoOP框架有利于我们方便、快速的实现计算机集群。在HADOOP平台上,采用了HDFS(分布武文件系统)来实现超大文件的存储和容错,而使用了Mapgeduceg的编程模式来进行计算。