基于MapReduce的频繁项集并行挖掘算法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:xxssdd55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有FP-growth频繁集挖掘算法在处理大数据时存在时空效率不高的问题,且内存的使用随着数据的增加已经无法满足把待挖掘数据压缩存储在单个内存中,为此,提出一种基于MapReduce模型的频繁项集并行挖掘算法。该算法采用一种基于key/value键值对直接扫描value寻找条件模式基的方式,同时通过在原有FP-tree树节点中新增一个带频繁项前缀的域空间来构建一颗新的条件模式树NFP-tree,使得对一项频繁项的条件模式基进行一次建树一次遍历就可以得到相应的频繁项集。对所提出的算法在Hadoop平台
其他文献
传统的等距特征映射算法在降维时未考虑数据的类别标签,降维后不能够产生从高维到低维的映射矩阵,且不适用于多个类簇的情况,不能直接用于分类。针对这几个问题利用近邻元分析方法取代多维尺度分析法,并且引入特征向量作为输入矩阵,提出一种以分类为目的的等距特征映射算法(NC-ISOMAP)。降维时获取理想的低维投影矩阵,使降维后类间数据更加分开,类内数据更加紧凑。实验结果表明NC-ISOMAP算法能够取得很好
鸦片战争以后,封建落后的中国由闭关锁国逐步融入了世界现代化潮流,并由此开启了对自身现代性的建构。经过历史潮流的反复淘洗,马克思主义最终成为中国现代化的指导思想,而中
合理的经济增长方式是目前中国经济发展的重要课题,从中国经济当前突出的结构矛盾、经济发展的瓶颈及产业结构问题等方面入手分析了中国现行经济发展模式的问题所在,同时阐述
运用灵敏度与线性回归的方法,分析了松花江哈尔滨段二维水质模型中参数的敏感性。结果可知:污水排放量(Qp)=污水排放浓度(Cp)〉河流本底浓度(Ch)〉流速(u)〉横向扩散系数(My)〉降解系数(Kl
将Levenberg-Marquardt BP算法用于五味子甲素、五味子醇甲、五味子乙素含量的同时测定。通过对网络结构和参数的优化,获得了较满意的结果,网络训练仅34即可达到要求。人工神经