基于MapReduce的频繁项集并行挖掘算法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户：xxssdd55

【摘要】

：

现有FP-growth频繁集挖掘算法在处理大数据时存在时空效率不高的问题,且内存的使用随着数据的增加已经无法满足把待挖掘数据压缩存储在单个内存中,为此,提出一种基于MapReduce模型的频繁项集并行挖掘算法。该算法采用一种基于key/value键值对直接扫描value寻找条件模式基的方式,同时通过在原有FP-tree树节点中新增一个带频繁项前缀的域空间来构建一颗新的条件模式树NFP-tree,使

【作者】

：

马强杨金民

【机构】

：

湖南大学信息科学与工程学院

【出处】

：

计算机应用与软件

【发表日期】

：

2015年09期

【关键词】

：

频繁项集 FP—growth MAPREDUCE 条件模式基 NFP—tree并行 Frequent itemsets FP-growth MapReduce

【基金项目】

：

国家自然科学基金项目（61272401,61133005）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

一种改进的ISOMAP分类算法

传统的等距特征映射算法在降维时未考虑数据的类别标签,降维后不能够产生从高维到低维的映射矩阵,且不适用于多个类簇的情况,不能直接用于分类。针对这几个问题利用近邻元分析方法取代多维尺度分析法,并且引入特征向量作为输入矩阵,提出一种以分类为目的的等距特征映射算法(NC-ISOMAP)。降维时获取理想的低维投影矩阵,使降维后类间数据更加分开,类内数据更加紧凑。实验结果表明NC-ISOMAP算法能够取得很好

期刊

流形学习数据降维等距特征映射分类监督学习Manifold learning Dimensionality reduction Isometric fe

论马克思主义视阈中的中国化与现代性构建

鸦片战争以后,封建落后的中国由闭关锁国逐步融入了世界现代化潮流,并由此开启了对自身现代性的建构。经过历史潮流的反复淘洗,马克思主义最终成为中国现代化的指导思想,而中

期刊

马克思主义中国化现代性

中国经济增长方式的问题分析及对策建议

合理的经济增长方式是目前中国经济发展的重要课题,从中国经济当前突出的结构矛盾、经济发展的瓶颈及产业结构问题等方面入手分析了中国现行经济发展模式的问题所在,同时阐述

期刊

经济增长问题对策建议

松花江哈尔滨段二维水质模型参数敏感性分析

运用灵敏度与线性回归的方法，分析了松花江哈尔滨段二维水质模型中参数的敏感性。结果可知：污水排放量（Qp）=污水排放浓度（Cp）〉河流本底浓度（Ch）〉流速（u）〉横向扩散系数（My）〉降解系数（Kl

期刊

二维稳态衰减模式参数敏感性two -dimensional steady and damped water quality model the para

人工神经网络分光光度法同时测定五味子中3组分含量

将Levenberg-Marquardt BP算法用于五味子甲素、五味子醇甲、五味子乙素含量的同时测定。通过对网络结构和参数的优化，获得了较满意的结果，网络训练仅34即可达到要求。人工神经

期刊

人工神经网络分光光度法测定五味子甲素五味子醇甲五味子乙素五味子artificial neural networks spectrophotometry

基于MapReduce的频繁项集并行挖掘算法

其他学术论文