【摘 要】
:
频繁闭项集的挖掘是发现数据项之间关联规则的一种有效方式.当前以MapReduce模式为基础的云计算平台为解决海量数据中的关联规则挖掘问题提供新的解决思路.文中提出并实现一
【机 构】
:
南京大学计算机软件新技术国家重点实验室;
【基金项目】
:
国家自然科学基金项目(No.61035003,60875011,60721002);国家973计划项目(No.2010CB327903);科技部国际科技合作计划项目(No.2010DFA11030);江苏省自然科学基金项目(No.BK2010054)资助
论文部分内容阅读
频繁闭项集的挖掘是发现数据项之间关联规则的一种有效方式.当前以MapReduce模式为基础的云计算平台为解决海量数据中的关联规则挖掘问题提供新的解决思路.文中提出并实现一种基于Hadoop云计算平台的频繁闭项集的并行挖掘算法.该算法主要包括并行计数、构造全局频繁项表、并行挖掘局部频繁闭项集和并行筛选全局频繁闭项集四个步骤.在多个数据集上的实验表明,该方法能较大提高数据挖掘的效率,具有较好的加速比.
其他文献
本文所使用的“底层书写”概念,是指以社会学意义上的“底层”为书写对象的文学作品。自本世纪初以来,由于社会分配不公、贫富差距急剧拉大等原因,“底层”重新进入作家的视
充分把握好柔性引进人才的特点,确立各种具体可行的措施,加强联系,构建平台,引进科技成果。刺激人才观念的转变和更新,建立保障机制,促使柔性引进人才取得实效。
婚姻伦理是社会伦理的重要组成内容之一,其形成、发展与社会生产力和生产方式紧密联系,是人类社会发展到一定阶段的历史产物。作为最基础、最亲密的社会关系形式,婚姻伦理对
针对基本蝙蝠算法(BA)寻优精度不高、收敛速度慢和易早熟收敛的问题,提出一种改进的具有自适应变异机制的蝙蝠算法,用以求解复杂函数问题;利用K-means聚类对蝙蝠种群进行初始
EVA方法是由剩余价值理论发展起来的,强调通过业务发展、成本节约、风险控制和资本保全的有机统一来实现银行价值最大化的目标。将EVA方法引入商业银行创造能力的研究,可对我
<正>在市场经济条件下,要保持劳动关系和谐发展,就要在劳动关系双方之间建立一种诉求能够及时顺畅表达、利益得到充分尊重、矛盾可以有效化解的制度机制。集体协商制度就是这
依托现代信息化技术,将传统的课程教学资源及教学活动与数字化的学习资源和虚拟化的网络空间有机地结合起来,形成一套有利于学生学习能力、创新能力和实践能力培养的课程立体
对通用的CFD(Computational Fluid Dynamics)模拟软件PHOENICS,FLUENT,STAR-CD,CFX,FIDAP进行了介绍,指出了它们各自的特点。
技术性贸易壁垒作为一种新兴的贸易保护措施,近年来成为发达国家限制进口的重要手段。广东作为出口依存度非常高的地区,国外技术性贸易壁垒对广东外贸出口的影响尤为严重。政
针对目前测试性验证试验中故障样本分配考虑因素单一,分配结果不太合理,影响测试性验证评估准确度的问题,文章综合考虑故障样本分配的影响因素,提出了故障样本分配的综合加权