分布式并行关联规则挖掘算法研究

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:emajor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘算法FP-Growth虽然效率比Apriori要快一个数量级,但存在频繁模式树可能过大而内存无法容纳和数据挖掘过程串行处理等两大缺点。提出一种分布式并行关联规则挖掘算法,该算法针对分布式应用数据架构,不需要产生全局FPtree,避免全局FP-tree可能过大而内存无法容纳的问题,算法在各个主要步骤上都实现了并行处理。算法测试结果和分析表明,与传统的关联规则挖掘算法FP-Growth相比,该算法通过多节点分布式并行处理显著提高了执行效率和处理能力。
其他文献
法拉第电磁感应定律和楞次定律是建立在实验基础上的电磁学基本定律,一向是高中物理的重点内容。要教好这部分内容,做好演示实验是前提和基础。为了提高演示实验的效果,作者
<正> 1 临床资料 观察组为临床怀疑为冠心病而申请进行冠状动脉造影的患者216人,均为2001-03~2001-12在中山医科大学第一附属医院心内科、内科高级病区和心外科及广州中医药大
本文旨在寻找延缓慢性肾功能衰竭进展的有效药物,观察了以温阳益阴,活血泻浊法组方的肾衰Ⅱ号方对CRF模型大鼠肾小管高代谢状态的抑制作用。结果表明该方可明显降低CRF模型大
现今社会发展迅速,时代所面临的能源危机也日趋严重。为了解决当今社会所面临的能源危机,发展对环境友好的可再生能源势在必行,而太阳能电池作为一种可持续发展的可再生清洁
目的检测细胞角蛋白5/6(cytokeratin5/6,CK5/6)、P63蛋白、甲状腺转录因子-1(thyroid transcription factor-1,TTF-1)和细胞角蛋白8/18(cytokeratin8/18,CK8/18)在人非小细胞
本文提出一种新的结构分解方法,分析我国转移支付均等化地方财力的效应。该方法将均等化效应分解为两个部分:反映中央政府财政干预的水平均等化效应,与反映地方财政财力聚集
目的:探讨结缔组织病并发肺动脉高压(CTD-PAH)的临床特点。方法:112例诊断明确、资料完整的结缔组织病并发肺动脉高压的患者(CTD-PAH组)与97例结缔组织病未并发肺动脉高压患
<正>读点书。苏州大学教授、苏州市副市长朱永新说:"在一定意义上说,读书就意味着教育,甚至意味着学校。在学校中,我最看重的就是教师与图书。学校就是提供了一个读书的空间,
目的:寻找治疗长期便秘的有效药物。方法:在对便秘进行辨证施治的基础上加用大剂量生白术(60~120g),观察临床疗效;并以不加用白术做对照观察。动物实验观察白术对小鼠肠内炭末