【摘 要】
:
FP-growth算法是不产生候选集的关联规则挖掘算法,在许多领域中具有很高的实际应用价值。然而经典的FP-growth算法是内存驻留算法,只能处理小数据集,在面对海量数据集时显得
【机 构】
:
重庆邮电大学计算机科学与技术研究所
【基金项目】
:
重庆市自然科学基金(CSTC,2007BB2445);重庆市教委科学技术研究项目(KJ110522);重庆邮电大学科研基金(A2009-26)~~
论文部分内容阅读
FP-growth算法是不产生候选集的关联规则挖掘算法,在许多领域中具有很高的实际应用价值。然而经典的FP-growth算法是内存驻留算法,只能处理小数据集,在面对海量数据集时显得无能为力。对经典FP-growth算法中FP-tree的结构和挖掘过程进行了改进,分析了FP-tree单路径和多路径的不同挖掘方法,提出了一个剪枝策略,在挖掘过程中减少了部分分支的迭代次数。然后利用云计算的MapReduce编程技术,对改进的FP-growth算法的各个步骤并行化。实验结果表明改进的算法在处理不同的数据集时有一定的优势,然后经过MapReduce模型并行化后,提高了对海量数据的处理能力和效率,并且具有较好的加速比和良好的扩展性。
其他文献
自我国汇率制度改革实施以来,人民币汇率的走势受到国内外的广泛关注,而同一时期的另一热点问题是国际石油价格的剧烈波动。从理论角度分析,这两个经济变量并不是相互独立的,
由于钢结构件均超大、超长、超重,施工现场塔吊又不能满足转运和吊装需要。为此,结合现场实际,采用楼面拼装、人工转运、土法吊装的方式,圆满完成万象城钢结构施工安装任务,
在竞争激烈的房地产市场中,客户是开发商生存的基础。根据客户需求提供房地产产品,通过改善产品和服务的质量增强客户满意度,与客户建立良好的关系,是开发商取得竞争优势的重
苏州环球188工程A、B楼钻石状屋顶高度均超过200m,通过采用钢管天线液压同步滑移提升倒装施工技术,在屋顶狭窄的空间进行天线的吊运和提升等一系列高难度作业,使得屋顶天线的
目的探讨针灸治疗失眠症的临床疗效。方法将我院收治的86例患者随即发那位对照组和观察组,对照组给予脑力宝、安定、谷维素等治疗,观察组给予针灸治疗。结果观察组的治愈率为
针对在关联规则的实际挖掘中,由数据快速增加所造成的大数据问题和增量更新问题。在快速更新频繁模式树算法(fast updated frequent pattern tree,FUFP-tree)的基础上,引入Ma
康德把审美判断的特征从"质"的契机上界定为"无利害关系的自由愉快",其用意在于借助审美来抵制人的思想行为受"欲望"所支配,从而使人具有自己的自由意志和独立人格,表明审美
区域全面经济伙伴关系协定是东盟在美国积极推动跨太平洋伙伴关系协定背景下做出的战略性选择,这也是东亚合作多年来取得的重大突破。"东盟+1"自由贸易协定的横向比较分析表
城市发展过程中,市政工程关系着城市的发展规模,有利于城市的基础设施建设,并关系着人们的生活质量和水平。给排水工程是市政工程的重要组成部分,关系着人们的用水以及污水排