论文部分内容阅读
摘要:近年来数据库信息越来越庞大,利用已有的算法来快速挖掘频繁项集已经变得越来越困难。为了解决这个问题,论文提出一种挖掘频繁项集的新算法。该算法首先需要为每一个项目设定一个不重复的优先级,然后采用最小优先级树堆的数据结构存储数据库中的每条事务,最后,从最小优先级树堆中寻找数据库中的各种频繁项集。通过实验测试,在相同的支持度下,使用该算法来挖掘频繁项集的运行效率的确比Apriori算法和FP-growth算法的运行效率要高。
关键词:数据挖掘;关联规则;频繁项集;树堆; Apriori ;FP-growth
中图分类号:TP312
关键词:数据挖掘;关联规则;频繁项集;树堆; Apriori ;FP-growth
中图分类号:TP312