论文部分内容阅读
本文就布尔关联规则的分布式挖掘与更新、最优数量关联规则的分布式挖掘、约束性关联规则的分布式挖掘与更新、基于关联规则的分类规则分布式挖掘等方面作了较深入的研究。取得的主要研究成果如下:
(1)针对实际应用中存在着大量的全局-局部站点模式的分布式数据库环境,提出了基于全局-局部站点的分布式数据挖掘系统的体系结构DDMINER,由局部站点和全部站点协同完成关联规则的分布式挖掘任务,为分布式数据挖掘提供了新的框架。
(2)提出了利用Hash树生成频繁项目集的有效方法,引入重频繁项目集的概念,提出面向全局-局部站点模式DDMINER的全局频繁项目集挖掘算法,为分布式关联规则挖掘提供了新思路。
(3)提出了面向全局-局部站点模式DDMINER的频繁项目集分布式更新方法,该方法能够实现数据库发生变化(增加或删除)和最小支持度发生变化后全局频繁项目集的高效更新。
(4)提出了一种利用凸包处理技术求解基于可信度最优的数量关联规则挖掘算法以及一种支持度和兴趣度最优的数量关联规则挖掘算法,提出分布式数据库环境下可信度最优的数量关联规则挖掘算法以及支持度和兴趣度最优的数量关联规则挖掘算法。
(5)引入向导集的概念,提出了面向全局-局部模式DDMINER的分布式约束性频繁项目集挖掘算法,包括局部约束性频繁项集挖掘算法CLF和全局约束性频繁项目集挖掘算法CGF。为用户在分布式数据库中挖掘感兴趣的关联规则提供了新方法。
(6)提出了面向全局-局部站点模式DDMINER的约束性频繁项目集的分布式更新算法,为分布式数据库更新情况下快速挖掘约束性关联规则提供了新的途径。
(7)将关联规则分布式挖掘思想应用于分类规则的分布式挖掘,提出了基于FP-tree的分类规则分布式挖掘算法,为分布式环境下分类规则挖掘技术研究作了有意义的探索,是分布式环境下关联规则挖掘算法的有效应用。
(8)研制了分布式数据挖掘原型系统DDMINER,验证了论文提出的各个算法的正确性,测试了有关算法的性能,实验结果表明本文提出的各个算法是有效可行的,且具有较高的效率。