分布式数据库关联规则挖掘与更新研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:askkwr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文就布尔关联规则的分布式挖掘与更新、最优数量关联规则的分布式挖掘、约束性关联规则的分布式挖掘与更新、基于关联规则的分类规则分布式挖掘等方面作了较深入的研究。取得的主要研究成果如下: (1)针对实际应用中存在着大量的全局-局部站点模式的分布式数据库环境,提出了基于全局-局部站点的分布式数据挖掘系统的体系结构DDMINER,由局部站点和全部站点协同完成关联规则的分布式挖掘任务,为分布式数据挖掘提供了新的框架。 (2)提出了利用Hash树生成频繁项目集的有效方法,引入重频繁项目集的概念,提出面向全局-局部站点模式DDMINER的全局频繁项目集挖掘算法,为分布式关联规则挖掘提供了新思路。 (3)提出了面向全局-局部站点模式DDMINER的频繁项目集分布式更新方法,该方法能够实现数据库发生变化(增加或删除)和最小支持度发生变化后全局频繁项目集的高效更新。 (4)提出了一种利用凸包处理技术求解基于可信度最优的数量关联规则挖掘算法以及一种支持度和兴趣度最优的数量关联规则挖掘算法,提出分布式数据库环境下可信度最优的数量关联规则挖掘算法以及支持度和兴趣度最优的数量关联规则挖掘算法。 (5)引入向导集的概念,提出了面向全局-局部模式DDMINER的分布式约束性频繁项目集挖掘算法,包括局部约束性频繁项集挖掘算法CLF和全局约束性频繁项目集挖掘算法CGF。为用户在分布式数据库中挖掘感兴趣的关联规则提供了新方法。 (6)提出了面向全局-局部站点模式DDMINER的约束性频繁项目集的分布式更新算法,为分布式数据库更新情况下快速挖掘约束性关联规则提供了新的途径。 (7)将关联规则分布式挖掘思想应用于分类规则的分布式挖掘,提出了基于FP-tree的分类规则分布式挖掘算法,为分布式环境下分类规则挖掘技术研究作了有意义的探索,是分布式环境下关联规则挖掘算法的有效应用。 (8)研制了分布式数据挖掘原型系统DDMINER,验证了论文提出的各个算法的正确性,测试了有关算法的性能,实验结果表明本文提出的各个算法是有效可行的,且具有较高的效率。
其他文献
本论文研究了移动IPv4中的原理和工作过程,分析了移动节点心使用静态的家乡代理HA,特别是当家乡代理地址是通过手工配置在MN上时,在某些情况下会有一些的缺陷。提出了动态家
随着数字视频摄像、处理技术的广泛运用和无线移动网络的迅猛发展,数字视频已经成为在手机、平板等移动设备间传递信息的重要媒介。近年来,人们对视频质量的要求不断提高,希
随着移动互联网的快速发展,移动平台的安全问题日益严重,尤其是近年来智能手机平台恶意软件的爆发式增长,使得如何保证移动平台数据的隐私性和完整性成为了当前安全研究的重
随着Internet和网络技术的不断发展,一种新的工作方式---计算机支持的协同工作(CSCW)应运而生。与此同时计算机支持的协同设计(CSCD)作为CSCW系统的一个主要应用,受到了越来
分布式应用系统具有网络化和异构性的特点,是网络一体化和并行处理分布化的产物。交易中间件是一种典型的分布式事务处理系统,成为构筑企业信息系统的主流平台,它提供了强大
随着互联网的迅猛发展,越来越丰富的信息呈现在用户面前,但同时伴随的问题是用户越来越难以获得其最需要的信息。如何主动地为满足某一类信息需求的用户提供相应的信息服务,
工作流管理系统是企业对其业务过程进行敏捷管理的新型信息系统,工作流管理系统维护的是以工作流过程定义形式表示的企业的业务过程。随着业务过程管理学的发展和业务过程改
测试用例自动生成是软件测试自动化领域的难题之一,目前仍处于研究探索阶段。作者围绕这一难题展开研究,在分析研究已有测试用例生成算法和实现技术的基础上,提出了面向单元
本文就此问题展开研究,结合下一代网络的特点,研究下一代互联网计费系统的关键问题:数据记录的表示方法和生成方法;计费系统如何在计费方案中使用这些源数据实现SLA和QoS与服务使
电子印章是应用层的数字签名,是电子签章的一种,由于文档签名与其他类型数据如程序,数据库数据等相比有其特殊性,本文针对文档签名的特殊性,如签名的可见与可证实性,文档的归档特性