数据挖掘中关联规则挖掘算法的分析与研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:zhouyi_love
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文首先对关联规则的挖掘的基本理论和方法进行了详细的阐述,并在此基础上,对经典的关联规则的挖掘算法进行了改进,从而提高了关联规则挖掘的性能.该文的工作主要包括以下内容:⑴论述了关联规则有趣性问题可从客观和主观两方面进行评测.利用模板将用户感兴趣的规则和不感兴趣的规则区分开,以此来完成关联规则有趣性的主观评测,对关联规则的有趣性的客观评测增加了约束,并给出模板匹配算法.⑵利用视图机制对原始数据进行预处理,把符合条件的数据和有用的属性放入视图中.根据一维(L<,1>)和二维(L<,2>)中的频繁数据项集对数据库中的属性进行过滤,以达到减少数据属性的目的,从而压缩数据库中的数据,为提高关联规则挖掘算法的性能打下基础.⑶利用Fisher聚类方法对定量属性变量进行分段,在处理时考虑了数据间隔的大小及数据间隔的稠密度,得到的定量关联规则可以近似地反映规则中数据项集的关联性.⑷分析基于关系操作的关联规则挖掘算法RS(Relation Set),算法RS将扫描空间分为若干简单的较小分区,每个分区可以在内存中分别处理.算法RS主要使用简单的交操作,可用数据库系统中的SQL语言表示.同时还给出了在给定概念层上对RS算法的改进算法-挖掘广义关联规则的算法GRS(Generalized Relation Set).实验结果表明,这两个算法具有高效性和可扩展性.
其他文献
互联网和IP技术的高速发展,电话服务的分组化已成为电信网络演进的主流方向,VoIP技术正在经历前所未有的迅速发展。各种VoIP产品大量推向市场,改变着人们的生活方式;同时,VoIP的协
该文首先对智能网的概念及移动智能网中的数据库应用进行了介绍.并以北京邮电大学程控交换与通信网国家重点实验室和东信北邮信息技术有限公司自主开发的CMIN02商用移动智能
随着当今商业活动的开放性和丰富性的增强,特别是我国企业正处在成长期,开发、部署、管理和维护企事业应用系统的客观复杂性正在加大。因此,缩短复杂应用系统的开发周期,降低开发
语音对话是人们相互通讯和交流最方便快捷的手段。但是人们在语音通讯过程中不可避免的会受到来自周围环境、传输介质的干扰,引入了噪音,影响了我们的听辨。在过去,我们一般使用
工作流技术是当前非常活跃的研究领域之一,无论是企业内部应用的集成还是外部B2B集成,工作流技术都是最主要的方法。工作流是业务流程的计算模型,即将相应的业务逻辑和业务规则
粗糙集理论是二十世纪八十年代由Z.Pawlak提出的一种新的处理不精确、不确定知识的软计算工具,而文本挖掘技术是随着互联网的蓬勃发展和电子图书的出现逐渐形成的信息技术领域
网络管理的提出是为了在网络规模不断壮大、网络设备越来越多样化的条件下保证计算机网络安全、稳定的运行。当今世界上有三种网络管理框架,分别为电信管理网TMN(Telecommunic
我们结合北京朝批商贸有限公司的管理信息系统,设计并实现了一个适合国内商业领域的B2B商务平台EDI-CP.在EDI-CP的基础上,又设计面向服务的数据交换平台EDI-MQ, EDI-MQ提供了