关联规则维护算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:kim_xt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘作为数据挖掘的一个重要的研究方向,有着极其重要的应用价值。频繁项目集的发现是关联规则数据挖掘的核心问题。数据库的动态变化,使得关联规则与频集的更新维护成为重要的研究内容。 本文在对关联规则挖掘中的一些经典算法进行分析和总结的基础上,提出了新的解决相应问题的关联规则挖掘算法。 (1) 提出基于项目增长法求解频繁项集的算法,只需一次扫描数据库,即可得到所有频繁项集,增强了产生候选项的针对性和有效性,提高了候选项的支持事务计数的效率;在求解最大频繁项集时,由于求解过程中无需用到大量的中间结果,节省了内存空间,提高了挖掘效率和性能。 (2) 利用已有挖掘结果,对新增数据集只扫描一次,即可得到事务更新后的数据集的频繁项集,提高了挖掘效率。 (3) 提出一种在数据集规模减小而支持度和置信度不变的情况下,负增量关联规则维护算法。 (4) 提出一种快速聚焦关联规则维护算法。在需要反复调整最小支持度的情况下,充分利用以往挖掘过程中的信息,避免多次扫描数据集。 (5) 基于上述研究,给出了一个实现关联规则维护的原型系统,实现了基于项目增长求解最大频繁项集算法,实现了正增量式维护算法,实现了负增量更新算法,实现了最小支持度频繁调整时的快速聚焦算法。实验表明了算法的有效性和可行性。
其他文献
报表系统是数据库应用系统中最基本、最重要的子系统。采用手工方式开发嵌入式报表系统存在开发任务繁重、产品生命周期短等缺陷。因此,研究报表自动生成具有重要意义,其目的在
完全的句法分析是当前自然语言处理的一个重点和难点。现阶段被认为无法彻底解决。进行部分句法分析,即组块分析,既可以达到自然语言句子进行句法分析的目的,又可以降低分析
中间件技术和操作系统技术,数据库技术并列为三大系统级软件技术之一,IBM、BEA、Oracle等国外著名厂商围绕J2EE应用服务器的中间件技术竞争也激烈地展开。但是J2EE技术在解决
光电经纬仪的通信系统中,视频信号的传输数据量是最大的。一直以来视频信号的传输都是通过并行电缆进行传输,一方面系统的安装和维护十分复杂;另一方面,又容易受到其他系统的
电子政务是随着计算机技术和网络技术的快速发展而建立起来的。电子政务的目的是利用现代的信息技术实现政府办公网络化、自动化、无纸化,打破政府各部门之间的隔阂,提高政府
三维重建是一个跨学科的热点研究领域,其目的是利用已知数据恢复物体的三维立体信息,并在计算机中进行显示。在文化遗产数字化保护领域,利用三维重建技术,可以更好的重现文物
计算机取证是打击计算机犯罪的有力工具及手段。传统的计算机取证大多采用事后分析的静态取证技术,该取证技术存在的问题是,证据的采集不够及时、全面,经恢复的数据可能是已经被
网格发展的目标是一个以共享资源为目的的基础设施。这里的资源是广义的,可以是计算资源、存储资源、信息资源、通信线路、程序和科学仪器,即一切能够通过通信网络连接起来的资
“3S”技术是GIS、GPS和RS技术的总称。作为目前对地观测系统中空间信息获取、存贮、管理、更新、分析和应用的3大支撑技术,它们是现代社会持续发展、资源合理规划利用、城乡规划与管理、自然灾害动态监测与防治等的重要技术手段,三者在空间信息管理上各具特色,均可独立完成自身具有的功能,同时相互之间又有许多关联,在解决问题的功能上各有优点与不足。三者的结合与集成已成为空间科学的发展方向和必然趋势。本文基
随着Internet的迅速发展,网站和静态HTML页面也急剧膨胀。随着Web应用的日益广泛,它的局限性越来越明显,已经不再适应下一代更复杂的Web应用。因此,在未来的Web发展中,如何提高信