基于FP树的关联规则算法改进研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:lgwfzc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从海量数据中发现蕴含其中的有用信息和知识的过程,应用广泛。关联规则分析作为数据挖掘的主要功能之一得到了广泛应用,对关联规则算法的深入研究具有很高的理论价值和现实意义。本文首先阐述了数据挖掘的相关知识,对关联规则经典算法Apriori算法和FP-growth算法作出详细介绍,分析并指出了这些经典算法存在的问题与不足。虽然基于FP-Tree的经典FP-growth算法不需要像Apriori算法一样产生大量的候选频繁项集,但必须进行大量的遍历和递归操作,严重影响了挖掘的整体效率。针对FP-growth算法在构建FP-Tree和挖掘频繁项集两方面存在的缺陷,本文提出了DFP-Tree构造和FP-数组技术来提高算法的效率,结合两种技术提出DFPmine算法,并通过实验证明了算法的效率。实验结果表明,DFPmine算法比FP-growth算法来的更有效率,尤其是在数据集比较大且比较稀疏,关联聚集度较低,FP-Tree分支较多的情况下,本算法效果明显,比经典FP-growth算法能获得更好的性能。
其他文献
近年来,各种存储媒介中产生的海量图像在极大的丰富人们视觉生活的同时,也为图像的管理带来了许多的不便。由于大部分的图像是通过数码产品拍摄,通常只是具有简单的数字序列名称
随着人们对现实环境的深入探索,发现在某些特定的网络环境或应用场景下,由于地理位置或基础设施建设等因素的限制,无法保证稳定全连通的网络状态,导致传统网路通信手段难以为
到目前为止IETF已公布的网络协议有5000多种,面对增长速度逐渐加快的网络协议数量,健壮性测试的难度日益加大;对于每个具体协议的测试同样困难,为了达到完全测试,其要求的测试
火灾环境中的应急疏散问题一直以来都是国内外公共安全领域研究的热点,该问题自从被提出后,国内外学者取得了一定的研究进展和成果。在初期阶段,研究者们相继提出的例如社会
信息资源是社会发展的重要战略资源,随着国民经济以及社会信息化的全面加速发展,信息化正在深入到我国政治、军事、经济、社会、企业、生活各个领域,涌现出了大量的数字化业
结构光三维重建技术属于一种非接触主动测量技术,具有低成本、高精度、大视场、实时性好和抗干扰能力强等特点,在工业自动化测量、机器人导航、大规模复杂三维场景重建、医学
随着计算机技术和电子商务系统的不断发展,灵活的界面设计技术在网站建设中应用得越来越广泛。传统的基于JSP的电子商务系统存在页面显示和业务逻辑强耦合的情况,造成系统开
盲源分离又称为盲分离,是在不需要太多的源信号和信道先验信息的情况下,仅根据观测到的混合输出信号,分离出各输入源信号的过程,是信号处理领域的一个前沿问题,广泛应用于图
为满足用户移动通信需求,第三代合作伙伴计划3GPP(Third GenerationPartnership Project)组织提出了长期演进计划LTE(Long Term Evolution),以实现3G到4G的演进。本文围绕LTE系统性
近二十年间,随着计算机相关技术尤其是图形学技术的发展,计算机图形学产生了巨大的变革,三维图形学在各领域的应用也日趋广泛。与此同时计算机图形硬件也遵从着摩尔定律飞速发展