关联规则挖掘相关算法研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:lwy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是近年来数据库和人工智能等领域研究的热点课题,它引起了科学界和产业界的广泛关注。在数据挖掘技术发展繁荣的大背景下,关联规则技术得到了蓬勃发展,并正朝更为广泛而深入的方向继续发展。 关联规则挖掘作为数据挖掘领域的一个重要研究分支,它的任务是发现所有满足支持度阈值和置信度阈值的强关联规则。近年来,关联规则挖掘研究已经成为数据挖掘中的一个热点,并被广泛应用于市场营销、事务分析等应用领域。关联规则挖掘算法是关联规则挖掘研究的主要内容,迄今为止已提出了许多高效的关联规则挖掘算法。 本文对关联规则挖掘进行了系统的分析与研究,并在已有研究的基础上提出了两个改进算法。论文的主要工作如下: (1)对关联规则挖掘的基本理论进行了总体研究,包括关联规则挖掘的基本概念、分类、挖掘过程、改善关联规则挖掘质量的主要策略等,并在此基础上分析了关联规则的扩充问题,从而指出关联规则挖掘的研究方向。 (2)对关联规则经典算法Aoriori作了全面的分析,指出了挖掘中的关键步骤并提出算法的不足,并分析总结了二进制算法和矩阵算法的相关研究,提出了一种基于频繁项集矩阵的关联规则挖掘算法。该算法不需要生成频繁候选项集,并且只需要扫描事务数据库一次,采用频繁项集矩阵存储事务数据并对其约简,占用的存储空间也少得多。理论分析和测试实验证明了新算法在性能上的优越性。 (3)研究并分析了频繁模式增长算法FP-growth,结合用户访问模式的特点,提出了一种新的用户访问模式挖掘算法AP-mining。该算法将Web用户的会话集映射为一棵访问模式树,然后在访问模式树上挖掘频繁访问模式并生成模式数组,最后在模式数组中找到所有的频繁访问模式。利用挖掘出来的模式知识,可以更好地对Web站点进行设计与维护。
其他文献
本体作为一种能在语义和知识层次上描述知识系统的概念模型和建模工具,自被提出就引起了国内外众多科研人员的关注,并在计算机的许多领域得到了广泛应用。但是本体的构建研究
在织物染色配色问题研究中,由于染料本质的问题,本文中提出两种不同的解决问题的思想,并且建立了两种模型。第一种方法采用数学建模方法,主要针对三种染料与三刺激值之间关系
模型驱动架构(MDA)是对象管理组织(OMG)提出的一种新的软件开发框架。与传统软件开发不同,MDA以模型为中心,使用模型来指导系统的设计、开发和维护。它将模型和实现技术分离,
FPGA技术已经取得了巨大进步,FPGA芯片在容量和速度上都达到了较高的水平,现在已经有许多学者研究如何使用FPGA完成对应用程序的加速。Deflate算法是无专利保护的可以自由使用
深度学习是人工神经网络的新技术进展。深度学习在若干领域已经突破历史记录,提高准确率和缩短收敛时间依旧是神经网络追求的目标。人脸识别作为深度学习的一个成熟的应用领
传统的嵌入式语音识别系统存在结构复杂、硬件要求高、灵活性和鲁棒性差以及词库更新难等不足。本文从网络应用的角度研究了基于HMM的分布式汉语语音识别系统的相关技术,包括
大气自然偏振特性蕴含罗盘方位信息,利用自然偏振特性的仿生偏振光导航是一种新型自主导航方法,是弱/无卫星环境下导航研究的一个重要尝试。因此,仿生偏振光导航及由其构成的
数据挖掘中的聚类分析一直是近年来应用极为广泛的技术之一。所谓聚类,是物理或抽象对象的集合分成由类似的对象组成的多个类的过程。而随着信息技术的发展,数据的形式也逐渐
随着微传感器技术、射频技术、无线通信技术日新月异的发展,信息产业进入了以物联网、无线传感器网络为代表的第三次浪潮,人类社会将进入人与人、人与物、物与物沟通的新时代