关联规则挖掘算法的研究与应用

来源 :苏州大学 | 被引量 : 0次 | 上传用户:hardstar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机应用技术的迅速普及,各个领域的业务数据量以前所未有的速度快速增长,数以TB的数据积累存储在各自系统的数据库中,使得提取其中的信息变得越来越困难。数据挖掘技术自20世纪80年代后期诞生以来,日益成熟,越来越广泛地应用于工程技术、医疗、保险和商业管理等领域。数据挖掘给人们提供了一种新的认识数据理解数据的手段。而关联规则则是数据挖掘的一个重要研究方向。在教育领域,每年每学期均要产生大量的学生成绩数据,在这个超大规模的成绩数据后面,蕴含着极其丰富的可能被挖掘的隐含信息。挖掘并分析这些隐含信息,对指导我们的教学有较大帮助。   关联规则挖掘发现大量数据中项集之间有趣的关联或者相关联系,作为经典的关联规则算法,Apriori算法执行广度优先搜索策略,采用剪枝策略,减少了用于计数的候选项集的数量;而Eclat算法执行深度优先搜索策略,由于缺乏用于剪枝操作的必要的项集信息,所以无法对候选项集进行剪枝,因此计数的候选项集的数量要多于Apriori算法,基于此,本文在针对关联规则算法中挖掘频繁项集的效率低下问题,在Eclat算法的基础上,提出一种改进的Eclat算法,改进的Eclat算法是一种在垂直数据表示方式上执行广度优先搜索和交叉计数的新算法,新算法充分利用了垂直数据表示和交叉计数的高效优势,以及改进的Apriori算法的剪枝策略,减少了计数的候选项集的数量,减少了由k-1级频繁项集生成七级候选项目集的连接次数。实验结果表明,改进的Eclat算法的运行速度较优于Eclat算法。   本文的研究工作是结合教学中的教学规律研究开展的,着重研究如何应用数据挖掘技术中的关联规则挖掘方法对教育教学数据进行分析,挖掘教育教学数据中蕴含的各种教育教学规律。本文采用改进的Eclat算法,用VC++实现了基于关联规则的挖掘模块,并且利用本系统对CET成绩数据进行了规则挖掘,取得了良好的效果。
其他文献
随着中国城市化的发展和土木工程技术的进步,城市中各种民用工程建设发展很快。而对这些桥梁、大坝、隧道等建筑物以及电力电缆等方面的健康状态的监测,根据关键部件的特征信
生物模型可以模拟系统行为,预测系统未知的行为和特性,从而测试生物学家提出的假设,进行一些实验条件无法达到或非常耗时耗力的模拟实验,它们与生物实验相辅相承,使得生物系统的研
IEEE 802.11 DCF协议以其简易性与健壮性成为目前主流的无线Ad hoc 网络的MAC协议,其基本思想是载波侦听与冲突避免。同时,DCF协议也提供了两种数据包传输机制:二次握手机制(又被
P2P网络具有良好的开放性与扩展性,同样也具有极大的动态性和差异性。正是这样的特性,使得将P2P技术引入VoIP这类对网络环境要求较高的应用带来系统整体性能提升的同时,用户
科学技术推动世界的发展,科技的力量正影响着我们生活、学习和工作。矿产资源管理信息化作为矿产资源管理工作与现代信息技术的结合点,对促进高效管理、科学决策、依法行政,进
基于特征造型技术的三维CAD系统目前已广泛应用于产品设计。随着三维建模技术的发展,CAD系统中包含越来越多的几何特征。含有丰富特征的CAD模型被广泛应用于产品发展的各个阶
cDNA微阵列和寡核苷酸芯片等高通量检测技术的成熟应用,产生了大量的基因表达数据,其中包括静态数据和时序数据。基因表达时序数据反映了生物基因在时间进程上的特性,对其进
随着并行与分布式系统的发展,并行计算机中处理器数量大量增加,处理器之间的互连网络的性质显得越来越重要。同时,在具有大量处理器的系统中,处理器发生故障的情形变得不可避
从数据挖掘的角度上看,分类问题就是要建立相应的分类模型或者分类规则,使用构建好的分类模型将未知分类的样本映射到某一个类中。贝叶斯分类法以其坚实的理论基础和良好的分类
多处理器系统是并行计算系统的一种实现方式,具有良好的可扩展性、高可靠性和高性价比等优点,因而得到了广泛的应用。但是多处理器系统的处理单元独立性强,并且系统结构松散,