基于聚类和压缩矩阵的Apriori算法的研究与应用

来源 :苏州大学 | 被引量 : 0次 | 上传用户:yanghao_711
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从20世纪80年代后期数据挖掘理论出现以来,数据挖掘技术有了突飞猛进的发展。随着数据量大量增加,数据挖掘技术变得越来越重要,从而引起了众多研究人员的兴趣,数据挖掘迅速扩展到各个领域。数据挖掘作为一种用于从大规模数据集中提取潜在有用的信息和知识的技术,得到越来越广泛的研究和应用。关联规则挖掘是一种重要的数据挖掘技术,其主要研究目的就是从大型数据集中发现隐藏的、有趣的、属性间的规律,即关联规则。针对关联规则经典算法Apriori算法的缺点已有许多学者做出改进,本文在已有改进算法的基础上,设计了一种基于聚类和压缩矩阵(Cluster&Compression Matrix)的Apriori改进算法- CCM_Apriori算法。论文的主要内容如下:(1)对数据仓库和数据挖掘技术进行阐述和归纳,重点介绍了聚类分析和关联规则的基本概念、思想及代表算法,并分析了算法的优缺点。(2)运用聚类分析和布尔向量的关系运算思想,设计了一种基于聚类和压缩矩阵的Apriori改进算法- CCM_Apriori算法。该算法通过聚类和对相同事务的计数来压缩矩阵以减小数据库规模,并且只需扫描一次数据库,无需产生候选项集直接生成频繁项集,较大地提高了算法的效率。(3)在原有的高校教务管理系统中,运用数据仓库和CCM_Apriori算法,根据学生成绩和历史选课记录预测学生选修的课程和人数,实现了选修课决策支持系统,为学院选修课的开设提供决策支持。
其他文献
在Internet高速发展的今天,网页数量急剧的增长,给信息采集的硬件带来极大的压力,与此同时,搜索引擎中网络爬虫的“密集”抓取活动会阻碍普通用户通过浏览器的正常访问。网络
宽视域(FOV,Wide field-of-view)在许多的工业生产中发挥着重要的作用,比如空中交通管制、大型车辆的驾驶与导航中都离不开FOV。在这篇论文中介绍了一种实时的沉浸感显示系统,能
射频识别(RFID)作为一种高效的数据采集和自动识别技术,在制造、物流、医疗、运输、零售等领域具有广泛的应用前景。但随着RFID技术的快速发展和其应用规模的逐渐扩大,RFID系
医学图像融合是对多幅不同模态的医学图像进行信息综合,合成一幅包含所有源图像重要信息的融合图像的过程。该技术充分利用不同模态医学图像提供病灶信息的冗余性和互补性,以获
随着现代工业和交通运输业的飞速发展,噪声问题日益引起了人们的极大关注。基于自适应控制理论的噪声主动控制技术已经成为噪声控制领域的重要研究内容之一,并取得了丰硕的成果。在自适应噪声主动控制控制系统中,控制算法是直接影响自适应控制性能的重要因素。目前,在自适应噪声主动领域,使用最为广泛的是基于线性自适应滤波器的滤波-XLMS算法,而滤波-XLMS算法存在需要较高阶次的自适应滤器和不能有效的控制非线性噪
H.264是一种高度压缩的数字视频编解码标准,2002年由ITU-T视频编码专家组和ISO/IEC动态图像专家组组成的联合视频组(JVT, Joint Video Team)提出,其特点是具有更好的编码效率
计算机技术、网络技术、Internet技术的进步,带来了数据挖掘技术的迅速发展。该技术主要是以从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜
现代计算机技术的高速发展,使得在科学研究和社会生活的各个领域中积累了大量的数据,为将这些数据转换成有用的信息和知识,数据挖掘技术应运而生并得以迅速发展。但是存在一
网络系统日趋大型化、连续化、高速化和自动化,功能越来越多、结构也越来越复杂,其故障诊断与预测技术涉及到相互关联、相互制约的多个层次和众多因素,其中有很多因素对于系
随着经济全球化的发展,互联网为中小型企业的发展带来更广阔的市场前景。针对目前网购市场中的大量女性客户,本文设计并实现基于化妆品销售的中小型B2C商城系统,提供给客户一