数据挖掘中关联规则算法及应用的研究

来源 :安徽理工大学 | 被引量 : 0次 | 上传用户:xcnyy_007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,人们把握数据的能力在不断提升。面对海量数据,人们更加关注的是隐藏在数据背后的重要信息,而非数据本身。数据挖掘满足了我们的需求,它是帮助我们发现数据中重要知识的有利工具。关联规则是数据挖掘的一个重要分支,挖掘出大型事务数据库中的关联规则对不同领域实际问题的解决起着非常重要的作用。本论文主要研究关联规则算法及其应用。首先,论文系统地阐述了数据挖掘和关联规则中的相关理论知识,为研究内容的全面展开打下坚实的理论基础。其次,论文通过指出经典的挖掘频繁项目集算法Apriori算法的性能瓶颈问题,即多次扫描数据库以及可能会产生庞大的候选集,为新算法的研究找到入口。因此,本论文对Apriori算法做了如下改进:首先从数据库布尔矩阵的角度来生成L1和L2,打破了Apriori算法生成Lk的固有模式;然后在证明结论“Lk-1生成Ck的连接步可用Lk-1∞L1来代替Lk-1∞Lk-1”成立的基础上,再来改进k-候选集的集合Ck(k≥3)的生成算法。所以,综合上述工作本论文提出了Apriori算法的改进算法BMSL_Apriori算法(Boolean Matrix Simplified Linked_Apriori算法)。首先通过对BMSL_Apriori算法的理论性分析,我们可以得知该算法不仅能够减少数据库的扫描次数以及一定程度上避免庞大候选集的产生,而且还能够降低算法的时间与空间开销。然后,我们又通过具体的实验进一步证明了BMSL_Apriori算法的效率确实优于Apriori算法和其他算法。最后,在较好的软硬件环境下并借助真实超市交易数据库中的部分数据,论文采用Microsoft SQL Server 2005和VB.NET作为开发平台来构建一个简单的关联规则挖掘系统,将BMSL_Apriori算法应用到关联规则的生成中通过挖掘结果再次证明了该算法较Apriori算法和其他算法确实取得了不错的挖掘效果。
其他文献
随着信息科技的快速发展,当4G、WiFi和WiMax的技术被成功地应用并接入网络,IP网络、移动互联网络终端用户呈指数规模上升,这使得当前网络变得越来越复杂。此外,网络流量呈现出多
测试数据自动化生成技术尝试寻找一个相对小的数据集来满足测试充分性标准,以降低软件测试的成本,提高测试效率。由于程序语言的复杂性以及被测程序的多样性,随机生成方法和静态
近年来经济活动的越趋全球化,使企业对货物调度的时效性和可靠性提出了更高的要求。在电子商务极大的加速了商业活动运作的环境中,滞后缓慢的物流服务已经成为了制约经济发展的
车牌识别系统是计算机视觉、模式识别和图像处理在智能化交通及园区安全领域的重点研究课题之一,在理论和实际应用中都有重要意义。本文认真研究了数学形态学和神经网络的理
人脸检测是人脸识别技术首要一环,快速精确的定位人脸的位置是高质量入脸识别后续流程的前提和基石。本论文在综合分析前人研究之基础上,以实时性为目标,并保证高的检测率和低的
网络编码作为一种新的技术对无线网络的理论与实践研究都有着深远的影响。网络编码改变了传统的“存储-转发”模式,取而代之的是“存储-编码-转发”方式,能够提高网络容量,增
近年来,随着智能终端和移动互联网的迅速发展,移动端的社交应用每天都在不断涌现。微信由腾讯公司于2011年推出,目前微信用户已经突破6.5亿,覆盖国家超过200个,覆盖语言超过2
计算机支持的协同设计是计算机支持的协同工作的一个重要领域,也是国内外计算机应用研究中最为活跃的前沿方向之一。在协同设计中,由于CAD图纸信息的冲突不可避免,又由于产品设
快鸟卫星是美国Digital Globe公司所拥有的商用高分辨率光学卫星,其影像分辨率高达61厘米。这种高分辨率卫星数据已经被广泛应用于国土、规划、测绘、遥感等领域,在交通领域的应用也越来越深入。由于在快鸟卫星影像上能清楚地观测到车辆,因此利用它来辅助交通监控越来越得到人们的关注。为了能从快鸟图像上分类出车辆目标,本文使用了一种纹理分析结合神经网络的方法来对快鸟图像进行分类。首先对快鸟图像进行预处
P2P网络作为一种分布式的网络结构,改变了以往C/S(客户端/服务器)为主的网络结构,成为得到网络用户广泛认可一种结构。然而,P2P高效的文件分发机制在为用户带来便利的同时也