关联规则并行算法在医药销售系统中的应用

来源 :重庆大学 | 被引量 : 0次 | 上传用户:yp888yp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是帮助人们在海量数据中发现信息和知识的工具。近年来数据挖掘技术成了商业智能的核心技术,被广泛应用到了诸多领域,引起了学术界极大的关注,如何提高数据挖掘的效率成为学术界热门的研究课题。本文主要针对关联规则发现,在商业销售行为领域方面的应用研究。Apriori(先验的)算法是一种最有影响的挖掘布尔关联规则频繁项集的算法,但是Apriori算法也有其明显的缺陷,即需要多次重复扫描交易数据库、效率不高等。作者对现有的关联规则算法进行了分析,在经典的Apriori算法基础上,提出了并行Bi-Apriori算法,该过程使用一种特殊的数据结构,对于每个项集,记录包含项集中项的事务的TID,使得找出所有频繁k项集只需两次数据库扫描。实验证明这种新的并行算法能大大提高收敛速度,得到优于一般并行算法的加速比。此并行算法实现简单有效,能更好地应用于现实问题。本文选用通过商用网络连接起来的PC机,以及并行虚拟机PVM和Windows 2000 Server操作系统,共同构成了一个机群系统作为并行计算平台。在并行程序的模型上选用了Master/Slave模型。算法并行化方式采用了将训练数据平均分配到各节点机的数据并行方式。最后,本文从实用性的角度介绍了关联规则挖掘在商业分析领域方面的应用。并且详细的讨论了不同结点机数时,挖掘结果的纵向对比,验证了算法的正确性和准确性等。最后对挖掘结果的关联规则进行了商业分析,取得了令人满意的效果。证明了此算法在该医药公司销售数据集中具有局部实用性。
其他文献
分布式虚拟现实(Distributed Virtual Reality,简称DVR),就是大规模的、网络化的、基于计算机的虚拟系统。在DVR环境下,许多分布在各地的人和计算机控制的实体能够进行交互作用
随着千兆网络的建设和升级,传统防火墙在硬件和结构上不能满足性能的要求,本课题采用INTEL IXA架构开发的新一代防火墙,不仅能够更好地保护防火墙内部网络的安全,而且也保证
学位
Femto是一种工作在授权频段、发射功率低、小范围覆盖、以固定宽带接入网络为回程的微蜂窝式基站设备。Femto技术的提出为解决蜂窝移动通信系统中室内覆盖效果不佳和容量低的
由于超强的计算能力,支持大规模数据级并行程序设计以及高速的访存带宽等特点,GPU集群已经成为现代高性能计算的主流技术和研究热点。但GPU给集群带来了复杂的体系结构特征,
随着高性能微机和高速计算机网络的发展,分布式应用系统得到广泛的使用.但由于存在多种硬件平台和多种操作系统,因此要开发一个能运行于多种异种平台,具有良好移植性和可靠性
随着科学管理方法的应用和推广,数据分析技术在企业质量管理中的作用得到了前所未有的发挥,ISO9000标准更是将它提到了基础地位加以强调.数据挖掘则是一种新兴的数据分析技术
现代密码学根据密钥体制的不同分为了非对称密码体制和对称密码体制,其中对称密码体制又可以分为分组密码和流密码,两种密码体制都在实际应用中扮演着重要的角色。本文讨论流
随着Internet和电子商务的蓬勃发展,商业活动范围不断扩大,企业与其分支机构实现互联的要求越来越迫切,有时甚至允许合作伙伴、设备供应商等外部机构访问自己的部分局域网资源。
传统教务管理耗时和耗费,教务管理部门操作起来很烦琐,开发一种基于分布、网络计算的智能教务管理平台迫在眉睫。本次硕士论文设计的重点是在研究多种信息挖掘技术方法的基础上
当前webGIS面临着两个问题:第一,如何将不同数据源、不同格式的地理数据融合在一起;第二,如何实现各种不同的WebGIS间的互操作,从而实现各种不同的WebGIS系统的无缝结合。 将We