【摘 要】
:
数据挖掘(DM,Data Mining)是一个涉及多学科领域的新兴学科,其中关联规则挖掘是一个重要的研究内容。由于关联规则的挖掘对象大多包含有海量原始数据和大量项目的事务数据库,
论文部分内容阅读
数据挖掘(DM,Data Mining)是一个涉及多学科领域的新兴学科,其中关联规则挖掘是一个重要的研究内容。由于关联规则的挖掘对象大多包含有海量原始数据和大量项目的事务数据库,因此,如何设计一个高效的算法,以提高数据挖掘的效率,成为一个重要课题。本文所做的研究工作主要如下:对传统关联规则挖掘的概念进行了扩展,引入了交易之间基于属性的覆盖关系、频繁项目集和项目集蜕化等概念。在对经典关联规则挖掘算法研究的基础上,提出一种基于属性覆盖的的关联规则挖掘算法—ArBac。该算法只对原数据库进行1次扫描,得到压缩数据库链表,其后的数据挖掘过程都是在其压缩链表中进行,从而提高了算法的时间性能。由于该算法并不产生候选项目集,因而避免了候选项目集组合爆炸的情况,提高了算法的空间性能。最后,为了使得ArBac算法应用到大型交易数据库的关联规则挖掘,本文在ArBac算法的基础上提出了基于属性划分的拼接树模型。
其他文献
地标识别近年来吸引了国内外许多研究者的关注。现有地标识别技术大多以单张图片作为查询图,用基于内容的图像检索技术实现地标识别。然而单张图片视角小,包含信息较少,识别
并行计算机互连网络的拓扑结构一直是国际上的研究热点。人们已提出了多种互连网络拓扑结构,其中超立方体是最流行的互连网络拓扑结构之一而且已被广泛用于商业并行计算机系统
计算网格是分布式计算中的一个重要组成部分。随着个人电脑的普及以及性能的提高,互联网的日益成熟和壮大,使得计算网格的潜力在大型计算中得到越来越重要的发挥。出于经济或
近年来,随着软硬件技术的飞速发展,移动终端——特别是手机具有了访问因特网的能力。作为在因特网中获取信息最重要的工具浏览器,在这类设备上也有了发展。然而,相比于桌面浏
对于大规模实体系统,由于实体的数量巨大,具有有限感知能力并且是不可靠的,因此不可能将针对小规模实体系统的,由可靠实体组成的方法应用到这样的系统中。人类免疫系统就是这样一
现代的搜索引擎系统需要存储海量的数据,并接收大规模用户的高并发检索需求。由于磁盘具有价格便宜、超大容量存储等优势,被很多搜索引擎作为系统的主要存储介质。但磁盘相对
随着市场竞争的加剧,如何保持旧客户,发展新客户,是企业面临的新问题,也是客户关系管理系统(CRM)面临的问题。汽车经销企业要与客户建立和保持一种长期的、良好的伙伴关系,掌
大学生素质拓展计划是关系到祖国发展,社会进步,人民生活水平提高的一项伟大工程。然而目前的大部分高校都没有足够重视,或者高校之间很难开展统一的素质拓展活动。本文在研
本文研究的人力资源管理系统(Human Resource Management System,HRMS)是一个旨在为大型国有企业人力资源管理部门提供完整功能的综合管理系统,通过对人力资源管理的管理理论和业务流程进行研究,设计实现功能全面的HRMS。文中详细描述了系统中表示层、业务逻辑层、数据持久层的业务流程,以国家电网公司HRMS为基础进行了设计、开发与实现。开放式的Web Service技术是分