基于无或言规则集的关联规则挖掘算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:loveandlove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是信息技术自然演化的结果。使用数据挖掘工具进行数据分析可以方便的获得重要的数据模式并应用于决策。数据挖掘本身是面向应用的,关联规则挖掘作为数据挖掘的重要技术广泛应用于各大领域,特别是商业领域。随着数据集的大小和复杂度的增长,研究高效的关联规则挖掘算法,并增强其对不同数据集的适应性显得十分重要。关联规则挖掘算法分两步实现。先挖掘得到频繁项目集集合,然后根据频繁项目集集合得到强关联规则。目前的研究侧重于频繁项目集集合生成。经典的生成频繁项目集集合的算法包括Apriori算法和FP-growth算法。基于这些算法产生了很多变体,不同的变体侧重于不同的改进方向。基于Apriori的改进算法IHPD利用多种改进思想的互补性,进一步提高了关联规则挖掘算法的时间性能,并且使算法的适应性更广。IHPD算法采用了精简集挖掘思想。精简集挖掘基于以下思想:先挖掘出精简频繁项目集集合,即频繁项目集集合的子集,然后构造出其它频繁项目集,并且计算得到支持度,而不需要额外的扫描数据库。IHPD算法将IHP算法在候选项目集集合剪枝方面的特点以及DHP算法在数据库数据剪枝方面的经验应用于精简集挖掘,使得该算法不仅改善了针对长类型频繁项目集挖掘的程序性能,而且对精简集不太擅长的非长类型频繁项目集挖掘,它也能有效的实现。
其他文献
随着Internet/Intranet上电子商务以及企业级Web应用系统应用范围的不断扩展、应用程度的不断深入,如何实现安全身份认证和授权管理,满足企业信息系统用户一次性登录,按照不
通过分析研究CD/VCD/DVD光盘的物理、逻辑格式、文件系统,光盘的ATAPI接口协议,设计了一个基于DOS平台的、用于台湾唯冠集团光驱产线的测试程序,实现了对其基本性能进行快速
随着计算机技术的飞速发展,企业对计算机提供信息的能力要求越来越高.为了解决大量数据堆积与计算机难以从中获取有效信息的矛盾,1992年,W.H Inmon在其里程碑式的《Building
随着网络技术和多媒体技术的飞速发展,图像在人们的日常生活和工作中扮演着越来越重要的角色。图像能给人们以直观而具体的物体形象,是人类认识世界的重要信息来源。如今,图
目前,电子商务自动协商技术已经成为电子商务有效实现中涉及的一个重要问题。但现在尚无一种令人满意的、对现实的商务协商进行有效形式化的模型。 针对这一问题,本文提出了
该论文讨论了嵌入式系统的开发,特别是专用硬件板上的嵌入式驱动程序的开发;同时,给出了嵌入式系统中两个应用:嵌入式的GUI及LAS-CDMA无线通信系统中的小区选择和重选的实现.
当前工程图形考试基本上还是采取传统的笔试形式加上机操作进行,来测试学生掌握知识的情况,因此工程图形的自动识别一直是当前远程教育中工科课程考试的一个亟待解决的问题。工
入侵检测在网络安全领域扮演着越来越重要的角色,作为一种动态的安全技术,它能够全面对主机、网络和应用程序进行监控,识别和响应网络中存在的入侵活动,提供了对内外部攻击和用户
J2EE是Sun公司提出和制定的基于Java技术的分布式组件计算平台规范,基于这个平台可以实现快速开发和部署多层结构的易于移植的应用系统。EJB技术是J2EE的基石,它能让开发者快速
进入21世纪以来,随着电路材料、结构设计、计算机制造工艺等技术的进步,以智能手机为代表的移动设备得到了飞速发展,移动计算技术在工业企业的应用逐步走向实用化阶段。国内