数据挖掘中关联规则算法的研究及应用

被引量 : 0次 | 上传用户:wang525659571
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,其主要目标是从大型的数据库中挖掘出对用户有价值的信息。其中关联规则挖掘是数据挖掘的一个重要研究分支,主要用于发现数据集中项之间的相关联系。由于关联规则形式简洁、易于解释和理解并可以有效地捕捉数据间的重要关系,因此从大型数据库中挖掘关联规则问题已成为数据挖掘中最成熟、最重要、最活跃的研究内容。本文对数据挖掘技术,尤其是关联规则数据挖掘技术进行了全面地分析和研究,在先前研究的基础上,提出解决相应问题的关联规则挖掘算法。论文的主要内容包括以下四个方面:第一、数据挖掘技术、关联规则挖掘技术的分析与研究。文中详细地介绍了数据挖掘基本概念,并对数据挖掘的过程、数据挖掘的应用领域以及数据挖掘的常用技术进行分类、归纳和总结,并且对数据挖掘技术的国内外研究现状进行分析;文中还对关联规则的定义、性质、基本步骤做了系统地阐述,分析研究关联规则挖掘的经典挖掘算法Apriori以及基于Apriori算法的的改进方法,另外,对不产生候选挖掘频繁项集的FP-growth算法的过程、思想进行了详细地描述。第二、深入研究了关联规则中最大频繁项目集,提出一种基于FP-tree结构的最大频繁模式挖掘算法DMFIA-D。通过实例说明该DMFIA-D算法执行过程,并通过试验证明该算法与DMFIA算法相比更具有优越性,试验还验证了算法的可扩展性。DMFIA-D算法对FP-tree结构进行了改进,充分利用FP-tree结构特征,并运用双向搜索策略,自顶向下选取最大频繁候选项集,自底向上对候选项集进行计数、剪枝最终确定最大频繁项目集。由于减少了最大频繁候选集,并对候选集进行有效剪枝,从而缩短了算法的挖掘时间,提高效率。第三、文中研究了增量更新算法FUP,提出一种基于临时表的改进算法MFUP。实例说明了MFUP算法的执行过程,实验验证了MFUP算法的优越性。通过对FUP算法进行分析,指出它的优缺点,针对FUP算法的不足,提出改进算法MFUP。该算法通过建立临时表,来存放增量数据库的频繁项集,充分利用原数据库挖掘的结果,尽早的删除了更新数据库的非频繁项目集,从而大大减少了对数据的重复扫描,提高了数据挖掘算法的效率。第四、研究探讨了算法DMFIA-D在超市系统分析中会员消费情况的应用尝试。为超市系统针对会员消费情况制定销售策略、促销活动等提供辅助决策信息。
其他文献
新编《陈隋》是刘德海先生根据曹安和《汉宫秋月》演奏谱加工整理而成的一首现代琵琶文曲。刘先生在保留原曲风格意境的基础上进行了技术、结构创新,因此,这首作品堪称刘先生
80年代末以来,随着金融的全球化趋势及金融市场的波动性加剧,各国银行和投资者受到了以前从未有过的信用风险的挑战。世界银行对全球银行业危机的研究表明,导致银行破产的主
二十世纪以来人类的历史进程从蒙昧迈向文明,先后经历了工业文明时代及后工业文明时代,社会的进步推动了各种新思潮的兴起。现代艺术作为文化变迁的急先锋也呈现出逐步简化的
组织公平(Organizational Justice)理论多年来一直是研究者们关注的焦点。国内外研究者在经过多年的探讨研究后,已经在组织公平的内涵和维度理论方面取得了大量研究成果,对其
结构与行动二元对立是社会学理论发展过程中不可避免而又难以解决的难题。当代社会学理论家吉登斯与布迪厄都对这种主客二元对立进行了反思,各自提出了既有区别又有联系的结
近些年来,我国城市土地使用制度的改革进一步深入,地价机制对我国城市土地资源合理配置,空间结构的优化布局和土地的节约集约利用具有越来越重大的作用。伴随着城市土地价值
在国内外,大斜度井和水平井技术被广泛应用于不同类型油气藏的勘探开发中,水平井测井技术(尤其是随钻测井技术)也日趋完善。随着大庆油田勘探开发的不断深入,大斜度井和水平
论述了软环境对港口发展的作用,分析了影响港口软环境的主要因素,提出了改善港口软环境的措施.
节能型能源管理系统通过采集现场监测装置、多功能表的数据,监测、分析地铁各种用能设备的能耗使用情况,通过节能控制系统实现对空调和冷冻水系统的节能控制。
甜玉米正在中国迅速发展,把我国的优良自交系、综合种转育成具有sh2、sul和se基因的自交系、综种,自交系再组配成杂交种,如扬甜1号(sh2综合种)、蜜玉4号(sh2杂交种)、苏甜8号