关联规则基本技术研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:liuwenting02
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是指从大型数据库中发现潜在的、新颖的、有价值的、可用的及能被用户理解的模式和信息的过程。关联规则挖掘是数据挖掘的一个重要研究领域,主要是发现数据库中属性之间的关联关系。 本文在广泛查阅国内外文献的基础上,针对关联规则算法的若干问题进行了深入地分析研究,论文的主要研究内容和成果如下: 首先,提出了基于排序FP-Tree(SortedFP-Tree,简称SFP-Tree)的最大频繁项目集挖掘算法SFP-Miner。在SFP-Miner算法中,通过两次扫描数据库将其中每个事务所包含的频繁项目压缩存储在SFP-Tree中。在挖掘过程中,充分利用SFP-Tree的特点,并采用合并子树和预剪枝策略在SFP-Tree上进行深度优先挖掘,而不需要扫描数据库,减少了算法在挖掘过程中使用的存储空间和计算时间。实验结果表明,该算法有较好的性能。 其次,提出了基于完全合并SFP-Tree的最大频繁项目集更新挖掘算法UAMFI。该算法基于完全合并SFP-Tree,直接在树上进行深度优先搜索,能够快速地进行最大频繁项目集的更新挖掘。实验测试和结果分析,该算法可以高效的更新最大频繁项目集。 最后,针对多值属性关联规则挖掘问题,提出了基于高维聚类的多值属性关联规则挖掘算法DBSMiner。该算法借鉴ARCS思想,先将高维数据集的各维进行划分,然后将密度单元进行排序,并提出一种基于网格的高维聚类算法对划分后的数据进行聚类挖掘。理论分析和试验结果表明,DBSMiner算法具有较好的执行效率和精确度,能有效的进行多值属性关联规则的挖掘。
其他文献
随着软件开发技术和开发工具的不断进步,管理信息系统开发模型在沿着主机/终端模型到C/S模型再到B/S模型这条道路上前进,相应地系统应用体系结构也由单层结构发展到二层结构再到三
文字识别是模式识别的一个重要应用方向。目前,阿拉伯文字及以阿拉伯字母为基础的维吾尔文字识别技术研究相对滞后。发展维吾尔文字识别技术对研究我国西部地区少数民族历史
Ad Hoc自组织网络,简称Ad Hoc,是由一些具有无线网络接口的移动主机构成的临时性、多跳和自治的,没有网络基础设施,没有中心节点,网络中的节点处于移动状态和网络拓扑结构随意变化
随着计算机技术的发展,Internet在过去十几年中迅速发展,其网络规模的迅速膨胀和用户数量的急剧增长不仅对网络设备提出了更高的要求,也对网络拥塞问题的研究提出了新的挑战
学位
人脸识别是当前模式识别领域的一个研究热点,常用的方法有很多,一般说来包括定位和分类两个部分。准确的定位是正确分类的前提,而分类的成功率又反映了定位质量的好坏,这两个
目前,电动助力自行车日益受到市场的欢迎,人们在追求出行方便的同时,也特别关注健康、环保等方面的问题。智能电动自行车相比于传统的电动自行车最明显的区别就是其具有智能
支持向量机是在统计学习理论基础上发展起来的一种新的机器学习方法,具有理论完备、适应性强、全局优化、训练时间短、泛化性能好等优点,自提出以来,一直受到人们的关注,已经
在计算机动画技术中,本文在基于元球的三维物体变形和使用模糊C均值聚类算法处理误差数据的两个方面做了改进工作。   元球(metaball)造型是一种隐式曲面造型技术。通过改
遥感影像分类是遥感研究领域的一个重要内容。对于怎样解决多类别图像的分类,并且满足一定的精度要求,是遥感应用研究中的一个关键问题,特别是在地质调查、矿产勘查方面具有十分重要的现实意义。神经网络技术是遥感影像分类处理的一个重要手段。BP神经网络具有较强的学习能力,在分类识别方面具有广泛的运用。但是,BP神经网络学习收敛速度缓慢、训练过程易陷入局部极小值,所以论文采用自适应的学习速率和附加动量法改进BP