数据挖掘中关联规则算法的研究

被引量 : 0次 | 上传用户:GoAndSeek
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,它成为未来信息技术应用的重要目标之一。经过十几年的努力,数据挖掘产生了许多新的概念和方法。特别是最近几年,一些基本概念和方法趋于清晰,它的研究正向着更深入的方向发展。 数据挖掘利用分类、关联性、序列分析、群集分析、机器自我学习及其他统计方法,从数据库庞大的数据中,找出隐含的、未知的、但却十分有用的信息。它是一个涉及多学科领域的新兴学科,并伴随着这些学科的发展而不断发展。数据挖掘系统可以挖掘出多种类型的模式,而其中描述给定数据集的项之间有趣联系的关联分析模式就是一个非常重要的研究方向。本文主要从事的是数据挖掘中关联规则的研究。 在整个数据挖掘的研究中,算法的研究占有特别重要的地位。一方面,数据挖掘面对的是大量数据集,因此算法的效率将对其应用起关键的作用;另一方面,我们面对的计算机系统在其性能上远远不能满足对大量数据集进行处理的要求。因此,我们必须研究和改进现有的算法,使其有更广泛的应用前景。鉴于此,本文着重对关联规则挖掘算法进行了研究。 本文首先对数据挖掘作了一般性讨论,包括数据挖掘的概念、模式、挖掘的主要问题、系统的分类以及数据挖掘的应用和发展趋势。然后,本文对数据挖掘中重要的关联规则挖掘算法做了深入的研究,分析了关联规则中经典的Apriori算法及其他学者对Apriori算法的改进算法,总结了算法中存在的问题;接着,详细介绍了DHP(Direct Hashing and Pruning)算法及在Apriori算法和DHP算法基础上的快速挖掘算法FARM(Fast Association Rule Mining);最后,在分析FARM算法的特点和性能的基础上提出了改进算法FARM2,并将FARM2算法与Apriori算法、DHP算法以及FARM算西南交通大学硕士研究生学位论文第n页法进行了比较分析,得出了FARMZ算法在效率上优于上述几种算法的结论。
其他文献
目的 通过检测抑癌蛋白p27kipl和周期蛋白E在鲍温病及皮肤鳞癌中的表达,探讨p27kipl和周期蛋白E的表达水平及二者的相互关系在鲍温病及皮肤鳞癌的发病中所起的作用,以期为鲍温
目的:采用现代细胞分子生物学实验技术,初探阿尔泰瑞香提取物抗食管癌Eca-109细胞作用机制,为哈萨克药阿尔泰瑞香的后期研究提供依据。方法:将阿尔泰瑞香三种提取物不同浓度,
目的通过血瘀证的客观化检测指标与骨代谢生化标志物的相关性研究,探求血瘀证与原发性骨质疏松症发病机制之间的联系,为评价骨质疏松症的严重程度寻求依据,为进一步预防和治
炎性痛是病理性疼痛的一种,指在伤害性刺激清除后还持续存在疼痛的病理现象,是临床上疼痛病症中最常见的类型之一。由于本身炎性痛病程的反复迁延,治疗难度比较大,从而严重影
目的分析神经节苷脂在新生儿缺氧缺血性脑病中的具体运用.方法此次研究选取2016年1月1日-2017年11月30日我院收治的48例新生儿缺氧缺血性脑病患儿作为临床研究对象,将所有患
为使双色红外/毫米波复合导引头满足弹载要求,运用较优的扫描方式,提出了几种型式的光机系统。在光机设计方面,完成了偏轴偏斜非球面光学系统设计程序,提出了结构设计的关键。
文章总结了金融隐私权保护的历史沿革以及美国、欧盟等域外金融隐私权的保护经验,阐述了大数据背景下金融消费者隐私权保护的原则是强化金融消费者自我保护意识、建立完善的
由于翻译界的研究重心一直都比较偏重于文学翻译,故此,科技翻译迄今尚未得到足够的重视,相关研究由于理论匮乏,也缺乏理论圆融度和较高的系统性。有鉴于此,本项研究即重点探讨科技
塑料薄膜闪烁体在辐射作用下发射荧光的空间分布对于设计和优化闪烁探测器结构,提高测量的信噪比具有重要意义。利用平均能量为1.25MeV的^60Coγ射线源辐照0.5mm厚的BC418薄膜闪
为了修复石油污染土壤和资源化利用城市绿化树木枯落叶,采集陕北典型石油污染土壤,施入19种常见城市绿化树木枯落叶粉碎样进行为期120 d的室内混合分解培养试验,检测不同枯落