【摘 要】
:
随着信息技术和数据库技术的广泛应用,数据的存储规模越来越大,而数据挖掘(KDD)作为一种可以从海量数据中自动、高效地提取有价值的信息和知识,以有效地支持决策的新技术,引
论文部分内容阅读
随着信息技术和数据库技术的广泛应用,数据的存储规模越来越大,而数据挖掘(KDD)作为一种可以从海量数据中自动、高效地提取有价值的信息和知识,以有效地支持决策的新技术,引起了学术界的极大关注,并被应用到在商业、金融、农业等多个领域,取得了较好的效果。关联规则挖掘是数据挖掘研究的一个重要分支,关联规则是数据挖掘的众多知识类型中最为典型的一种·。由于关联规则形式简洁、易于解释和理解并可以有效地捕捉数据问的重要关系,因此从大型数据库中挖掘关联规则问题已成为数据挖掘中最成熟、最重要、最活跃的研究内容。关联规则挖掘算法当中最为典型的是由Agrawal于1993年提出的Apriori算法,以后研究人员针对Apriori算法的不足,做了大量的研究工作。随着计算机技术的发展,研究的深入,如何在分布式系统上实现Apriori算法进行关联规则挖掘成为研究的热点问题。本文首先介绍了数据挖掘和关联规则挖掘的基本理论和方法,其次对基于Apriori算法的分布式算法CD算法(Count Distribution)进行了研究,通过对CD算法的改进,得到一种新的算法,并把改进后的算法应用ICMLC2005会议数据库当中,得到了较好的结论。
其他文献
随着人工神经网络技术的发展,其用途日益广泛,应用领域也在不断拓展,已在工程技术、科学计算等领域得到了广泛地应用。而在科学计算与工程技术应用领域,许多问题最终归结到非线性
本文基于地图符号自动识别,从四个方面进行了研究和探讨:(1)在对点状地图符号特点分析和对现有常用识别方法研究。(2)设计了点状符号的神经网络识别流程。采用三层BP网络模型,通
本文主要研究了空间索引结构和算法在配电GIS中的应用,提出了对固定网格索引的改进,分析比较了各索引结构性能的优缺点,最后根据研究的结构和改进的算法给出了配电GIS系统的
随着网络和多媒体技术的迅速发展,特别是3G技术的即将普及,多媒体信息特别是视频图像信息越来越丰富,而且在我们的生活中的地位也越来越重要。数据量庞大是视频信息的一大优点,也
知识时代的来临促使当今社会的信息量以前所未有的速度增加,对决策者而言,他们面临的环境更加变幻莫测,因而更迫切需要高效的决策支持工具。由于现代体育系统的高度开放性,这
当今有关自动排课系统的研究大多根据每个学校自己的情况设计排课算法,局限于传统思路,系统的通用性和可扩展性较差。传统的排课方法无法灵活表示排课中所涉及的排课知识,而语义
伴随网络信息技术的持续发展,世界范围内数字博物馆建设也保持着蓬勃发展的良好势头。而博物馆长久以来存在的各自为政的管理模式,给博物馆领域相关数据资源实现对外开放分享
一般的系统都是在外界持续扰动力作用下工作的,这些扰动不仅导致系统的性能下降,甚至使系统失稳。由于变量测量、信号传递延时等因素的存在,时滞现象普遍存在,例如输油管道中
数据库技术的发展与推广使越来越多的应用领域在信息化的过程中受益。而随着一些新型领域的兴起,为适应其发展需求,数据库技术也在不断地扩展和丰富。其中,分布式实时数据库就是
数字图像去噪,自从被提出以来就一直是图像处理领域的基本课题之一,其难点在于无法对所有类型的图像使用同一种去噪方法而都得到很好的去噪效果。传统的去噪方法便是针对图像