【摘 要】
:
关联分析是数据挖掘研究领域的经典问题,目的是通过统计变量间的定量关系来揭示数据内部存在的复杂关联关系。关联分析面临的一个主要问题是关联规则的数量太多,破坏了关联规
论文部分内容阅读
关联分析是数据挖掘研究领域的经典问题,目的是通过统计变量间的定量关系来揭示数据内部存在的复杂关联关系。关联分析面临的一个主要问题是关联规则的数量太多,破坏了关联规则的可解释性和可应用性,也给其挖掘、存储和传播带来很大的资源压力。目前已有多种关联规则的精简表示模型被提出,但这些模型仍不同程度存在紧致度不够、信息丢失或恢复算法复杂等问题。本文放弃了经典关联规则精简表示方法所依赖的最小描述原则,致力于探索用更富于关联关系描述能力的新型关联规则来形成关联规则精简集的研究。本文的主要研究工作如下:(1)对经典关联规则精简表示方法所依赖的最小描述原则,分析了遵循该原则而设计的关联规则在关联关系代表性方面的不足,提出了不遵循该原则而具有更好关联关系代表性的基本关联规则的概念,据此构造了一种无损的关联规则精简表示方法,分析了相关的几个性质并加以证明。根据关联规则之间的格结构特征,将基本关联规则集划分为近似基本关联规则和精确基本关联规则两部分,设计了基本关联规则的挖掘算法并进行算法分析。实验结果表明,基本关联规则模型比现有的关联规则精简模型更加紧致。(2)针对从基本关联规则集恢复全体关联规则集的问题,将基本关联规则集划分为精确基本关联规则子集的和近似基本关联规则子集两个部分,然后分别利用两类基本关联规则规则的关联关系代表性特征,分别进行扩展以恢复其所代表的原始关联规则,最后合并以形成全体关联规则集。据此分别设计了精确关联规则和近似关联规则的恢复算法并进行算法分析。最后进行了实验验证。
其他文献
从二维图像中估计场景的深度信息是计算机视觉领域的经典问题之一,其主要目的是获取各场景点与摄像机之间距离,从而实现场景三维重建等任务。从相机成像原理可以发现散焦模糊
随着信息技术的飞速发展,面向各种实际问题的应用系统层出不穷,随之的监控系统也纷纷浮出水面。在目前复杂而多变的监控市场中,以往的专用监控系统难免显得力不从心了。 资源
近年来,随着无线技术和Internet的发展,对可携带、可移动计算机的需求不断增长,而无线局域网(Wireless Local Area Network WLAN)以其高灵活性、健壮性等优点被广泛应用。现
随着信息技术的快速发展,对含有时态特性的信息处理提出了越来越多的需求。目前对时态数据库的理论研究和时态信息处理相关的应用开发都迫切需要一个基础的时态信息处理系统来
随着Internet的普及和电子商务的迅速发展,对电子商务的要求越来越高,为了适应这种要求,Agent技术被应用到了电子商务中,来提高电子商务的智能性和实用性。本论文针对当前电
近年来,随着建模、数字化和可视化技术的发展人们可以更容易地获得三维模型数据。这就导致专用数据库和互联网上的三维模型数量急剧增加,如何有效地进行三维模型的检索和提取
嵌入式数据库管理系统是近些年才兴起的一项新的数据管理技术。它以目前成熟的数据库技术为基础,针对嵌入式设备的具体特点,实现对移动设备和嵌入式设备上数据的存储、组织和
很多的学术研究和工程应用都会涉及到数据的处理,而且范围也很宽泛,处理的数据既可以很小也可以非常庞大。这些应用一般常用定点数和算术运算来描述。但在很多情况下,这种方法描
由于井下采矿活动的不断进行,常使回采巷道受到扰动而失稳。为确保地下采矿活动的正常进行和工人的安全,必须对回采巷道进行支护。 回采巷道支护方式及其参数的确定受众多
秘密共享是密码学的重要组成部分,为密钥管理提供了全新的思路,在密钥保存、传递和使用上都起到重要作用。秘密共享能够平摊风险、防止密钥管理权利过于集中,对提高系统的安