增量式关联分类算法与多标号关联分类方法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:ssskstar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用关联规则挖掘方法来构造分类模型在数据挖掘领域被称为关联分类。关联分类方法将数据挖掘中的两个重要技术——关联规则挖掘和分类技术很好的结合起来。近几年的研究成果表明,已有的关联分类算法在分类准确率方面比起传统的分类方法,如决策树分类,有了很大的提升。然而,在对关联分类方法研究的过程中发现,已有的这些算法对其在实际应用会遇到的问题没有给予足够的关注;与此同时,将高效的分类方法用于解决实际问题的需求却与日俱增。因此,本文从实际应用的角度出发,对提高关联分类方法的性能方面进行了深入研究。首先,针对实际应用中常见的数据库更新情况,提出一种适用于MCAR关联分类算法的增量算法——IUAC。该算法基于频繁模式树挖掘和更新关联规则,并使用一种树形结构来存储最终用于分类的关联规则。同时,增加了对分类规则的约束条件,进一步控制用于分类的关联规则的数量。其次,针对实际应用中常会出现的多标号分类问题,提出多标号懒关联分类方法——CMLAC。该方法在对已有多标号技术和懒关联分类方法进行研究的基础上,采用循环过滤策略,发掘出标号之间的潜在关系,得到一个多标号的分类关联规则集MCARs,从而使得已有的懒关联分类方法能够解决多标号分类问题。
其他文献
针对日趋复杂的软件需求的挑战,软件业界发展出了软件复用技术。作为针对“软件危机”的最佳对策,软件复用技术已经引起人们的普遍关注。而组件技术是当今解决软件复用的最有效
在企业大量地部署信息化系统之后,系统的弊端逐渐暴露,主要表现在:各系统建设在异构平台上,缺乏互操作性,形成信息孤岛;系统与工作流程粘度高,不能便捷的改变流程以满足市场快速变化
时序数据在日常生活中随处可见,对时序数据的研究和挖掘具有重大实际应用意义。本文以测井数据作为时序数据分组方法研究对象,是由于测井数据不仅具有时序数据的普通特性,且具有
支持向量机是在统计学习理论基础上发展出来的一种新的、非常有效的机器学习方法。它较好地解决了以往困扰很多学习方法的小样本、非线性、过学习、高维数、局部极小点等实际
随着科学的发展,科学对计算的要求的不断提高。但是,由于受到物理器件极限速度和技术水平的限制,使得单处理机远远满足不了现代许多领域中具有挑战性的大规模计算课题对计算资源
流媒体应用是互联网和多媒体技术发展的趋势和前沿性研究课题。基于Mesh的P2P网络凭借其高可扩展性和部署成本低等特点,成为了解决流媒体应用的最重要的途径之一。论文主要针
计算机技术和计算机网络的快速发展,使多媒体技术得到了蓬勃的发展,图像、视频成为网络传输的主要信息之一。而图像、视频的大数据量始终是困扰图像传输的一个问题,计算机对图像
本课题的研究背景是我国某航天工程中空间材料科学的空间实验。某航天工程空间材料科学的实验设备在功能和性能上比前期有了很大的提高。表现在: ●炉子从一个温区变成了多
近年来,P2P技术被视为新世纪计算机领域的热点技术之一。随着网络技术的飞速发展和个人计算机性能的增强,互联网的计算模式正经历着从C/S模式向P2P模式的转变。P2P网络的匿名
Web服务的松散耦合的、跨语言和跨平台的特性使其在各领域中被广泛使用。同时,Web服务的安全性也被广为关注。本文对现有Web服务相关的安全技术进行分析和研究,并基于.NET平台,