基于量化概念格的关联规则挖掘模型研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:doraemon1226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库中的知识发现是当前涉及人工智能、数据库等学科的一门相当活跃的研究领域。数据挖掘是从数据中提取人们感兴趣的、潜在的、可用的知识,并表示成用户可理解的形式。关联规则挖掘是数据挖掘的一个重要分支,是描述数据库中数据项(属性、变量)间存在的潜在关系。 概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述。在概念格的内涵中引入等价关系并将其外延量化,得到量化概念格。本文是基于量化概念格的关联规则挖掘为中心而展开的。 本文中创新性的主要内容如下: ①提出了基于量化概念格的关联规则及基于兴趣度加权的量化概念格的关联规则挖掘的思想、算法以及性能分析。基于兴趣度加权的量化概念格关联规则挖掘选择大于兴趣度加权阈值的项目构造量化概念格,在此基础上交互地挖掘感兴趣的关联规则。 与Apriori算法相比,两种方法所挖掘出的规则结果完全吻合,前者具有较好的时间性能,规则表示更直观,减少了算法的搜索空间和计算量,提高了挖掘的效率和准确性。 ②改进了传统的购物篮分析,由于传统的购物篮分析只关心顾客是否购买商品,忽略其购买的数量,因而在实际应用中,有很大的局限性,在本文中,不仅要关心顾客是否购买商品,而且考虑顾客购买的数量,在传统的购物篮分析中,引入兴趣度加权思想,并提出了如何获取兴趣度加权阈值的方法,因此在改进了传统的购物篮分析基础上,基于量化概念格所挖掘出的关联规则有更贴近于实际和应用价值。
其他文献
OCR技术可以将文档图像信息转变为计算机可以理解和编辑的信息,以便保存和使用.随着办公自动化程度的日益发展,人们对OCR服务的需求也越来越多.而且互联网宽带的推广,使得越
本论文首先描述了企业投资优化所面临的问题;随后,从免疫系统生物原型、免疫算法原理、免疫算法与遗传算法的比较等方面概述了免疫算法;提出了RAIA算法,描述了RAIA算法的具体步骤
当今世界的信息总量已经大大地超乎人们的想象,达到了一个十分惊人的数字,与此同时信息的膨胀速度还在不断的加快,人们几乎已经被信息的海洋所淹没。虽然信息技术的出现,为人
随着智能无人车系统(Intelligent Unmanned Vehicle,IUV)的发展,无人车的在线感知能力日益受到重视,障碍物检测能力则是无人车在线感知能力的重要组成部分。因为视觉传感器具有
数据中心作为云计算的核心支撑部分,数据中心的性能直接决定了云计算服务的质量。数据中心网络作为数据中心中的通信桥梁,其负载正变得越来越重,并开始影响数据中心的性能。组播