论文部分内容阅读
数据挖掘是数据处理的一种重要的方法,而关联规则挖掘是数据挖掘技术中的一个重要研究方向。在关联规则挖掘中已经产生了许多挖掘算法,然而这些算法都认为发现的关联规则是永恒有效的,没有考虑到规则的变化。这些规则是一种静态的关联规则。实际上,规则和数据特性随着时间可能会有很大的变化。 本文在关联规则挖掘理论的基础上,改进了关联规则的描述和评价方法,在支持度和置信度两个度量指标的基础上加入了支持度向量和置信度向量两个新的规则评价指标。这种新的规则称之为动态关联规则。 全文由以下六章组成: 第一章为概述。本章对数据挖掘的发展历程和挖掘方法进行了介绍,并对数据挖掘的应用和发展趋势进行了讨论。 第二章介绍了关联规则挖掘技术的基本概念,并对三种经典的关联规则挖掘算法进行了详细的描述。 第三章在普通关联规则的基础上,改进了规则的描述和评价标准,提出了动态关联规则的概念,并给出了两种动态关联规则的挖掘算法。相应的还给出了几种利用动态规则进行预测和分析的方法。 第四章给出了一个利用Web文本挖掘技术于辅助研究的系统,它能够对网络数据库中的信息进行分析,并得到对研究工作有辅助作用的知识。本章也把动态关联规则应用于辅助研究系统,能得到更多的辅助信息。 第五章应用动态关联规则于茂名第四套蒸馏装置的数据分析之中,并给出了数据分析的过程和结果,也对结果进行了解释与分析。得到的规则可以用于指导实际的生成过程。 第六章总结了全文并讨论了进一步需要研究的问题。