关于时态数据关联规则挖掘的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:xst191217
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术自20世纪90年代初期开始崛起,并迅速的成为计算机理论及应用界研究的热点。如今数据挖掘是一个多学科交叉研究领域,它融合了数据库技术、人工智能、机器学习、统计学、信息检索、高性能计算以及可视化等最新技术的研究成果,成功的打破了“数据丰富,知识贫乏”的局面。在数据挖掘技术蓬勃发展的过程中,人们逐渐意识到时态数据挖掘研究的必要性及其重要意义。因为时间是客观世界的客观属性,是数据的固有属性,在数据挖掘的过程中忽略数据的时态语义已然暴露出很多不足。于是诸如时态数据的模式、趋势、约束、因果关系等时态知识的挖掘得到了越来越多的研究,值得提出的是,计算机学术界对于挖掘时态关联规则给予了尤其多的关注。本文提出的是时态数据库中离散属性的带周期规律的关联规则发现方法。关于时态数据周期性关联规则挖掘的研究也有不少,其中包括连续属性的周期性关联规则提取,定制周期内时态关联规则提取等等。在这些研究成果的基础上,本文提出的方法能够计算得到时态数据库中离散属性的周期,进而通过执行改造了的Apriori算法挖掘周期性时态关联规则。本文所做的主要工作概括如下:1.在对时态数据库中的有效时间属性进行划分和标记的基础上,提出了时态数据库中离散属性的周期计算方法,并详细描述了算法的执行步骤。2.提出新的时间区间标记方法,通过划分和标记时态数据库的有效时间属性,用标记集合代替时间区间,达到有效时间区间合理离散化的目的。3.提出改进了的Apriori算法,在计算频繁项集的过程中,相匹配的项集根据其所携带的时间区间标记的不同来分别计算支持度,从而得到带时态信息的频繁项集。4.计算得到带时态信息的关联规则,结合离散属性的周期,合理解释关联规则的周期规律。5.分析本文提出的改进了的Apriori算法在性能上有所提升的主要原因。本文通过对时态数据库的有效时间属性进行两次划分和标记,有效的实现了离散属性的周期计算以及时间区间的离散化,为进一步执行Apriori算法奠定了基础。另外,本文提出的改进了的Apriori算法使得计算频繁项集的迭代过程迅速收敛,减少了扫描数据库的次数,提高了算法的执行效率。
其他文献
肤色检测技术的研究是目前图像识别与理解研究中的一个热点,它是很多基于肤色的应用的前期处理,如人脸检测、手势识别、色情图像识别及过滤等。稳健的肤色检测技术是这些计算机
数据挖掘指的是从大量数据中提取隐含的、事先未知的、并且潜在有用的知识的技术,是目前国际上数据库和信息决策领域最前沿的领域之一。聚类分析就是其中一个重要的研究方向,
由铝箔和纸料贴合而成的贴纸铝箔是香烟包装行业的主要包装材料,在烟箔生产过程中,对张力控制的好坏直接影响烟箔的质量,因此张力控制系统是复合机控制的关键技术。论文从复
路径规划就是指按照先验知识,在满足一定约束条件下,从有障碍物的环境中规划出一条从起点到终点的无碰撞路径。它在机器人学,地理信息系统,G IS等众多领域有广泛的运用,对它的研究
科学计算可视化是20世纪80年代发展起来的一个新的研究领域。它运用计算机图形学和图像处理技术,将科学计算过程中产生的数据及计算结果数据转化为图形及图像在屏幕上显示出来
随着社会信息化进程的不断发展,人们对信息的需求和依赖程度越来越高,如何从海量信息中快速有效的获取有用信息,已经成为人们研究的焦点。信息检索的研究可以帮助人们有效的
随着科学技术的迅速发展和工业化进程的持续深入,我国的航空航天事业有了长足的进步和举世瞩目的成就。作为空间探索的关键设备,航天器的性能很大程度上受到其回旋机构上的轴
随着世界经济的高速发展,商业活动中越来越注重追求高效率和自动化。特别是在一些零售行业、银行业,对货币自动识别的要求已经成为新的研究热点。如何快速、有效而又低成本地对
情感倾向性分析是通过研究文本中人们的情感,观点,看法等内容,来确定文本中所包含的情感与态度等主观信息。情感倾向性分析经历了最近10年的快速迅猛发展,现在已经成为一个热
多输入多输出(Multiple-Input Multiple-Out-put,简称MIMO)系统的信道容量近似地与收发天线数目的最小值成正比,相对于传统的通信系统能够成倍地提高系统容量,而正交频分复用