基于滑动窗口的多元时间序列数据动态关联规则挖掘

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:kkk0089
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的快速发展,在工业生产,金融服务,电子商务,卫星遥感,传感器网络等领域中都会产生大量的数据,这些数据往往都带有时间标签,即时间序列流。挖掘某一个领域多个时间序列流的关联关系是其中一个重要的研究方向。由于时间序列流具有海量性、实时性和连续性等特点,其中的数据和知识都会随着时间的推移而发生变化,传统的关联规则挖掘方法难以对其进行有效挖掘。目前已有一些数据流关联规则挖掘的研究,但是很多都是数据流已经符号化了,或者说数据本身已经代表了一种模式,不需要预处理提取模式。针对多元时间序列的关联规则挖掘的深入研究较少,且很多挖掘都是采用等长的时间长度来提取模式,挖掘出来的规则的每个元模式含有相同的时间长度,也没有考虑到新数据中的规则更令人感兴趣的情况。本课题使用滑动窗口来对时间序列数据进行限制,挖掘其中的动态关联规则即规则随滑动窗口的移动动态变化。由于时间序列数据是连续性的,在挖掘前需要对其进行预处理来提取元模式形成事务集,预处理的过程首先对序列进行线性化近似,对线性化后的序列切割使在同一时间段内每个序列只有一条线段也即一种变化模式,然后将相似的线段增量地聚类,为每一类分配一个符号,这样多元时间序列数据就被符号化了,将同一时间段内的符号组成事务集就可以对其进行关联规则挖掘了。本课题关联挖掘的算法同样是基于滑动窗口的。在滑动窗口维护一个全局的SWIU-tree(Incremental Updating tree based on Sliding Window)来存储已经扫描的事务集的概要结构,通过剪枝策略以去掉SWIU-tree中的不频繁模式和过期的模式。同时,对滑动窗口中不同的基本窗口采取计数衰减的策略,减少历史事务的影响。在实际热电厂的数据和股票数据集上通过将已有算法与本课题SWIU-tree算法对比,显示了本课题所提算法的有效性,可以快速准确地挖掘多元时间序列的关联规则。
其他文献
将改进的协同过滤算法应用于微博平台的信息推荐,拓展微博算法的应用范围,增加微博平台的可用性,提高信息推荐的结果准确性,更好地满足用户的信息需求。首先分析协同过滤技术
本文首先列举了各种数学方法,然后通过各种数学方法的结构分析,得出统一的数学方法——MM方法.最后指出研究数学方法统一性的意义.
提出了一个基于小生境遗传算法的平面叶栅的优化设计方法。该方法利用奇点分布法设计无厚翼型骨线,然后通过小生境遗传算法使叶栅表面边界层中的流动损失最小化,以此搜索沿骨线
作者分析了我国现行水资源质量评价方法中存在的问题,介绍了国外该项工作的思路和人法。在此基础上,建立了一套基于水质项目环境影响的分区、分类、分级的多指标综合指数评价体
为研究导弹发射时格栅式贮运发射箱易碎易裂盖自动开盖技术,文中建立了导弹和贮运发射箱二维模型,并求解非定常、雷诺平均Navier-Stokes(RANS)方程组和RNG k-ε湍流模型方程
基于破坏性创新的多元化战略可消除新市场中原有竞争者业已建立的顾客忠诚,有效避免企业在新市场中的竞争劣势。通过对传统多元化战略和基于破坏性创新的多元化战略的对比分
目的:研究肿瘤坏死因子超家族成员4-1BBL在宫颈癌和宫颈上皮内瘤变组织中的表达及临床意义,并探讨其在宫颈组织恶性转化过程中的作用,进一步为宫颈癌的早期预防和治疗提供理
该设计是以单片机控制的多功能遥控小车的电子设计,多功能遥控小车是集中运用了单片机技术、传感器技术、红外遥控技术等高新技术的综合体。小车采用了模块化的设计,以电动机
感受美挖掘美创造美──让课文的艺术美感渗透到作文教学中去张爱国一、充分感受美认真渲染美深入挖掘美感受美,渲染美是审美与创美的首步.语文教学与美密不可分,全套语文教材是