论文部分内容阅读
随着互联网和物联网技术的蓬勃发展,时序数据已经广泛存在于社会生活的各个方面。时序数据挖掘就是分析和处理海量的时间序列,从中挖掘出有价值的信息,使人们能够正确地认识事物和科学地做出决策。时间序列分类和规则发现在时序数据挖掘中占有极其重要的地位,并且已经在诸多领域得到了实际的应用,为人类的生产生活活动提供了极大的便利。目前,大部分的分类算法在分类之前都需要提供包含所有类别的训练样本,并在训练阶段进行学习。但在很多情况下,数据以流的形式存在,刚开始时可能只有少量甚至是没有明确的类别知识可供学习。虽然聚类算法能够在没有训练样本的情况下对数据进行类别划分,但其通常处理的是离线数据集,对于在线数据流难以达到较好的分类效果。针对上述问题,面向时间序列的在线层次分类算法能够从在线时序数据流中学习新的类别知识,不断填充分类字典,并根据分类字典对时间序列分类。实验表明,该算法对于时序数据流具有较好的分类效果,且时间复杂度较低。在传统的关联规则挖掘中,不同的事件之间并没有一定的先后次序,更多的是体现一种伴随的关系。但是在时序数据中,事件是按照时间顺序依次发生的,事件之间的时间关系对时间序列的规则挖掘至关重要。面向时间序列的关联规则发现算法通过改进传统的Apriori算法,充分考虑了时序数据的时间特性,能够从多数据流中挖掘出形如1∧…∧?,?的关联规则。基于频繁模式的规则发现算法也进行了改进,作为关联规则发现算法的补充,以期可以更加全面地挖掘规则。通过在实际的数据集上测试,上述规则发现算法能够从时序数据中挖掘出正确且有意义的规则。