论文部分内容阅读
本文深入研究了多维时间序列相似性查询的有关方法,重点分析了多维时间序列预处理技术和相似性度量方法,提出了一种改进的多维时间序列线性分段方法,并且以该分段方法为基础,提出了一种新的基于形态特征与动态时间弯曲距离的多维时间序列相似性度量方法,并且通过具体方法进行了相应的论证,最后运用改进算法设计并实现了具体应用。本文的主要内容如下:1)多维时间序列数据的模式表示。多维时间序列的模式表示是多维时间序列研究的基础。本文首先在PAA分段线性方法的基础上提出了PAA_ERR算法,该方法能够在时间维上对原始时间序列进行降维处理,PAA_ERR方法通过计算所有维度上拟合误差确定分段滑动窗口的大小,最后在分段后的时间序列上提取序列的倾斜角和形态特征值作为序列的模式表示,实验表明该算法能够很好的对时间序列进行拟合,并且计算简单易于实现。2)多维时间序列数据的相似性度量方法。本文根据多维时间序列数据的特点以及已有相似性度量算法的优缺点,提出了基于动态时间弯曲距离的SA_DTW方法。该方法首先通过PAA_ERR算法将时间序列数据在时间维上进行降维处理,求出时间序列数据的模式表示,也就是序列各个分段的形态特征与倾斜角,最后通过求时间序列模式矩阵中不同维度之间的动态时间弯曲距离来进行相似性查询。实验表明,该方法能够有效的提高相似性查询的准确性。3)本文在上述改进算法的基础上设计并实现该多维时间序列算法的原型系统以及将其初步运用到实际。原型系统主要由三个模块所组成,分别是时间序列模式表示模块、时间序列相似性查询模块以及改进算法的应用展示模块。前两个模块主要用来体现展现PAA_ERR和SA_DTW算法的实际运行效果,第三部分的展示模块能够提供实时数据,通过采集屏幕手势滑动的轨迹点数据,来进行时间序列相关图形的相似度比较,结果表明SA_DTW方法对这些时间序列具有较好的匹配效果。最后基于原型系统所完成的桌面助手应用具有使用简单,灵活,操作方式多样的特点。