论文部分内容阅读
近几年,伴随着各种无线通信技术(例如,蓝牙,Wi-Fi,GPRS,3G,等等)的迅速发展,越来越多的移动设备被使用到各个应用领域。这使得大量包含定位信息的移动数据(也称为轨迹数据)被存储在各种定位服务应用系统,典型的有手机定位服务、GPS车载导航、野生动物追踪系统等。定位数据的不断累积逐渐使人们认识到:有效地从移动数据集中挖掘运动规律对于进一步发展定位服务相关应用系统具有举足轻重的作用。轨迹数据的复杂性使得传统数据挖掘技术和方法无法直接在该领域使用。因此,许多国内外研究人员对移动数据挖掘算法做了深入的研究,研究内容主要集中在移动数据聚类分析、移动数据异常点检测、频繁模式挖掘和位置和轨迹预测等四个方向。本文的研究对象是移动对象数据库中的历史轨迹数据。在全面分析了国内外对移动对象轨迹的相关研究后,本文主要研究了移动对象轨迹的聚类分析和移动对象轨迹的异常检测问题,并在此基础上提出了移动对象轨迹的匹配方法、移动对象轨迹异常检测方法和移动对象轨迹聚类分析方法。本文的主要工作和创新点有:1.轨迹匹配问题的研究。在移动对象轨迹的研究中,关键技术是轨迹的相似性度量。目前,轨迹匹配的距离度量方式(如欧氏距离、Hausdoff距离及相关距离方法)还不能够很好的适合轨迹的匹配,因为轨迹间存在着公共偏差以及移动对象具有运动模式。为了能够消除轨迹间的公共偏差和考虑移动对象的运动模式,本文提出了一种新的轨迹距离度量方法,巧妙利用轨迹间的平移消除公共偏差,以点对点的形式包含轨迹的运动模式。2.移动对象轨迹的异常检测方法研究。TRAOD算法是目前比较典型的轨迹异常检测算法,该算法在优化过程中采用了粗细粒度方法来提高算法性能。但是其优化是以检测的准确性为代价,在二次优化时需要将轨迹点数取到尽量大以提高性能,可是理论中能够实现但在现实中很难做到这点,并且检测的准确性也会大大减小。基于上述的问题,本文巧妙的利用了R-Tree的索引结构,提出了一种R-TRAOD算法。该算法通过对数据的分析,确定R-Tree索引的半径,利用对每个轨迹子段建立起一个R-Tree索引结构以快速的找到领域内的所有轨迹子段而提高算法的性能。3.移动对象轨迹的聚类分析研究。根据目前的聚类算法所存在的缺点,即忽略了移动对象的运动模式,本文提出了一种基于Hausdoff距离的轨迹子段聚类算法。该算法解决了轨迹在聚类时所忽略的方向性信息,利用将Hausdoff距离和流失量相结合,使轨迹在进行聚类时具备方向性。经过进一步的研究之后,发现轨迹间存在着公共偏差,由于上一种算法无法消除轨迹间的公共偏差以及难以区分速率不同的轨迹,本文提出了另一种基于改进的Hausdoff距离轨迹子段聚类算法。该算法解决了轨迹在聚类时忽略的方向、速率信息以及消除了轨迹间的公共偏差问题。