论文部分内容阅读
轨迹数据在日常生活、商业应用与科学研究等方面起着日益重要的作用。随着无线通信与移动计算技术的快速发展,我们所能获取到的轨迹数据规模也变得前所未有的庞大。如此大量的轨迹数据既带来了巨大的研究价值,也对数据管理、计算与挖掘提出了严峻的挑战。受限于存储与计算能力,一方面需要研究如何在确保数据质量的前提下对轨迹数据进行压缩,另一方面需要研究如何高效地完成一些基础操作,例如轨迹的相似性查询。本文以轨迹数据相似性查询为研究重点,针对现有研究成果的不足,提出了相应的轨迹压缩算法与高效的轨迹相似性查询算法。在此基础上,本文还探索了轨迹数据的应用,设计并实现了一个基于磁场传感器的细粒度字符输入系统。具体而言,本文开展了以下研究:1.基于重要轨迹段的轨迹相似性查询研究。现有的轨迹压缩算法只是孤立地压缩单条轨迹,而且压缩之后的轨迹与原始轨迹相比,丢失了细节的语义信息。为此,本文提出了一种新的轨迹压缩算法,通过将轨迹分段,并计算每一段的权重,可以将权重较高的轨迹段提取出来,组成压缩轨迹。本算法可以将轨迹中重要部分的细节全部保留下来,使得压缩轨迹的语义更完整。实验结果表明本算法可以在确保轨迹数据可用性的前提下,达到较好的压缩率。2.基于轨迹段旋转的轨迹相似性查询研究。作为使用最广泛的轨迹距离度量函数,动态时间弯曲(Dynamic Time Warping, DTW)具有能处理轨迹中的局部时间偏移、查询准确度高的优点,但是其计算开销也较大。在实际应用中,通常先根据DTW的下限距离排除不可能出现在结果集合中的候选轨迹,从而提高查询效率。现有的DTW下限计算方法并没有考虑多维轨迹的特性,因此本文设计了一种新的DTW下限计算方法,可以有效提高多维轨迹数据上的相似性查询效率,并通过实验验证了该方法的有效性。3.基于磁场传感器的字符输入系统。作为对轨迹数据应用的探索,本文设计并实现了一个基于磁场传感器的字符输入系统,可以用于任何配备了磁场传感器的智能设备。该系统首先通过一个轨迹变换算法,消除用户的不同书写习惯带来的影响,然后采用DTW作为轨迹之间的距离度量函数,通过1-最近邻分类来识别输入字符。在大量真实应用场景中的实验结果表明,该系统的输入识别准确率可以达到94.99%。