【摘 要】
:
轨迹数据是指通过对移动对象运动过程的采样所形成的具有时空特征的数据信息。随着位置采集技术的不断发展和采集设备的大量部署,产生了越来越多的移动对象轨迹数据。这些轨
论文部分内容阅读
轨迹数据是指通过对移动对象运动过程的采样所形成的具有时空特征的数据信息。随着位置采集技术的不断发展和采集设备的大量部署,产生了越来越多的移动对象轨迹数据。这些轨迹数据可以用来交通规划,城市规划,兴趣推荐等,具有广泛的意义和重要的价值。如果希望使用轨迹数据进行数据分析和应用,快速高效的查询是必不可少的,而查询的效率通常与数据存储方式和索引结构有关。而存储方式和索引结构,与数据本身的质量息息相关。数据质量的好坏又与原始数据和数据预处理有关。进行数据分析,原始数据无法再进行优化,但细致的数据预处理能够使后续的分析工作更加快速和有效。因此,本文对轨迹分段、轨迹查询、轨迹索引三方面进行了详细的研究工作,设计并实现了分段算法,索引结构与查询算法。具体有如下三方面:1.结合轨迹数据的时空特性,提出了一种基于动态阈值的定点轨迹数据行程识别方法。首先,该方法采用聚类方法确定与阈值相关的时空多粒度参数;其次,根据参数对历史记录进行统计,计算参数对应阈值,最后,利用时空相关参数获取对应阈值,对轨迹进行分段,进而实现行程识别。基于真实的城市交通卡口数据的实验结果表明,使用时空相关的动态阈值方法对定点轨迹数据进行行程识别在准确率和覆盖率上都要优于传统基于固定和单一阈值的方法。2.给出了面向三类典型轨迹数据查询的时空索引结构。首先,根据传统轨迹查询类型归纳了点查询和范围查询两类轨迹查询,其次根据轨迹分段结果,新提出一类轨迹段查询;由于不同索引方式下的查询表现存在差异,进而本文分别为点查询、范围查询和轨迹段查询三类查询给出了R树索引、Z3索引、Z3+索引三种不同的索引结构,使在进行轨迹查询时,可以采用合适的索引结构,从而实现轨迹数据查询效率的提升。3.设计并实现了大数据环境下的轨迹数据查询和管理原型系统。本文选择了Hadoop作为轨迹数据存储和查询的基本环境,选择Hbase做为存储原始轨迹和规范轨迹的数据库,基于Geomesa的开源框架进行开发,实现了三类典型查询以及对应索引构建。同时,基于该系统在相关真实轨迹数据集上实验,验证了本文工作相对于传统工作在轨迹分段、轨迹查询方面都具有更好的性能,也表明了本文工作的有效性和适用性。
其他文献
“以钱养事”改革以后,基层的公共服务组织也就是“七站八所”都向市场转换机制,由事业单位转变为企业或中介服务机构,但是近几年,这些改制后的基层公共服务组织又变回了事业
我国煤层气的开采随着自动化设备的更新已逐渐进入半自动化发展阶段,可实现大部分排采参数的自动采集,因此随着时间的推移积累了海量的排采数据。但是煤层气井的排采仍然存在
随着人类社会的发展,环境和能源问题越来越受到关注。磁制冷技术具有不产生温室气体、不破坏臭氧层、高效节能等优点,成为最有希望替代传统压缩制冷的新技术之一。在众多的磁制冷材料当中,MnFePGe材料不仅具有巨大的磁热效应,而且其原材料无毒且成本低廉,成为极具应用前景的磁制冷材料之一。为了优化材料制备工艺,本文利用机械合金化(MA)技术结合放电等离子烧结(SPS)技术,制备了直径38mm的Mn1.2Fe
随着移动互联网和物联网技术的快速发展,虚拟现实、增强现实以及人脸识别等一系列具有计算密集、延迟敏感特征的新型应用不断涌现。然而,由于移动终端受自身计算能力和电池容
互联网技术的快速发展有利于信息存储、提取和传播,使得大量的信息得以转换为电子文档的形式,从而可以有效的以半结构或者非结构化的数据类型保存,很大程度上缓解了大数据储
随着半导体器件的尺寸趋于纳米量级,原子层刻蚀工艺已经成为微电子工业进一步发展的必要技术手段。对于原子层刻蚀工艺,用于刻蚀的能量粒子必须满足三个基本要求:能量低、能量分布集中以及通量便于调控,这对于低温等离子体(Low Temperature Plasma,LTP)源提出了极为严峻的挑战。传统的LTP源如射频容性耦合等离子体(Capacitively Coupled Plasma,CCP)电子温度高
西北太平洋是世界上台风发生频数最多的区域,平均每年有28.2个台风生成。我国东部与西北太平洋相邻,是受台风影响严重的国家,平均每年有7个台风登陆我国。由台风带来的狂风、暴雨、风暴潮及次生灾害会给沿海地区带来重大的财产损失及人员伤亡。台风活动具有显著的季节、年际以及年代际变化特征,1977-2016年间,台风年频数最高达37个,而最少的只有14个。因此,将具有年际变化的台风季节活动在台风季来临之前准
移动用户数量的迅猛增长和多媒体服务种类的不断丰富,使得无线网络的信道容量以及回传链路的带宽资源都面临着巨大的挑战。异构蜂窝网络作为一种新兴的异构式扩容网络架构,可
目的:探讨人脐带间充质干细胞(Human Umbilical Cord Mesenchymal Stem Cells,HUMSCs)在大鼠体内分化为Leydig细胞并治疗雄性性腺功能低下症的可行性。方法:采用贴壁法分离培
在数值分析领域,主流方法为有限元法、有限差分法等基于网格的方法,此类方法经过多年发展已经具备了成熟的理论基础且广泛应用于各种工程领域。在数字图像处理领域,基于网格