论文部分内容阅读
近年来随着城市道路交通的迅速发展,交通拥堵、交通污染等问题日益凸显,成为了制约城市发展的主要障碍。为解决这些交通问题,各国纷纷利用物联网技术建立智能交通系统(ITS),而大规模定位数据的道路匹配是ITS系统中的核心技术。用传统的单机方式保存、处理这些海量数据不仅成本高,而且效率较低,难以满足ITS系统的各种需求。而Hadoop作为一款开源的分布式云计算框架,在海量数据存储和处理等方面具有极大的优势。本文在研究了典型道路匹配算法以及Hadoop常用组件的基础上,提出了一种适合对大规模定位数据进行处理的道路匹配算法,并将其迁移至Hadoop平台实现。论文工作如下:1)研究了典型道路匹配算法的原理、优缺点,以及Hadoop常用组件的体系结构、运行原理。为下面的研究奠定理论基础。2)对实验数据,包括北京市出租车7天GPS定位数据、北京道路底层数据进行了预处理,根据道路底层数据的特点设计了路网模型,并以划分网格的方式建立了北京市电子地图数据库。3)基于北京市电子地图数据库,设计了基于网格搜索的道路匹配算法。该算法通过计算网格编号快速获取候选路段,根据改进后的直接投影法进行道路匹配计算,能够高效地计算出匹配结果。并将此算法迁移至Hadoop平台实现,利用HDFS、HBase存储输入输出数据,MapReduce进行道路匹配计算。4)基于北京市电子地图数据库与匹配结果数据库,设计实现了车辆行驶轨迹还原系统。该系统能够将电子地图以及道路匹配结果进行可视化展示,从而直观地向用户展现车辆的行驶轨迹。5)以群集方式搭建了Hadoop平台,对以上提出的算法进行了测试,验证了该算法的高效性。并通过车辆行驶轨迹还原系统对比了匹配前后车辆位置的变化,验证了该算法的可行性。