论文部分内容阅读
城市化进程的加速,给大中型城市带来很大的交通压力,交通拥堵成为其中的一个顽疾。研究城市居民的出行规律、出行的热点区域和出行活动的频繁模式提供了解决交通问题的一种途径。传统研究方式普遍基于问卷调查等形式进行,耗费财力多、工作量大、效率低且样本量小,导致无法全面和准确地发现居民出行的活动规律。随着现代定位技术的飞速发展,手机定位数据已经成为一种新的、快速获取实时位置信息的重要数据源。由于手机定位数据具有实时性、低成本、样本量大等优点,能全面记录居民日常的出行活动。利用大量的手机定位数据挖掘居民出行的目的、兴趣爱好和行为模式等已经成为近年来智能交通领域的研究热点。本文针对手机定位数据的时空分布特征,分别从整体和局部对居民出行模式进行综合研究。首先,从宏观上建立了多种出行特征指标来分析居民的出行行为,根据手机定位数据之间的关联关系,发现居民在工作日和休息日下的不同移动模式。接着,针对经典DBSCAN算法难以确定参数的问题,提出了基于截断距离的参数自适应算法AC-DBSCAN,并在Spark平台上实现了该算法的并行化;在此基础上,对工作日和休息日不同时段下的手机定位数据进行挖掘,发现居民出行的热点区域及其时空变化规律。最后,针对现有频繁模式挖掘缺乏语义化的问题,本文提出以语义化交通小区为研究对象,利用A-PrefixSpan算法进行语义化的居民出行的频繁模式挖掘,获得居民与地理空间的互动关系,更好地发现居民出行所隐含的知识和规律。本文采用Python语言实现相关算法,并搭建由7台主机构成的Spark平台来处理数据。采用贵阳市移动公司提供的三天,共54844135条手机定位数据作为数据源来验证本文研究方法的可行性。实验结果表明所提算法有效可行,相关研究成果可以为城市道路交通规划、交通运营管理、土地价值评估以及公共设施规划等领域提供更多的理论依据和决策支持。