论文部分内容阅读
乘客在时间和空间上的一般出行规律,可以反映出一个城市的基本情况。但往往特殊的情况更能反映出事物潜在的机制,比如一个区域最没有活力的是哪一个城市,最受移民欢迎的是哪一个城市等。受到全球金融危机的影响,过去十年间失业者、自营职业者、兼职者、远程办公者等群体人数越来越多,这些特殊群体在一定程度上可以暴露出城市的问题。随着公共交通自动计费系统的广泛使用,具有时空标签的智能刷卡数据为研究乘客的特殊出行行为提供了新的方法论。本研究利用武汉市2015年3月23日至2015年3月29日连续一周的地铁刷卡数据、土地利用数据、房价数据等多源大数据,在掌握乘客出行特征及其分类理论的前提下,以“人”和“地”两个方向为切入点,运用数据挖掘、聚类、回归分析、数据可视化等技术方法提出了基于地铁大数据的乘客特殊出行行为研究。本研究首先基于全样本的地铁客流数据,从时间和空间两个维度对地铁客流的时空分布格局及特征进行了系统的分析,掌握了乘客的基本出行特征;其次从“人”的角度出发,对乘客的特殊出行行为进行了分类(早出类、晚归类、长时间出行类、频繁出行类和进出同站类),并对每一类人群进行了特征分析并做出合理的猜测;然后从“地”的角度,根据特殊出行特征指标对地铁站点进行了分类,识别出异常站点的分布情况;最后运用土地利用数据和房价数据,通过回归分析、相关分析等方法,进一步挖掘出现特殊行为现象背后的原因。研究结果发现:1.地铁2号线承担了最多的客流,且客流较多聚集在商圈附近。2.地铁客流的流向和流量不论是从组团尺度还是环路尺度均呈现出很高的对称性。3.乘客可能存在多种特殊出行行为,如在一天的出行行为中,即早出又晚归、即长时间出行又进出同站等等。4.特殊人群的客流量主要集中在地铁1号线上,且主要分布在汉口中央活动区附近,地铁4号线上的特殊人群客流是最少的。5.这些特殊人群有可能是远离市中心的居民、地铁站的维修、检测、工作人员,也有可能是兼职发传单的人、扒客、乞讨者、流浪汉等。6.早出类和长时间出行类站点分布和物流仓储用地呈相关关系,印证了可能是物流公司员工的猜想;晚归类站点分布和商业商务、娱乐康体用地呈正相关关系,印证了加班或娱乐性活动导致乘客晚归猜想;所有异常站点分布都和娱乐康体用地呈正相关。