论文部分内容阅读
随着信息时代到来,大数据的研究已经目前行业与学术界的研究热点之一,大数据具有多数据形式、大数据量、数据传输快捷等优势,大数据已经逐渐影响和改变人们解决问题的思维方式。除了数据本身的价值,人们同时也关心原本数据下的深层知识,或者更看重深层知识。不同数据之间的关联关系,数据分类、聚类以及异常点发现都是数据挖掘的重要方法。本文研究的是结合POI与滴滴打车数据分析人们的打车需求。城市中包含很多类型的POI数据,包括商店、超市、公司、旅游景点、住宅小区,学校等,这些POI可以反映出城市内部区域功能。滴滴出行数据代表了人们打车出行的需求,不同时间段的打车需求量的变化可以帮助管理者合理分配出租车,满足人们的需求。本文利用滴滴打车数据,分析打车聚集区域以及打车活跃时间段,分析每个集中区域中POI分布以及之间的关联特征,分析因为打车点附近POI的特征而引起打车需求活跃时间段差异和打车活跃区域地理位置差异的原因。1)本文提出对滴滴打车需求数据进行时间段划分。先按照一周中的工作日和周末进行划分,将一天打车活跃时间段主要分为早高峰7-9点、中午12-13点、晚高峰17-18点、夜晚21-23点;然后对一个打车点周围500米的范围内最大打车需求量进行赋值,最大需求点的时刻代表这个打车点的最大打车时刻,使用核密度分析得到打车需求整体分布特征;然后按照一定数值提取打车需求较大的区域,这些区域反映出时间上打车活跃的时间段以及地理上打车活跃的区域。2)在打车活跃区域中,分析打车点100米范围内是否存在五类POI,包含商场、公司、景点、住宅小区、学校。使用Apriori算法挖掘打车需求与POI的关联规则,然后统计打车点附近各类型POI的个数,分析各区域内打车需求与时间段、地理位置、工作日和周末的关系,以及分析产生时间段差异、地理位置差异和同一位置工作日与周末的活跃时间段变化的原因。