论文部分内容阅读
随着我国城市规模的扩张以及城市功能的地理分工,居民出行模式在时间和空间上都变得更加复杂、多样,对城市交通管理和客流预测带来了巨大挑战。交通出行需求本质是满足人的日常活动需求。深入挖掘城市个体交通活动本源机理、揭示居民日常出行时空规律和活动特征,能够为构建优质、高效的城市交通管理系统提供重要支撑,意义深远。传统居民出行信息主要依靠入户问卷、电话访问等方式获取,长期以来,在数据采集质量和效率方面存在诸多缺陷,如主观回忆数据失真、调查组织复杂繁琐、数据更新困难等,越来越难以支撑现代化交通规划方案对精细居民出行数据的需求。随着大数据和互联网时代的到来,基于手机传感器数据的个体出行轨迹追踪与活动特征分析技术出现了良好发展契机。手机传感器调查技术借助手机GPS、加速度计、陀螺仪、WiFi等多种感知单元,能够实时获取更为丰富的时间、空间和出行状态信息来描绘个体出行过程,数据更加客观、精确,已成为当前交通信息采集领域的前沿热点。本文以手机传感器数据的采集、分析和挖掘技术研究为基础,探索基于手机传感器数据的个体交通出行链信息提取新方法。主要研究要点和成果如下:1)详细分析了智能手机传感器模块和数据采集功能,开发了一款手机传感器数据采集APP软件用于数据采集。软件连通手机GPS、加速度计、陀螺仪、WiFi、无线通信等模块端口,能够实时采集个体出行时空轨迹(出行日期、时间、经纬度、方向角等)和出行状态数据(速度、三维加速度、三维角速度、定位精度、服务基站等)。后台数据库管理系统能够高效、安全保障数据存储和管理。2)研究了出行环境、技术条件等因素对数据采集质量的影响,设计试验完成数据采集工作。不同数据采样环境下个体出行特征数据将发生显著变化,针对我国城市人口和交通环境特征,本论文详细设计了多种环境制约要素组合下数据采集试验,数据采样频率包含1s、2s、3s、4s、5s、10s,20s、30s、60s、120s;交通方式包含由步行、自行车、公交车、小汽车、地铁等常见出行方式的10种组合模式;出行目的包含上班、上学、访友、就医、购物等8类通勤与非通勤出行;出行时间考虑了节假日、双休日、工作日、早高峰时间、晚高峰时间和平峰时间6类;交通状态包含了畅通、一般拥堵和严重拥堵3类。3)分析了手机传感器数据采样内容和采样格式,借助地图匹配技术、三维可视化技术,探索了不同环境、技术要素组合制约条件下手机传感器数据波动特征和变化规律,研究了多源手机传感器数据对个体出行时空特征的表达水平和表达方法;提炼了不同出行环境下模型构建指标,提升算法可移植性和兼容性。研究结果表明,个体出行时空轨迹点密度和瞬时速度指标分别适用于出行端点和交通方式换乘点的识别,每分钟平均速度、最大速度、速度波动方差以及加速度波动方差则对不同环境下交通方式识别起到良好效果。4)提出了个体出行链参数精细化提取方法总体框架、分阶段处理流程以及各阶段实现要点。按照从整体到局部思路可细分为3步:首先,构建了时空聚类算法、驻留点状态判定算法、误差优化算法用于出行端点识别,实现将一天或多天出行数据按照停留特征进行切割,各出行子段只包含一种出行目的(即识别出行OD);其次,引入小波分析模极大值算法进行交通方式换乘点识别,实现将出行轨迹进一步切分为单一交通方式出行段(即交通方式换乘点识别);最后,针对单一出行方式轨迹,探索了数据挖掘算法(如:神经网络、支持向量机、贝叶斯网络、随机森林)用于交通方式识别的可行性,针对公交车和小汽车识别困难的问题,进一步提出GIS站点匹配算法实现优化。研究结果表明,出行端点识别准确率达到了86%,停留时间识别误差控制在150s之内;交通方式换乘点识别率达95%,换乘时间平均误差小于1min;交通方式识别准确率均则达到90%以上。5)运用10折交叉验证理论标定了模型参数,基于实验工程学的思想,结合实例详细研究了个体出行链参数提取模型构建过程与结果反馈优化方法;开展技术应用效果实证评估和敏感性分析工作,研究了不同采样频率、交通状态、模型算法条件下交通方式识别准确率。研究发现,数据采样频率最佳值为5s,最大不宜超过20s;算法选择显著影响交通方式识别效果,机器学习算法+GIS地图匹配算法效果明显要优于单一机器学习算法,尤其对公交车和小汽车,模式识别准确率提升近20%;交通状态对交通方式识别有一定的影响,但GIS地图匹配算法能够降低交通拥堵造成的识别误差。