基于出租车GPS数据的出行行为研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:sisi200713
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
出行行为的研究一直是交通研究中的重点内容。近年来,随着信息技术的发展和“大数据”时代的到来,出行行为数据的采集更加便捷,数据内容更加丰富准确,数据体量也更加庞大,“交通大数据”孕育而生。面对如此庞大复杂的数据,传统的出行行为分析方法显得难以适应,出行数据中所蕴藏的丰富信息难以被有效利用。另外,近几年机器学习技术得到了快速发展,在许多领域内都取得了成功应用。如何利用机器学习中的技术方法来分析研究交通出行行为是当前“交通大数据”发展的重点内容。因此,本研究着重关注如何利用机器学习技术来分析研究交通出行行为中的特征和规律。论文首先介绍了本次研究中所用的北京市出租车GPS数据集来源、数据内容以及针对原始数据集的数据整理和数据清洗工作,接着分析了北京市出租车系统的总体运行特征,之后从出租车出行行为的宏观统计规律角度出发,分别针对出租车出行行为中的出行距离、出行时间和出行时间间隔等时空特征进行了统计分析。结果表明,与现有的一些研究结论相似,出租车出行行为的统计规律服从幂律分布,进而验证了出行行为的幂律分布特性。接着,为了更加精确地研究出租车出行行为中的微观模式特征,本研究引入了自然语言处理中常用的LDA主题模型。通过出租车GPS出行数据与文本数据之间的类比,说明了主题模型在本次研究中的适用性。经过适当的离散化处理,论文构造了“出行时间+出行距离+行程时间”形式的“词语”,并应用LDA主题模型对北京市出租车GPS数据进行了分析研究。结果表明,主题模型不仅能够通过主题-词语条件概率分布有效地给出隐藏在GPS数据中的微观出行模式特征,还能够通过文档-主题概率分布给出每天各出行模式的分布规律,进而发现出行行为中的周期性特征。论文还从文档-主题概率分布角度出发,针对出租车GPS出行数据中的周期性规律存在的可能原因做出了解释和说明。最后,针对出行行为中的出行预测问题,论文基于北京市交通小区的划分、长短时记忆神经网络模型和编码-解码神经网络模型,分别构建了针对单个交通小区和多个交通小区的出行预测模型。论文将前20天出行数据作为训练集,后2天出行数据作为测试集。通过与其他常用交通预测模型在测试数据集上预测结果的对比,说明了基于神经网络所构建的出行预测模型的可靠性和优越性。另外,通过比较不同时间间隔长度下模型的预测效果,得到了各情景下的最优时间间隔长度。
其他文献
高压输电线路线路长、沿线地理环境复杂,经常穿越山河湖泊与密林,冬季出现的覆冰对线路有巨大的威胁。传统的线路除冰方法主要有机械除冰法、热力融冰法和人工除冰法等。传统的除冰方法中人工除冰存在除冰效率低,安全性差的缺点;热力融冰存在能耗大,除冰不能适用于地线的局限。针对现有除冰机器人除冰缺乏主动性、不同覆冰除冰适应性、续航时间短等问题,本文对110k V高压输电线路除冰机器人控制系统关键技术进行了研究,
随着绿色出行的理念被大力倡导,有轨电车已成为大中城市人们日常出行广泛运用的交通工具。其中,储能式有轨电车的发展对节能减排,提高能源利用率及城市轨道交通发展具有重要意义。混合动力系统的能量管理策略是储能式有轨电车性能的关键,其核心是对动力系统进行协调控制,对动力源之间的功率进行分配。在满足整车动力需求的前提下,能量管理策略的优劣将直接影响整车的能量效率。但是目前已有的能量管理策略在列车工况及驾驶员驾
当今世界正面临前所未有之大变局,我国经济发展正处于战略机遇期,发展的外部环境和内部条件也发生着深刻的变化,尤其是2020年新冠疫情的爆发,更是加剧了经济发展的不确定性。对外而言,国际环境更加复杂,不稳定性和不确定性明显增加;对内来说,我国经济发展具有多方面的优势和条件,但也面临着结构性、体制性、周期性等问题相互交织所带来的困难和挑战。国有企业在我国经济发展过程中占据着举足轻重的地位,随着我国经济的
随着铁路信息化建设不断深入,各类生产办公信息系统相继投入到铁路运输生产中,导致铁路企业数据中心机房内服务器等设备数量急剧增加,使得数据中心运维困难重重。传统数据中心将不同应用系统分别安装在单独的物理服务器上保证各应用系统的安全稳定运行,应用系统硬件之间彼此孤立,无法实现硬件资源共享。随着数据中心硬件设备的不断增加,导致机房供电系统、制冷系统运行负荷不断加重,空间急剧减少。按照数据中心目前的发展趋势
随着三维激光扫描技术的逐步发展,大规模地形点云的获取更加便捷,扫描速度更快,扫描仪分辨率不断提高。在地表形变(如滑坡监测、地貌形变),需要比较不同时期的点云;还有地基Lidar不同站获取的地形点云同样也需要拼接。对于地形点云的匹配,目前应用广泛的是ICP算法,国内外学者对ICP算法进行了大量的改进研究,但它们的效率和精度尚不完全满足要求,或需要额外的辅助数据,或者需要前置的预处理等。因而需要对于高
预算管理是当代企业管理一项重要的管理工具,是一种全方位、全过程的科学管理体系,涉及企业经济活动中的方方面面,是企业实现战略目标的重要方法。通过实行预算管理,可以帮助企业提升整体的管理水平,合理配置资源,规范企业内部管理,提高盈利能力,确保企业战略目标的实现。预算管理最早起源于英国,在美国得到充分运用和发展。我国的预算管理起步较晚,在历经了市场无数次的实践验证后得到初步发展,但大部分企业预算管理的运
目标跟踪技术是计算机视觉领域的重要研究内容,在视频监控、人机交互、军事侦察、精确打击、智能交通、增强现实以及医疗诊断等领域都有着广泛的应用。近年来,由于相关滤波跟
网上拍卖作为电子商务的一种重要实现形式,正在日益受到商家和消费者的关注和喜爱。作为一种以价格竞争为中心的资源配置方式,当前拍卖已经成为互联网上最常见的动态定价方法
创业的经济增长效应历来备受关注。目前,学术界关于创业经济增长效应的研究主要集中在两个方面,一是创业与经济增长的关系研究,二是创业影响经济增长的途径研究。在创业与经
影视字幕作为当代影视艺术的关键构成要素,是镜头画面构成与信息表达的重要场景元素。字幕的字体设计不单单与影视制作技术水平相关联,更融合了视觉传达设计、审美理念于一体。探索如何最大限度地发挥好字幕功能,能够使影视作品内容与形式达到完美统一。面对数字媒体时代下数字技术的发展、大众传播的变化以及网络通信技术应用的普及,静态的影视字幕字体设计会存在形式传统、无法充分利用多维时空特性等局限。人们越来越希望看到