论文部分内容阅读
随着社会经济的快速发展,城市道路的拥堵问题日益凸显,给城市居民的出行生活带来了极大的困扰。作为智能交通管理系统的重要组成部分,交通状态判别技术可以准确地识别路段的交通状况,为交通参与者提供可靠的诱导信息,从而有效地缓解交通拥堵问题。目前我国大中城市的路网规模极其庞大,每时每刻都在产生着海量的交通数据,传统的单机方法已经无法对其进行有效的处理,因此,本文利用具有强大并行计算能力的Hadoop平台从海量交通数据中挖掘有用的信息来提高交通状态判别的精度。本文以广州市南沙自贸区智能交通管控平台项目为研究背景,对基于Hadoop的城市道路交通状态判别技术进行了深入的研究,主要包括以下几方面:1)详细地介绍了交通大数据,描述了交通数据的获取和预处理技术,阐述了数据挖掘的过程和方法,并具体地分析了Hadoop平台的组成体系。2)详细地分析了交通状态特征指标,选取了流量、速度、占有率这三个特征指标作为交通状态判别方法的输入数据。针对传统FCM算法随机挑选初始聚类中心和没有充分考虑数据对象不同属性贡献差异的缺点,本文采用K-means算法和特征权重的方法对传统FCM算法进行了改进,同时对改进的FCM算法进行了并行化设计,并在Hadoop平台上完成了对海量历史交通数据的聚类分析仿真实验,最后从误判率和加速比两个方面对改进FCM算法进行了评价对比。实验结果显示,改进的FCM算法性能最好。3)根据改进FCM算法得到的已标识状态的历史交通数据,本文采用随机森林算法对当前和未来的交通状态进行判别,首先对随机森林算法进行了并行化设计,同时在Hadoop平台上完成了随机森林算法对交通状态的分类预测仿真实验,并分析了算法的加速比,同时在Hadoop平台上将随机森林算法、Bayes和SVM这三种算法进行了判别准确率的对比,结果显示随机森林算法对交通状态判别的准确率最高,达到91.1%,最后对比分析了随机森林算法在单机和Hadoop平台上的运行时间。4)从框架设计和功能实现两个方面对交通云平台进行了详细的介绍,同时设计了基于Hadoop的交通状态判别系统的建立流程,并从实时路况的显示、未来交通状态的预测、历史交通状态的查询和交通状态的数据分析四个方面对基于Hadoop的交通状态判别技术进行了实际应用的功能展示。