论文部分内容阅读
目前,基于浮动车GPS数据的异常检测已成为智能交通领域与数据挖掘领域的研究热点。异常检测的目标是能实时自动地检测出车辆在运行过程中出现的异常行为并及时报警,是实现交通监测智能化的关键步骤。然而,数据的不确定性、特征稀疏性以及数据量的庞大性,又为轨迹数据的挖掘方法及其质量结果带来巨大的影响。本文对出租车轨迹数据的异常行为挖掘进行了深入的研究,在对数据进行清洗和处理的基础上,充分利用轨迹的不同特征信息,从微观与宏观两个层次对轨迹异常与交通状况异常分别提出了切实可行的检测方法。论文主要工作如下:(1)针对西安市出租车轨迹数据特性,对数据进行清洗与载客轨迹提取处理。通过过滤、重复值删除等预处理工作,筛选清洗了频率异常、记录重复以及经纬度范围异常的数据,并对筛选后的数据基于车辆的状态值提取出了载客轨迹。然后结合已有的路网信息,基于位置、时间、方向等多元信息对GPS点采取了基于方位角与距离的多权值地图匹配方法,将轨迹准确地匹配到路网道路上。(2)设计了一种以道路信息为基础的路口序列轨迹表达方式,并采用基于贝叶斯原理的轨迹异常检测方法对该路口序列轨迹进行异常检测。该部分首先利用了已有的路口数据,通过将轨迹以唯一的路口序列的形式表达,有效地降低了数据复杂度。然后通过每个路口经过的轨迹数量,基于贝叶斯原理计算得到了每个路口单元的转移概率并构建了路口转移概率矩阵,并计算得到了待测路口序列轨迹的轨迹概率。最后将待测轨迹的概率值与设定阈值进行比较,判断轨迹为异常或正常。结果表明本文方法可有效地检测出轨迹的异常程度,准确判断出存在不按正常线路行驶、绕路等现象的异常与局部异常轨迹。(3)提出了一种以空间、时间、驾驶行为三种特征为基础的OD对间的常规路径模式构建方法,并基于该模式对路径变化异常引起的交通流异常提出检测策略。该部分首先把城市路网栅格化,将轨迹以网格序列的形式表达。然后从空间、时间、驾驶行为三个方面建立了轨迹异常标准,并对剔除了异常轨迹的数据集构建OD对之间的常规路径模式。最后通过对路径模式变化引起的交通流变化,建立了交通异常检测标准。实验采取对已发生的交通事件引起的交通异常进行检测验证,结果表明本文方法能有效地检测出交通异常。本文对提出的两个层面的异常检测方法利用真实的西安市出租车GPS数据进行了实验验证:对于近5000条轨迹(60000个数据点),在Inter Xeon 2.50 GHz CPU、16.0GB内存的实验环境中,能实现在3分钟内完成异常检测。相比该层次的传统算法,在效率和准确率方面均有明显的提升,可以满足交通管理系统对异常检测算法的需求。