论文部分内容阅读
随着智能手机上传感器可以越来越便利地收集用户位置信息,如何利用这些信息挖掘用户兴趣爱好、移动习惯已经成为了当前移动智能技术研究的热点,其中一个研究方向是根据用户历史轨迹预测用户下一位置。位置预测因其在许多领域的重要作用而备受关注,例如外卖、出租车服务、实时公交系统和广告张贴服务等。目前已经有许多课题在位置预测方面都取得了一定研究成果,但依然存在一些问题:从原始轨迹中提取停留点的效果欠佳;难以预测用户从未到过的位置;结合其他特征建模复杂;传统方法对长轨迹序列预测表现不佳;预测准确率偏低等问题。因此本文对此课题进一步研究,提出了两种改进方案去解决以上问题,提高模型预测准确率。论文对Markov模型进行改进,使用一种基于变阶Markov模型的位置预测改进方案,其核心是使用一种基于字典树的Markov模型-PPM。通过噪声点过滤、停留点提取、聚类、地点转换,将原始数据集转换为具体的地点序列。为了提高建模效果,本文将频繁轨迹树和PPM模型结合使用。根据每个用户的轨迹建立频繁轨迹树,根据用户位置频率用AP算法对用户进行聚类,将每类用户的位置序列放入PPM模型中进行训练。将用户当前轨迹带入到模型中,找到概率最大位置即为预测的最终结果。论文提出了一种基于LSTM模型的位置预测改进方案。考虑到用户的下一位置受多重因素影响,本文将位置序列、时间周期、天气状况因素用来进行特征建模。为使样本更加丰富,本文采用滑动窗口方式对轨迹进行分割。最终将准备好的特征数据放入LSTM模型中进行训练,并利用训练好的模型进行预测。经过实验验证,本文提出的两种改进预测模型与原有模型相比准确率均有所提升,并且变阶Markov预测模型在预测用户未到过的区域有较好表现,基于LSTM预测模型预测更适宜于反映时间规律、用户意图等信息。