论文部分内容阅读
位置获取技术的发展导致时空数据的大量产生,同时对于这些数据信息的共享和研究在近几年越来越受重视。其中,图片共享成为最流行的Web服务之一,很多图片共享网站提供带有标签或地理标记的照片,使得图片组织更为便捷。人们通过拍照记录那些吸引他们的事物,形成带有标签或地理标记的照片,这些图片可提供包括用户的位置、处于特定位置的时间等丰富的信息。本文基于图片信息所形成的用户访问路线,挖掘用户的兴趣偏好。同时,将大多数人的路线作为参考,挖掘适合用户的个性化路径。为了描述用户的兴趣偏好,本文引入了TF-IDF算法,将单个用户的路线信息与多个用户的路线信息进行统计对比,从而计算出用户对各兴趣点类别的兴趣度。在此基础上,基于所提取的兴趣偏好,结合路线的频繁度,定义相应的评价函数,挖掘满足用户偏好的路线。并基于已有路网,挖掘出路线中相邻兴趣点间的最短路径,向用户进行推荐。本文主要贡献如下:首先,引入TF-IDF算法对用户的兴趣度进行提取量化。以路线中的兴趣点所属类别代替兴趣点描述路线,并将兴趣点类别对于用户的贡献度作为用户对该类别的兴趣度。其次,针对路线存储问题,提出了以路线段为单位的索引结构,降低了空间消耗,提高了路线查询效率。再次,针对路线的选择问题,提出了基于用户兴趣度的评价函数。该评价函数既考虑了用户对于兴趣点的偏好程度,又考虑了路线的频繁度,采用此评价函数能够挖掘出满足用户兴趣偏好的路线。最后,针对带有时间限制的路线推荐问题,提出了动态路线递归算法。在对候选路线进行剪枝的基础上,根据路线评价函数进行动态路线选择。并采用改进的A*算法对路线中的相邻兴趣点进行最短路径挖掘,获得最佳路径。通过理论分析和实验评估,验证了本文提出的基于用户偏好的个性化路径挖掘方法的有效性。