移动社交网络中用户行为分析和位置预测研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:xcn1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球定位系统(Global Positioning System,GPS)设备的普及和基于位置的移动社交网络(Location-based social networks,LBSNs)的迅猛发展,海量的轨迹数据正在我们的日常生活中源源不断地积累。因为这类数据包含了人群移动的时空和语义等特征,所以这类数据对分析用户行为模式和预测用户下一个位置都至关重要。通过对近年来相关文献的调研,虽然已经有一些基于时空特征对用户轨迹进行预测的相关研究,但在缺乏语义特征的轨迹数据位置预测问题中以往的研究忽视了用户在当前位置当前时间的语义信息,但该信息对理解用户行为和位置预测是至关重要的,因此本文在数据集中缺乏了地点语义的情况下分析和提取了位置语义并结合语义强化和时空特征提出了一种有效的用户位置预测算法,同时还改进了一种城市“热区”挖掘算法,并构建了一个挖掘移动社交网络大数据的原型系统。首先,通过研究移动社交网络中的多维特征,提出了一种停留点语义化算法和城市“热区”挖掘算法。其中,停留点语义化提升了用户位置预测的准确率,加速了模型训练时的收敛速度;根据轮廓系数对本文的“热区”挖掘算法进行了验证,其聚类效果优于基准模型。在相同数据集下,对比过去研究中同类算法的结果,本文的城市“热区”挖掘算法挖掘出了更细粒度的“热区”,从而提升了本文位置预测的范围精度。其次,本文分析了移动社交网络中的用户行为,构建了一个语义强化和时空关注网络SSTAN(An Semantic reinforcement and Spatial-Temporal Attention Networks),用于融合移动社交网络中用户的多维特征。结合该SSTAN网络的融合特征,本文提出了一种基于语义强化和时空特征关注机制的用户位置预测算法GLP-SSTAN(Geographical Location Prediction algorithm based on Semantic reinforcement and Spatial-Temporal Attention Network)用于对移动社交网络中的用户位置进行预测。接着,基于停留点提取算法、城市“热区”挖掘算法、SSTAN网络和GLP-SSTAN算法,本文构建了一个挖掘移动社交网络大数据中用户行为和位置预测的原型系统(简称为NUPT ST-Data Miner)。原型系统主要功能包括:停留点的可视化、城市“热区”的可视化、用户位置预测的可视化和停留点周围推荐服务。该原型系统对比过去相关文献中的基准模型,拥有结果可视化直观、用户交互性良好和功能模块可延展的三大优势。最后,本文使用微软亚洲研究院提供的真实数据集进行了验证,实验结果表明本文的城市“热区”挖掘算法对比其他算法有更好的聚类效果(轮廓系数更优);GLP-SSTAN算法在准确率、召回率、位置预测精度和模型普适性方面都优于基准模型。
其他文献
随着市场对产品个性化需求的日益增加,不仅要求企业具备快速研发、设计新产品的能力,而且用户对袋式除尘器产品定制日益强烈的市场需求,本文提出了用于产品研发设计的数字化测试
农业科技成果的转化应用效果是农业科技创新的试金石。从科学试验到生产应用,农业成果经历着一个系统复杂的转化过程,而实现这一过程的必要手段就是农业技术推广。研究农业技术推广,探寻更为先进科学的推广体系,实现传统农业向现代农业的跨进,这对乡村振兴战略的实施有着非常重要的意义。本文以巴彦淖尔市的农业技术推广为研究对象,以二元经济结构、科技成果转化等理论为研究基础,了解掌握巴彦淖尔市农业技术推广现状,分析存
针对三点支撑机床的最优支撑位置设计问题,提出了一种三点支撑床身垫铁位置设计方法.以某型号数控外圆磨床的T形床身为研究对象,对三点支撑床身垫铁位置优化方法进行了详细说
钢材是当今应用最广、产量最大的金属材料,钢材又因为其良好的物理性能和机械性能而广泛应用于各类建筑工程。随着社会不断发展,在工业建筑和民用建筑中,钢筋混凝土工程所占的比
十八届五中全会指出,"把统筹金融业综合统计列为金融监管改革的重要内容之一"。国际金融危机后,主要发达国家和经济体积极弥补统计信息缺口,加强金融业综合统计体系构建,改进
职业教育是国民教育体系和人力资源开发的重要组成部分,肩负着培养多样化人才、传承技术技能、促进就业创业的重要职责。党的十九大报告明确提出,要“完善职业教育和培训体系,深
利用天然的或经过遗传改良的微生物进行植物病虫害的防治是目前国际上较为活跃的研究领域,尤其是利用植物本身根系和叶围正常存在的微生物进行外源抗病虫害基因的转化,可使外源
目前对于已敷设的电力电缆的局部放电检测,单一的采用高频电流法或超高频法都易受到现场干扰信号的影响。因此,为提高检测的有效性和准确度,文中采用高频电流法和超高频法联
本论文以湘中地区21个典型土壤剖面为研究对象,依据《中国土壤系统分类检索》(第三版)和《中国土壤系统分类土族和土系划分标准》,通过土壤野外调查、剖面形态特征描述和土壤理
本文在极值理论的基础上,推导出基于极值理论的风险度量模型、非寿险再保险定价模型和非寿险总准备金的计量模型,并且详细阐述了这三种模型如何应用于非寿险。该文章也是一篇