基于UGC的多时空尺度旅游地热度及共现关系计算方法

来源 :河北师范大学 | 被引量 : 6次 | 上传用户:gracestoney
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在社交网络快速发展的今天,用户生成内容(UGC)已经成为大众传播信息的重要源头,垂直型的UGC旅游网站和综合型旅游网站的攻略频道为旅游者提供了一个能够传播和分享个人游览经历的平台,在分享和传播的过程中就产生了大量带有丰富时空属性的旅游地数据,为地理学者研究多时空旅游地理问题提供了数据支撑。本文以长江三峡为案例区,选取携程网游记数据和新浪位置微博数据为数据来源,在研究组前期工作的基础上,丰富和完善了旅游地热度和共现关系分析的计算方法。文本表征热度计算使用地名权重分配方法所得结果表示,微博表征热度计算方法创新的提出了基于位置微博文本内容与所发微博位置之间的耦合程度计算位置微博的分布密度,并结合文本词频最终计算出微博表征热度。同时将文本表征热度和微博表征热度结合计算出了旅游地的综合热度来反映旅游地热度空间结构的综合特征。文中文本共现关系计算是以共现矩阵形式体现,在将其转置成三元组形式表达。微博共现关系计算方法有别于之前研究中单纯的文本关键词共现的方法,创新性的使用了地名与位置关系相结合,从而反映出位置微博基于景点的共现网络关系。利用不同UGC数据的热度和共现计算方法,从不同时空尺度对长江三峡及沿江景区的旅游地内景观的热度和景观之间的共现关系进行了量化计算和可视化表达。热度分析结果表明:1)基于游记文本和位置微博的长江三峡景点热度分布曲线均呈长尾分布特征,在空间分布上具有明显的冷热现象。2)高热度景点在空间上分布“景区间分散景区内集中”的特征。3)热度的空间分布具有核心引导和集聚现象,具体表现在三个核心,两个景点集聚区。4)不同时间尺度旅游地热度的分布符合人们生活作息规律,其在空间上的分布随时间稍有变化。共现关系分析结果表明:1)高共现强度的景点之间形成高关联层级的网络。2)景区内部景点共现关系网络在不同景区间分布极不均衡,景区内共现关系网络越复杂,所包含的关联层级就越多。3)旅游地的共现关系网络具有明显的分层现象,关联层级越高,其关联景点组数量就越少。研究结果表明,基于UGC的多时空尺度旅游地热度和共现关系的计算方法能够解决旅游地理及相关学科对包含语义文本及时空属性的数据进行挖掘和分析的问题。其挖掘分析结果证明研究数据中蕴含的时空信息对于旅游地的认知空间及游客行为的时空变化研究具有重要意义。
其他文献
实体关系提取是信息抽取领域的重要技术之一,它旨在以三元组的形式抽取句子中已标注的实体对之间的关系,有助于后续构建知识图谱等任务。同时,实体关系提取在篇章理解和机器
随着社会的快速发展与不断进步,儿童的学前教育越来越受到人们的重视,而儿童学前教育质量的优劣在很大程度上取决于幼儿教师专业水平的高低与专业成长的质量。幼儿教师作为教育
优化内部治理结构、提升组织运行效能是建设中国特色现代大学制度的核心问题。通过对教育部直属75所高校的调查研究发现,我国高校属于典型的"以合为主、合分结合"的整合型治