论文部分内容阅读
在经济发展和信息科技日益发展的今天,对大数据的研究越来越多,这其中尤以空间数据的需求最为强烈,而这些空间数据中社交媒体地理数据有着重要的影响与作用。有很多学者对这些数据进行分析来得到想要的结果,在这些研究中,城市居民出行的时空行为特征和城市的功能区分布即热点区域的发现对城市的规划以及居民的需求发挥着巨大作用。由于微博的用户对整体居民用户具有代表性,本文通过网页爬取技术获取新浪微博签到数据,并结合其他数据对北京市的热点区域进行探究并对北京市居民时空行为特征进行研究,针对这些问题,具体研究内容分如下:(1)网络数据采集与预处理。通过聚焦网络爬虫对新浪微博的签到数据进行爬取,之后对爬取下来的数据进行处理,预处理包括对多余数据的剔除以及对兴趣点POI的重分类,然后通过对比北京市POI样本数据和微博签到数据在北京市的分布情况来验证我们获取到的数据的正确性。(2)基于核密度分析的北京市热点区域发现。首先通过北京市POI样本数据在北京市的分布图来对北京市城市功能区进行划分,之后通过基于核密度分析的空间分析方法来进行北京市热力发现,通过热力图展示,最后发现北京市工作办公区、商业消费区和居住空间区这三个功能区的热点区域。(3)基于空间聚类的北京市居民上下班与休闲的时空行为特征研究。在时间方面通过一天之内各个时间段的微博数进行分析,并结合城市功能区做进一步的了解,在空间方面,对北京市每个时段的数据进行可视化,通过城市热力图来发现北京市居民空间行为特征,最后总结居民出行与城市功能区分布之间的关系。