论文部分内容阅读
随着全球信息技术浪潮和城市计算等概念的兴起,促使新兴大数据的潜在价值挖掘以及基于数据驱动的科学研究策略日益得到学界的普遍关注,已被应用至人类行为学、社会学、城市规划学等学科的现实问题发掘与决策支持之中。城市化的高速发展是当今时代的洪流,尤其是近些年发展中国家的城市化进程不断加快,导致了疾病传播、生态破坏、交通拥堵等城市问题层出不穷。因此,如何有效利用泛在位置信息、大数据挖掘和深度学习等新兴感知分析方法,并充分发挥地理信息科学多学科融合的优势,构建面向海量人群的城市活动分析模型、探究各类城市活动的时空分布模式成为实现复杂城市社会系统的动态监测与相关问题分析的关键技术手段。一方面,能够为社会人文科学的相关分析提供方法论支持,同时,还能为城市人口、交通、医疗、休旅等行业的发展现状与问题发现提供了科学的信息来源。目前,国内外已有部分学者开展了基于泛在位置数据的城市人群活动相关的研究。但是,由于受到数据源与分析技术的限制,这些研究多数以人口或人群密度分布估计为主。从时间尺度来看,以日为分析尺度居多;从空间尺度来看,以公里网或行政区划为单位的研究较多;从活动类型语义来看,多针对交通、家庭等特定空间场景的分析,尚未提出城市多类型活动分布的建模与分析方法。结合现有研究的不足,面对大数据的价值密度低以及人类行为的多样性和复杂性特征,本研究综合运用数据挖掘技术、行为分析技术、概率图学习技术以及空间分析技术,以城市人群活动时空格局分析为研究对象,系统的提出了人类活动建模、类型推断与分布估计模型的研究框架,实现了以人群活动为中心的城市建模及其应用模式探究,主要包括以下三方面内容:(1)系统地研究了城市内人类的多样性活动,解决了如何基于海量手机信令数据构建人类城市活动模型的问题。由于年龄、职业、性别等的差异,人们的城市活动丰富多彩,且根据研究目的、建模粒度等的不同,活动类型的划分也有所区别。本文结合居民问卷调查和人类城市行为的相关研究,提出了城市人类活动的主要分类。同时,面对高人口密度的城市巨系统,通过分析各类大数据在人类活动建模上的优劣,选择了具有一定时空精度、长时间观测以及高人口覆盖率的手机位置数据作为数据源,并结合手机位置数据的特征,综合运用Hadoop集群框架和基于速度的滤波等方法,构建并实现了人类城市活动链模型。(2)提出并实现了半监督式城市活动类型识别概率图神经网络模型和综合多维辅助的城市时空人群活动分布插值方法。针对当前统计关系学习模型在城市活动类型推断上面临复杂关系模式的后验分布难以收敛,以及关系模型势函数依赖手动构造导致对数据特征表达能力十分有限的问题,提出使用半监督式图马尔可夫网络模型来解决样本稀疏且图谱关系复杂的活动类型标注任务。此外,考虑到当前的人类活动分布估算大多未顾及活动语义的情形,本文充分利用多源大数据的优势,运用多源数据构建多维度辅助信息作为有效时空约束和权重系数,进而构建了城市活动时空分布格局的估算模型。(3)探究多时空尺度的活动格局构建技术以提升模型的健壮性,使其适应多样化现实应用场景的需求,同时,提出城市人群活动分布格局构建技术的应用范畴、应用模式,探索其在城市地理学、旅游地理学等学科研究领域中的应用价值。一方面,将城市人群活动类型推断方法运用到城市活力评价中,构建城市活力内涵的评估框架,包括对经济活力与社会活力的评估,进而探究城市活力的驱动因素和塑造策略。另一方面,将城市人群活动时空分布格局估算模型应用于城市休闲模式的分析中,探索城市人群在第三空间的活动状况,通过对不同时段活动空间模式、类型偏好的挖掘与对比分析,提出城市休闲空间的开发建议与未来规划意见,旨在促进城市的协调可持续发展。