论文部分内容阅读
近年来,我国自然灾害和偶然突发事件越发频繁,给国家和人民带来了巨大的损失。人作为灾害发生后最重要的承载体,当灾害发生后如何快速获取受灾人口分布、准确评估受灾人口数量是减少人员伤亡,及时开展抢险救援的首要任务,也是合理分配救援物资、救灾人员的前提。然而当前我国应急测绘系统建设还处于初级阶段,主要侧重于基础数据的获取如灾区影像、三维模型等,凭借灾区基础数据能够判断受灾范围和受灾程度,但是对灾区内的人口分布却不能及时有效的获取。为了解决应急测绘不能有效评估人口受灾问题,本文通过阅读国内外文献发现,当前研究人口时空分布模型主要有两类:基于格网数据的人口空间化和基于时空大数据的人口空间分布。通常情况下,前者以行政界线为单位统计得到的人口数据为基础,利用某种算法或数学模型将人口分散到格网中,这类方法的缺点在于人口统计数据时空分辨率过大,不能反映人口实时分布。基于时空大数据的人口空间分布方法虽然能够实时的反映人口分布,但时空大数据通常是由一系列含有坐标信息的离散型点组成,不利于研究连续性人口分布规律。因此本文在两种方法的基础上,提出了基于格网化手机信令数据的人口动态分布。论文首先利用分布式计算框架对手机信令数据进行清洗,清洗的内容主要涉及到数据的缺失、重复、错误,由于清洗后的数据具有“一人多机”现象,需要对重复用户数据进行二次清洗,清洗方法采用ST-DBSCAN聚类算法提取用户出行轨迹,当多条轨迹重合时,只保留一条轨迹数据,删除重复数据,此时手机信令数据才能真实的代表用户信息,然后将清洗后的手机信令数据叠加到以研究区域为边界的格网中,并利用时间序列预测模型-差分自回归移动平均模型(ARIMA)对格网数据进行预测,当时间序列数据不符合ARIMA模型随机性检验时,本文采用移动平均法进行模型预测。预测误差评价采用绝对误差法,并统计不同范围误差频率。最后将模型集成到应急测绘系统中,模型运行结果以网页的形式动态展示。利用本文研究方法,可以在第一时间内获取较为准确的受灾人群分布以及人口数量统计,目前,该方法已经应集成到应急测绘系统中。