论文部分内容阅读
互联网位置数据已经作为当前用来感知人类社群活动规律、分析地理国情和构建智慧城市的重要信息资源而广受关注。互联网位置数据的获取为互联网位置数据的分析挖掘提供基本的数据支撑,互联网位置数据的模型和基于模型的集成与管理为互联网位置数据的共享应用奠定技术基础和提供平台保障。目前,互联网位置数据获取在获取效率和数据完整性上还有较大提升空间,关于互联网位置数据集成管理的研究也还不够深入。本文面向互联网位置数据整合与共享的应用需求,针对互联网位置数据的获取与集成管理方法进行研究,研究内容主要包括以下几个方面:1.开展与本文相关的基础理论研究,分析研究现状,建立研究框架。研究互联网位置数据的基本理论,分析互联网位置数据获取、建模与管理等方面的研究现状和存在的问题,确定本文的研究内容和研究思路,并以此为基础建立互联网位置数据获取与集成管理的研究框架,明确各项研究任务。2.互联网位置数据获取方法研究及实验分析。通过对目前常用的数据获取方法的研究和对比分析,针对文本数据,提出基于多策略的互联网位置文本数据获取方法;针对图片数据,提出基于人口密度的动态格网划分的互联网位置图片数据获取方法,旨在提升互联网位置数据获取的效率和完整性。并对两种方法的基本原理、基本流程和主要特点进行研究,最后分别进行软件研制和实验分析。3.互联网位置数据的集成管理方法研究。面向互联网位置数据整合与共享的应用需求,对获取到的互联网位置数据进行结构化和去除冗余的预处理,然后完成互联网位置数据模型的构建,并基于模型实现四种数据检索方法,最后在此基础上进行互联网位置数据管理架构的设计与研究。4.实验平台研制与功能实现。基于Ubuntu操作系统,利用PostgreSQL、Nginx、GeoDjango等系列开源软件和技术,对本文提出的互联网位置数据管理架构进行技术实现,研制面向数据整合与共享任务的互联网位置数据管理平台,并实现了数据检索与下载等核心功能,验证了本文提出的数据集成管理方法的科学性和有效性。