论文部分内容阅读
随着国家“金盾工程”的持续建设,我国公安信息化取得了突破性进展,各种来源、类型的社会信息不断涌入公安业务系统,为警用信息带来了大数据的特征。警用大数据作为公安部门的核心数据资源,是开展公安业务工作不可或缺的数据支撑,实现其有机整合和深度挖掘分析成为当前公安信息化面临的新挑战。本文从数据驱动和应用驱动的角度出发,借助GIS特有的时空表达机制,开展对警用大数据整合理论和方法的研究,并针对公安领域的案事件数据进行时空聚类算法的探索,为警务人员发现犯罪模式,探索犯罪高发区域和时间,预防打击犯罪,合理调配警力资源提供科学依据。本文主要研究内容和成果包括以下几个方面:(1)时空驱动的警用大数据整合方法通过分析警用大数据体量巨大、多源异构、价值密度低、时空特征明显等特点,提出“以时空为框架,以地理实体为核心,以要素关系为线索”的思路,构建警用大数据时空集成框架和空间化模型。利用数据源获取、信息标签化、数据集成与入库、时空数据模型构建等步骤实现警用大数据整合。实验表明,该方法能够有效整合现有数据,为警用大数据的应用提供基础数据支撑。(2)案事件时空数据探索性分析案事件时空数据探索性分析是时空聚类的关键步骤,包括时空数据相关性和异质性分析。借助空间全局相关性指标Moran’s Ⅰ指数、时间自相关函数(ACF)、时空自相关性指标(STI)对案事件时空相关性进行探索;利用散点图、趋势线法等方法对案事件时空异质性进行研究。实验表明,案事件时空数据具有较强的时空相关性和平稳性趋势,从而为时空聚类算法的探索提供了可行性依据。(3)多条件约束的案事件时空聚类算法以时空聚类领域两类典型算法(ST-DBSCAN和STSNN)为基础,通过确定案事件最佳时间窗口、空间范围等聚类因子构建案事件时空邻近域和时空共享域,探索不同条件(时间、专题属性)约束下的案事件时空聚类算法。实验表明,ST-DBSCAN算法具有识别不同形状案事件时空簇、参数选择简单、对噪声不敏感等优点,更适用于案事件类型丰富、时间尺度较大的案事件数据;STSNN算法具有识别不同形状、不同密度案事件时空簇的优点,对于探测单一案事件要素且时间尺度较小数据的时空簇更为有效。