论文部分内容阅读
我国改革开放以来,政府强调的区域发展战略、提速城镇化建设工作进程、人口迁移等变化导致犯罪情况复杂,国内频发型犯罪案件(例如:抢劫盗窃、冲突纠纷、刑事损害等)整体呈现出“高发低破”的态势,给国家带来人力、财力、物力等多方面的不必要损失,严重影响社会正常秩序。频发型犯罪本身作为一种普遍的社会现象,在时空中的分布并不是随机的,而是在其发展过程中表现出一定的历史规律性。“日常活动理论”指出,犯罪活动总是与周围物理环境紧密联系在一起。并且,随着经济改革的日趋深入,公安部门累积了大量犯罪案件数据,可以用于支持犯罪预测的研究与应用。迄今为止,国内外研究学者已基于犯罪时空分布特征,提出了多种犯罪预测方法,较好地解决了传统人工犯罪分析预测方法难以系统地分析实时数据的不足。然而,这些犯罪预测方法仅通过在不同维度上计算离散案件点的间隔长度来进行统计分析,一定程度上忽略了犯罪特有的近重复属性;同时,研究学者们通常忽视犯罪数据在全局地理区域内分布的高度不均匀性,导致输入特征中“零犯罪”的占比极大,并且犯罪特征难以被识别和提取,使模型预测结果稀疏表现严重;另一方面,传统的深度学习算法在模型训练最初阶段,常采用先验知识确定其初始参数,直接影响网络结构的构建,使模型预测结果不稳定。为解决上述问题,本论文以美国芝加哥市4类频发案件类型(盗窃、殴打、袭击和刑事损害)作为研究对象,借鉴传染病研究中的时空聚集度计算方式,提出了一种基于改进的Knox算法与改进的QPSO优化DBN网络相结合的时空犯罪数据网格化预测模型。首先,本论文采用基于平均最邻近距离的Knox算法避免了对案件间自相关性分析不足的问题;然后,通过网格化地理信息管理方法及基于质心的K-means低密度时空簇欠采样法缓解了现存犯罪数据分布不均衡问题;最后采用基于粒子势阱长度变化率比重的改进QPSO算法提升了传统DBN网络模型预测的稳定性。本论文科学地选取了犯罪时空预测模型的初始参数,并在模型输入中附加地理特征,改善了模型对犯罪相关数据集的利用率,实现了对4类案件时空分布情况和犯罪近重复现象的分析。在上述成果基础上,本论文对预测结果进行了可视化展示,以期为警务决策的精确指挥及犯罪防控部署提供参考。本论文的研究内容和所取得的成果如下:(1)创新性地将传染病研究时空聚集度的Knox算法应用于犯罪领域,研究犯罪时空近重复性尺度,并针对标准Knox算法初始参数确定方法的模糊性问题,提出一种基于平均最邻近距离的Knox算法(本论文将其命名为Mnd-Knox算法),一方面创新性地采用有别于直接利用原始犯罪数据集进行预测的方法,克服了简单宏观预测导致数据利用不充分的问题;另一方面能够较好地拟合频发犯罪类型案件发展规律,充分考虑了邻近案件点比疏远案件点存在更为紧密的关系,使其在预测频发案件时具有更好的效果。(2)引入城市网格化管理思路,在犯罪点间的内部自相关性完整保留的前提下,将预处理后的犯罪数据点投放到三维时空交互网格结构中,结合核密度估计法统计单位网格中的时空数据信息,并采用基于质心的K-means低密度时空簇欠采样法,从技术层面平衡多数类样本和少数类样本的数量,解决了犯罪数据分布不均衡的问题。(3)通过融合犯罪相关环境特征、基于Mnd-Knox算法确定犯罪时空近重复性阈值、三维时空交互网格构建、基于质心的K-means低密度时空簇欠采样法和DBN-DNN网络设计这五个部分,建立了基于DBN-DNN网络的犯罪时空分布预测模型,有效地学习训练了跨时空域的犯罪案件分布特征,对犯罪时空分布情况进行了预测,并对该预测模型性能及其预测结果进行了全面性的评价分析。(4)提出了一种基于粒子势阱长度变化率比重的改进QPSO算法,并利用该算法优化DBN参数建立犯罪时空预测模型(本论文将其命名为基于L-QPSO-DBN网络的犯罪时空分布预测模型)。该模型对(3)中模型进一步进行了优化,避免了基于先验知识确定网络结构参数的随意性问题,提升了标准DBN-DNN模型的准确性及平稳性。(5)基于L-QPSO-DBN网络的犯罪时空分布预测结果,利用Python中的Plotly Express对犯罪预测结果进行热点地图可视化展示。该热点地图以网格为单位进行犯罪数量的划分及统计,并根据预测犯罪数量的大小进行防控等级划分,能够为警务日常巡防工作的部署提供依据。针对美国芝加哥市4类频发案件的实验结果表明,本论文所提出的基于Mnd-Knox算法与L-QPSO-DBN网络相结合的时空犯罪数据网格化预测模型,可以有效实现所研究区域的犯罪预测,经过数据特征优化提取的4类案件预测模型平均绝对误差值降低了88.56%,利用L-QPSO改进的DBN网络模型预测准确率标准差降低了45.17%,模型性能总体表现良好,能够达到预期目标,特别是用于分析自相关性显著的案件类型时,效果最佳。