论文部分内容阅读
古遗址在空间上的分布与其所处的自然环境以及人文环境有着密不可分的联系,这些环境变量的变化在一定程度上也影响着人类文明的发展。考古遗址预测模型建立是当前考古学界的一个新潮,借助于统计学和GIS空间分析工具建立遗址与各种环境变量的关系模型来预测为调查区域的遗址出现概率。旨在减少可能存在对遗址造成破坏的潜在因素,为考古发掘提供一定的科学依据。 Logistic回归模型是目前在遗址预测中应用最广的一个模型,主要由于其二项分类和多变量的分析功能,但是将Logistic回归建模方法应用于遗址分类预测中会出现欠拟合、精度低的问题。本文将对其进行最优化算法的改进,通过GIS空间分析方法进行提取研究区域的自然及人文环境变量,利用SPSS中的逐步回归分析法对其进行备选自变量的筛选,最终筛选出对建模有显著作用的自然及人文环境六个变量。借助于Python语言编写程序中的Numpy和Matplotlib模块,分别利用Logistic回归常用的梯度上升法和改进随机梯度上升法求解模型的最佳回归系数,建立以汾河流域为研究区域、龙山文化时期遗址点为研究对象的遗址预测模型,通过梯度上升法建立的预测模型其训练精度和预测精度分别为71.4%和68.8%,通过改进随机梯度上升法建立的模型其训练精度和预测精度分别为89.2%和85.3%。对其预测结果进行分析对比,实验结果表明改进随机梯度上升算法较梯度上升算法分类精度可以提高16.5%。最终对两个模型建立的预测模型进行Kvamme增益统计有效性验证,其G值分别为0.67和0.75,说明两模型均具有实际应用意义,而利用改进随机梯度上升法建立的Logistic回归的预测模型具有更高、更加显著的实际应用意义。