论文部分内容阅读
随着军事训练信息化的不断推进,实现客观评估、公正裁决是实兵对抗演习评估系统亟须解决的难题,而这需要以高质量的数据为基础。通过对评估系统数据分析发现,完全重复数据、评估信息的错误数据以及不完整数据是影响系统数据质量的主要因素,由此容易造成评估不客观、裁决不公正、态势判断不准确等问题,降低了评估系统的可信度。为了提高数据质量,促进军事训练水平的进一步提高,本文针对这三类数据的清理进行研究:1.提出了基于特征值的完全重复数据的检测算法。针对经典重复数据检测算法的时间复杂度高,难以满足实兵对抗演习评估系统实时性要求的问题,本文以“散列+匹配”为研究思路,提出了基于特征值的完全重复数据检测算法。该算法首先利用提取规则将待检测数据组成数据块,然后根据特征值生成函数计算出数据块的特征值,最后对特征值相同的记录进行匹配检测。同时,对确定性字段提取规则、特征值生成函数和冲突处理等算法要素进行了分析。理论分析和实验结果表明,与经典检测算法相比,该算法以有限的内存空间增加和记忆率下降为条件,显著的提高了重复数据检测效率。2.提出了基于孤立点的评估信息错误数据检测算法与基于键盘距离的启发式错误值纠正算法。首先,针对目前基于规则的错误数据检测算法难以满足错误数据检测实时性要求的问题,将规则划分为单值规则和多值规则,并结合错误数据的孤立性特征,提出了基于孤立点的错误数据检测算法;其次,为减少有用信息的流失,分析了评估信息错误数据的产生原因,提出了基于键盘距离的启发式错误值纠正算法。理论分析和实验结果表明,与原有算法比较,该检测算法和纠正算法分别提高了错误数据检测的实时性和数据利用率,具有针对性强、误差小的特点。3.改进了用于评估信息不完整数据估计的K-NN(K-Nearest Neighbor)算法。首先,针对K-NN算法受数据规模影响的问题,通过对搜索空间的限制,提高了K-NN算法的实时性;其次,针对K-NN算法存在少量估计值误差大的问题,将军事评估专家经验总结转化为模糊规则,与K-NN算法相结合,有效规避了误差大的估计值,提高了K-NN算法的估计精度。理论分析和实验结果表明,与原有算法比较,该算法针对性强,提高了实时性,减小了估计误差。在实兵对抗演习评估系统中的应用表明,本文研究算法提高了数据清理的实时性,改善了系统数据质量,为客观评估和公正裁决奠定了基础。