实兵对抗演习评估系统中数据清理方法研究

被引量 : 2次 | 上传用户:gl5458
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着军事训练信息化的不断推进,实现客观评估、公正裁决是实兵对抗演习评估系统亟须解决的难题,而这需要以高质量的数据为基础。通过对评估系统数据分析发现,完全重复数据、评估信息的错误数据以及不完整数据是影响系统数据质量的主要因素,由此容易造成评估不客观、裁决不公正、态势判断不准确等问题,降低了评估系统的可信度。为了提高数据质量,促进军事训练水平的进一步提高,本文针对这三类数据的清理进行研究:1.提出了基于特征值的完全重复数据的检测算法。针对经典重复数据检测算法的时间复杂度高,难以满足实兵对抗演习评估系统实时性要求的问题,本文以“散列+匹配”为研究思路,提出了基于特征值的完全重复数据检测算法。该算法首先利用提取规则将待检测数据组成数据块,然后根据特征值生成函数计算出数据块的特征值,最后对特征值相同的记录进行匹配检测。同时,对确定性字段提取规则、特征值生成函数和冲突处理等算法要素进行了分析。理论分析和实验结果表明,与经典检测算法相比,该算法以有限的内存空间增加和记忆率下降为条件,显著的提高了重复数据检测效率。2.提出了基于孤立点的评估信息错误数据检测算法与基于键盘距离的启发式错误值纠正算法。首先,针对目前基于规则的错误数据检测算法难以满足错误数据检测实时性要求的问题,将规则划分为单值规则和多值规则,并结合错误数据的孤立性特征,提出了基于孤立点的错误数据检测算法;其次,为减少有用信息的流失,分析了评估信息错误数据的产生原因,提出了基于键盘距离的启发式错误值纠正算法。理论分析和实验结果表明,与原有算法比较,该检测算法和纠正算法分别提高了错误数据检测的实时性和数据利用率,具有针对性强、误差小的特点。3.改进了用于评估信息不完整数据估计的K-NN(K-Nearest Neighbor)算法。首先,针对K-NN算法受数据规模影响的问题,通过对搜索空间的限制,提高了K-NN算法的实时性;其次,针对K-NN算法存在少量估计值误差大的问题,将军事评估专家经验总结转化为模糊规则,与K-NN算法相结合,有效规避了误差大的估计值,提高了K-NN算法的估计精度。理论分析和实验结果表明,与原有算法比较,该算法针对性强,提高了实时性,减小了估计误差。在实兵对抗演习评估系统中的应用表明,本文研究算法提高了数据清理的实时性,改善了系统数据质量,为客观评估和公正裁决奠定了基础。
其他文献
以石墨尾矿,粉煤灰,煤矸石,垃圾焚烧灰等固体废料为主要原料研制陶瓷环保生态砖.讨论了固体废料加入量、颗粒级配及造孔剂等对陶瓷环保生态砖制备工艺及性能的影响.并制备出
随着现代科学技术的进步,人类社会正逐步走向信息化。计算机技术在各个行业领域得到广泛应用,各种各样的自动化管理应用系统在各种不同性质、不同类型、不同规模的领域中发挥
<正>数据收集的意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理,以达到决策的目的.在现今的"大数据时代"里,数据是一种重要的信息,统计概率所提供
头盔式消防用红外热像仪因携带方便、轻便高效,逐渐被消防部队所接受。本文围绕一款新型头盔式消防用红外热像仪的设计展开探讨。总结了头盔式热像仪的现状与不足,提出了总体
由Q/A(《问答》)的小说改编、以偏纪实性风格形式拍摄的《贫民窟的百万富翁》是一部反映印度现实社会的影片,它以《谁想成为百万富翁》这一电视栏目为"由头"做情节展示,独具
文章以构词能力最强的50个素形所承载的581个语素为对象,详细地阐述了这些语素的语法类别及构词能力,同时对语素的语法类别和构词能力之间的关系进行了较为深入的探索性研究
凡是审计就会有风险,对环境审计这门新兴学科尤其如此。审计人员如何识别、评估这种风险,最后针对评估结果进行有效控制,是环境审计的关键问题。环境审计为现代风险导向审计
人犯了罪,沦为服刑人员,从社会学角度来看是个体在社会化过程中的一种失败。虽然服刑人员所经历的社会化过程和社会上其他成员一样,但是,由于存在外部环境、教育层次、生活水
随着网络产业与电子商务的快速发展,网络已渗透到我们社会生活的各个领域。无论是学习、工作还是在我们的日常活动中,对网络的依赖性越来越强。在享受网络提供的便捷服务的同