论文部分内容阅读
随着我军数据建设的逐步发展,我军数据建设的主体已经从基础属性数据延伸到了动态情况数据、决策支持数据等内容,数据种类和规模增长非常迅速,形成了不同领域的海量动态数据。然而,受限于之前技术的发展水平,很多历史积累数据和实时采集数据并未被有效利用,基本上只是进行了简单的存储和宏观的统计分析,海量动态数据中隐含的重要知识和规律尚未被有效挖掘。为此,本文针对战场环境数据和作战行动数据的主要特性,基于数据分析领域最新的技术和成果,研究动态战场环境对军事行动影响在线分析挖掘的关键技术。总体来讲,本文的主要工作如下:1、提出动态战场环境对军事行动影响在线分析框架。总结归纳战场环境对军事行动影响分析相关研究内容,建立了动态战场环境对军事行动影响在线分析框架,梳理出时间序列聚类、动态数据流分类、影响因子挖掘、模糊影响图评估等相关关键技术进行研究。2、提出基于峰值区间的时间序列聚类算法。提出了一种基于峰值区间的时间序列数据层次聚类算法,所提方法能够有效利用时间序列数据集内在的峰值区间信息并提高聚类性能。在合成数据集和真实数据集上进行了实验,实验结果表明所提算法是有效的,与基于欧式距离和动态时间弯曲的方法相比,具有更高的精度。3、提出针对概念漂移数据流的在线主动学习集成框架。提出了一种基于混合标记策略的漂移数据流在线主动学习集成框架,集成分类器由一个长期的稳定分类器和多个动态分类器组成,对渐进漂移类型和突变漂移类型数据流均能进行有效处理;主动学习采用动态标记预算,支持按需请求标签,使用了不确定度策略和随机策略相结合的混合策略标记实例。在合成数据集和真实数据集上的实验结果表明,所提方法能在不增加标记总成本的情况下获得良好的预测准确率。4、提出基于对比模式的分类影响因子挖掘方法。首先,将两种频繁闭项集挖掘算法扩展到Hadoop平台以挖掘高速数据流的闭合频繁模式,分别采用了压缩前缀树结构和垂直数据格式,实验结果表明采用垂直数据格式能提高处理速度。进一步,通过挖掘高质量的对比模式等价类,确定不同数据类别的主要影响因子,从理论上分析了挖掘对比模式等价类来确定分类影响因子的合理性和可行性,并通过实例解释了挖掘过程,实验结果表明所提方法对挖掘分类影响因子是有效的。5、提出基于模糊影响图的战场环境对军事行动效能影响分析方法。针对战场环境对军事行动效能影响的定性定量相结合的综合分析需求,引入模糊影响图评估方法,并进行适当扩展,结合一次“反恐”行动实例,给出了基于模糊影响图分析战场环境对军事行动效能影响的分析过程,说明了模糊影响图方法在军事行动效能评估领域的有效性。总之,本文对动态战场环境对军事行动影响分析进行研究,建立了动态战场环境对军事行动影响在线分析框架,针对时间序列聚类、动态数据流分类、影响因子挖掘、模糊影响图评估等相关关键技术进行研究,研究成果是对动态战场环境对军事行动影响分析技术的探索,具有很现实的军事价值,对提高复杂战场环境下军事行动效能有一定的理论意义和实践意义。