论文部分内容阅读
数据挖掘作为知识发现过程中的重要步骤,是从大型数据库及数据仓库中提取未知的、有价值的和可操作性的关系、模式和趋势用于决策支持的过程。我国目前在防洪领域存在着大量水文数据、水库调度数据和预报成果数据,如何充分有效地利用各种智能算法对这些数据进行分析与挖掘,以形成相应的水文预报、水库调度模型进行准确的预报、合理的调度,是一项具有重要的意义的工作。本文结合数据挖掘中的聚类、分类、关联分析等方法特点,着重探讨了在水文预报、水库调度、组合预报中的应用。同时为了使数据更高效地进行挖掘分析,对水文数据仓库的结构与应用进行探讨与设计,将其与各种数据挖掘应用形成一个水文数据挖掘体系。研究内容和成果概述如下: (1) 针对以数据挖掘为基础的预报与调度的特点,结合我国的防洪减灾实际,建立面向预报、调度等不同主题的水文数据仓库的结构模型,并对其结构、功能、数据存储模型和实现技术进行研究,从而对海量水文信息进行管理与分析,为以数据挖掘为基础的预报、调度体系提供数据支持和提高挖掘效率。随后建立包括数据层、组织层、挖掘层和决策层的水文数据挖掘体系,各层承担着水文数据挖掘不同阶段的任务,从数据预处理、数据挖掘到知识表达,形成了一个完整的系统体系。 (2) 以水文预报中实践性很强的河道洪水传播为例探讨基于数据挖掘的水文预报模型。利用水文数据仓库对流域河道洪水数据进行数据预处理,同时利用T-S模糊推理模型提出一种根据上游各支流条件模糊推理下游流量的方法,针对模糊推理中随着推理条件增多而形成的“维数灾”问题,利用数据挖掘的关联规则分析方法确定历史数据中频繁出现的上游条件组合(即推理规则),将洪水传播中的低流量组合和极少出现的组合规则进行合并或删减,然后利用优化模型分析历史数据确定的规则集在模糊推理中的参数,最终形成基于模糊推理与关联规则分析的洪水传播模型,提高了高流量条件下的预报精度。 (3) 不同的水文预报模型有着不同的特点,很难有适用各种情况的“全能预报模型”。针对这一问题,提出了基于多目标模糊优选的组合预报模型,将多种模型预报结果的洪峰、峰现时间、流量过程的相对误差作为模糊优选的指标,通过对历史预报数据的模式识别分析,得到各种预报模型在不同情况下的适用度,然后在实时预报中根据条件及各种模型的适用度进行组合预报,得到比单个预报模型更合理的预报结果。 (4) 针对目前水库调度技术中的分类调度、扩大调度信息源等研究热点,提出一种利用数据挖掘技术分析历史水文数据与历史调度数据,从而生成调度规则的方法:决策树水库调度模型,该模型将生成的调度结果以调度树的形式表达。作为数据挖掘的结