论文部分内容阅读
随着农业数据的快速积累和增长,如何利用海量的农业数据以获取科学的农业知识、规律和决策支持信息成为非常重要的课题。数据挖掘技术定义为提取隐含在数据集合中新颖的、人们事先不知道的、潜在有用的信息和知识。目前数据挖掘技术在农业数据处理方面基本处于经典挖掘算法在实例应用层次,总体起步较晚,没形成一套系统的、成体系的研究与开发方法。针对上述问题,本文提出了一种基于Web的农业数据挖掘平台的原理框架,包括数据挖掘可视化、数据挖掘流程处理和数据存储等关键部分;并基于责任链模式初步实现一个基于Web的农业数据挖掘平台;最后结合具体的农业数据应用案例,验证了基于Web的农业数据挖掘平台的扩展性、灵活性和有效性。主要研究工作包括以下几个方面:(1)给出了基于数据挖掘的多阶段过程模型,对数据准备、数据挖掘和结果评价展开深入的研究,从而明确了农业数据挖掘的一般流程和经典数据挖掘算法的应用特点。(2)提出了一种基于Web的农业数据挖掘平台的原理框架,研究了数据挖掘可视化、数据挖掘流程和数据存储等关键技术。该原理框架具有以下特点:使用Web和可视化技术提高可交互性;使用可配置的数据挖掘流程支持数据挖掘算法的动态替换;使用统一、可扩展的数据集成方式桥接后台多元数据库和数据仓库等,为构建农业数据挖掘平台和专家系统提供理论指导。(3)采用责任链模式设计并初步实现了基于Web的农业数据挖掘平台,包括数据准备链、数据挖掘链、数据桥接链和数据过滤链。该平台成功应用于农业病虫害和农业土壤污染数据分析,从而验证了基于Web的农业数据挖掘平台的原理框架的有效性,以及责任链式结构的灵活性和可扩展性。