论文部分内容阅读
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,积累的数据越来越多,数据挖掘技术正是从这些海量数据中抽取出潜在的、有价值的知识的技术。经过十几年的发展,一些经典的数据挖掘算法日趋成熟,数据挖掘的相关标准也逐渐完善,数据挖掘技术已经开始在各行各业得到广泛应用。为了使数据挖掘技术能满足不同层次的用户需要,可视化数据挖掘技术被提出,通过可视化的手段将数据挖掘过程的各个阶段展示给用户,使用户能更好的理解数据挖掘过程,对数据挖掘结果进行有效评估,可视化数据挖掘技术已经成为数据挖掘领域的研究热点。本文首先阐述了可视化数据挖掘技术的相关理论、方法和技术,剖析了目前可视化数据挖掘技术的主要研究方向和应用发展趋势。然后在此基础上,分别从数据的可视化、数据挖掘过程的可视化和数据挖掘结果模型的可视化三方面提出了相应的可行的设计思路,最终实施了一个具有开放性和可扩展性的可视化数据挖掘技术的原型系统,以验证和实践本论文的研讨成果。具体地,文中基于通用的Netbeans 6.1开发平台,采用Java、JFreeChart等主流开发技术完成了可视化数据挖掘技术的原型系统中的主要的可视化功能模块和公用组件的开发与实施工作,实现了数据的可视化、数据挖掘过程的可视化和数据挖掘结果模型的可视化的基本功能。在实现过程中,采用数据挖掘扩展语言DMX构建了一个数据挖掘算法与界面交互的映射组件,通过组件复用的方式为不同的数据挖掘算法提供界面访问接口。同时还融合了目前业界主流的数据挖掘标准/规范,即采用数据挖掘结果模型标准PMML来存储数据挖掘结果模型,构建了一个通用的PMML解析组件对各类数据挖掘结果模型进行解析,使得所完成的数据挖掘结果模型可视化模块能与其它数据挖掘软件产品/工具实现结果模型的无缝交换并共享可视化功能。文中选用了一个业界普遍公认的开放式的实验数据集完成了对该可视化技术原型系统的功能测试和评估,实践结果表明:该原型系统能在数据挖掘过程开展之前提供直观的、易于理解的图表帮助用户更好地完成相应的数据准备工作;在数据挖掘过程中能够提供友好的用户界面使用户能够直观地介入到数据挖掘算法的执行过程中;并且能够提供可视化的图/表完成数据挖掘结果的有效评估,从而让各类用户能够更好地共享可视化数据挖掘技术的成果。