可视化数据挖掘技术的研究与实现

被引量 : 0次 | 上传用户:syy1116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,积累的数据越来越多,数据挖掘技术正是从这些海量数据中抽取出潜在的、有价值的知识的技术。经过十几年的发展,一些经典的数据挖掘算法日趋成熟,数据挖掘的相关标准也逐渐完善,数据挖掘技术已经开始在各行各业得到广泛应用。为了使数据挖掘技术能满足不同层次的用户需要,可视化数据挖掘技术被提出,通过可视化的手段将数据挖掘过程的各个阶段展示给用户,使用户能更好的理解数据挖掘过程,对数据挖掘结果进行有效评估,可视化数据挖掘技术已经成为数据挖掘领域的研究热点。本文首先阐述了可视化数据挖掘技术的相关理论、方法和技术,剖析了目前可视化数据挖掘技术的主要研究方向和应用发展趋势。然后在此基础上,分别从数据的可视化、数据挖掘过程的可视化和数据挖掘结果模型的可视化三方面提出了相应的可行的设计思路,最终实施了一个具有开放性和可扩展性的可视化数据挖掘技术的原型系统,以验证和实践本论文的研讨成果。具体地,文中基于通用的Netbeans 6.1开发平台,采用Java、JFreeChart等主流开发技术完成了可视化数据挖掘技术的原型系统中的主要的可视化功能模块和公用组件的开发与实施工作,实现了数据的可视化、数据挖掘过程的可视化和数据挖掘结果模型的可视化的基本功能。在实现过程中,采用数据挖掘扩展语言DMX构建了一个数据挖掘算法与界面交互的映射组件,通过组件复用的方式为不同的数据挖掘算法提供界面访问接口。同时还融合了目前业界主流的数据挖掘标准/规范,即采用数据挖掘结果模型标准PMML来存储数据挖掘结果模型,构建了一个通用的PMML解析组件对各类数据挖掘结果模型进行解析,使得所完成的数据挖掘结果模型可视化模块能与其它数据挖掘软件产品/工具实现结果模型的无缝交换并共享可视化功能。文中选用了一个业界普遍公认的开放式的实验数据集完成了对该可视化技术原型系统的功能测试和评估,实践结果表明:该原型系统能在数据挖掘过程开展之前提供直观的、易于理解的图表帮助用户更好地完成相应的数据准备工作;在数据挖掘过程中能够提供友好的用户界面使用户能够直观地介入到数据挖掘算法的执行过程中;并且能够提供可视化的图/表完成数据挖掘结果的有效评估,从而让各类用户能够更好地共享可视化数据挖掘技术的成果。
其他文献
近来研究证实肺腺癌具有与致癌作用及靶向药物疗效有关的独特分子特征,这些分子改变被视为驱动基因,负责恶性病变的发生和维持。目前发现约50%肺腺癌携带驱动基因,其中EGFR通
亚临床甲状腺机能减退症(SCH),是以血清游离甲状腺素(FT4)或总甲状腺素(TT4)正常,促甲状腺激素(TSH)增高,很少临床症状为特征的一种甲状腺功能状态[1],高敏感,高特异的TSH测定方法的建立[2
近年来,以空气作为换热介质的太阳能集热器越来越受到重视。本文以微热管阵列为核心传热元件,设计并搭建了改进型微热管平板太阳能空气集热器性能测试系统。通过实验研究了不
目前,由于国家对教育投入的增加,高校办学规模的不断扩大,高校作为促进高教事业发展的事业独立法人,依法多渠道筹措教育经费,这样一来,使得高校教育经费来源与结构发生了明显的变化
目的通过分析大肠癌术后治疗的相关医案,挖掘其中医证治规律。方法筛选中医治疗大肠癌术后的医案,辨证与用药逐一录入中医传承辅助平台,采用软件集成的数据挖掘方法,对筛选出
随着市场经济的加快发展,我国的人均可支配收入逐年增高,各大银行陆续推出多种多样的理财产品。目前,经济加速发展,随着而来的还有大量的可支配收入,银行的理财产品因其安全
古诗词是古代劳动人民给我们留下的宝贵遗产,是中华民族灿烂文化的标志,中国古代文化博大精深,古诗词更是中华文化的瑰宝。因此,在小学语文教学过程中,应加强学生对于古诗词
城市可持续发展能力的评价指标和方法是衡量城市生态规划、建设、管理成效的主要依据。本文以辽宁营口市为例,建立了可持续发展指标体系,包括经济发展、社会进步和环境保护3
自从2005年全球媒体巨星新闻集团(News Corporation)斥资5.8亿美元收购了MySpace,2007年,微软以2.4亿美元仅买到Facebook的1.6%股份,2008年4月,美国在线以8.5亿美元现金收购
<正>一、以开场道白,激发兴趣学生对知识兴趣的第一个源泉就是教师对化学学科每个单元、每个课题的开场白,好的开头是成功的一半,开场白这个引子利用得好不好关系到整个教学