国外数据挖掘与知识发现工具的评估研究

来源 :中南大学湘雅医学院 中南大学 | 被引量 : 0次 | 上传用户:wangyiming1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景:经过十多年发展,国外数据挖掘与知识发现工具已大量涌现并开始大幅度由研究走向应用.国内数据挖掘工具研究虽处在起步阶段,但应用需求也很大.如何借鉴国外先进经验与成果进行研究,如何选择数据挖掘工具以促进应用,这是国内数据挖掘领域发展所面临的一个紧迫问题.目的:本研究旨在通过对国外主流数据挖掘工具的评估了解国外数据挖掘工具的发展现状,分析数据挖掘工具发展过程中存在的问题,对数据挖掘工具的发展提出若干建议,并试图阐述数据挖掘工具的发展给情报工作带来的影响.方法:本文以国外主流数据挖掘工具为研究对象,根据国内外研究成果以及国外数据挖掘与知识发现软件的发展状况,设计了一套由7个部分共119项组成的评估表,并用该表对国外主流数据挖掘与知识发现软件进行了比较与评估.结论:就总体特征而言,迄今为止,通用数据挖掘软件的使用占绝对优势;数据挖掘与知识发现软件的功能不再停留在"挖掘"这个单一功能的实现,而已延伸到数据挖掘与知识发现的广义过程,即包括数据的预处理、数据挖掘、模型评估与可视化;数据挖掘软件使用的专业性较强;数据挖掘对象较单一;数据挖掘可视化取得了一定的进展,在单纯的模型可视化基础上扩充了数据可视化与数据挖掘过程可视化;数据挖掘还未真正融入企业应用与决策.就具体方面来说,各软件在能访问的数据源类型,能完成的数据挖掘任务,数据预处理,参数设置的灵活性,提供的算法的多样性与层次性,数据、过程以及模型的可视化程度等方面各有特色.本文在比较评估基础上对数据挖掘软件的发展提出若干建议,包括完善专用数据挖掘工具功能;完善数据挖掘标准化的内容,促进已有数据挖掘标准的应用;扩充数据挖掘对象的范围,实现对象数据库、空间数据库等非结构化数据的挖掘;实现数据挖掘与企业内部其它应用软件的无缝集成;各数据挖掘工具应相互借鉴,取长补短;加强数据挖掘与数据库、数据仓库等的一体化研究;提供对移动数据的挖掘;实现互联网上的数据挖掘等.
其他文献
英语的阅读是英语“听、说、读、写”四项技能之一,但笔者发现在教学中我们很多年老的英语教师过多的关注知识点的传授,语法的讲解;而年轻的教师更注重听说的训练,二者都忽略了阅读这一环节。实际上阅读是对书面信息进行认知构建的心理语言过程。阅读是英语学习过程中一个极为重要的组成部分。学生通过阅读学习,获得外来信息。因此阅读的过程实质上就是获取信息的过程。使他们在学习英语的过程中,促进心智、情感态度、学习策略
随着我国社会文化事业和图书馆事业的发展,图书馆用户权利与义务的协调与平衡越来越受到图书馆界的重视和关注。目前,图书馆界对图书馆用户权利进行了相对充分的研究,而对图书馆
本文论述了电子商务和知识产权管理的密切关系,分析了电子商务下知识产权管理中存在的若干问题,探讨了电子商务环境下企业知识产权管理的思路,结合我国的现实情况提出了目前企业
静电纺丝工艺能够有效制备纳米纤维,并被广泛应用在传感器、生物医学、过滤等领域.使用聚氧化乙烯(PEO)溶液,通过改变传统静电纺丝装置中常用的平面收集板为曲面收集板,研究