【摘 要】
:
随着计算机网络和数据库技术的飞速发展,数据和信息呈现出了一些新的特征:第一,积累的速度更加快速、更新的频率更加频繁;第二,数据和信息的规模越来越庞大;第三,数据分布的范围
论文部分内容阅读
随着计算机网络和数据库技术的飞速发展,数据和信息呈现出了一些新的特征:第一,积累的速度更加快速、更新的频率更加频繁;第二,数据和信息的规模越来越庞大;第三,数据分布的范围越来越广泛;第四,数据的结构也越来越多样化。传统的集中式数据挖掘技术已经无法满足这些新的需求。分布式数据挖掘技术就是为了解决上述问题而被提出的。在目前,如何设计出一个良好的分布式数据挖掘系统结构,实现平台的无关性以及很好的支持各种分布式数据挖掘算法已经成为分布式数据挖掘研究工作中非常重要的一个方面。本文在解决这一个问题中做了一些研究,主要的工作如下:首先,介绍了分布式数据挖掘产生的背景、研究现状以及存在的问题;阐述了Web服务、面向服务的软件架构以及企业服务总线技术。接着,在对现有实现分布式系统技术分析的基础上,研究并提出了一种基于企业服务总线的分布式数据挖掘系统架构。它融合了企业服务总线共享与开放的设计理念,挖掘服务具有高度自治的特性。所提出的系统架构具有平台无关性、易扩展性以及挖掘服务透明性等特点。然后,以开源企业服务总线Mule作为系统的实施平台,结合服务注册库jUDDI等开源软件,实现了基于企业服务总线的分布式数据挖掘系统。最后,使用Flex技术制定了一个前端应用系统,以某银行贷款模拟数据为例进行了一次预测数据挖掘操作,并给出了相应的预测数值及预测评估结果。挖掘结果表明,本文提出的数据挖掘系统架构是切实可行的,能够真实可靠的完成数据挖掘任务。
其他文献
随着计算机技术的迅速发展以及Internet的广泛应用,知识和信息在世界范围内实现了平等共享和快速传播,人们可以方便、快捷地从互联网络上获取信息;但网络信息的爆炸性增长,使得准
随着Web服务的爆炸式增长,如何处理信息过载、定位合适的Web服务变得越来越关键。目前已有很多相关的服务推荐方法,但很少有研究通过挖掘服务使用数据中的潜在知识进行服务推
现代战争是高技术与信息化战争。电磁环境在未来的信息化战场上将变的非常复杂。由于干扰与反干扰的激烈的斗争,电子信息装备的广泛使用,不仅数量庞大、体制复杂、种类多样,
在几何造型中,代数曲线曲面适合于表示具有复杂拓扑的光滑外形,是主流的参数NURBS曲线曲面表示方法的重要补充。张量积代数B-样条曲线曲面是一种分段定义的代数曲线曲面,具有
随着计算机动画技术的飞速发展,计算机动画在人们生活中的应用范围也不断扩大。它不但在传统的动画、电影特效及游戏中得到广泛的应用,在网络会议、视觉广告、儿童教育等诸多
生物式水质监测是水质监测领域一个十分重要的研究课题。生物式水质监测技术和传统的理化水质监测技术相比,具有反应灵敏度高、成本低、直观性和综合分析代表性强的优点,在近
查询处理技术是无线传感器网络研究的核心,而近年来随着无线传感器网络技术的发展与成熟,日益严重的隐私问题已经逐步成为制约无线传感器网络查询处理技术研究的瓶颈问题。因此
近年来,数据中心(Data Center)的高速发展和和Mapreduce/Hadoop框架的日益重要,云提供商把越来越多的大数据放到云系统中处理。在现代基于虚拟化的数据中心上,虚拟机分配是实
正电子发射断层(PET)是一种无创的能够再现体内生物分布的分子成像技术,是现代生物医学成像中最高层次的成像技术之一,在临床诊断、生物医学研究和癌症普查等方面有重大意义
本文主要是针对当前基于时间序列模型的集成产品在实际应用中灵活性差、模型软件复杂难以维护、模型缺乏对分布环境的支持、不支持超大规模模型集成计算等缺点,提出了分布式的