校园网格环境下“数字化党校”信息分布式数据挖掘研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:kekedehome
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的快速发展,迫切需要实现计算资源,数据资源,信息资源,设备资源等各种网络资源的有效共享,方便用户使用,同时还要不必考虑计算机的硬件类型,计算机的放置地点,以及计算机所安装的操作系统类型,以及实现多个异步计算机共同工作,提高整个网络的吞吐量。在这种情况下,网格技术应运而生。”数字化党校”网格平台正是以网格技术为切入点,以达到消除信息孤岛,充分实现数据资源的共享。但是随着以数据库、数据仓库等数据仓储技术为基础的信息系统在各行各业的应用,使海量数据不断产生。如何对”数字化党校”网格的数据进行有效地整理和组织,从中提取我们感兴趣的知识——这就需要web数据挖掘技术。本文正是采用网格和web挖掘这两个工具,以达到对数据的有效整合。为此,本论文重点研究了两个方面的内容:一是实现对”数字化党校”系统进行网格化,得到适合web挖掘的网格平台;二是设计一种适合于”数字化党校”网格平台下的web数据挖掘的算法。所以,本论文首先分别介绍了网格的背景,web数据挖掘的现状,网格模型的基本思想,以及常用的web数据挖掘方法。资源的调度是网格能否高效利用资源的关键组件。本文借助资源的调度的网格模型,实现对web挖掘模型建立。本文根据”数字化党校”网格资源的特点,采用基于web服务的分布式数据挖掘方法,同时借鉴ID3算法,C4.5算法,CHAID算法和CART算法等四个经典的决策树算法,并在此基础上,提出了一个适合于”数字化党校”网格平台环境的决策树算法——合并和修剪决策树算法,运用它对原始决策树的合并和修剪,既可以扩大决策树的知识涵盖面,提升其预测未知知识的准确度外,还在与原始决策树相比,具有更少节点数,降低了决策树的复杂度。最后,本论文给出了全文总结和结论,并概述了今后进一步研究的方向。
其他文献
规划识别是人工智能领域近年来发展起来的一个重要分支。规划识别是指根据观察到的智能体的片断的、琐碎的动作来推断智能体的目标及它的规划,从而预测智能体未来的动作序列
在保证内容传输的安全方面,目前大多数运营商采用条件接收(Content Access,CA)或数字版权管理(Digital Rigthts Management,DRM)技术来实现,但是根据国际知识产权联盟(IIPA)2
虚拟现实(Virtual Reality)技术是当代信息科学的前沿研究领域。VR综合应用了计算机图形学、计算机视觉等多个学科领域的关键技术,在计算机中营造出一个虚拟的环境,使用户产
随着实时应用对效率要求的不断提高,以及移动通信技术的快速发展和移动计算机的大量普及,由移动计算和实时应用结合传统数据库技术而形成的移动实时数据库系统已成为数据库领
访名人难!这是我们新闻记者常叹的话题。其实,访名人难与不难,取决于访问者的知识水平、工作能力和处事为人的方式,如果这些都无可非议,那么,名人们不但愿意和你交谈,甚至愿
对于企业的发展而言,思想动力是不可忽略的动力元素,基层党建政工工作作为思想教育的组成部分,对指导企业的思想方向具有较深的意义.因此,企业若是想要为自身发展提供保障,那
UML作为面向对象分析和设计建模语言的标准,有广泛的应用和扩展背景,通过UML的扩展机制使其支持面向方面状态图的建模,但UML建模的状态图采用的是自然语言描述及图表结构,缺
作为一种重要的转录调控元件,转录因子结合位点的识别已经成为当前的研究热点。准确的预测、识别算法有助于人们识别不同转录因子的目标基因,进而研究转录因子结合位点在上游
目的 研究对急性心肌梗死伴急性左心衰患者进行重组人脑利钠肽、呋塞米治疗的临床效果.方法 选取2017年12月~2019年4月我院收治的84例急性心肌梗死伴急性左心衰患者作为研究对
引言:在中国改革发展站在新起点的时候,在回顾改革开放三十年的时候,我们该如何看待民众和媒体不断升温的言说欲望,该如何看待批评报道及其背后的潜规则?提起中华民族的历史,