教育信息的关联规则挖掘

来源 :上海海运学院 上海海事大学 | 被引量 : 20次 | 上传用户:liongliong416
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
教育信息化使教育系统结累了大量的与教育、教学有关的数据,激增的数据背后隐藏着许多重要的信息,由于缺乏挖掘数据背后隐藏的知识的手段,无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。导致了“数据爆炸但知识贫乏”的现象。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。关联规则挖掘是数据挖掘的一个重要方面,它揭示事物之间的相关程度。教育中存在很多相关性问题,可以用关联规则挖掘方法对教育信息进行数据挖掘,发现其中的教育规律。 关联规则表达数据库中属性之间的相关程度。关联规则X(?)Y,support=s%,confidence=c%表示由规则的前提X得到规则的结果Y,支持度为s%,置信度为c%。本文通过对教育信息的关联规则挖掘,得出类似物理(?)数学,support=25%,confidence=77%的结果,利用关联规则揭示的教育、教学的内部规律、学生的发展模式、学课之间的相关性规律,科学地制定教育的中、长期规划,更新教育理念,合理地组织教学活动,理性地引导学生朝德、智、体方面全面发展。 关联规则挖掘的基本方法是基于频集的Apriori算法,根据给定的最小支持度(min_sup),在待挖掘数据库中找出所有频繁项集,根据给定的最小置信度(min_conf),由频繁项集产生强关联规则。在众多的数据挖掘工具中本文中采用基于MS SQL Server环境的数据挖掘。根据教育信息的数据特点,在应用Apriori算法时稍作修改,即在用Apdofi算法计算频繁项集前,先用类似聚类的方法压缩数据(经过量化处理),然后对压缩过的数据计算频繁项集,使计算频繁项集的数据量减少。 教育信息挖掘模型(EIDM)是以教育系统为主要应用领域,以交互性、数据源的可选择性、系统的可集成性、易操作性为主要设计原则的数据挖掘系统模型,其中变换方法和量化方法体现了处理教育数据的功能,通过增加挖掘模式库、变换方法和量化方法库的方法可较容易地扩充EIDM的挖掘功能。 系统设计中采用不同的数据挖掘方法和不同的数据挖掘参数,产生不同应用层次的关联规则,取其共同部分按被认可的程度分为三类:第一类规则描述的事实和传统的教育学对有关问题的认识相一致,数据挖掘获得的关联规则用数据进一步证实了教育理论的有关论述。第二类规则是人们在研究和工作中没有认识到的或未被重视的事实,这类规则反映了教育规律,这是通过数据挖掘获取的新知识。第三类规则是以前未被发现、现在也未被教育专家认可,但在现实中业已存在、而且是在一定条件下一种有代表性的现象,其内涵还有待进一步研究。
其他文献
本论文的研究内容是从结构的角度,通过在进化过程中相对保守,并且相互作用的结构域(domain)来描述蛋白质的相互作用。为此我们首先基于序列相似性的比较对生物序列数据进行了同
数据挖掘是数据库最活跃的领域之一。由于其广泛的应用背景和现实意义,数据挖掘技术的研究和应用都获得了突飞猛进的发展,在国内外的学术界和信息产业界备受关注。 数据挖掘
随着嵌入式Internet 的发展,嵌入式Web 服务器已被越来越广泛的应用到信息家电、网络视频监控、工业自动化等领域。嵌入式Web 服务器也逐步成为嵌入式研究领域的一个热点。开
流媒体技术是一种新型的网络多媒体技术,它把多媒体数据压缩技术,数据流调度策略以及网络数据传输控制技术有机地结合起来,使用户可以在下载数据的同时就可以进行观看,大大地
随着Internet的迅速发展,搜索引擎的应用越来越广泛。为了提供高效、准确的信息服务,我们需要对搜索引擎的结果信息进行合理的组织与分类。本文的目标就是以Web文本信息处理为
随着软件规模的不断增加,软件开发的进度越来越慢,不能按时完成开发计划,用户的需求不能得到完全满足的情况常常发生。美国于1995年开始了一项调查,在这项调查中,他们对全国
粒子群优化算法(Particleswarmoptimization,PSO)是一种源于对鸟群捕食行为研究的一种进化计算技术(evolutionarycomputation),是一种新的群体智能进化技术。本文首先介绍了遗
本文对出版物条码的现状以及在图书馆管理系统中的应用作了全面的研究.主要从图书馆内部码应用范围的确定、内部码数据库的建立、内部码的编制、加工与识读等各个环节加以了
XML数据在实施安全保护措施方面有着自身的特点.忽视XML数据的安全会使得物流企业的机密信息和敏感信息面临危险.因此,如何在非安全的网络中实现XML数据的安全传输是物流企业
在今后很长时期内,汉字键盘编码输入法仍将是汉字输入计算机的主要方式。建立科学的输入法评价体系,不仅可以指导编码发明者形成科学的汉字编码方案,而且可以帮助输入系统设