论文部分内容阅读
数据挖掘指的是从大量的数据中提取隐含的、事先未知的、并且潜在有用的知识的技术,是目前国际上数据库和信息决策领域最前沿的研究方向之一。它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。随着数据库技术的迅速发展以及数据库管理系统的广泛应用,各行各业积累了大量的历史数据,而这些激增的历史数据中往往隐藏着很多重要的信息。如何从历史数据中及时发现有用的知识,从而挖掘出其潜在的价值,提高其利用率,是信息处理技术研究领域的一项重要课题。作为其解决方案,近年来数据挖掘(Data Mining,DM)技术迅速崛起。 普通高等学校入学考试是我国选拔优秀人才进入高等学校学习的一种方法,是为全国各个普通高等院校提供生源的唯一的正规考试。现代的高等教育入学考试从直观上来看,是普通高等学校选拔新生的一种手段。然而,它的社会本质却远远超出教育,是国家对结束了基础教育最高阶段学习以后的青年人所进行的大规模的社会分流工作。 数据挖掘是揭示存在于数据里的模式及数据间的关系的学科,它能够找到隐藏在大量数据背后的规律性,为制定管理决策提供相应的支持信息。数据挖掘可以认为是对迄今为止的非常精确化的统计模型的一个启示。把数据挖掘应用于普通高考数据中具有很高的学术价值和广阔的市场空间。 本文首先对数据挖掘中的概念分层和分类问题进行了研究;其次,采用这些数据挖掘技术,针对内蒙古自治区普通高考近几年的数据构建了高考数据分析模型;最后,应用高考数据分析模型对内蒙古自治区普通高考的数据进行分析,并对结果进行了评价。 第一,介绍课题的研究背景;从数据挖掘的理论研究和应用研究方面,对当前数据挖掘的国内与国外的研究动态进行分析;通过对知识发现一般过程的分析,给出了一些典型的数据挖掘算法的介绍,讲解了本论文所使用的主要方法,并对其中采用的数据挖掘的技术作了详细阐述。 第二,阐述了将数据挖掘应用到高考数据中的极其重要的研究意义;对本系统的体系结构做了详细的介绍:回顾了当前的研究动态,介绍了各层的具体功能,具体分析了各层的实现、人工神经网络的BP算法的主要内容。 第三,构建基于数据挖掘的高考志愿填报系统,对相应技术中所采用的算法进行了详细的描述,利用该系统对近4年内蒙古自治区普通高等学校入学考试数据进行分析,并对结果进行了评价。 最后,对本文的工作进行了总结并对研究前景进行了展望。