APRIORI_T算法研究及在高考数据分析中的应用

来源 :中南大学 | 被引量 : 0次 | 上传用户:ccj66417
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术和网络技术的发展,加上先进的自动数据采集工具的使用,人们拥有的数据量急剧增加,这使得数据挖掘技术得到了广泛的应用。高考数据中隐含着各地区高考教育的特点,蕴藏着高考的发展规律和趋势,为了找出这些规律和趋势,我们利用数据挖掘技术来对高考数据进行分析。本文针对高考志愿预测分析、自主命题质量评价、加分政策影响分析、中学教学绩效评价四个方面,利用关联规则挖掘Apriori算法来对高考数据进行分析。由于Apriori算法在挖掘频繁项集时需要多次扫描数据库,并产生大量的候选项集,时间复杂度过高。为了克服Apriori算法的缺陷,本文采用项集信息表来记录项集信息,避免了重复扫描数据库,并以此为基础对Apriori算法进行了改进,设计了Apriori_T算法。本文对Apriori_T算法的基本思想及步骤做了详细的描述,并通过示例和实验分析验证了算法的有效性和优势。此外,本文将Apriori_T算法应用到高考数据挖掘中,针对高考关联规则挖掘中产生无效规则较多的特点,研究设计了有效频繁项集关联规则的高考数据挖掘方法,同时在分析“支持度-置信度”框架的衡量标准的基础上,提出了高考数据的评价度标准,提高了高考关联规则挖掘的效率。论文最后将Apriori_T算法应用到高考数据分析系统中,同时利用该系统对2008年湖南省的高考数据进行了分析,完成了高考数据分析系统的设计与开发。
其他文献
支持向量机(Support Vector Machine, SVM)是实现统计学习理论的通用学习方法,其优异的泛化性能使得支持向量机在模式识别、回归分析和预测、密度估计等领域都得到了实际应用
近年来在经济发展的热潮中电力技术也得到了巨大的发展,现有的继电保护装置和各类异常、故障预警检测手段虽已得到长足的发展,但仍有很多亟待提高和需要继续发展的薄弱环节。在继电保护学科领域中,有关自适应继电保护的各类研究也在不断增多。各学校相关专业及相关电力行业在近10年内也在对自适应电网及自适应保护方面做了大量的研究和探索。众所周知,神经网络具有训练效果好,适应融合力强的特点。利用这些特点可以搭建出优良
传统的存储系统可靠性通过数据备份以及数据冗余技术保证,一旦存储设备发生故障,可以通过数据恢复以及数据重建的方式修复数据,但这种方式下故障恢复时间窗口较大,在故障恢复
Web服务为互联网应用提供了一种共享数据和功能的有效手段,较好地解决了异构应用之间及松散耦合环境下的互操作、集成和协作的问题。随着web服务技术的日益成熟,越来越多的稳
光盘前端芯片技术是光存储行业的共性技术和关键技术,同时也是公益性技术。该技术将促进高清光存储行业的发展,从而刺激整个光存储业务和利润的上升。目前整个光盘视盘机行业
对象关系型数据库管理系统(ORDBMS)是面向对象技术与数据库技术的结合走向成熟的产物。它提供对复杂数据进行复杂查询的支持,从而能够更好的满足多媒体、Web应用以及一些新的
随着网络信息量的快速增长,人们要在其中获取所需要的信息变得十分困难。虽然搜索引擎为用户查询信息提供了很多方便,但是目前大多数的搜索引擎存在许多缺陷。由于对用户的个性
计算机动画是一个迅速发展的领域,它不仅可以将已经存在的事物变为可见的,也可以将人为创造的概念动态地表现出来。计算机动画是一门涉及多学科的综合技术,它以计算机图形学
云计算通过虚拟化技术将海量的计算资源、存储资源和网络资源进行整合,形成一个虚拟化的资源池,使用资源调度与管理技术对各种资源进行部署、动态扩展和按需分配。然而,各个
针对PBmice小鼠信息系统功能扩展的需求,文章提出并实现了PBMICE-SR语义检索框架。检索框架在PBmice系统基础上提供了智能获取数据的方法,提高了试验研究中数据获取的效率,避