基于机器学习的学业预警研究

来源 :西安石油大学 | 被引量 : 0次 | 上传用户:leolee19820604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在高校智慧校园建设过程中,学业预警作为智慧校园的主要组成部分,其主要利用数据挖掘技术保障学生顺利完成学业,同时为高校提供一定的决策支持。
  本文以某校相关部门的研究课题为背景,旨在搭建适用于该校的学业预警系统,保障学生顺利完成学业。主要研究内容分为“学业预警模型研究”和“学业预警系统设计与实现”两个部分,其详细内容如下:
  在学业预警模型研究的过程中,以某校本科生的历史成绩数据、一卡通消费数据和图书馆刷卡记录数据为基础,预测他们在第四学期结束之后是否会被留级。首先在数据预处理中提出了启发式的缺失值填充方法,得到可用于留级预测的数据特征。然后分析不同特征与留级之间的相关性进行特征筛选并组成不同的特征集合,分别利用随机森林、决策树、支撑向量机和逻辑回归四个常用的机器学习分类算法构建学业预警模型,综合评估后选择预测效果最佳的预警模型。最后为了解决所选模型在预测过程中的过拟合问题,提高模型的预测效果,提出了一种基于遗传算法改进的模型和一种基于投票集成的模型组合优化方法,通过分析实验证明基于遗传算法改进的模型评估效果最优,Recall达到了89.35%,Precision达到了80.96%,AUC达到了84.25%。
  在学业预警系统设计与实现过程中,依据某校相关部门的软件需求,在学业预警模型的基础上,采用ZhimaPHP框架,采用PHP程序设计语言和Python程序设计语言,基于Mysql数据库,实现了学业预警系统。该系统实现了成绩查询、数据导出,能够从学生的多个维度数据进行学业预警的功能,保障学生正常完成学业,为高校提供一定的决策支持。
其他文献
随着我国大部分油田开发逐步进入中后期阶段,油田必须采取必要的油气增产措施以确保油田持续高效生产。由于增产措施种类繁多,如压裂、酸化、大修、补孔等,各项措施的增产效果和费用不同,每种增产措施应用于油田各作业区的增产效果也不同。为了合理的规划油田增产措施,需要先建立增产措施效果预测模型,在预测结果的基础上再进行具体的措施规划。本文基于数据挖掘的神经网络算法,对油田增产措施指标优选模型进行了研究与应用。
学位
目前我国地处偏远、环境复杂的油田普遍存在石油钻井物料供应成本高、效率低下的问题,为避免钻井作业物料短缺,保证钻井过程物料的质量及生产需求响应速度,本文将众包思想融入石油钻井物料供应链中,通过网络众包方式,使众多的钻井物料供应方参与到钻井企业物料供应中,并运用众包供应链的组织流程和结算管理模式,设计并实现了一个基于众包的石油钻井物料供应链系统,为传统石油钻井物料供应提出了一个新思路。主要的研究工作如
三维海洋场景的模拟是计算机图形学场景建模研究内容之一。海洋与其他自然场景不同之处在于海洋场景往往具有随机性,模拟起来具有一定难度。目前的海洋的仿真场景中对于海面光照模拟没有进行细致的划分,只是使用简单的光照模型进行渲染,并且场景中对于海面漂浮物分析不够全面。本文实现一个完整的三维海洋场景,对于海面的光照渲染综合海面上和海面下的渲染,更加真实地模拟海洋场景中光的效果,并且对海面漂浮物进行模拟,对物体
学位
在高速发展的信息时代,数据在各个行业中都已成为一种无形资产,但随着近些年有关数据安全的问题频发,引起了相关政府企业的高度重视,对敏感数据进行加密或者脱敏成为目前研究的一个重点。数据脱敏相较于加密来说它的不同之处在于需要尽可能不留痕迹的将敏感数据替换成非敏感信息。但是,目前数据脱敏技术大都仅能针对文本类信息,针对该现象,本文选取油气勘探领域作为研究对象,聚焦其中带有敏感信息的曲线图像数据,根据曲线结
学位
计算机组成原理是计算机类相关的一门重要的专业基础课,由理论和实验两部分组成,控制器的设计实验是理论知识应用的重要环节,在传统的教学实验中学生只能通过实验箱观察实验结果,不能便捷地看到设计中存在的问题,如果在实验环节增加调试系统可以帮助学生看到模型机内部的数据变化过程,发现组件、数据通路和控制器设计中存在的问题。RISC-V指令集架构短小精悍,编码规范,解决了以往指令集中存在的问题,RV32I是RI
学位
通常在地震勘探中采集到的地震资料因受各种因素的影响常常混杂着大量噪声,如果能有效的消除地震信号中的噪声干扰,这将为后续解释工作提供极大的保障。所以本文从消除地震信号随机噪声提高地震资料信噪比方向展开研究,主要研究内容如下:首先,本文介绍了小波变换由理论知识到实际应用的内容与流程,深入分析了常用小波阈值选取算法的优缺点。然后,研究改进了小波变换阈值去噪算法去除地震资料随机噪声。本文针对常用小波阈值去
学位
人体的健康状态可以依靠人体生理信号来反映,实时监测人体的生理信号参数可以及时分析与诊断患者病情。随着各类便携式智能移动设备和人工智能的快速发展,在对疾病筛查和预测过程中,除了可以通过生化、影像检查结果发现疾病的端倪外,还可以通过移动智能设备对人们的语言和文字形成的规律进行分析,这种分析得出的数据能够帮助医生更有效地预测并追踪早期的发展障碍、精神疾病和退化性神经疾病等。本文设计的人体多生理参数数据处
学位
卷积神经网络(Constitutional Neural Networks,CNN)具有良好的非线性拟合性,因此被广泛应用于图像分类,语音识别和目标检测等领域。随着CNN的发展,模型的大小和计算量剧增导致CNN模型只能在特定平台使用,无法实现专有化和小型化。现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)具有高性能、低功耗及可重构等特点,在进行CNN加速
现如今,物联网技术将世界变成一个万物互联的时代,嵌入式设备与物联网的结合成为了嵌入式技术发展的真正未来。天然气作为一种高效清洁的能源,在国内呈现需求日益旺盛的态势。而天然气的开发环境恶劣,天然气井控制器的应用就为天然气开采和管理提供了技术支持。目前的气井控制器的设计以进口CPU为主,国产龙芯CPU的发展为我国摆脱技术依赖提供了新的支持。基于此,本课题开发了一款基于国产龙芯CPU的气井控制器。通过对
水质检测是水保护的前提和基础,生化需氧量(Biochemical Oxygen Demand,BOD)、化学需氧量(Chemical Oxygen Demand,COD)、亚硝酸盐能够很好地反映水污染的程度。研究上述参数的快速检测,可为水资源保护提供有效的数据支持。研究基于高光谱技术的水质指标定量研究,可快速、无接触、大面积的实现水质的实时检测,对我国目前的水污染治理问题提供理论依据具有极为重要的
学位