基于神经网络的MOOC辍课预测研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:cerlin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,大规模在线开放课程(Massive Open Online Courses,MOOC)因其在高等教育领域中的灵活性和便捷性而受到广泛的关注,吸引了越来越多的教育者和学习者参与其中。然而正是因为这种灵活性和便捷性使得学习者更加容易辍课,高辍课率问题目前成为MOOC平台面临的一个巨大挑战。在已有的关于辍课预测问题的相关研究中,MOOC的辍课率高于90%。因此提出一种更可靠,更高效的辍课预测模型,对于MOOC平台实现教育活动的早期干预和MOOC平台的发展都非常有必要。在MOOC辍课问题的研究中,早些年研究大都使用传统的机器学习方法,虽然取得了良好的效果,但是这些方法仅仅只是依赖人工特征工程提取的浅层的特征信息,忽略了特征与特征之间的联系。而且人工特征工程的方法提取的特征存在大量噪音数据,影响模型的预测效果。近年来,研究者们利用神经网络自动提取特征,虽然在一定程度上解决了行为特征之间独立的问题,然而却没有考虑到不同的学习行为模式对于辍课的影响程度以及学习行为之间的时序关系,很难保证预测结果的有效性。而且辍课预测中常用的KDDCup2015比赛的数据集存在正负样例分布不平衡的问题,对预测的结果在一定程度上也产生了影响。为了改善现有研究存在的不足,本文利用神经网络和改进的SMOTE算法来提高辍课预测的表现效果。本文的主要内容如下:1.针对现有人工特征工程不能有效地提取学习者学习行为的深层次特征,进而无法全面挖掘学习行为特征之间关系,导致预测结果不理想的问题,提出了一种融合卷积神经网络(Convolutional Neural Networks,CNN)和长短期记忆神经网络(Long Short-Term Memory,LSTM)的辍课预测模型CLNN。该模型先是利用卷积神经网络提取学习者学习行为特征的深层次信息,然后通过长短期记忆神经网络进一步挖掘学习者学习行为之间的时序关系信息,使得预测结果更加准确。通过理论分析和实验结果,证明了该方法与现有的辍课预测方法相比有显著的改进。2.针对学习者不同的学习行为模式对辍课影响程度不同的问题,提出了基于激励挤压神经网络(Squeeze-and-Excitation Networks,SEN)和门控循环单元(Gated Recurrent Unit,GRU)神经网络的辍课预测模型SCGNN。该模型在优化CLNN模型时序特征提取模块的同时,对每个行为特征矩阵的重要性进行了显性表示,使得预测结果更加准确。此外,考虑到辍课预测数据集中正负样例不平衡影响模型性能的问题,我们使用了改进的SMOTE算法,通过过采样少样例的样本,来训练模型,使得预测结果更加准确。并且通过不同时间段数据在SCGNN模型上的进行实验,实验结果表Abstract明发现SCGNN模型在辍课预测的早期阶段的预测结果能够达到与传统机器学习模型在整个阶段同样的预测效果,更加说明我们的实验模型的有效性。
其他文献
在人与人的交往方式中,表情是传递人类情感信息与意图的重要方式,通过表情识别技术可以有助于计算机像人类一样观察、理解和提供相应的反馈。目前表情识别技术面临两个难题:一方面无论是基于几何特征还是纹理特征的特征提取算法都存在对皱纹、凸起、凹陷等细微面部变化不敏感;另一方面现有的算法无法解决实际生活中采集到的图片光照分布不均匀、噪声干扰等问题。针对上述的问题,本文分别设计了可变形卷积网络的面部动作单元识别
形式化方法是指依赖严格的数学基础对软、硬件系统进行形式规约、开发和验证的技术。形式规约作为形式化方法的基础,通过形式语言严格描述所开发系统的模型和其需要满足的性质,包括模型规约和性质规约。而性质规约分为线性时间规约和分支时间规约,安全性和活性作为这两种性质规约中的基础属性,已经得到了广泛的研究。安全性断言系统运行时“坏”的事情不会发生,而活性断言系统运行时“好”的事情最终会发生。安全性和活性的验证
5G(The fifth generation mobile communication,第五代移动通信)网络于2019年6月在国内正式商用,5G网络有三大特点分别是高速度、低延时和广连接,其中移动边缘计算(Mobile Edge Computing,MEC)是其中的一项关键技术,其能满足用户在低时延、低能耗、隐私安全等方面的需求。但是目前MEC服务器是部署在固定地点的,当其他区域有需求时无法快速
信息抽取是自然语言处理中的重要分支,目的是从非结构化或半结构化的文本中抽取出结构化数据,其最关键的子任务之一是关系抽取。然而以往的传统方法在处理复杂的文本结构时并不能达到良好的效果,往往无法处理其中的关系重叠问题以及抽取过程中产生的噪声信息。本文基于深度学习方法,围绕面向复杂文本结构的关系抽取研究,提出了针对传统流水线方法和联合学习框架的两种优化方案。论文的主要研究工作和创新内容如下:(1)设计了
随着工业物联网的全面发展,现代工业系统已呈现智能化的发展趋势。机电设备作为工业生产活动中重要组成部分,在智慧交通等领域应用广泛。高速公路机电设备内部结构复杂,运行环境恶劣等因素导致机电设备发生故障的可能性大幅提升。目前,高速公路机电设备的故障检测普遍采用传统的云计算模式,海量数据的远距离传输占用大量网络带宽,并存在高延迟现象。针对高速公路机电设备故障检测的实际应用场景,本文对基于边缘智能的机电设备
脑中风伤残率、死亡率、反复发作概率较高,很大程度上伤害人类身心健康,会导致病患家庭、国家经济负担过大。微波探测脑出血的原理是微波经过被测组织会出现电磁波的反射、散射及吸收,根据肿瘤组织与健康组织之间电磁参数存在明显差异,可以利用不同位置出血、不同出血量的散射信号幅度和相位变化量对脑出血进行研究。本文主要对应用于微波探测脑出血小型化宽带定向单极子天线单元、利用微波散射法对脑出血进行仿真探测、及模拟实
本文研究具有宽带和高增益特性的超透镜天线。超透镜天线包括馈源和超透镜两部分,其中的超透镜由大量的透射单元组成。以相位补偿原理为理论依据,主要研究了宽带超透镜天线的设计方法,超透镜单元的相位特性和它们在超透镜上的分布特点。主要研究内容包括:研究了宽带平面超透镜天线的工作原理、理论依据以及设计方法。首先分析了传统透镜天线的工作机理,然后基于相位补偿原理,讨论了平面超透镜天线的结构特性、离散相位分布特性
图像超分辨率一直以来都是图像处理领域的一个非常热门的研究课题。在现实生活中,受到现实环境和拍照设备的影响,人们往往无法获得包含细节信息的高分辨率图像。图像超分辨率技术可以将因环境、设备、人为因素得到的低分辨率图像重建出清晰的、包含更多细节信息的高分辨图像。随着卷积神经网络在图像超分辨率的重建工作中的蓬勃发展,图像超分辨率的重建效果越来越好。本文主要对现有的卷积神经网络图像超分辨率算法的网络模型进行
随着物联网(Internet of Things,Io T)的不断发展,物联网应用逐渐进入人们的日常生活。物联网环境的复杂性、传感器种类多样性与物联网环境动态性等特点,使得物联网设备所收集到的数据种类较多,并且数据收集过程中由于各种原因导致终端设备数据缺失。缺失数据给物联网的数据挖掘、物联网应用等带来较大影响。因此,物联网环境下的不完全数据流填充问题,成为了一个重要的研究课题。本文主要针对物联网环
针对水下可见光MIMO信道相关性强导致系统信号检测性能差的问题,本文搭建了水下光成像MIMO-OFDM系统仿真模型,对光成像MIMO信道相关性以及基于格基约减的降低信道空间相关性算法进行了研究。由于光MIMO技术利用多径传输使系统获得分集增益或复用增益,当阵列规模增加时,MIMO信道具有较强的空间相关性,多个路径传输的光信号在接收端的叠加不可避免,接收端难以进行准确的数据恢复。因此本文将格基约减降