【摘 要】
:
随着教育信息化的不断发展,教育数据挖掘受到越来越多研究者的关注。利用智能信息技术开展智慧校园建设标志着教育信息化智慧教育时代的开启。高校教育积累了海量的数据,却没有充分利用,很少挖掘数据背后隐藏的价值。针对以上问题,为了从校园大数据中挖掘有用信息,帮助学生提升学习效果,促进学校提高教学管理水平,本文从聚类算法改进,学生行为数据分析,行为数据与成绩数据关联性分析,以及学生成绩预测等方面进行研究。本文
论文部分内容阅读
随着教育信息化的不断发展,教育数据挖掘受到越来越多研究者的关注。利用智能信息技术开展智慧校园建设标志着教育信息化智慧教育时代的开启。高校教育积累了海量的数据,却没有充分利用,很少挖掘数据背后隐藏的价值。针对以上问题,为了从校园大数据中挖掘有用信息,帮助学生提升学习效果,促进学校提高教学管理水平,本文从聚类算法改进,学生行为数据分析,行为数据与成绩数据关联性分析,以及学生成绩预测等方面进行研究。本文主要完成工作如下:(1)多因素改进K-means聚类算法。针对原始K-means聚类算法迭代过程计算复杂、聚类数目需要人为确定、对初始聚类中心敏感、易受孤立点影响等问题,依据优化后的离群点检测算法和最大最小距离思想以及启发式方法提出一种多点因素相结合的改进K-means算法。实验表明,改进算法具有非常好的稳定性,与FECA聚类算法相比在准确率上平均提高9.17%,在迭代次数上平均减少4.16次,在DBI指标上平均减少5.70%,在SC指标上平均提高5.22%。(2)基于聚类的学生行为分析。针对高校学生生活学习行为复杂且多样,不便于分析的问题,构建了学生行为描述指标体系,并使用改进的聚类算法对描述指标中的学生行为数据进行聚类,得到各指标上不同的学生行为类别,分析每个类别学生的行为特点,总结出不同类别学生的行为特征标签。(3)基于Apriori的关联规则挖掘。针对Apriori算法剪枝步操作效率较低且传统关联规则度量指标存在一定局限性的问题,采用方向扫描的方式对Apriori算法剪枝步进行优化,并引入有效度指标优化传统关联规则度量。基于学生行为数据聚类结果,使用优化后的Apriori算法对不同课程成绩之间、行为与成绩之间的规则进行挖掘,并对其间的关联性进行分析。(4)基于Attention-Bi LSTM的学生成绩预测。针对传统成绩预测方法忽略不同行为特征对成绩的影响程度不同的问题,并考虑到不同时期的行为数据对学生成绩的影响程度也不同,将成绩预测问题抽象为时间序列分类问题,并将注意力机制与长短期记忆神经网络相结合,构建了基于Attention-Bi LSTM的成绩预测模型。实验表明,本文提出的预测模型相比传统基准模型中预测效果较好的Logistic Regression模型以及未引入注意力机制的长短期记忆神经网络模型在准确率上分别提升了15.72%、7.21%,有效地改善了预测质量。
其他文献
农作物监测与分类是极化合成孔径雷达(PolSAR)影像的重要应用之一。极化SAR系统是一种主动遥感系统,能获取观测场景高分辨率的遥感信息,包括目标的极化强度和相位。在农作物分类中,一方面由于同一作物在生长过程中表现出不同的外部特征,单一时间的PolSAR图像很难提供足够的信息。随着越来越多的星载SAR系统成功入轨,提供了大量的PolSAR数据,为多时相数据分析和应用提供了可靠基础。另一方面,随着机
作为一种新型荧光碳纳米材料,碳点(CDs)因其优良的荧光性能、简洁的合成方法、良好的生物相容性和广泛的检测应用而得到了长足发展。与传统半导体量子点和有机染料相比,发光CDs不仅在水溶性、耐光漂白性、毒性、光稳定性、生物相容性等方面具有优势,而且有优良的光致发光特性,这使其在发光器件、生物成像、生物传感等方面具有广泛应用。近年来,以绿色碳源为前体合成CDs的研究受到了越来越多的关注,而绿色CDs由于
非规则算法已在复杂网络分析、机器学习、图像处理、生物信息、分子动力学和气候模拟等领域有着广泛的应用,如何有效地通过线程级推测技术提升非规则算法的执行效率已成为当前研究的热点。然而,现有的线程级推测调度策略没有考虑非规则算法自身特征,推测并行时采用“一刀切”策略进行线程调度,导致执行效果不佳。为了得到更好的推测执行性能,本文从非规则算法样本集和线程级推测调度领域和实验论证三个方面展开研究,论文主要工
糖尿病是一种以高血糖为特征的代谢性疾病。目前临床上治疗糖尿病以注射外源胰岛素为主,但无法维持血糖长期稳定,并发症的风险依然存在。胰岛移植是解决这一难题的有效方法,但存在供体短缺、免疫排斥等问题。因此体外生成胰岛素分泌细胞(insulin producing cells,IPCs)代替胰岛移植成为研究热点。脂肪间充质干细胞(adipose-derived mesenchymal stem cells
呼吸是奶牛最基本的生理活动之一,蕴含着丰富的生理健康信息。奶牛呼吸行为的准确、自动检测是基于“医工交叉”技术实现热应激等呼吸相关疾病智能诊断的技术前提,不仅有利于奶牛健康问题的及时治疗,也有助于优化饲养方案、提升牛奶产量和养殖场经济效益。为解决现代化大规模养殖场中人工检测奶牛呼吸行为面临的人力成本高、易疲劳、准确率低等问题,本研究以杨凌区科元公司的泌乳中期“荷斯坦”奶牛为研究对象,进行基于视频分析
冠心病作为一种慢性病,是目前各种疾病中致死率最高的一种疾病,在临床上治疗冠心病最主要的方法是经皮冠状动脉介入术(percutaneous coronary intervention,PCI),但有关报道证实PCI技术在降低患者死亡率的同时,患者的心理情绪会有一定的波动,术后会出现不同程度的心血管狭窄的风险和其他并发症。临床常规护理不能很好地全面了解患者的需求,对患者的负面情绪也不能有效缓解。结构式
糖尿病是一种在全世界范围内普遍存在的慢性代谢性疾病,对人们的健康以及医疗资源产生了严峻的影响。目前,胰岛移植有望治疗糖尿病,但由于胰岛供体短缺和免疫排斥问题而受限。因此,寻找其它来源的胰岛素分泌细胞(Insulin producing cells,IPCs)进行移植成为治疗糖尿病的有效途径。在近几年的研究中,虽然体外诱导干细胞分化为IPCs已初见成效,但IPCs的分化程度和胰岛素分泌量都很低。通过
磷酸甘油酸变位酶1(Phosphoglycerate Mutase 1,PGAM1)是一种参与糖酵解过程的关键酶,可以通过将3-磷酸甘油酸转变为2-磷酸甘油酸促进糖酵解。PGAM1在调节能量产生和核苷酸生物合成等多种细胞活动中发挥关键作用。PGAM1在包括肺癌、骨肉瘤和胰腺癌在内的多种癌症中高表达,并起到促进细胞增殖活性、迁移和侵袭的作用。目前,PGAM1在肺血管疾病中的作用尚不清楚。为探究PGA
肺动脉高压(Pulmonary Hypertension,PH)是一种由肺部微小动脉血管壁增厚以及持续的肺血管收缩等病理机制导致的临床症状,其特征为肺血管阻力(Pulmonary Vascular Resistance,PVR)和肺动脉压力(Pulmonary Artery Pressure,PAP)进行性升高。其诊断标准为:在海平面水平、静息状态下,经右心导管检测(Right Heart Cat
肺动脉高压(Pulmonary arterial hypertension,PAH)是一种由多种病理因素引起的综合性疾病,累及心肺,治疗困难且死亡率较高。在临床上,PAH患者多表现为肺动脉平均压(Mean pulmonary artery pressure,mPAP)异常升高、肺血管栓塞性阻塞以及右心功能障碍等,病理特征主要包括血管重塑、右心肥厚等方面。其中血管重塑主要是由肺动脉血管中膜的异常增厚