论文部分内容阅读
随着高校信息管理系统中学生行为数据的日益繁增,激发新思路分析与挖掘学生的各类行为数据成为当前教育领域的主流,同时,可以通过构建学生行为画像找到学生的行为数据与真实生活之间的联系。学生行为画像是指利用语义化的学生行为数据标签集合识别学生的行为特征,描述学生的行为习惯。本文提出基于大数据的学生行为画像研究与分析。该研究主要是以学生的各类行为数据为主,以空间聚类算法模型和基于关联规则的分类算法模型为辅,挖掘隐藏在学生行为背后的数据价值。从而引导和预测学生的行为轨迹,改进了高校传统的教与学的模式,在满足学生行为画像需求的同时,打破了学生数据已形成的先入之见。本文的主要内容如下:(1)处理学生行为数据。目前,针对高校学生行为数据的存储与量级鳞次栉比的问题,利用学生行为数据预处理和行为类型划分策略,集成相对完整的学生静态属性数据、成绩数据、消费金额数据、消费频次数据和借阅册数数据,消除学生各类行为数据的量级差异,规范化学生的各类行为数据。(2)分析学生各类行为数据。以规范化和集成化后具有相同量级的学生各类行为数据为基础。首先结合改进的肘部法则与K-means聚类算法分别对学生的各类行为数据进行聚类分析,确定了学生的各类行为数据的最佳聚类k值和聚类类别,其次结合学生各类行为数据的反规范化值对学生的各类行为数据的聚类类别进行数字化描述,最后通过各类行为数据的数字化描述与聚类类别构建学生各类行为数据的离散化标签集合。(3)构建学生行为画像。以学生的各类行为数据的聚类类别为基础,结合学生的静态属性数据和各类行为数据的聚类类别构建学生数据的离散化标签集合,利用基于多频繁模式树的分类算法模型,发现学生数据中的多频繁模式树,识别并描述学生的各类行为特征,根据学生各类行为数据的前缀路径构建学生行为画像。实验结果显示,本文所构建的学生行为画像能够有效地引导和预测学生的行为发展趋势。