基于CEMs聚类分析与语义结合的程序自动测评方法研究

来源 :西安工程大学 | 被引量 : 0次 | 上传用户:yantianwa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展以及新工科、新文科等教育教学理念的提出,应用新技术支持教学过程的设计、互动分析与评价已经成为一个重要的方向。对于计算机学科的程序设计类课程而言,大量编程练习可以有效地培养学生编程思维、提升学生动手实践能力、促进课程目标的实现。但是依托传统的人工评阅方式很难保证评阅结果的时效性和评价标准的客观性、统一性。因此,利用计算机辅助评价技术实现无纸化作业评阅、反馈已成为计算机学科发展的必然趋势。本文的研究是在程序动态测评基础下,对程序编译错误信息进行收集整理,静态分析程序编译错误信息数据,最终应用动态测试和静态分析相结合的方式构建程序自动评分模型,实现编程题自动评阅技术。主要完成了以下三个方面的工作:1.程序编译错误信息特征提取。这一部分工作主要包括三个方面:(1)使用Word2Vec工具的Skip-gram模型训练程序编译错误信息文本数据集;(2)利用TF-IDF算法计算编译错误信息的词汇权重,将编译错误信息的Word2Vec向量乘以对应的TF-IDF权重得到加权的Word2Vec词向量;(3)将数据集中所有加权Word2Vec词向量输入到卷积神经网络模型,深度挖掘文本特征,最终得到能够表示文本关联性的特征向量。通过实验验证,该方法能深入挖掘程序编译错误信息之间关联性,更加准确地获得程序编译错误信息的特征向量。2.提出了一种改进的基于K-means算法的编译错误信息聚类分析模型。这一部分工作主要包括两个方面:(1)计算文本语义相似度。运用RWMD距离算法计算词汇之间的语义相似度,用以代替传统K-means算法中距离计算公式;(2)使用K-means算法进行编译错误信息聚类分析。利用肘部法则确定最优聚类簇,得到最优簇值为3。通过分析将这三类分别定义为语法错误、语义错误和逻辑错误。经过实验验证,改进的K-means算法在聚类结果上准确性更高。3.构建程序自动评分模型。这一部分工作主要包括三个方面:(1)动态测试。将源程序输入在线自动测评系统中,若源程序编译且测试用例通过,则直接得满分;(2)静态分析。源程序编译未通过则进入静态分析环节,如果是由于未严格按照输出格式要求而引起的解答错误,则按照总分的5%扣除输出错误分,否则将进入自动评分模型。(3)自动评分模型。首先依赖人工评分的大量数据进行训练,明确聚类结果中每个类别对应的权重值大小。最后将该权重乘以对应类别的基础分,计算程序最终得分。通过实验验证,应用该方法评阅程序更接近人工评分。
其他文献
学位
随着国民经济快速发展,对资源的大量需求和浅表矿产资源的枯竭,许多露天矿山逐步转向地下开采。露天开采转为地下开采时,如何对露天边坡上的挂帮矿石进行回收利用,如何开采坑底矿石资源,如何确保露天边坡的稳定性,是露天矿山生产方式、安全、管理成功转型、实现矿山可持续发展的重要课题。金平长安矿业有限公司长安矿段2017年整体露天开采结束,露天边坡最高高差412m。本文针对长安矿段露天转地下开采技术问题,通过对
近年来,我国人口老龄化现象日益严重、亚健康人群普遍增多、421家庭结构的转变和后疫情时代的到来带来的诸多居住问题越来越受到人们的关注,普通住宅已逐渐无法满足养老需求和康养需求,而康养小镇作为一种新兴的居住模式来构建的住宅和设施并未从根本上解决以上问题。本文以大健康的理念为背景,结合康养小镇中住宅存在的问题,在第四代住宅的基础上,研究了社区和机构的养老模式、康养社区及建构条件、居住建筑“代际论”发展
学位
学位
学位
学位
学位
高熵合金往往具有强度高、韧性好、耐腐蚀、抗辐照等特点,其多主元的设计理念为研发优良的合金材料提供了广阔的空间。高熵合金优异的力学性能与其微结构及微观变形机理紧密关联,因此开展微观机理与宏观力学性能的关联性研究,对理解材料的力学行为和通过微结构设计优化材料性能具有重要意义。本文将高熵合金的微观变形机理通过内变量引入本构关系中,采用晶体塑性有限元方法模拟研究高熵合金的力学性能,考察微结构、位错演化机制
学位