支持自然语言的智能阅卷算法研究与实现

来源 :济南大学 | 被引量 : 3次 | 上传用户:xyjslzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
英语教学堪称国内教学之重之难。其重要性在高考、考研、考博、出国留学等人生重要考试中的地位已无须多言;其困难性在于环境与师资的严重不足。以英语作文为例,学生要想在英语作文上有较大的提高,需要得到教师对学生作文进行有效的批改。这种教学上的内在需求,不仅仅要求英语教师花费大量的时间去批改作文,还要求教师有较高的英语写作水平。目前国内的英语教师基本上为本土教师,母语并非英语,无论是水平上,还是精力上都不能胜任这项工作。在实际的英语写作教学过程中,常见的情形是:学生人数多,教师人数少,阅卷效率低,“从考试到阅卷到反馈”的周期太长,学生写作练习机会太少,反馈滞后致使不足之处得不到及时纠正提高等普遍存在的现象,不一而足。除此之外,在阅卷的过程中,阅卷教师给出的得分很容易受到主观情绪等不利因素的影响,甚至以偏概全,给出比较极端的判卷结果。随着计算智能的长足发展,近年来“机器阅卷”已走入大众视野。它克服了人工阅卷效率低的不足,弥补了掺杂教师情感的缺陷,保证了阅卷的准确高效以及评价的客观性和一致性,将教师从繁重的劳动力中解脱出来,以便于做更有意义的工作。国外对于写作智能评阅的研究比较早,并且已有比较成熟的系统,实际的应用中表现出了较好的可靠性,但这些系统的设计都是针对以英语作为母语写作来进行评阅的,对于国内的英语考试,考虑到考生和阅卷老师母语都不是英语,且针对英语写作能力的要求也不同于英语作为母语的要求,若套用这些系统进行评阅,必然存在于人工评阅的“不兼容”,因此针对国内学生及其文化的诉求,作文智能评阅算法在指标选取与反馈中作了改进。本研究以英语作文智能评分算法为探索背景,收集真实考试的样本试卷,研究可能影响作文结果的阅卷指标,归纳对作文分数影响显著的算法指标,提取出考试的一般规律,在此基础上建立一个分层的阅卷模型。通过综合考虑英语四级作文的评分标准,以及借鉴前人总结的一些指标,构建了一套指标体系,考虑到构成作文的基本要素是单词、句子和篇章结构三大方面的指标,通过各个指标跟作文分数进行主成分分析,挖掘出影响作用显著的指标,并对这些指标进行分析,根据指标与作文分数的线性拟合,得到一个最佳的值,构建一个分层的评阅模型。然而作文分数不是最终的目的,本研究提出的智能评阅系统不仅仅包括评阅分数,还包括分析信息的自然语言反馈以及个人学习建议,从而达到以评促学的目的。本系统通过三种工具计算潜在影响作用的指标,对来自不同专业和班级的三种话题312篇作文进行了测试。实验表明,智能作文评阅与人工评阅相对比的精确准确性为79.66%,邻接准确率为94%,最大误差率均小于20%,智能评分系统不存在奇异值性误差。结果表明改进后的Adaboost/CT算法能够很好地应用于智能作文评分。
其他文献
目的调查佳木斯铁路车务段各火车站售货点糕点的卫生状况、保障广大旅客的身体健康,为有关卫生部门提供相关的工作依据。方法对佳木斯铁路车务段18个火车站售货点出售的糕点随
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议