短文本主观题评分复核算法研究与系统实现

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:zitayangxin2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前无论是在学校中还是在职称评定方面普遍存在各种类型的考试,考试实际上是一种进行测试和选拔的过程,以此可以检验考生的真实水平,并为相关领域的人才选聘以及评定提供准确的依据。随着计算机以及人工智能技术的持续发展,逐步改变了传统的考试模式,在线考试系统的应用成为重要的趋势,在很多考试中已经采用了自动化的考试系统,可以基于计算机高效完成考试以及评分的过程,相对于传统的考试模式效率更高,成本更低,能够得到较为准确的考核结果。当前在采用在线考试系统中,在客观题评分中大多采用了自动评分技术,此类技术比较成熟,可以高效得到评分的结果。但是在主观题评分中依然缺少自动评分技术的应用,此类题目具有很多的种类,例如有作文或者其它形式的简答题等。主观题的作答具有一定的开放性,很多题目并没有固定的答案,所以实现自动评分的复杂度较高,现如今并不能依靠计算机实现自动评分,仍然需要人工评分。因此,阅卷人需要在极短地时间内对答题者的表述进行阅读并理解,进而用自身的标准对答题者掌握知识的程度进行评价,这种方式存在明显的不足问题,增大了评分教师的工作压力,降低了评分的效率,而且评分结果的准确性往往无法达到较高的要求。本文以简答题和名词解释题这类具有标准答案的短文本主观题为研究重点,对该类主观题自动评分算法进行研究,进而实现自动评分,可以在人工阅卷时起到辅助、复核作用。这样可以相对消除阅卷人一定的主观意识影响,同时进一步提高评分的准确率和公正性。围绕着短文本主观题自动评分研究,本文将短文本主观题标准答案得分点划分为fullmatch和非fullmatch两部分。(1)对于标注为fullmatch的得分点,通过该得分点和考生答案进行正则匹配;若正则匹配成功,则考生答案减去对应的fullmatch答案且获得该得分点分值,否则保留原考生答案且不获得该得分点分值。(2)对于非fullmatch得分点计算分为三步,第一步将考生答案和非fullmatch得分点提取特征并进行拼接,将拼接后的向量值输入全连接神经网络计算出相似度值,然后依据相似度值计算出分值A;第二步提取非fullmatch得分点的关键词并与考生答案进行双向匹配从而计算出分值B;第三步将分值A和分值B分别加权并相加得出考生在非fullmatch部分最终得分。最终将在fullmatch得分点所得分数和非fullmatch得分点所得分数相加即为该考生的总得分。本文做的主要工作有:(1)本文运用了特征拼接思想,通过提取基于BERT生成句向量,基于改进的jaccard系数和熵相似度特征,基于依存句法分析和词性标注得到的句法特征向量以及基于语义角色标注相似度五部分特征并进行拼接,最终形成长度为1619的一维长向量。(2)根据提取特征的方式不同,本文设计了四种网络模型,通过对每种模型选取不同的超参数进行训练,同时采用了数据增强的思想,最终选择出更适应于短文本主观题自动评分的全连接网络模型。(3)基于Textrank算法实现了一种简单且高效的关键词提取工具用于后续模型的建立。(4)利用Django设计并实现了可交互的web端主观题评分复核系统,同时也论证了系统的可用性和高效性。本文对短文本主观题自动评分模型进行研究,并成功将其应用于系统当中,在评卷老师打分过程中,自动评分可以起到复核,参考的作用,可以相对消除一定的主观意识影响,进一步提高评分的准确率和公正性,能够更好地保证考试的公平性,具有一定现实意义。
其他文献
在临床医学领域,传统的心音听诊是常用的心血管疾病诊断方式,存在着主观判断性。心音信号包含着人体丰富的病理信息。研发一套心音电子采集系统并结合决策树融合算法对其进行分析,可高效率的区分正常心音信号和异常心音信号,这对临床诊断具有重要意义。本课题设计了一套基于WiFi无线技术和LabVIEW可存储实时显示的电子心音采集系统。心音传感器拾音部分(胸件)可用来采集心音信号,并利用内置9767P电容式驻极体
在脑电图(EEG)信号采集过程中,EEG信号极易会受到来自实验设备和参与者自身产生的伪迹(如眼电、肌电、心电)的影响。在许多情况下,这些伪迹信号远比神经生理信号更突出,如果不加以纠正,会严重破坏作为衡量大脑功能指标的EEG信号。其中眼电(EOG)伪迹是由眨眼和眼球移动产生的,相比于其他肌电等伪迹的产生原因,这个眼部动作是不可避免的,眨眼的频率也是特别大的。EOG伪迹很容易混淆EEG信号,它与EEG
当前我国正处于基础建设加速的高峰时期,在不断完善社会各方所需的建筑结构前提下,很多城市都在建设服务于人民的公共场所以迎合人民对便捷舒适生活的追求,但是公共场所作为一个人群密集,且人流量巨大的生活必经场所,公共场所中所发生的各类安全事故也与日俱增。近年来,我国地铁、学校等公共场所发生的暴力踩踏事件和人群恐慌事件不仅造成了社会资源的大量浪费,同时给人民的心身健康带来了巨大威胁。在此背景下,本论文针对公
现代社会正面临着严重的老龄化挑战,我国60岁以上的老年人口数量将在“十四五”期间突破3亿。许多老年人在夏季或冬季更容易受到温度波动变化等极端天气的影响,因为他们往往体质较弱,并伴有各种健康问题,且大多不会积极主动调节室内空调等热环境设备。然而老年人大约90%的时间都呆在室内。但是现有PMV模型作为建筑室内热环境设计标准的热舒适预测模型,未考虑人员的实时热感觉,同时该模型是根据稳态热环境下年轻人的实
磁共振成像(Magnetic Resonance Imaging,MRI)具有对软组织成像分辨率高、无电离辐射、任意方位成像等优点,被广泛应用于临床疾病检查中。但是MRI成像速度慢,限制了其进一步应用。并行、压缩感知MRI成像技术分别通过多线圈采集和压缩感知理论来加速磁共振成像。但这两种技术,由于硬件和自身理论的限制,在高倍因子加速情况下成像质量较差。目前深度学习也开始应用于快速MRI重建中。相比
蛋白多肽类药物属于生物大分子,与传统化学合成的小分子药物在理化性质和体内过程均有显著不同,其药代动力学的规律和特点亟待阐明。近期研究表明,对于该类药物的药代动力学研究,不仅要解决相关理论问题,而且要和新技术、新方法建立新体系;已批准上市的蛋白多肽类药物,由于在体内稳定性较低,多以注射方式给药,给患者带来极大痛苦,因此,开发一种口服给药的蛋白多肽类药物成为亟待解决的问题。早期实验通过对猪小肠中的多肽
人工智能技术的发展使得计算机辅助诊断的应用日益广泛,借助于临床医学大数据分析,计算机辅助诊断的效率和准确性也受到业界认可。近年来,随着深度学习在图像处理应用中的迅速发展,利用深度学习方法对医学图像进行分割也成为研究的热点,特别是基于卷积神经网络的图像分割已成为医学图像处理的重要应用领域。医学图像分割的目的是将指定图像的病灶区域分割出来,其分割的准确性直接影响图像识别效果,也会对医生制订手术治疗方案
甲基苯丙胺,又名冰毒,因其外形酷似冰糖而得名,是一种可以导致成瘾行为的精神类物质。作为新型毒品的一种,冰毒不仅具有戒断周期长、复吸率高的特点,其还会引起严重的精神类疾病,对大脑造成不可逆的损伤。目前,冰毒已广泛出现在中国境内的大部分地区,但人们对中国境内冰毒成瘾个体的研究相对较少,尤其是关于其认知行为和神经特征等方面的研究。由Yuan jiajin改良的双选择oddball范式可以定量评估冰毒成瘾
肝癌是我国常见的恶性肿瘤之一,其最有效的治疗手段是外科手术治疗。CT是肝脏病变的一种常见的检查方法。随着计算机应用的发展,基于计算机辅助的肝脏手术规划系统能够帮助外科医生在实施肝脏手术之前,为患者提供合理的手术方案,降低手术风险,提高手术成功率。肝脏图像的分割是肝脏手术规划中非常重要的一步,它能够为后续肝脏的治疗提供定量的分析。目前,临床上采用的大多是手动分割和半自动分割,但是分割效率和精度却没有
作为经典的植物激素之一,细胞分裂素(Cytokinins,CK)在植物生长发育,生长-防御平衡,营养信号远程传递等方面具有关键性的作用。因此,建立植物体内CK实时原位分析方法,对于研究植物生理生化过程和信号传递网络机制等具有重大意义。由于传统的CK体内检测方法都具有一定的缺陷,我们采用对CK具有高亲和力(Kd≈2~4 n M)的CK受体拟南芥组氨酸激酶4(Arabidopsis histidine