基于修辞句识别的中学语文作文评价系统的设计与实现

来源 :中国科学院大学(中国科学院沈阳计算技术研究所 | 被引量 : 0次 | 上传用户:liumusi1314520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作文在所有汉语水平的考试中作为一项重要的考核题目,目前评价多依赖于人工的方式,而人工阅卷往往耗费大量的人力物力,同时作文评价的过程中评阅老师往往不可避免的带有主观性,会有失公平。在这种背景下,如果能够利用机器自动进行作文的评价,就可以在一定程度上解决以上问题。最重要的,对作文提出特定的建议,这将对学生写作水平的提升大有裨益。本文主要采用文本处理的相关技术进行设计,主要围绕作文中修辞句子进行自动识别,并依据修辞句结果给出评价结果,同时训练的总分预测模型给出相应的总体评分,通过方法的正确性在实验中得以验证,系统的有效性通过实例结果保证。最终本文设计并实现了基于修辞句识别的中学语文作文自动评价系统,经测试运行良好。对于排比句的自动识别,本文融合多方面特征包括输入句子的分词序列、词性序列、情感极性序列,分别做交互运算获得交互矩阵,然后以多输入的形式输入CNN逐层提取局部特征,实现了两个句子是否属于排比句的判断,然后进行合并处理从而提取出作文中所有的排比句。对于比喻句的识别,分别用LSTM编码以明喻词分割的句子两段,采用注意力机制捕捉两段内本体和喻体的联系,可以有效的提取出作文中明喻句;引用句的识别主要采用构建引用资源库,利用Elasticsearch内部的倒排索引组织引用原文的存储,通过两个字符串序列的最长公共子串计算相似度的方法。最后考虑提取出来的所有修辞句特征,加入基线学习器,对比四种回归算法训练并挑选一个最合适的回归模型,并证明修辞句特征对中学语文作文自动评价的有效性。所有方法针对数据集测试,均表现出了较好的效果。对于系统的实现,本文基于Python实现多线程的调用多个算法模块进行作文多方面的特征提取,实现了面向中学语文作文的自动评价系统,并提供了简单的评语给出学生写作水平的反馈。目前已经在服务器中部署并试运行。
其他文献
本文主要运用统计学方法来探求三国时期吴蜀两国人才籍贯的地理分布状况及其对政治产生的影响。孙吴和蜀汉的统治者均依靠旧部打天下,旧部和新部结合治理国家。两国的人才依籍贯地缘都形成了大大小小的集团。执政者对各人才集团的倚重程度并不相同,且随具体情况而有变动。集团与集团之间存在着复杂的矛盾斗争。不同州郡县的人才在两国中所占的比重很不平衡。孙吴政权大量起用宗室人才,让他们担任重要官职;而蜀汉政权的宗室人才则
【背景】牛分枝杆菌(Mycobacterium bovis, M. bovis)是重要的人畜共患病原体,严重危害公共卫生安全。巨噬细胞是牛分枝杆菌感染的主要效应细胞,M1型巨噬细胞极化对于宿主免疫防御M. bovis感染至关重要。【目的】探讨鸟苷酸结合蛋白5(guanylate-binding protein 5, GBP5)对M. bovis感染的小鼠单核巨噬细胞系RAW264.7细胞M1、M2
目的:观察新风胶囊对类风湿关节炎大鼠关节炎症的影响,并初步探讨其作用机制。方法:将32只清洁级雄性SD大鼠随机分为正常组、模型组、甲氨蝶呤组(0.98 mg·L-1)和新风胶囊组(0.34 g·L-1),每组8只,除正常组外,其余组大鼠右后足跖皮内注射弗氏完全佐剂构建类风湿关节炎大鼠模型。致炎后第12天开始灌胃给予相应药物,正常组及模型组给予10 mL·kg-1生理盐水灌胃,给药30天后,检测各组
为解决医院门、急诊卫生间排水问题,改善患者就医环境,研究了真空技术在医院排水提升改造中适用性及运行效果。以天津某医院对门、急诊楼卫生间真空改造为实例,得到医院应用此密闭的真空排水系统具有节水、节电、管道铺设灵活、负压隔臭等优点,可实现对污、废水的同层收集、同层排放,防止细菌滋生、带辐射污水(物)二次污染,解决困扰医院卫生间环境的难题,可作为传统重力排水方式的补充与替代。针对真空改造后运行中存在的真
个人敏感信息泄露是目前多发的网络安全事件之一,可能危及人身和财产安全,损害公民名誉和身体健康等.本文通过爬虫技术获取网页内容及附件,然后提取其正文并通过ElasticSearch实现全文索引和查询,实现了个人敏感信息的检测.以手机号码为例,采用不同分词器和查询方式对查询效率进行测试后得出结论:通过自定义分词器进行全文索引并使用正则表达式查询进行个人敏感信息检测具有最高的效率.
目的:分析2011-2020年青海省登记报告肺结核患者就诊延迟时间、地区和人群分布状况以及空间分布特征,并进行影响因素研究。通过构建贝叶斯网络模型对青海省肺结核患者就诊延迟进行因果关联和条件概率分析。方法:分别描述2011-2020年青海省肺结核患者就诊延迟时间变化趋势、地区和人群分布特征。利用Arc GIS软件绘制就诊延迟率可视化地图和三维趋势图确定就诊延迟高发地区。以肺结核患者是否发生就诊延迟
确定在线课程质量要素的学习者关注度—重要度对有效引导课程质量迭代有重要意义。文章将IPA分析方法与学习评论数据相结合,提出了“关注度—重要度”双视角下的质量要素分析方法,并对中国大学MOOC上的课程学习评论进行分析。结果表明:“课程讲解”等三个要素为高关注度高重要度要素;“教学风格”等五个要素为低关注度高重要度要素;“视频质量”等三个要素为低关注度低重要度要素。最后,针对各类型的质量要素提出了课程
随着国内经济的快速发展和人均受教育水平的提高,员工资质过剩现象逐渐出现并引起了人们的关注。论文重点分析资质过剩的解释理论、前因及结果,探讨员工资质过剩的作用机制,从新的视角——组织投入,研究资质过剩感对员工工作绩效(任务绩效、组织公民行为和组织不当行为)的间接影响,并探讨组织认同的调节作用。研究发现,当前存在资质过剩测量方法还需完善、前因研究尚无定论、组织层面的资质过剩研究较少等问题。最后,论文对
目的 了解烟台市成年居民超重、肥胖、中心性肥胖的流行现状及其影响因素,为采取相应的干预措施提供理论依据。方法 采用多阶段整群随机抽样方法在烟台市芝罘区抽取12个街道办事处,对18岁以上常住居民进行个人问卷填写、身体测量和实验室检测。采用多分类logistic回归模型分析超重、肥胖的影响因素,二分类非条件logistic回归模型分析中心性肥胖的影响因素。结果 有效调查3046人,超重率39.95%,