面向汉语学习的作文识别与批改方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:chrron
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着越来越多的外国人开始学习汉语,汉语教学的需求也在不断增加。语言教学在语言学习过程中有着至关重要的作用,它可以帮助学习者更好地掌握正在学习的语言。通过建立良好的语言学习平台,及时地发现学习者书写的内容中存在的问题,进行个性化地修改语法错误并给出指导意见和建议,对于提高语言学习和教学的效率具有非常重要的意义。由于深度学习的兴起和蓬勃发展,自然语言处理发生了重大的变革。语法改错作为自然语言处理的重要研究领域之一,也受到了这一变革浪潮的影响,吸引了大量的研究者,从而出现了许多基于深度学习的语法改错方法,进而产生了很多智能批改平台,很好地提升了语言学习和教学的效率。智能批改平台需要解决以下问题:(1)由于手写的作文无法直接作为智能批改模型的输入,并且通过人工将其录入系统的处理方式费时费力,故有必要在批改之前将其自动地识别为文本;(2)有研究表明,不同母语等特征的第二语言学习者所犯的语法错误不同,对这些特征建模可以有效地提升语法改错模型的效果。但是,当前面向汉语的深度语法改错方法都未考虑汉语学习者的母语等个性化特征;(3)尽管基于深度学习的语法改错方法在通用领域获得了不错的效果,但其在特定领域无法获得较高的性能,主要原因是特定领域内的数据资源匮乏以及存在领域漂移的现象。很少有工作研究语法改错少样本领域自适应问题。针对上述挑战,本文的主要工作有:(1)实现了基于边框回归的文本定位模型,构建了作文图像数据集并进行了实验,实验结果表明经过训练后的模型可以实现高精度的作文文本定位。在定位结果的基础上,实现了基于序列化信息的文本行识别模型,使用公开的数据集以及作文文本行图像共同训练识别模型,最终成功实现了作文信息的自动提取。(2)提出了面向汉语作为第二语言学习的个性化语法改错,对不同特征的汉语学习者所犯的错误分别进行改正。通过迁移学习方法将语法改错模型适应到汉语学习者不同的领域,实现个性化语法改错。本文将语法改错任务视为翻译任务,通过将错误的句子翻译为正确的句子实现改错。在此基础上,构建了不同领域汉语学习者的数据集并进行实验,实验结果验证了所提个性化语法改错方法的有效性。(3)提出了一种基于元学习的语法改错少样本领域自适应方法,解决少样本条件下,语法改错模型快速领域自适应的问题。本文把不同领域的语法改错视为不同的语法改错任务,使用一组资源丰富的源任务去学习语法改错模型的初始化参数,这些初始化参数仅使用少量的数据就可以快速适应到新的目标任务上。在此基础上,构建了一个语法改错少样本领域适应数据集并进行实验,实验结果表明,本文所提出的方法可以有效解决低资源条件下的语法改错领域自适应问题。
其他文献
随着开关电源应用场景的不断增多,开关电源的使用环境也日趋复杂,对于开关电源质量的要求也越来越高。目前关于出厂开关电源的检测通常采用多设备组合的检测方式,工作效率低,检测结果精度不高。本文根据开关电源检测标准,对开关电源高精度、高效率的检测方法进行研究。主要研究内容如下:首先,对开关电源检测系统的指标进行分析,确定了开关电源待测参数特征。针对检测精度的提高开展两个方面的研究:一个是对信号采集电路进行
作为居民出行、交通系统和土地利用的重要评价指标,交通可达性逐渐成为地理、规划、交通等领域的研究热点。近年来,移动互联网、大数据等技术的成熟,海量移动数据使得学者们从空间交互角度研究可达性问题成为可能。随着地理信息数据与交通领域的深度融合,可达性研究逐渐开始关注居民对于公共服务设施使用的便利程度,评估公共服务资源的分布现状,帮助政府在公共设施选址方面的投资决策,从而促进公平、高效的公共服务设施布局,
目的:分析应用芒硝外敷与中药清胰承气汤联合治疗急性胰腺炎的临床疗效。方法:选取2019年10月-2020年12月期间因急性胰腺炎入院治疗的112例患者,随机分为治疗组(芒硝外敷与中药清胰承气汤联合治疗)与对照组(常规基础治疗),各56例。比较两组肛门恢复排气排便时间、治疗总有效率、腹部压痛消失时间及治疗前后C-反应蛋白(CRP)、白细胞(WBC)、尿淀粉酶(UAMY)、血清淀粉酶(AMS)。结果:
停车精度是影响高速磁浮交通系统运营效率的重要技术指标之一。尽管轮轨列车精确停车控制取得了较丰富的研究成果,但是,高速磁悬浮列车在牵引、定位、制动等方面与轮轨列车存在巨大差异,轮轨列车的研究成果不能直接应用于高速磁浮列车,因此,研究高速磁浮列车的精确停车控制具有重要的理论意义及应用价值。本文借鉴轮轨列车的研究成果,针对磁悬浮列车特点,设计了高速磁浮列车精确停车制动控制器。首先,针对高速磁浮的特点,建
大力发展城市公共交通,优化道路交通资源配置是缓解城市交通拥堵的重要举措,城市地面公交作为城市公共交通系统的重要组成部分,作用更是举足轻重。在城市地面公交运营过程中,公交串车是一种常见的现象,其所具有的向后传播性和持续影响性极大地限制了公交运营效率和服务水平提升的上限。同时,在实际生活中,交通方式服务质量的高低逐渐成为人们出行方式选择的一个重要衡量标准。因此,提高对公交串车问题的认识,采取合理的方式
卷积神经网络(Convolutional Neural Network,CNN)作为深度神经网络中典型的网络类型,在人工智能领域得到广泛的应用,又因其以大规模参数训练为代表,属于计算密集型和访存密集型的任务,这就对设计专用的CNN训练的处理器体系架构提出了要求。现今面向神经网络训练处理器通常是具有大量并行运算资源的片上多核处理器,计算速度与访存速度的严重不均衡导致“存储墙”问题。由于CNN训练的访
重症急性胰腺炎在急腹症领域具有较高的患病比例,患者一般起病较急、病情凶险、变化迅速,再加上相关并发症较多,易导致腹膜炎、继发性感染、休克等问题,病死率相对较高。常规西医治疗重症急性胰腺炎已经步入了瓶颈阶段,治疗效果不够理想、治疗费用相对较高、住院时间过长等仍是临床重点关注的问题。经过诸多专家和学者不断研究与探索,发现中西医结合治疗重症急性胰腺炎有良好效果。现从中西医结合治疗重症急性胰腺炎方向进行分
弓网之间接触压力直接影响列车受流性能的好坏,因而需要定期测量并调整受电弓的静态接触压力。便携式受电弓检测仪可用于测量静态接触压力随升降弓高度变化的静态特性曲线,适合日常检修过程使用。本研究的目的在于分析现有便携式受电弓检测仪机械结构方面存在的缺点,在此基础上,提出一种改进的便携式受电弓检测仪机械结构方案,提高检测仪的测力精度,减小结构尺寸。对现有便携式受电弓检测仪进行分析。存在以下问题:结构尺寸较
为进一步开展杂环缓蚀剂的合成研究,实验室选取了含有呋喃环的糠酸作为缓蚀剂合成原料,与二乙烯三胺在二甲苯携水条件下合成了糠酸咪唑啉,并经进一步复配后获得糠酸咪唑啉缓蚀剂。通过配置油田高矿化度模拟水样并开展动态挂片腐蚀评价实验,结果表明该具备呋喃环和咪唑啉环的双杂环缓蚀剂针对该较高流速和较高CO2分压条件下的腐蚀工况具有良好的缓蚀效果。
金属等离子体推进器是一种利用真空电弧烧蚀阴极金属材料产生的金属等离子体作为推力源的电推进器,具有体积小、质量轻、可靠性高等特点。而目前真空放电生成的等离子体源的喷射性能较差,包括等离子体密度较低,运动能量较小,导致推进器形成的推力相对较小,实际应用受到限制。因此,研究新型、高效的金属等离子体推进器,探究能够有效提高等离子体特性和推进性能的新型推进方式具有重要意义。本研究主要以金属等离子体推进器为研